Unipormeng pamamahagi ng dalawang-dimensional na random na variable. Mga sistema ng mga random na variable

Kahulugan 2.7. ay isang pares ng mga random na numero (X, Y), o isang punto sa coordinate plane (Larawan 2.11).

kanin. 2.11.

Ang dalawang-dimensional na random na variable ay isang espesyal na kaso ng isang multidimensional na random variable, o random na vector.

Kahulugan 2.8. Random na vector - ito ba ay isang random na function?,(/) na may isang tiyak na hanay ng mga posibleng halaga ng argumento t, na ang halaga para sa anumang halaga t ay isang random na variable.

Ang isang dalawang-dimensional na random na variable ay tinatawag na tuloy-tuloy kung ang mga coordinate nito ay tuluy-tuloy, at discrete kung ang mga coordinate nito ay discrete.

Upang itakda ang batas ng pamamahagi ng dalawang-dimensional na random na mga variable ay nangangahulugang magtatag ng isang sulat sa pagitan ng mga posibleng halaga nito at ang posibilidad ng mga halagang ito. Ayon sa mga paraan ng pagtatakda, ang mga random na variable ay nahahati sa tuloy-tuloy at discrete, bagama't may mga pangkalahatang paraan upang itakda ang batas sa pamamahagi ng anumang RV.

Discrete two-dimensional random variable

Ang discrete two-dimensional random variable ay tinukoy gamit ang distribution table (Talahanayan 2.1).

Talahanayan 2.1

Talaan ng alokasyon (pinagsamang alokasyon) CB ( X, U)

Ang mga elemento ng talahanayan ay tinukoy ng formula

Mga katangian ng elemento ng talahanayan ng pamamahagi:

Ang pamamahagi sa bawat coordinate ay tinatawag one-dimensional o marginal:

R 1> = P(X =.d,) - marginal distribution ng SW X;

p^2) = P(Y= y,)- marginal distribution ng SV U.

Komunikasyon ng magkasanib na pamamahagi ng CB X at Y, na ibinigay ng hanay ng mga probabilidad [p () ), i = 1,..., n,j = 1,..., t(talahanayan ng pamamahagi), at marginal distribution.


Katulad din para sa SV U p- 2)= X p, g

Suliranin 2.14. Ibinigay:

Patuloy na 2D random variable

/(X, y)dxdy- elemento ng probabilidad para sa isang two-dimensional random variable (X, Y) - probabilidad ng pagtama ng random variable (X, Y) sa isang parihaba na may mga gilid cbc, dy sa dx, dy -* 0:

f(x, y) - density ng pamamahagi dalawang-dimensional na random na variable (X, Y). Gawain /(x, y) nagbibigay kami ng kumpletong impormasyon tungkol sa pamamahagi ng isang dalawang-dimensional na random na variable.

Ang mga marginal distribution ay tinukoy bilang mga sumusunod: para sa X - ayon sa density ng distribution ng CB X/,(x); sa Y- Densidad ng pamamahagi ng SV f>(y).

Ang pagtatakda ng batas sa pamamahagi ng isang dalawang-dimensional na random na variable ng function ng pamamahagi

Ang isang unibersal na paraan upang tukuyin ang batas sa pamamahagi para sa isang discrete o tuloy-tuloy na dalawang-dimensional na random na variable ay ang distribution function F(x, y).

Kahulugan 2.9. Distribution function F(x, y)- posibilidad ng magkasanib na paglitaw ng mga kaganapan (Xy), i.e. F(x0,y n) = = P(X y), itinapon sa coordinate plane, nahulog sa isang walang katapusang quadrant na may vertex sa puntong M(x 0, ikaw i)(sa may kulay na lugar sa Fig. 2.12).

kanin. 2.12. Ilustrasyon ng function ng pamamahagi F( x, y)

Mga Katangian ng Function F(x, y)

  • 1) 0 1;
  • 2) F(-oo,-oo) = F(x,-oo) = F(-oo, y) = 0; F( oo, oo) = 1;
  • 3) F(x, y)- hindi bumababa sa bawat argumento;
  • 4) F(x, y) - tuloy-tuloy na kaliwa at ibaba;
  • 5) pagkakapare-pareho ng mga pamamahagi:

F(x, X: F(x, oo) = F,(x); F(y, oo) - marginal distribution over Y F( oo, y) = F 2 (y). Koneksyon /(x, y) kasama F(x, y):

Relasyon sa pagitan ng joint density at marginal density. Dana f(x, y). Nakukuha namin ang marginal distribution density f(x),f 2 (y)".


Ang kaso ng mga independiyenteng coordinate ng isang dalawang-dimensional na random na variable

Kahulugan 2.10. SW X at Yindependent(nc) kung ang anumang mga kaganapang nauugnay sa bawat isa sa mga RV na ito ay independyente. Mula sa kahulugan ng nc CB ito ay sumusunod:

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = F l (x)F 2 (y).

Para pala sa mga independent SW X at Y natapos at

3 )f(x,y) = J(x)f,(y).

Patunayan natin yan para sa mga independent SW X at Y2) 3). patunay, a) Hayaan ang 2), ibig sabihin,

sa parehong oras F(x,y) = f J f(u,v)dudv, kung saan ito sumusunod 3);

b) hayaan ang 3 na humawak ngayon, pagkatapos


mga. totoo 2).

Isaalang-alang natin ang mga gawain.

Suliranin 2.15. Ang pamamahagi ay ibinibigay ng sumusunod na talahanayan:

Bumubuo kami ng mga marginal distribution:

Nakukuha namin P(X = 3, U = 4) = 0,17 * P(X = 3) P (Y \u003d 4) \u003d 0.1485 => SV X at mga Dependent.

Pag-andar ng pamamahagi:


Suliranin 2.16. Ang pamamahagi ay ibinibigay ng sumusunod na talahanayan:

Nakukuha namin P tl = 0.2 0.3 = 0.06; P 12 \u003d 0.2? 0.7 = 0.14; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0.8 0.7 = 0.56 => SW X at Y nz.

Suliranin 2.17. Dana /(x, y) = 1/st exp| -0.5(d "+ 2xy + 5d/ 2)]. Hanapin oh) at /Ay)-

Desisyon

(kalkulahin ang iyong sarili).

Kadalasan, kapag nag-aaral ng mga random na variable, ang isa ay kailangang harapin ang dalawa, tatlo, o higit pang mga random na variable. Halimbawa, ang dalawang-dimensional na random na variable na $\left(X,\ Y\right)$ ay maglalarawan sa hit point ng projectile, kung saan ang mga random na variable na $X,\ Y$ ay ang abscissa at ang ordinate, ayon sa pagkakabanggit. Ang pagganap ng isang random na napiling mag-aaral sa panahon ng session ay nailalarawan sa pamamagitan ng isang $n$-dimensional na random na variable na $\left(X_1,\ X_2,\ \dots ,\ X_n\right)$, kung saan ang mga random na variable ay $X_1,\ X_2,\ \dots ,\ X_n $ - ito ang mga markang inilagay sa grade book sa iba't ibang disiplina.

Ang set ng $n$ random variables $\left(X_1,\ X_2,\ \dots ,\ X_n\right)$ ay tinatawag random na vector. Nililimitahan namin ang aming sarili sa kaso na $\left(X,\ Y\right)$.

Hayaang ang $X$ ay isang discrete random variable na may mga posibleng value na $x_1,x_2,\ \dots ,\ x_n$, at $Y$ ay isang discrete random variable na may mga posibleng value na $y_1,y_2,\ \dots , \ y_n$.

Pagkatapos ay maaaring kunin ng isang discrete two-dimensional random variable na $\left(X,\ Y\right)$ ang mga value na $\left(x_i,\ y_j\right)$ na may probabilities $p_(ij)=P\left(( \left(X=x_i \right)\left(Y=y_j\right)\right)=P\left(X=x_i\right)P\left(Y=y_j|X=x_i\right)$. Dito ang $P\left(Y=y_j|X=x_i\right)$ ay ang conditional probability na ang random variable na $Y$ ay kumukuha ng value na $y_j$ na ibinigay na ang random variable na $X$ ay kumukuha ng value na $x_i$.

Ang posibilidad na ang random variable na $X$ ay kukuha ng halaga na $x_i$ ay katumbas ng $p_i=\sum_j(p_(ij))$. Ang posibilidad na ang random variable na $Y$ ay kukuha ng halaga na $y_j$ ay katumbas ng $q_j=\sum_i(p_(ij))$.

$$P\left(X=x_i|Y=y_j\right)=((P\left(\left(X=x_i\right)\left(Y=y_j\right)\right))\over (P\ kaliwa(Y=y_j\kanan)))=((p_(ij))\over (q_j)).$$

$$P\left(Y=y_j|X=x_i\right)=((P\left(\left(X=x_i\right)\left(Y=y_j\right)\right))\over (P\ kaliwa(X=x_i\kanan)))=((p_(ij))\over (p_i)).$$

Halimbawa 1 . Ang pamamahagi ng isang dalawang-dimensional na random na variable ay ibinibigay:

$\begin(array)(|c|c|)
\hline
X\backslash Y & 2 & 3 \\
\hline
-1 & 0,15 & 0,25 \\
\hline
0 & 0,28 & 0,13 \\
\hline
1 & 0,09 & 0,1 \\
\hline
\end(array)$

Tukuyin natin ang mga batas sa pamamahagi para sa mga random na variable na $X$ at $Y$. Hanapin natin ang mga conditional distribution ng random variable na $X$ sa ilalim ng kondisyon na $Y=2$ at ang random variable na $Y$ sa ilalim ng condition na $X=0$.

Punan natin ang sumusunod na talahanayan:

$\begin(array)(|c|c|)
\hline
X\backslash Y & 2 & 3 & p_i & p_(ij)/q_1 \\
\hline
-1 & 0,15 & 0,25 & 0,4 & 0,29 \\
\hline
0 & 0,28 & 0,13 & 0,41 & 0,54 \\
\hline
1 & 0,09 & 0,1 & 0,19 & 0,17 \\
\hline
q_j & 0.52 & 0.48 & 1 & \\
\hline
p_(ij)/p_2 & 0.68 & 0.32 & & \\
\hline
1 & 0,09 & 0,1 \\
\hline
\end(array)$

Ipaliwanag natin kung paano napuno ang talahanayan. Ang mga halaga ng unang tatlong hanay ng unang apat na hanay ay kinuha mula sa kundisyon. Ang kabuuan ng mga numero ng $2$th at $3$th column ng $2$th ($3$th) na row ay ipinahiwatig sa $4$th column ng $2$th ($3$th) na row. Ang kabuuan ng mga numero sa $2$th at $3$th column ng $4$th row ay nakasaad sa $4$th column ng $4$th row.

Ang kabuuan ng mga numero sa $2$th, $3$th at $4$th row ng $2$th ($3$th) column ay nakasulat sa $5$th row ng $2$th ($3$th) column. Ang bawat numero sa $2$th column ay hinati sa $q_1=0.52$, ang resulta ay ni-round up sa dalawang decimal place at nakasulat sa $5$th column. Ang mga numero mula sa $2$th at $3$th column ng $3$th row ay hinati sa $p_2=0.41$, ang resulta ay ni-round up sa dalawang decimal place at nakasulat sa huling linya.

Pagkatapos ang batas ng pamamahagi ng random variable na $X$ ay may sumusunod na anyo.

$\begin(array)(|c|c|)
\hline
X & -1 & 0 & 1 \\
\hline
p_i & 0.4 & 0.41 & 0.19 \\
\hline
\end(array)$

Ang batas ng pamamahagi ng random variable na $Y$.

$\begin(array)(|c|c|)
\hline
Y & 2 & 3 \\
\hline
q_j & 0.52 & 0.48 \\
\hline
\end(array)$

Ang conditional distribution ng random variable na $X$ sa ilalim ng kondisyon na $Y=2$ ay may sumusunod na anyo.

$\begin(array)(|c|c|)
\hline
X & -1 & 0 & 1 \\
\hline
p_(ij)/q_1 & 0.29 & 0.54 & 0.17 \\
\hline
\end(array)$

Ang conditional distribution ng random variable na $Y$ sa ilalim ng kondisyon na $X=0$ ay may sumusunod na form.

$\begin(array)(|c|c|)
\hline
Y & 2 & 3 \\
\hline
p_(ij)/p_2 & 0.68 & 0.32 \\
\hline
\end(array)$

Halimbawa 2 . Mayroon kaming anim na lapis, dalawa sa mga ito ay pula. Inilalagay namin ang mga lapis sa dalawang kahon. Ang $2$ piraso ay inilalagay sa una, at dalawa sa pangalawa. Ang $X$ ay ang bilang ng mga pulang lapis sa unang kahon, at ang $Y$ ay nasa pangalawa. Isulat ang batas sa pamamahagi para sa sistema ng mga random na variable $(X,\ Y)$.

Hayaang ang discrete random variable na $X$ ang bilang ng pulang lapis sa unang kahon, at ang discrete random variable na $Y$ ang bilang ng pulang lapis sa pangalawang kahon. Ang mga posibleng halaga ng mga random na variable na $X,\ Y$ ay ayon sa pagkakabanggit $X:0,\ 1,\ 2$, $Y:0,\ 1,\ 2$. Pagkatapos ay maaaring kunin ng isang discrete two-dimensional random variable na $\left(X,\ Y\right)$ ang mga value na $\left(x,\ y\right)$ na may probabilities $P=P\left(\left(( X=x\right) \times \left(Y=y\right)\right)=P\left(X=x\right)\times P\left(Y=y|X=x\right)$, kung saan $P\left(Y =y|X=x\right)$ - ang conditional probability na ang random variable na $Y$ ay kukuha ng value na $y$, sa kondisyon na ang random variable na $X$ ay kukuha ng value na $x$. Katawanin natin ang pagsusulatan sa pagitan ng mga value na $\left(x,\ y\right)$ at ang probabilities $P\left(\left(X=x\right)\times \left(Y=y\right) \right)$ gaya ng mga sumusunod na talahanayan.

$\begin(array)(|c|c|)
\hline
X\backslash Y & 0 & 1 & 2 \\
\hline
0 at ((1)\over (15)) & ((4)\over (15)) at ((1)\over (15)) \\
\hline
1 at ((4)\over (15)) & ((4)\over (15)) & 0 \\
\hline
2 at ((1)\over (15)) at 0 & 0 \\
\hline
\end(array)$

Ang mga hilera ng naturang talahanayan ay nagpapahiwatig ng mga halaga $X$, at ang mga haligi ay nagpapahiwatig ng mga halaga $Y$, pagkatapos ay ang mga probabilidad na $P\left(\left(X=x\right)\times \left(Y =y\right)\right)$ ay nakasaad sa intersection ng kaukulang row at column. Kalkulahin natin ang mga probabilidad gamit ang klasikal na kahulugan ng probabilidad at ang product theorem ng probabilities ng mga dependent na kaganapan.

$$P\left(\left(X=0\right)\left(Y=0\right)\right)=((C^2_4)\over (C^2_6))\cdot ((C^2_2) \over (C^2_4))=((6)\over (15))\cdot ((1)\over (6))=((1)\over (15));$$

$$P\left(\left(X=0\right)\left(Y=1\right)\right)=((C^2_4)\over (C^2_6))\cdot ((C^1_2\\ cdot C^1_2)\over (C^2_4))=((6)\over (15))\cdot ((2\cdot 2)\over (6))=((4)\over (15)) ;$$

$$P\left(\left(X=0\right)\left(Y=2\right)\right)=((C^2_4)\over (C^2_6))\cdot ((C^2_2) \over (C^2_4))=((6)\over (15))\cdot ((1)\over (6))=((1)\over (15));$$

$$P\left(\left(X=1\right)\left(Y=0\right)\right)=((C^1_2\cdot C^1_4)\over (C^2_6))\cdot ( (C^2_3)\over (C^2_4))=((2\cdot 4)\over (15))\cdot ((3)\over (6))=((4)\over (15)) ;$$

$$P\left(\left(X=1\right)\left(Y=1\right)\right)=((C^1_2\cdot C^1_4)\over (C^2_6))\cdot ( (C^1_1\cdot C^1_3)\over (C^2_4))=((2\cdot 4)\over (15))\cdot ((1\cdot 3)\over (6))=(( 4)\over(15));$$

$$P\left(\left(X=2\right)\left(Y=0\right)\right)=((C^2_2)\over (C^2_6))\cdot ((C^2_4) \over (C^2_4))=((1)\over (15))\cdot 1=((1)\over (15)).$$

Dahil sa batas ng pamamahagi (ang resultang talahanayan) ang buong hanay ng mga kaganapan ay bumubuo ng isang kumpletong pangkat ng mga kaganapan, ang kabuuan ng mga probabilidad ay dapat na katumbas ng 1. Suriin natin ito:

$$\sum_(i,\ j)(p_(ij))=((1)\over (15))+((4)\over (15))+((1)\over (15))+ ((4)\over (15))+((4)\over (15))+((1)\over (15))=1.$$

Distribution function ng isang two-dimensional na random variable

function ng pamamahagi Ang dalawang-dimensional na random na variable na $\left(X,\ Y\right)$ ay isang function na $F\left(x,\ y\right)$, na para sa anumang totoong numero na $x$ at $y$ ay katumbas ng ang posibilidad ng magkasanib na pagpapatupad ng dalawang kaganapan $ \left\(X< x\right\}$ и $\left\{Y < y\right\}$. Таким образом, по определению

$$F\left(x,\ y\right)=P\left\(X< x,\ Y < y\right\}.$$

Para sa isang discrete two-dimensional random variable, ang distribution function ay matatagpuan sa pamamagitan ng pagsusuma ng lahat ng probabilities $p_(ij)$ kung saan $x_i< x,\ y_j < y$, то есть

$$F\left(x,\ y\right)=\sum_(x_i< x}{\sum_{y_j < y}{p_{ij}}}.$$

Mga katangian ng function ng pamamahagi ng isang dalawang-dimensional na random na variable.

1 . Ang distribution function na $F\left(x,\ y\right)$ ay may hangganan, ibig sabihin, $0\le F\left(x,\ y\right)\le 1$.

2 . $F\left(x,\ y\right)$ hindi bumababa para sa bawat argumento nito kasama ang iba pang naayos, ibig sabihin, $F\left(x_2,\ y\right)\ge F\left(x_1,\ y\ kanan )$ para sa $x_2>x_1$, $F\left(x,\ y_2\right)\ge F\left(x,\ y_1\right)$ para sa $y_2>y_1$.

3 . Kung hindi bababa sa isa sa mga argumento ang kukuha ng halaga na $-\infty $, ang distribution function ay magiging zero, ibig sabihin, $F\left(-\infty ,\ y\right)=F\left(x,\ - \infty \right ),\ F\left(-\infty ,\ -\infty \right)=0$.

4 . Kung ang parehong argumento ay kukuha ng halaga na $+\infty $, ang distribution function ay magiging katumbas ng $1$, ibig sabihin, $F\left(+\infty ,\ +\infty \right)=1$.

5 . Kung ang eksaktong isa sa mga argumento ay kumukuha ng halaga na $+\infty $, ang distribution function na $F\left(x,\ y\right)$ ay nagiging distribution function ng random variable na naaayon sa isa pang elemento, ibig sabihin, $ F\left(x ,\ +\infty \right)=F_1\left(x\right)=F_X\left(x\right),\ F\left(+\infty ,\ y\right)=F_y\left (y\kanan) =F_Y\kaliwa(y\kanan)$.

6 . Ang $F\left(x,\ y\right)$ ay iniwang tuloy-tuloy para sa bawat argumento nito, i.e.

$$(\mathop(lim)_(x\to x_0-0) F\left(x,\ y\right)\ )=F\left(x_0,\ y\right),\ (\mathop(lim) _(y\to y_0-0) F\left(x,\ y\right)\ )=F\left(x,\ y_0\right).$$

Halimbawa 3 . Hayaan ang isang discrete two-dimensional random variable na $\left(X,\ Y\right)$ ay ibigay ng isang distribution series.

$\begin(array)(|c|c|)
\hline
X\backslash Y & 0 & 1 \\
\hline
0 at ((1)\over (6)) at ((2)\over (6)) \\
\hline
1 at ((2)\over (6)) at ((1)\over (6)) \\
\hline
\end(array)$

Pagkatapos ang function ng pamamahagi:

$F(x,y)=\left\(\begin(matrix)
0,\ at\ x\le 0,\ y\le 0 \\
0,\ at\ x\le 0,\ 0< y\le 1 \\
0,\ para sa\ x\le 0,\ y>1 \\
0,\ sa\ 0< x\le 1,\ y\le 0 \\
((1)\over (6)),\ at\ 0< x\le 1,\ 0 < y\le 1 \\
((1)\over (6))+((2)\over (6))=((1)\over (2)),\ when\ 0< x\le 1,\ y>1 \\
0,\ para sa\ x>1,\ y\le 0 \\
((1)\over (6))+((2)\over (6))=((1)\over (2)),\ when\ x>1,\ 0< y\le 1 \\
((1)\over (6))+((2)\over (6))+((2)\over (6))+((1)\over (6))=1,\ for\ x >1,\ y>1 \\
\end(matrix)\right.$

bivariate discrete distribution random

Kadalasan ang resulta ng eksperimento ay inilalarawan ng ilang mga random na variable: . Halimbawa, ang lagay ng panahon sa isang partikular na lugar sa isang tiyak na oras ng araw ay maaaring mailalarawan ng mga sumusunod na random na variable: X 1 - temperatura, X 2 - presyon, X 3 - kahalumigmigan ng hangin, X 4 - bilis ng hangin.

Sa kasong ito, ang isa ay nagsasalita ng isang multidimensional random variable o isang sistema ng random variable.

Isaalang-alang ang isang dalawang-dimensional na random na variable na ang mga posibleng halaga ay mga pares ng mga numero. Sa geometriko, ang isang dalawang-dimensional na random na variable ay maaaring bigyang-kahulugan bilang isang random na punto sa isang eroplano.

Kung ang mga sangkap X at Y ay mga discrete random variable, pagkatapos ay isang discrete two-dimensional random variable, at kung X at Y ay tuluy-tuloy, pagkatapos ay isang tuluy-tuloy na dalawang-dimensional na random na variable.

Ang batas ng pamamahagi ng posibilidad ng isang dalawang-dimensional na random na variable ay ang pagsusulatan sa pagitan ng mga posibleng halaga at ang kanilang mga probabilidad.

Ang batas sa pamamahagi ng isang dalawang-dimensional na discrete random variable ay maaaring ibigay sa anyo ng isang double-entry table (tingnan ang Talahanayan 6.1), kung saan ang posibilidad na ang bahagi X kinuha ang kahulugan x i, at ang bahagi Y- ibig sabihin y j .

Talahanayan 6.1.1.

y 1

y 2

y j

y m

x 1

p 11

p 12

p 1j

p 1m

x 2

p 21

p 22

p 2j

p 2m

x i

p i1

p i2

p ij

p im

x n

p n1

p n2

p nj

p nm

Dahil ang mga kaganapan ay bumubuo ng isang kumpletong pangkat ng magkapares na hindi magkatugma na mga kaganapan, ang kabuuan ng mga probabilidad ay katumbas ng 1, i.e.

Mula sa talahanayan 6.1 mahahanap mo ang mga batas ng pamamahagi ng mga one-dimensional na bahagi X at Y.

Halimbawa 6.1.1 . Hanapin ang mga batas ng pamamahagi ng mga bahagi X at Y, kung ang distribusyon ng isang two-dimensional na random variable ay ibinigay sa anyo ng talahanayan 6.1.2.

Talahanayan 6.1.2.

Kung ayusin natin ang halaga ng isa sa mga argumento, halimbawa, pagkatapos ay ang resultang pamamahagi ng dami X ay tinatawag na conditional distribution. Ang kondisyonal na pamamahagi ay tinukoy nang katulad Y.

Halimbawa 6.1.2 . Ayon sa pamamahagi ng isang dalawang-dimensional na random na variable na ibinigay sa Talahanayan. 6.1.2, hanapin ang: a) ang kondisyonal na batas sa pamamahagi ng bahagi X Kung ganoon; b) kondisyonal na batas sa pamamahagi Y sa kondisyon na.

Desisyon. Mga kondisyong probabilidad ng mga bahagi X at Y kinakalkula ng mga formula

Batas sa pamamahagi ng kondisyon X kondisyon ay may anyo

Ang kontrol: .

Ang batas ng pamamahagi ng isang dalawang-dimensional na random na variable ay maaaring ibigay bilang mga function ng pamamahagi, na tumutukoy para sa bawat pares ng mga numero ang posibilidad na X tumatagal sa isang halaga na mas mababa sa X, at kung saan Y tumatagal sa isang halaga na mas mababa sa y:

Sa geometriko, ang function ay nangangahulugan ng posibilidad ng isang random na punto na bumagsak sa isang walang katapusang parisukat na may isang vertex sa punto (Larawan 6.1.1).

Pansinin natin ang mga katangian.

  • 1. Ang saklaw ng function - , i.e. .
  • 2. Function - hindi bumababa na function para sa bawat argumento.
  • 3. May mga naglilimita sa mga relasyon:

Sa , ang distribution function ng system ay nagiging katumbas ng distribution function ng component X, ibig sabihin. .

Gayundin, .

Alam mo, mahahanap mo ang posibilidad ng isang random na punto na nahuhulog sa loob ng parihaba ABCD.

Ibig sabihin,

Halimbawa 6.1.3. Bivariate discrete random variable na tinukoy ng distribution table

Hanapin ang function ng pamamahagi.

Desisyon. Halaga sa kaso ng mga discrete na bahagi X at Y ay matatagpuan sa pamamagitan ng pagsusuma ng lahat ng probabilidad sa mga indeks i at j, para sa, . Pagkatapos, kung at, pagkatapos (ang mga kaganapan at imposible). Katulad nito, nakukuha namin ang:

kung at pagkatapos;

kung at pagkatapos;

kung at pagkatapos;

kung at pagkatapos;

kung at pagkatapos;

kung at pagkatapos;

kung at pagkatapos;

kung at pagkatapos;

kung at pagkatapos.

Ang mga resultang nakuha ay ipinakita sa anyo ng isang talahanayan (6.1.3) ng mga halaga:

Para sa dalawang-dimensional na tuloy-tuloy random variable, ang konsepto ng probability density ay ipinakilala

Ang geometric probability density ay isang distribution surface sa espasyo

Ang isang two-dimensional na probability density ay may mga sumusunod na katangian:

3. Ang function ng pamamahagi ay maaaring ipahayag sa mga tuntunin ng formula

4. Ang posibilidad na matamaan ang isang tuluy-tuloy na random variable sa lugar ay katumbas ng

5. Alinsunod sa property (4) ng function, ang mga formula ay nagaganap:

Halimbawa 6.1.4. Ang distribution function ng isang two-dimensional random variable ay ibinigay

Ang isang nakaayos na pares (X , Y) ng mga random na variable X at Y ay tinatawag na isang two-dimensional na random variable, o isang random na vector ng isang two-dimensional na espasyo. Ang dalawang-dimensional na random variable (X,Y) ay tinatawag ding sistema ng mga random na variable na X at Y. Ang hanay ng lahat ng posibleng halaga ng isang discrete random variable na may kanilang mga probabilities ay tinatawag na distribution law ng random variable na ito. Ang isang discrete two-dimensional random variable (X, Y) ay itinuturing na ibinigay kung ang batas ng pamamahagi nito ay kilala:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Pagtatalaga ng serbisyo. Gamit ang serbisyo, ayon sa ibinigay na batas sa pamamahagi, mahahanap mo ang:

  • serye ng pamamahagi X at Y, inaasahan sa matematika M[X], M[Y], variance D[X], D[Y];
  • covariance cov(x,y), correlation coefficient r x,y , conditional distribution series X, conditional expectation M;
Bilang karagdagan, ang isang sagot ay ibinibigay sa tanong na, "Are the random variables X and Y dependent?".

Pagtuturo. Tukuyin ang dimensyon ng probability distribution matrix (bilang ng mga row at column) at ang anyo nito. Ang resultang solusyon ay nai-save sa isang Word file.

Halimbawa #1. Ang isang dalawang-dimensional na discrete random variable ay may talahanayan ng pamamahagi:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Hanapin ang q value at ang correlation coefficient ng random variable na ito.

Desisyon. Nahanap namin ang halaga q mula sa kondisyon na Σp ij = 1
Σp ij = 0.02 + 0.03 + 0.11 + … + 0.03 + 0.02 + 0.01 + q = 1
0.91+q = 1. Saan ang q = 0.09

Gamit ang formula ∑P(x i,y j) = p i(j=1..n), hanapin ang serye ng pamamahagi X.

Pag-asa sa matematika M[Y].
M[y] = 1*0.05 + 2*0.46 + 3*0.34 + 4*0.15 = 2.59
Dispersion D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Karaniwang lihisσ(y) = sqrt(D[Y]) = sqrt(0.64) = 0.801

covariance cov(X,Y) = M - M[X] M[Y] = 2 10 0.11 + 3 10 0.12 + 4 10 0.03 + 2 20 0.13 + 3 20 0.09 + 4 20 0.02 + 1 30 210.02 + 0.02 3 30 0.08 + 4 30 0.01 + 1 40 0.03 + 2 40 0.11 + 3 40 0.05 + 4 40 0.09 - 25.2 2.59 = -0.068
Koepisyent ng ugnayan rxy = cov(x,y)/σ(x)&sigma(y) = -0.068/(11.531*0.801) = -0.00736

Halimbawa 2 . Ang data ng pagpoproseso ng istatistika ng impormasyon tungkol sa dalawang tagapagpahiwatig X at Y ay makikita sa talahanayan ng ugnayan. Kailangan:

  1. isulat ang serye ng pamamahagi para sa X at Y at kalkulahin ang mga sample na paraan at sample na mga standard deviations para sa kanila;
  2. sumulat ng conditional distribution series Y/x at kalkulahin ang conditional averages Y/x;
  3. graphical na ilarawan ang pag-asa ng mga conditional na average na Y/x sa mga halaga ng X;
  4. kalkulahin ang sample correlation coefficient Y sa X;
  5. sumulat ng isang sample na direktang regression equation;
  6. kumakatawan sa geometrical na data ng talahanayan ng ugnayan at bumuo ng isang linya ng pagbabalik.
Desisyon. Ang isang nakaayos na pares (X,Y) ng mga random na variable X at Y ay tinatawag na isang dalawang-dimensional na random na variable, o isang random na vector ng isang dalawang-dimensional na espasyo. Ang dalawang-dimensional na random variable (X,Y) ay tinatawag ding sistema ng mga random na variable X at Y.
Ang hanay ng lahat ng posibleng halaga ng isang discrete random variable na may kanilang mga probabilities ay tinatawag na distribution law ng random variable na ito.
Ang isang discrete two-dimensional random variable (X,Y) ay itinuturing na ibinigay kung ang batas ng pamamahagi nito ay kilala:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Ang mga kaganapan (X=x i , Y=y j) ay bumubuo ng kumpletong pangkat ng mga kaganapan, kaya ang kabuuan ng lahat ng probabilidad p ij ( i=1,2...,n, j=1,2...,m) na nakasaad sa talahanayan ay katumbas ng 1.
1. Dependence ng random variables X at Y.
Hanapin ang serye ng pamamahagi X at Y.
Gamit ang formula ∑P(x i,y j) = p i(j=1..n), hanapin ang serye ng pamamahagi X. Pag-asa sa matematika M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42.3
Dispersion D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42.3 2 = 99.71
Standard deviation σ(y).

Dahil, P(X=11,Y=20) = 2≠2 6, pagkatapos ay ang mga random na variable X at Y umaasa.
2. Batas sa pamamahagi ng kondisyon X.
Batas sa pamamahagi ng kondisyon X(Y=20).
P(X=11/Y=20) = 2/6 = 0.33
P(X=16/Y=20) = 4/6 = 0.67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
May kundisyon na inaasahan M = 11*0.33 + 16*0.67 + 21*0 + 26*0 + 31*0 + 36*0 = 14.33
Conditional variance D = 11 2 *0.33 + 16 2 *0.67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14.33 2 = 5.56
Kondisyon na batas sa pamamahagi X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0.67
P(X=21/Y=30) = 3/9 = 0.33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
May kundisyon na inaasahan M = 11*0 + 16*0.67 + 21*0.33 + 26*0 + 31*0 + 36*0 = 17.67
Conditional variance D = 11 2 *0 + 16 2 *0.67 + 21 2 *0.33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17.67 2 = 5.56
Batas sa pamamahagi ng kondisyon X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0.11
P(X=26/Y=40) = 45/55 = 0.82
P(X=31/Y=40) = 4/55 = 0.0727
P(X=36/Y=40) = 0/55 = 0
May kundisyon na inaasahan M = 11*0 + 16*0 + 21*0.11 + 26*0.82 + 31*0.0727 + 36*0 = 25.82
Conditional variance D = 11 2 *0 + 16 2 *0 + 21 2 *0.11 + 26 2 *0.82 + 31 2 *0.0727 + 36 2 *0 - 25.82 2 = 4.51
Batas sa pamamahagi ng kondisyon X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0.13
P(X=26/Y=50) = 8/16 = 0.5
P(X=31/Y=50) = 6/16 = 0.38
P(X=36/Y=50) = 0/16 = 0
May kundisyon na inaasahan M = 11*0 + 16*0 + 21*0.13 + 26*0.5 + 31*0.38 + 36*0 = 27.25
Conditional variance D = 11 2 *0 + 16 2 *0 + 21 2 *0.13 + 26 2 *0.5 + 31 2 *0.38 + 36 2 *0 - 27.25 2 = 10.94
Batas sa pamamahagi ng kondisyon X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0.29
P(X=31/Y=60) = 7/14 = 0.5
P(X=36/Y=60) = 3/14 = 0.21
May kundisyon na inaasahan M = 11*0 + 16*0 + 21*0 + 26*0.29 + 31*0.5 + 36*0.21 = 30.64
Conditional variance D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0.29 + 31 2 *0.5 + 36 2 *0.21 - 30.64 2 = 12.37
3. Batas sa pamamahagi ng kondisyon Y.
Batas sa pamamahagi ng kondisyon Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
May kundisyon na inaasahan M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Conditional variance D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Kondisyon na batas sa pamamahagi Y(X=16).
P(Y=20/X=16) = 4/10 = 0.4
P(Y=30/X=16) = 6/10 = 0.6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
May kundisyon na inaasahan M = 20*0.4 + 30*0.6 + 40*0 + 50*0 + 60*0 = 26
Conditional variance D = 20 2 *0.4 + 30 2 *0.6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Batas sa pamamahagi ng may kundisyon Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0.27
P(Y=40/X=21) = 6/11 = 0.55
P(Y=50/X=21) = 2/11 = 0.18
P(Y=60/X=21) = 0/11 = 0
May kundisyon na inaasahan M = 20*0 + 30*0.27 + 40*0.55 + 50*0.18 + 60*0 = 39.09
Conditional variance D = 20 2 *0 + 30 2 *0.27 + 40 2 *0.55 + 50 2 *0.18 + 60 2 *0 - 39.09 2 = 44.63
Batas sa pamamahagi ng may kundisyon Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0.79
P(Y=50/X=26) = 8/57 = 0.14
P(Y=60/X=26) = 4/57 = 0.0702
May kundisyon na inaasahan M = 20*0 + 30*0 + 40*0.79 + 50*0.14 + 60*0.0702 = 42.81
Conditional variance D = 20 2 *0 + 30 2 *0 + 40 2 *0.79 + 50 2 *0.14 + 60 2 *0.0702 - 42.81 2 = 34.23
Batas sa pamamahagi ng may kundisyon Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0.24
P(Y=50/X=31) = 6/17 = 0.35
P(Y=60/X=31) = 7/17 = 0.41
May kundisyon na inaasahan M = 20*0 + 30*0 + 40*0.24 + 50*0.35 + 60*0.41 = 51.76
Conditional variance D = 20 2 *0 + 30 2 *0 + 40 2 *0.24 + 50 2 *0.35 + 60 2 *0.41 - 51.76 2 = 61.59
Batas sa pamamahagi ng may kundisyon Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
May kundisyon na inaasahan M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Conditional variance D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
covariance.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 1 + 40 50 3 6 + 60 31 7 + 60 36 3)/100 - 25.3 42.3 = 38.11
Kung ang mga random na variable ay independyente, kung gayon ang kanilang covariance ay zero. Sa aming kaso cov(X,Y) ≠ 0.
Koepisyent ng ugnayan.


Ang linear regression equation mula y hanggang x ay:

Ang linear regression equation mula sa x hanggang y ay:

Hanapin ang mga kinakailangang numerical na katangian.
Ang ibig sabihin ng sample ay:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42.3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25.3
pagpapakalat:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42.3 2 = 99.71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25.3 2 = 24.01
Saan natin nakukuha ang mga karaniwang paglihis:
σ x = 9.99 at σ y = 4.9
at covariance:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 1 + 40 50 3 6 + 60 31 7 + 60 36 3)/100 - 42.3 25.3 = 38.11
Tukuyin natin ang koepisyent ng ugnayan:


Isulat natin ang mga equation ng mga linya ng regression y(x):

at pagkalkula, nakukuha namin:
yx = 0.38x + 9.14
Isulat natin ang mga equation ng regression lines x(y):

at pagkalkula, nakukuha namin:
x y = 1.59 y + 2.15
Kung bubuo tayo ng mga puntos na tinukoy ng talahanayan at ng mga linya ng regression, makikita natin na ang parehong mga linya ay dumadaan sa puntong may mga coordinate (42.3; 25.3) at ang mga punto ay matatagpuan malapit sa mga linya ng regression.
Kahalagahan ng koepisyent ng ugnayan.

Ayon sa talahanayan ng Mag-aaral na may antas ng kahalagahan α=0.05 at antas ng kalayaan k=100-m-1 = 98 makikita natin ang t crit:
t crit (n-m-1;α/2) = (98;0.025) = 1.984
kung saan ang m = 1 ay ang bilang ng mga variable na nagpapaliwanag.
Kung ang t obs > t ay kritikal, kung gayon ang nakuhang halaga ng koepisyent ng ugnayan ay kinikilala bilang makabuluhan (ang null hypothesis na nagsasaad na ang koepisyent ng ugnayan ay katumbas ng zero ay tinanggihan).
Dahil t obl > t crit, tinatanggihan namin ang hypothesis na ang correlation coefficient ay katumbas ng 0. Sa madaling salita, ang koepisyent ng ugnayan ay makabuluhan sa istatistika.

Mag-ehersisyo. Ang bilang ng mga hit ng mga pares ng mga halaga ng mga random na variable X at Y sa kaukulang mga pagitan ay ibinibigay sa talahanayan. Mula sa mga datos na ito, hanapin ang sample correlation coefficient at ang mga sample na equation ng mga straight regression lines Y sa X at X sa Y .
Desisyon

Halimbawa. Ang probability distribution ng isang two-dimensional random variable (X, Y) ay ibinibigay ng isang table. Hanapin ang mga batas ng pamamahagi ng mga dami ng bahagi X, Y at ang koepisyent ng ugnayan p(X, Y).
I-download ang Solusyon

Mag-ehersisyo. Ang isang dalawang-dimensional na discrete value (X, Y) ay ibinibigay ng isang batas sa pamamahagi. Hanapin ang mga batas sa pamamahagi ng mga bahagi ng X at Y, covariance at coefficient ng ugnayan.