Distribuição uniforme de uma variável aleatória bidimensional. Sistemas de variáveis ​​aleatórias

Definição 2.7. é um par de números aleatórios (X, Y), ou um ponto no plano de coordenadas (Fig. 2.11).

Arroz. 2.11.

Uma variável aleatória bidimensional é um caso especial de uma variável aleatória multidimensional, ou vetor aleatório.

Definição 2.8. Vetor aleatório -é uma função aleatória?,(/) com um conjunto finito de valores de argumentos possíveis t, cujo valor para qualquer valor té uma variável aleatória.

Uma variável aleatória bidimensional é chamada de contínua se suas coordenadas forem contínuas e discreta se suas coordenadas forem discretas.

Definir a lei de distribuição de variáveis ​​aleatórias bidimensionais significa estabelecer uma correspondência entre seus valores possíveis e a probabilidade desses valores. De acordo com as formas de ajuste, as variáveis ​​aleatórias são divididas em contínuas e discretas, embora existam formas gerais de definir a lei de distribuição de qualquer RV.

Variável aleatória bidimensional discreta

Uma variável aleatória bidimensional discreta é especificada usando uma tabela de distribuição (Tabela 2.1).

Tabela 2.1

Tabela de alocação (alocação conjunta) CB ( X, VOCÊ)

Os elementos da tabela são definidos pela fórmula

Propriedades do elemento da tabela de distribuição:

A distribuição sobre cada coordenada é chamada unidimensional ou marginal:

R 1> = P(X =.d,) - distribuição marginal de SW X;

p^2) = P(Y=y,)- distribuição marginal de SV U.

Comunicação da distribuição conjunta de CB X e Y, dado pelo conjunto de probabilidades [p() ), eu = 1,..., n,j = 1,..., t(tabela de distribuição) e distribuição marginal.


Da mesma forma para SV U p-2)= X p, g

Problema 2.14. Dado:

Variável aleatória 2D contínua

/(X, y)dxdy- elemento de probabilidade para uma variável aleatória bidimensional (X, Y) - probabilidade de acertar uma variável aleatória (X, Y) em um retângulo com lados cbc, dy no dx, dy -* 0:

f(x, y) - densidade de distribuição variável aleatória bidimensional (X, Y). Tarefa /(x, e) fornecemos informações completas sobre a distribuição de uma variável aleatória bidimensional.

As distribuições marginais são especificadas da seguinte forma: para X - pela densidade de distribuição de CB X/,(x); em S- Densidade de distribuição SV f>(s).

Definir a lei de distribuição de uma variável aleatória bidimensional pela função de distribuição

Uma maneira universal de especificar a lei de distribuição para uma variável aleatória bidimensional discreta ou contínua é a função de distribuição F(x, y).

Definição 2.9. Função de distribuição F(x, y)- probabilidade de ocorrência conjunta de eventos (Xy), ou seja, F(x0,y n) = = P(X y), lançadas no plano de coordenadas, caem em um quadrante infinito com um vértice no ponto M(x 0, você e)(na área sombreada na Fig. 2.12).

Arroz. 2.12. Ilustração da função de distribuição F( x, y)

Propriedades da função F(x, y)

  • 1) 0 1;
  • 2) F(-o,-oo) = F(x,-oo) = F(-oo, e) = 0; F( oo, oo) = 1;
  • 3) F(x, y)- não decrescente em cada argumento;
  • 4) F(x, y) - esquerda e inferior contínuas;
  • 5) consistência das distribuições:

F(x, X: F(x, oo) = F,(x); F(y, oo) - distribuição marginal sobre S F( oo, y) = F2(y). Conexão /(x, y) com F(x, y):

Relação entre densidade articular e densidade marginal. Dana f(x, y). Obtemos as densidades de distribuição marginal f(x),f2(y)".


O caso de coordenadas independentes de uma variável aleatória bidimensional

Definição 2.10. SO X e Yindependente(nc) se quaisquer eventos associados a cada uma dessas RVs forem independentes. Da definição de nc CB segue-se:

  • 1 ) Pij = p X) pf
  • 2 )F(x,y) = Fl(x)F2(y).

Acontece que para SWs independentes X e S concluído e

3 )f(x,y) = J(x)f,(y).

Vamos provar que para SWs independentes X e Y2) 3). Prova, a) Seja 2), ou seja,

ao mesmo tempo F(x,y) = f J f(u,v)dudv, de onde segue 3);

b) deixe 3 agora valer, então


Essa. verdade 2).

Vamos considerar as tarefas.

Problema 2.15. A distribuição é dada pela tabela a seguir:

Construímos distribuições marginais:

Nós temos P(X = 3, U = 4) = 0,17 * P(X = 3) P (Y \u003d 4) \u003d 0,1485 => => SV X e Dependentes.

Função de distribuição:


Problema 2.16. A distribuição é dada pela tabela a seguir:

Nós temos Ptl = 0,2 0,3 = 0,06; P 12 \u003d 0,2? 0,7 = 0,14; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0,8 0,7 = 0,56 => SO X e S nz.

Problema 2.17. Dana /(x, e) = 1/st exp| -0,5(d"+ 2xy + 5d/2)]. Encontrar Oh) e /Ay)-

Decisão

(calcule você mesmo).

Muitas vezes, ao estudar variáveis ​​aleatórias, é preciso lidar com duas, três ou até mais variáveis ​​aleatórias. Por exemplo, a variável aleatória bidimensional $\left(X,\Y\right)$ descreverá o ponto de acerto do projétil, onde as variáveis ​​aleatórias $X,\Y$ são a abcissa e a ordenada, respectivamente. O desempenho de um aluno aleatório durante a sessão é caracterizado por uma variável aleatória $n$-dimensional $\left(X_1,\ X_2,\ \dots ,\ X_n\right)$, onde as variáveis ​​aleatórias são $X_1,\ X_2 ,\ \dots ,\ X_n $ - estas são as notas colocadas no livro de notas em várias disciplinas.

O conjunto de $n$ variáveis ​​aleatórias $\left(X_1,\ X_2,\ \dots ,\ X_n\right)$ é chamado vetor aleatório. Restringimo-nos ao caso $\left(X,\Y\right)$.

Seja $X$ uma variável aleatória discreta com valores possíveis $x_1,x_2,\ \dots ,\ x_n$, e $Y$ uma variável aleatória discreta com valores possíveis $y_1,y_2,\ \dots , \y_n$.

Então uma variável aleatória bidimensional discreta $\left(X,\Y\right)$ pode assumir os valores $\left(x_i,\y_j\right)$ com probabilidades $p_(ij)=P\left( \left(X=x_i \right)\left(Y=y_j\right)\right)=P\left(X=x_i\right)P\left(Y=y_j|X=x_i\right)$. Aqui $P\left(Y=y_j|X=x_i\right)$ é a probabilidade condicional de que a variável aleatória $Y$ assuma o valor $y_j$ dado que a variável aleatória $X$ assuma o valor $x_i$.

A probabilidade de que a variável aleatória $X$ tenha o valor $x_i$ é igual a $p_i=\sum_j(p_(ij))$. A probabilidade de que a variável aleatória $Y$ tenha o valor $y_j$ é igual a $q_j=\sum_i(p_(ij))$.

$$P\left(X=x_i|Y=y_j\right)=((P\left(\left(X=x_i\right)\left(Y=y_j\right)\right))\over (P\ left(Y=y_j\right)))=((p_(ij))\over (q_j)).$$

$$P\left(Y=y_j|X=x_i\right)=((P\left(\left(X=x_i\right)\left(Y=y_j\right)\right))\over (P\ left(X=x_i\right)))=((p_(ij))\over (p_i)).$$

Exemplo 1 . A distribuição de uma variável aleatória bidimensional é dada:

$\begin(array)(|c|c|)
\hlinha
X\barra invertida Y & 2 & 3 \\
\hlinha
-1 & 0,15 & 0,25 \\
\hlinha
0 & 0,28 & 0,13 \\
\hlinha
1 & 0,09 & 0,1 \\
\hlinha
\end(matriz)$

Vamos definir as leis de distribuição para as variáveis ​​aleatórias $X$ e $Y$. Vamos encontrar as distribuições condicionais da variável aleatória $X$ na condição $Y=2$ e da variável aleatória $Y$ na condição $X=0$.

Vamos preencher a tabela a seguir:

$\begin(array)(|c|c|)
\hlinha
X\barra invertida Y & 2 & 3 & p_i & p_(ij)/q_1 \\
\hlinha
-1 & 0,15 & 0,25 & 0,4 & 0,29 \\
\hlinha
0 & 0,28 & 0,13 & 0,41 & 0,54 \\
\hlinha
1 & 0,09 & 0,1 & 0,19 & 0,17 \\
\hlinha
q_j & 0,52 & 0,48 & 1 & \\
\hlinha
p_(ij)/p_2 & 0,68 & 0,32 & & \\
\hlinha
1 & 0,09 & 0,1 \\
\hlinha
\end(matriz)$

Vamos explicar como a tabela é preenchida. Os valores das três primeiras colunas das quatro primeiras linhas são retirados da condição. A soma dos números das colunas $2$th e $3$th da linha $2$th ($3$th) é indicada na coluna $4$th da linha $2$th ($3$th). A soma dos números nas colunas $2$th e $3$th da linha $4$th é indicada na coluna $4$th da linha $4$th.

A soma dos números nas linhas $2$th, $3$th e $4$th da coluna $2$th ($3$th) é escrita na linha $5$th da coluna $2$th ($3$th). Cada número na coluna $2$th é dividido por $q_1=0.52$, o resultado é arredondado para duas casas decimais e escrito na coluna $5$th. Os números das colunas $2$th e $3$th da linha $3$th são divididos por $p_2=0.41$, o resultado é arredondado para duas casas decimais e escrito na última linha.

Então a lei de distribuição da variável aleatória $X$ tem a seguinte forma.

$\begin(array)(|c|c|)
\hlinha
X & -1 & 0 & 1 \\
\hlinha
p_i & 0,4 & 0,41 & 0,19 \\
\hlinha
\end(matriz)$

A lei da distribuição da variável aleatória $Y$.

$\begin(array)(|c|c|)
\hlinha
Y & 2 & 3 \\
\hlinha
q_j & 0,52 & 0,48 \\
\hlinha
\end(matriz)$

A distribuição condicional da variável aleatória $X$ sob a condição $Y=2$ tem a seguinte forma.

$\begin(array)(|c|c|)
\hlinha
X & -1 & 0 & 1 \\
\hlinha
p_(ij)/q_1 & 0,29 & 0,54 & 0,17 \\
\hlinha
\end(matriz)$

A distribuição condicional da variável aleatória $Y$ sob a condição $X=0$ tem a seguinte forma.

$\begin(array)(|c|c|)
\hlinha
Y & 2 & 3 \\
\hlinha
p_(ij)/p_2 & 0,68 & 0,32 \\
\hlinha
\end(matriz)$

Exemplo 2 . Temos seis lápis, dois dos quais são vermelhos. Colocamos os lápis em duas caixas. Peças de $2$ são colocadas na primeira e duas na segunda. $X$ é o número de lápis vermelhos na primeira caixa e $Y$ na segunda. Escreva a lei de distribuição para o sistema de variáveis ​​aleatórias $(X,\Y)$.

Seja a variável aleatória discreta $X$ o número de lápis vermelhos na primeira caixa e a variável aleatória discreta $Y$ o número de lápis vermelhos na segunda caixa. Os valores possíveis das variáveis ​​aleatórias $X,\Y$ são respectivamente $X:0,\ 1,\ 2$, $Y:0,\ 1,\ 2$. Então uma variável aleatória bidimensional discreta $\left(X,\Y\right)$ pode assumir os valores $\left(x,\y\right)$ com probabilidades $P=P\left(\left( X=x\right) \times \left(Y=y\right)\right)=P\left(X=x\right)\times P\left(Y=y|X=x\right)$, onde $P\left(Y =y|X=x\right)$ - a probabilidade condicional de que a variável aleatória $Y$ assuma o valor $y$, desde que a variável aleatória $X$ assuma o valor $x$. Vamos representar a correspondência entre os valores $\left(x,\y\right)$ e as probabilidades $P\left(\left(X=x\right)\times \left(Y=y\right) \right)$ conforme as tabelas a seguir.

$\begin(array)(|c|c|)
\hlinha
X\barra invertida Y & 0 & 1 & 2 \\
\hlinha
0 & ((1)\acima (15)) & ((4)\acima (15)) & ((1)\acima (15)) \\
\hlinha
1 & ((4)\acima de (15)) & ((4)\acima de (15)) & 0 \\
\hlinha
2 & ((1)\mais de (15)) & 0 & 0 \\
\hlinha
\end(matriz)$

As linhas de tal tabela indicam os valores $X$, e as colunas indicam os valores $Y$, então as probabilidades $P\left(\left(X=x\right)\times \left(Y =y\right)\right)$ são indicados na interseção da linha e coluna correspondentes. Vamos calcular as probabilidades usando a definição clássica de probabilidade e o teorema do produto de probabilidades de eventos dependentes.

$$P\left(\left(X=0\right)\left(Y=0\right)\right)=((C^2_4)\over (C^2_6))\cdot ((C^2_2) \over (C^2_4))=((6)\over (15))\cdot ((1)\over (6))=((1)\over (15));$$

$$P\left(\left(X=0\right)\left(Y=1\right)\right)=((C^2_4)\over (C^2_6))\cdot ((C^1_2\ cdot C^1_2)\over (C^2_4))=((6)\over (15))\cdot ((2\cdot 2)\over (6))=((4)\over (15)) ;$$

$$P\left(\left(X=0\right)\left(Y=2\right)\right)=((C^2_4)\over (C^2_6))\cdot ((C^2_2) \over (C^2_4))=((6)\over (15))\cdot ((1)\over (6))=((1)\over (15));$$

$$P\left(\left(X=1\right)\left(Y=0\right)\right)=((C^1_2\cdot C^1_4)\over (C^2_6))\cdot ( (C^2_3)\over (C^2_4))=((2\cdot 4)\over (15))\cdot ((3)\over (6))=((4)\over (15)) ;$$

$$P\left(\left(X=1\right)\left(Y=1\right)\right)=((C^1_2\cdot C^1_4)\over (C^2_6))\cdot ( (C^1_1\cdot C^1_3)\over (C^2_4))=((2\cdot 4)\over (15))\cdot ((1\cdot 3)\over (6))=(( 4)\mais(15));$$

$$P\left(\left(X=2\right)\left(Y=0\right)\right)=((C^2_2)\over (C^2_6))\cdot ((C^2_4) \over (C^2_4))=((1)\over (15))\cdot 1=((1)\over (15)).$$

Como na lei de distribuição (tabela resultante) todo o conjunto de eventos forma um grupo completo de eventos, a soma das probabilidades deve ser igual a 1. Vamos verificar:

$$\sum_(i,\j)(p_(ij))=((1)\sobre (15))+((4)\sobre (15))+((1)\over (15))+ ((4)\acima (15))+((4)\acima (15))+((1)\acima (15))=1.$$

Função de distribuição de uma variável aleatória bidimensional

função de distribuição Uma variável aleatória bidimensional $\left(X,\Y\right)$ é uma função $F\left(x,\y\right)$, que para quaisquer números reais $x$ e $y$ é igual a a probabilidade de dois eventos $ \left\(X< x\right\}$ и $\left\{Y < y\right\}$. Таким образом, по определению

$$F\esquerda(x,\y\direita)=P\esquerda\(X< x,\ Y < y\right\}.$$

Para uma variável aleatória bidimensional discreta, a função de distribuição é encontrada somando todas as probabilidades $p_(ij)$ para as quais $x_i< x,\ y_j < y$, то есть

$$F\esquerda(x,\y\direita)=\sum_(x_i< x}{\sum_{y_j < y}{p_{ij}}}.$$

Propriedades da função de distribuição de uma variável aleatória bidimensional.

1 . A função de distribuição $F\left(x,\y\right)$ é limitada, ou seja, $0\le F\left(x,\ y\right)\le 1$.

2 . $F\left(x,\ y\right)$ não decrescente para cada um de seus argumentos com o outro fixo, ou seja, $F\left(x_2,\ y\right)\ge F\left(x_1,\ y\ right )$ para $x_2>x_1$, $F\left(x,\ y_2\right)\ge F\left(x,\ y_1\right)$ para $y_2>y_1$.

3 . Se pelo menos um dos argumentos tiver o valor $-\infty $, então a função de distribuição será igual a zero, ou seja, $F\left(-\infty ,\y\right)=F\left(x,\ - \infty \right ),\ F\left(-\infty ,\ -\infty \right)=0$.

4 . Se ambos os argumentos assumem o valor $+\infty $, então a função de distribuição será igual a $1$, ou seja, $F\left(+\infty ,\ +\infty \right)=1$.

5 . No caso em que exatamente um dos argumentos assume o valor $+\infty $, a função de distribuição $F\left(x,\y\right)$ torna-se a função de distribuição da variável aleatória correspondente ao outro elemento, ou seja, $ F\left(x ,\ +\infty \right)=F_1\left(x\right)=F_X\left(x\right),\ F\left(+\infty ,\ y\right)=F_y\left (y\direita) =F_Y\esquerda(y\direita)$.

6 . $F\left(x,\ y\right)$ é deixado contínuo para cada um de seus argumentos, ou seja,

$$(\mathop(lim)_(x\to x_0-0) F\left(x,\ y\right)\ )=F\left(x_0,\ y\right),\ (\mathop(lim) _(y\to y_0-0) F\left(x,\ y\right)\ )=F\left(x,\ y_0\right).$$

Exemplo 3 . Seja uma variável aleatória bidimensional discreta $\left(X,\Y\right)$ ser dada por uma série de distribuição.

$\begin(array)(|c|c|)
\hlinha
X\barra invertida Y & 0 & 1 \\
\hlinha
0 & ((1)\acima de (6)) & ((2)\acima de (6)) \\
\hlinha
1 & ((2)\acima de (6)) & ((1)\acima de (6)) \\
\hlinha
\end(matriz)$

Então a função de distribuição:

$F(x,y)=\left\(\begin(matriz)
0,\ at\ x\le 0,\ y\le 0 \\
0,\at\x\le 0,\0< y\le 1 \\
0,\ para\ x\le 0,\ y>1 \\
0,\ em\ 0< x\le 1,\ y\le 0 \\
((1)\sobre (6)),\at\ 0< x\le 1,\ 0 < y\le 1 \\
((1)\sobre (6))+((2)\sobre (6))=((1)\sobre (2)),\ quando\ 0< x\le 1,\ y>1 \\
0,\ para\ x>1,\ y\le 0 \\
((1)\sobre (6))+((2)\sobre (6))=((1)\sobre (2)),\ quando\ x>1,\ 0< y\le 1 \\
((1)\sobre (6))+((2)\sobre (6))+((2)\sobre (6))+((1)\sobre (6))=1,\ para\ x >1,\y>1\\
\end(matriz)\right.$

distribuição discreta bivariada aleatória

Muitas vezes o resultado do experimento é descrito por várias variáveis ​​aleatórias: . Por exemplo, o clima em um determinado local em uma determinada hora do dia pode ser caracterizado pelas seguintes variáveis ​​aleatórias: X 1 - temperatura, X 2 - pressão, X 3 - umidade do ar, X 4 - velocidade do vento.

Neste caso, fala-se de uma variável aleatória multidimensional ou de um sistema de variáveis ​​aleatórias.

Considere uma variável aleatória bidimensional cujos valores possíveis são pares de números. Geometricamente, uma variável aleatória bidimensional pode ser interpretada como um ponto aleatório em um plano.

Se os componentes X e S são variáveis ​​aleatórias discretas, então é uma variável aleatória bidimensional discreta, e se X e S são contínuas, então é uma variável aleatória bidimensional contínua.

A lei da distribuição de probabilidade de uma variável aleatória bidimensional é a correspondência entre os valores possíveis e suas probabilidades.

A lei de distribuição de uma variável aleatória discreta bidimensional pode ser dada na forma de uma tabela de dupla entrada (ver Tabela 6.1), onde é a probabilidade de que o componente X assumiu o significado x eu, e o componente S- significado y j .

Tabela 6.1.1.

y 1

y 2

y j

y m

x 1

p 11

p 12

p 1j

p 1m

x 2

p 21

p 22

p 2j

p 2m

x eu

p i1

p i2

p eu j

p Eu estou

x n

p n1

p n2

p nj

p nm

Como os eventos formam um grupo completo de eventos incompatíveis aos pares, a soma das probabilidades é igual a 1, ou seja,

Na tabela 6.1 você pode encontrar as leis de distribuição de componentes unidimensionais X e S.

Exemplo 6.1.1 . Encontre as leis de distribuição de componentes X e Y, se a distribuição de uma variável aleatória bidimensional for dada na forma da tabela 6.1.2.

Tabela 6.1.2.

Se fixarmos o valor de um dos argumentos, por exemplo, a distribuição resultante da quantidade Xé chamada de distribuição condicional. A distribuição condicional é definida de forma semelhante S.

Exemplo 6.1.2 . De acordo com a distribuição de uma variável aleatória bidimensional dada na Tabela. 6.1.2, encontre: a) a lei de distribuição condicional do componente X dado que; b) lei de distribuição condicional S providenciou que.

Decisão. Probabilidades condicionais de componentes X e S calculado por fórmulas

Lei de distribuição condicional X condição tem a forma

O controle: .

A lei de distribuição de uma variável aleatória bidimensional pode ser dada como funções de distribuição, que determina para cada par de números a probabilidade de que X assume um valor inferior a X, e em que S assume um valor inferior a y:

Geometricamente, a função significa a probabilidade de um ponto aleatório cair em um quadrado infinito com um vértice no ponto (Fig. 6.1.1).

Vamos anotar as propriedades.

  • 1. O intervalo da função - , ou seja, .
  • 2. Função - função não decrescente para cada argumento.
  • 3. Existem relações limitantes:

Em , a função de distribuição do sistema torna-se igual à função de distribuição do componente X, ou seja .

Da mesma maneira, .

Sabendo, você pode encontrar a probabilidade de um ponto aleatório cair dentro do retângulo ABCD.

Nomeadamente,

Exemplo 6.1.3. Variável aleatória discreta bivariada definida pela tabela de distribuição

Encontre a função de distribuição.

Decisão. Valor no caso de componentes discretos X e Sé encontrado pela soma de todas as probabilidades com índices eu e j, para qual, . Então, se e, então (os eventos e são impossíveis). Da mesma forma, obtemos:

se e então;

se e então;

se e então;

se e então;

se e então;

se e então;

se e então;

se e então;

se e então.

Os resultados obtidos são apresentados na forma de uma tabela (6.1.3) de valores:

Por bidimensional contínuo variável aleatória, o conceito de densidade de probabilidade é introduzido

A densidade de probabilidade geométrica é uma superfície de distribuição no espaço

Uma densidade de probabilidade bidimensional tem as seguintes propriedades:

3. A função de distribuição pode ser expressa em termos da fórmula

4. A probabilidade de acertar uma variável aleatória contínua na área é igual a

5. De acordo com a propriedade (4) da função, as fórmulas ocorrem:

Exemplo 6.1.4. A função de distribuição de uma variável aleatória bidimensional é dada

Um par ordenado (X, Y) de variáveis ​​aleatórias X e Y é chamado de variável aleatória bidimensional, ou um vetor aleatório de um espaço bidimensional. Uma variável aleatória bidimensional (X,Y) também é chamada de sistema de variáveis ​​aleatórias X e Y. O conjunto de todos os valores possíveis de uma variável aleatória discreta com suas probabilidades é chamado de lei de distribuição dessa variável aleatória. Uma variável aleatória bidimensional discreta (X, Y) é considerada dada se sua lei de distribuição for conhecida:

P(X=xi, Y=yj) = pij, i=1,2...,n, j=1,2...,m

Atribuição de serviço. Usando o serviço, de acordo com uma determinada lei de distribuição, você pode encontrar:

  • séries de distribuição X e Y, expectativa matemática M[X], M[Y], variância D[X], D[Y];
  • covariância cov(x,y), coeficiente de correlação r x,y , série de distribuição condicional X, expectativa condicional M;
Além disso, é dada uma resposta à pergunta: "As variáveis ​​aleatórias X e Y são dependentes?".

Instrução. Especifique a dimensão da matriz de distribuição de probabilidade (número de linhas e colunas) e sua forma. A solução resultante é salva em um arquivo do Word.

Exemplo 1. Uma variável aleatória discreta bidimensional tem uma tabela de distribuição:

S/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Encontre o valor de q e o coeficiente de correlação dessa variável aleatória.

Decisão. Encontramos o valor q da condição Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. De onde q = 0,09

Usando a fórmula ∑P(x eu,y j) = p eu(j=1..n), encontre a série de distribuição X.

Expectativa matemática M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Dispersão D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Desvio padrãoσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

covariância cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 20 0,02 + 1 30 0,02 + 2 30 0,11 + 3 30 0,08 + 4 30 0,01 + 1 40 0,03 + 2 40 0,11 + 3 40 0,05 + 4 40 0,09 - 25,2 2,59 = -0,068
Coeficiente de correlação rxy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Exemplo 2 . Os dados do processamento estatístico da informação referente a dois indicadores X e Y estão refletidos na tabela de correlação. Requerido:

  1. escrever séries de distribuição para X e Y e calcular médias amostrais e desvios padrão amostrais para elas;
  2. escreva a série de distribuição condicional Y/x e calcule as médias condicionais Y/x;
  3. representar graficamente a dependência das médias condicionais Y/x nos valores de X;
  4. calcular o coeficiente de correlação amostral Y em X;
  5. escreva uma equação de regressão direta amostral;
  6. representar geometricamente os dados da tabela de correlação e construir uma linha de regressão.
Decisão. Um par ordenado (X,Y) de variáveis ​​aleatórias X e Y é chamado de variável aleatória bidimensional ou vetor aleatório de um espaço bidimensional. Uma variável aleatória bidimensional (X,Y) também é chamada de sistema de variáveis ​​aleatórias X e Y.
O conjunto de todos os valores possíveis de uma variável aleatória discreta com suas probabilidades é chamado de lei de distribuição dessa variável aleatória.
Uma variável aleatória bidimensional discreta (X,Y) é considerada dada se sua lei de distribuição for conhecida:
P(X=xi, Y=yj) = pij, i=1,2...,n,j=1,2...,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Eventos (X=x i , Y=y j) formam um grupo completo de eventos, então a soma de todas as probabilidades p ij ( i=1,2...,n,j=1,2...,m) indicado na tabela é igual a 1.
1. Dependência das variáveis ​​aleatórias X e Y.
Encontre as séries de distribuição X e Y.
Usando a fórmula ∑P(x eu,y j) = p eu(j=1..n), encontre a série de distribuição X. Expectativa matemática M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Dispersão D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Desvio padrão σ(y).

Como P(X=11,Y=20) = 2≠2 6, então as variáveis ​​aleatórias X e Y dependente.
2. Lei de distribuição condicional X.
Lei de distribuição condicional X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Expectativa condicional M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Variação condicional D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Lei de distribuição condicional X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Expectativa condicional M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Variação condicional D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Lei de distribuição condicional X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Expectativa condicional M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Variação condicional D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Lei de distribuição condicional X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Expectativa condicional M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Variação condicional D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Lei de distribuição condicional X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Expectativa condicional M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Variação condicional D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Lei de distribuição condicional Y.
Lei de distribuição condicional Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Expectativa condicional M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Variação condicional D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Lei de distribuição condicional Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Expectativa condicional M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Variação condicional D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Lei de distribuição condicional Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Expectativa condicional M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Variação condicional D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Lei de distribuição condicional Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Expectativa condicional M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Variação condicional D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Lei de distribuição condicional Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Expectativa condicional M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Variação condicional D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Lei de distribuição condicional Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Expectativa condicional M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Variação condicional D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
covariância.
cov(X,Y) = M - M[X] M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Se as variáveis ​​aleatórias são independentes, então sua covariância é zero. No nosso caso cov(X,Y) ≠ 0.
Coeficiente de correlação.


A equação de regressão linear de y a x é:

A equação de regressão linear de x para y é:

Encontre as características numéricas necessárias.
Amostra significa:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
dispersões:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Onde obtemos os desvios padrão:
σ x = 9,99 e σ y = 4,9
e covariância:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Vamos definir o coeficiente de correlação:


Vamos escrever as equações das linhas de regressão y(x):

e calculando, temos:
x = 0,38 x + 9,14
Vamos escrever as equações das linhas de regressão x(y):

e calculando, temos:
x y = 1,59 y + 2,15
Se construirmos os pontos definidos pela tabela e as linhas de regressão, veremos que ambas as linhas passam pelo ponto de coordenadas (42,3; 25,3) e os pontos estão localizados próximos às linhas de regressão.
Significância do coeficiente de correlação.

De acordo com a tabela de Student com nível de significância α=0,05 e graus de liberdade k=100-m-1 = 98 encontramos t crit:
t crit (n-m-1;α/2) = (98;0,025) = 1,984
onde m = 1 é o número de variáveis ​​explicativas.
Se t obs > t for crítico, então o valor obtido do coeficiente de correlação é reconhecido como significativo (rejeita-se a hipótese nula de que o coeficiente de correlação é igual a zero).
Como t obl > t crit, rejeitamos a hipótese de que o coeficiente de correlação seja igual a 0. Em outras palavras, o coeficiente de correlação é estatisticamente significativo.

Exercício. O número de acertos de pares de valores de variáveis ​​aleatórias X e Y nos intervalos correspondentes são fornecidos na tabela. A partir desses dados, encontre o coeficiente de correlação amostral e as equações amostrais das linhas retas de regressão Y em X e X em Y .
Decisão

Exemplo. A distribuição de probabilidade de uma variável aleatória bidimensional (X, Y) é dada por uma tabela. Encontre as leis de distribuição das quantidades componentes X, Y e o coeficiente de correlação p(X, Y).
Baixar solução

Exercício. O valor discreto bidimensional (X, Y) é dado pela lei de distribuição. Encontre as leis de distribuição dos componentes X e Y, covariância e coeficiente de correlação.