A distribuição normal de uma variável aleatória x tem uma função. Lei de distribuição normal (gaussiana)

Variáveis ​​aleatórias estão associadas a eventos aleatórios. Eventos aleatórios são falados quando é impossível prever inequivocamente o resultado que pode ser obtido sob certas condições.

Suponha que estamos jogando uma moeda comum. Normalmente, o resultado deste procedimento não é exclusivamente certo. Só se pode dizer com certeza que uma de duas coisas acontecerá: ou sairá cara ou coroa. Qualquer um desses eventos será aleatório. Você pode inserir uma variável que descreverá o resultado desse evento aleatório. Obviamente, esta variável terá dois valores discretos: cara e coroa. Como não podemos prever com precisão qual dos dois valores possíveis essa variável assumirá, pode-se argumentar que, neste caso, estamos lidando com variáveis ​​aleatórias.

Suponhamos agora que no experimento estamos avaliando o tempo de reação do sujeito diante da apresentação de algum estímulo. Via de regra, verifica-se que mesmo quando o experimentador toma todas as medidas para padronizar as condições experimentais, minimizando ou mesmo eliminando possíveis variações na apresentação do estímulo, os valores medidos do tempo de reação do sujeito ainda serão diferentes. Nesse caso, eles dizem que o tempo de reação do sujeito é descrito por uma variável aleatória. Como, em princípio, no experimento podemos obter qualquer valor do tempo de reação - o conjunto de valores possíveis do tempo de reação que pode ser obtido como resultado das medições acaba sendo infinito - eles dizem sobre continuidade essa variável aleatória.

Surge a pergunta: existem regularidades no comportamento das variáveis ​​aleatórias? A resposta a esta questão acaba por ser afirmativa.

Assim, se alguém realizar um número infinito de lançamentos da mesma moeda, descobrirá que o número de gotas em cada um dos dois lados da moeda será aproximadamente o mesmo, a menos, é claro, que a moeda seja falsa e não dobrada. . Para enfatizar esse padrão, é introduzido o conceito de probabilidade de um evento aleatório. É claro que no caso de uma moeda ao ar, um dos dois eventos possíveis ocorrerá sem falhas. Isso se deve ao fato de que a probabilidade total desses dois eventos, também chamada de probabilidade total, é de 100%. Se assumirmos que os dois eventos associados ao teste da moeda ocorrem com probabilidades iguais, a probabilidade de cada resultado separadamente, obviamente, é de 50%. Assim, considerações teóricas nos permitem descrever o comportamento de uma determinada variável aleatória. Tal descrição em estatística matemática é denotada pelo termo "distribuição de uma variável aleatória".

A situação é mais complicada com uma variável aleatória que não possui um conjunto de valores bem definido, ou seja, acaba por ser contínua. Mas mesmo neste caso, algumas regularidades importantes de seu comportamento podem ser notadas. Assim, ao realizar um experimento com medição do tempo de reação do sujeito, pode-se notar que diferentes intervalos da duração da reação do sujeito são estimados com diferentes graus de probabilidade. É provável que seja raro que o sujeito reaja muito rapidamente. Por exemplo, em tarefas de decisão semântica, os sujeitos praticamente não respondem com mais ou menos precisão a uma velocidade inferior a 500 ms (1/2 s). Da mesma forma, é improvável que um sujeito seguindo fielmente as instruções do experimentador atrase grandemente sua resposta. Em problemas de decisão semântica, por exemplo, respostas estimadas em mais de 5 s são geralmente consideradas não confiáveis. No entanto, com 100% de certeza, pode-se supor que o tempo de reação do sujeito estará na faixa de 0 a + co. Mas essa probabilidade é a soma das probabilidades de cada valor individual da variável aleatória. Portanto, a distribuição de uma variável aleatória contínua pode ser descrita como uma função contínua y = f (X ).

Se estamos lidando com uma variável aleatória discreta, quando todos os seus valores possíveis são conhecidos antecipadamente, como no exemplo com uma moeda, geralmente não é muito difícil construir um modelo para sua distribuição. Basta introduzir algumas suposições razoáveis, como fizemos no exemplo em consideração. A situação é mais complicada com a distribuição de magnitudes contínuas que assumem um número desconhecido de valores antecipadamente. Claro, se nós, por exemplo, desenvolvemos um modelo teórico que descreve o comportamento de um sujeito em um experimento com medição do tempo de reação ao resolver um problema de solução semântica, poderíamos tentar descrever a distribuição teórica de valores específicos da reação tempo do mesmo sujeito mediante apresentação de um mesmo estímulo. No entanto, isso nem sempre é possível. Portanto, o experimentador pode ser forçado a supor que a distribuição da variável aleatória de seu interesse é descrita por alguma lei já estudada previamente. Na maioria das vezes, embora isso nem sempre seja absolutamente correto, a chamada distribuição normal é usada para esses fins, que funciona como um padrão para a distribuição de qualquer variável aleatória, independentemente de sua natureza. Esta distribuição foi descrita matematicamente pela primeira vez na primeira metade do século XVIII. de Moivre.

Distribuição normal ocorre quando o fenômeno que nos interessa está sujeito à influência de um número infinito de fatores aleatórios que se equilibram. Formalmente, a distribuição normal, como de Moivre mostrou, pode ser descrita pela seguinte relação:

Onde X representa uma variável aleatória de nosso interesse, cujo comportamento estudamos; R é o valor de probabilidade associado a esta variável aleatória; π e e- constantes matemáticas bem conhecidas que descrevem respectivamente a razão entre a circunferência e o diâmetro e a base do logaritmo natural; μ e σ2 são os parâmetros da distribuição normal da variável aleatória, respectivamente, a expectativa matemática e a variância da variável aleatória X.

Para descrever a distribuição normal, torna-se necessário e suficiente definir apenas os parâmetros μ e σ2.

Portanto, se tivermos uma variável aleatória cujo comportamento é descrito pela equação (1.1) com valores arbitrários de μ e σ2, podemos denotá-la como Ν (μ, σ2) sem lembrar de todos os detalhes desta equação.

Arroz. 1.1.

Qualquer distribuição pode ser representada visualmente na forma de um gráfico. Graficamente, a distribuição normal tem a forma de uma curva em forma de sino, cuja forma exata é determinada pelos parâmetros da distribuição, ou seja, esperança matemática e variância. Os parâmetros da distribuição normal podem assumir quase todos os valores, que são limitados apenas pela escala de medição usada pelo experimentador. Em teoria, o valor da esperança matemática pode ser qualquer número do intervalo de números de -∞ a +∞, e a variância pode ser qualquer número não negativo. Portanto, há um número infinito de tipos diferentes de distribuição normal e, consequentemente, um número infinito de curvas que a representam (tendo, no entanto, uma forma semelhante em forma de sino). É claro que é impossível descrever todos eles. No entanto, se os parâmetros de uma determinada distribuição normal são conhecidos, ela pode ser convertida para a chamada distribuição normal unitária, a esperança matemática para a qual é igual a zero, e a variância é igual a um. Essa distribuição normal também é chamada de padrão ou distribuição z. O gráfico da distribuição normal unitária é mostrado na fig. 1.1, de onde é óbvio que o topo da curva em forma de sino da distribuição normal caracteriza o valor da esperança matemática. Outro parâmetro da distribuição normal - a dispersão - caracteriza o grau de "espalhamento" da curva em forma de sino em relação à horizontal (eixo das abcissas).

em comparação com outros tipos de distribuição. A principal característica desta distribuição é que todas as outras leis de distribuição tendem a esta lei com uma repetição infinita do número de tentativas. Como essa distribuição é obtida?

Imagine que, pegando um dinamômetro de mão, você está localizado no local mais movimentado da sua cidade. E a todos que passam, você se oferece para medir sua força apertando o dinamômetro com a mão direita ou esquerda. Você registra cuidadosamente as leituras do dinamômetro. Depois de algum tempo, com um número suficientemente grande de testes, você coloca as leituras do dinamômetro no eixo das abcissas e o número de pessoas que “espremem” essa leitura no eixo das ordenadas. Os pontos obtidos são conectados por uma linha suave. O resultado é a curva mostrada na Figura 9.8. A forma dessa curva não mudará muito à medida que o tempo do experimento aumentar. Além disso, de algum ponto em diante, os novos valores apenas refinarão a curva sem alterar sua forma.


Arroz. 9.8.

Agora vamos mover nosso dinamômetro para a sala de atletismo e repetir o experimento. Agora o máximo da curva se deslocará para a direita, a extremidade esquerda ficará um pouco mais apertada, enquanto a extremidade direita será mais inclinada (Fig. 9.9).


Arroz. 9.9.

Observe que a frequência máxima para a segunda distribuição (ponto B) será menor que a frequência máxima para a primeira distribuição (ponto A). Isso pode ser explicado pelo fato de que o número total de pessoas que visitam o salão de atletismo será menor do que o número de pessoas que passaram próximo ao experimentador no primeiro caso (no centro da cidade em local bastante movimentado). O máximo mudou para a direita, já que as salas de atletismo são frequentadas por pessoas fisicamente mais fortes em comparação com o fundo geral.

E, por fim, visitaremos escolas, jardins de infância e asilos com o mesmo objetivo: revelar a força das mãos dos visitantes desses lugares. E novamente, a curva de distribuição terá uma forma semelhante, mas agora, obviamente, sua extremidade esquerda será mais inclinada e a extremidade direita será mais apertada. E como no segundo caso, o máximo (ponto C) será menor que o ponto A (Fig. 9.10).


Arroz. 9.10.

Esta notável propriedade da distribuição normal - manter a forma da curva de densidade de probabilidade (Fig. 8 - 10) foi notada e descrita em 1733 por Moivre, e depois investigada por Gauss.

Na pesquisa científica, na tecnologia, nos fenômenos de massa ou experimentos, quando se trata de repetir repetidamente variáveis ​​aleatórias sob condições experimentais constantes, dizem que os resultados dos testes sofrem espalhamento aleatório, obedecendo à lei da curva de distribuição normal

(21)

Onde é o evento que ocorre com mais frequência. Como regra, na fórmula (21) em vez do parâmetro, . Além disso, quanto mais longa a série experimental, menos o parâmetro diferirá da expectativa matemática. A área sob a curva (Fig. 9.11) é considerada igual a um. A área correspondente a qualquer intervalo do eixo x é numericamente igual à probabilidade de um resultado aleatório cair nesse intervalo.


Arroz. 9.11.

A função de distribuição normal tem a forma


(22)

Observe que a curva normal (Fig. 9.11) é simétrica em relação à linha reta e se aproxima assintoticamente do eixo OX em .

Calcule a esperança matemática para a lei normal


(23)

Propriedades da distribuição normal

Vamos considerar as principais propriedades desta distribuição mais importante.

Propriedade 1. Função densidade das definições da distribuição normal (21) em todo o eixo x.

Propriedade 2. A função densidade da distribuição normal (21) é maior que zero para qualquer um dos domínios de definição ().

Propriedade 3. Com um aumento infinito (diminuição), a função de distribuição (21) tende a zero .

Propriedade 4. Quando , a função de distribuição dada por (21) tem o maior valor igual a

(24)

Propriedade 5. O gráfico da função (Fig. 9.11) é simétrico em relação a uma linha reta.

Propriedade 6. O gráfico da função (Fig. 9.11) tem dois pontos de inflexão simétricos em relação a uma linha reta:

(25)

Propriedade 7. Todos os momentos centrais ímpares são iguais a zero. Observe que usando a propriedade 7, a assimetria da função é determinada pela fórmula . Se , então eles concluem que a distribuição em estudo é simétrica em relação à linha reta . Se , então eles dizem que a linha é deslocada para a direita (mais suavemente inclinando o ramo direito do gráfico ou apertado). Se , então considera-se que a linha é deslocada para a esquerda (ramo esquerdo mais achatado do gráfico da Fig. 9.12).


Arroz. 9.12.

Propriedade 8. A curtose da distribuição é 3. Na prática, muitas vezes é calculada e o grau de "compressão" ou "desfoque" do gráfico é determinado pela proximidade desse valor a zero (Fig. 9.13). E como está relacionado a , acaba por caracterizar o grau de dispersão da frequência dos dados. E uma vez que define

A lei mais famosa e frequentemente usada na teoria das probabilidades é a lei da distribuição normal ou lei de Gauss .

Característica principal A lei de distribuição normal reside no fato de ser a lei limitante para outras leis de distribuição.

Observe que, para uma distribuição normal, a função integral tem a forma:

.

Vamos mostrar agora que o significado probabilístico dos parâmetros e é o seguinte: uma existe uma expectativa matemática, - o desvio padrão (ou seja, ) da distribuição normal:

a) por definição da esperança matemática de uma variável aleatória contínua, temos

Sério

,

uma vez que existe uma função ímpar sob o sinal de integral, e os limites de integração são simétricos em relação à origem;

- integral de Poisson .

Assim, a esperança matemática da distribuição normal é igual ao parâmetro uma .

b) por definição da dispersão de uma variável aleatória contínua e, levando em conta que , podemos escrever

.

Integrando por partes, configurando , encontrar

Conseqüentemente .

Assim, o desvio padrão da distribuição normal é igual ao parâmetro .

Se e distribuição normal é chamada de distribuição normalizada (ou normal padrão). Então, obviamente, a densidade normalizada (diferencial) e a função de distribuição integral normalizada serão escritas respectivamente na forma:

(A função, como você sabe, é chamada de função de Laplace (veja LIÇÃO 5) ou integral de probabilidade. Ambas as funções, isto é, , são tabulados e seus valores são registrados nas tabelas correspondentes).

Propriedades de distribuição normal (propriedades de curva normal):

1. Obviamente, uma função em toda a linha real.

2. , ou seja, a curva normal está localizada acima do eixo Oh .

3. , ou seja, o eixo Oh serve como a assíntota horizontal do gráfico.

4. A curva normal é simétrica em relação a uma linha reta x = a (assim, o gráfico da função é simétrico em torno do eixo UO ).

Portanto, podemos escrever: .

5. .

6. É fácil mostrar que os pontos e são os pontos de inflexão da curva normal (prove você mesmo).

7.É óbvio que

mas desde , então . Além do mais , portanto, todos os momentos ímpares são iguais a zero.

Para momentos pares, podemos escrever:

8. .

9. .

10. , Onde .

11. Para valores negativos da variável aleatória: , onde .


13. A probabilidade de acertar uma variável aleatória em um gráfico simétrico em torno do centro de distribuição é igual a:

EXEMPLO 3. Mostre que uma variável aleatória normalmente distribuída X desvia da expectativa M(X) não mais que .

Decisão. Para uma distribuição normal: .

Em outras palavras, a probabilidade de que o valor absoluto do desvio excederá o triplo do desvio padrão é muito pequeno, ou seja, 0,0027. Isso significa que apenas em 0,27% dos casos isso pode acontecer. Tais eventos, baseados no princípio da impossibilidade de eventos improváveis, podem ser considerados praticamente impossíveis.

Assim, um evento com probabilidade de 0,9973 pode ser considerado praticamente certo, ou seja, uma variável aleatória se desvia da expectativa matemática em não mais que .

EXEMPLO 4. Conhecendo as características da distribuição normal de uma variável aleatória X - resistência à tração do aço: kg/mm ​​2 e kg/mm ​​2, encontre a probabilidade de obter aço com resistência à tração de 31 kg/mm ​​2 a 35 kg/mm ​​2.

Decisão.

3. Distribuição exponencial (lei de distribuição exponencial)

O exponencial (exponencial) é a distribuição de probabilidade de uma variável aleatória contínua X , que é descrito por uma função diferencial (densidade de distribuição)

onde é um valor positivo constante.

A distribuição exponencial é definida 1 parâmetro. Essa característica da distribuição exponencial indica sua vantagem sobre as distribuições que dependem de um número maior de parâmetros. Normalmente, os parâmetros são desconhecidos e é preciso encontrar suas estimativas (valores aproximados); claro, é mais fácil avaliar um parâmetro do que dois, ou três, etc.

É fácil escrever a função integral da distribuição exponencial:

Definimos a distribuição exponencial usando uma função diferencial; é claro que pode ser determinado usando a função integral.

Comente: Considere uma variável aleatória contínua T - a duração do tempo de atividade do produto. Vamos denotar seus valores aceitos por t , . Função de distribuição cumulativa define probabilidade de falha produtos durante um período de tempo t . Portanto, a probabilidade de operação sem falhas para a mesma duração t , ou seja, a probabilidade do evento oposto é igual a

Definição. Normalé chamada de distribuição de probabilidade de uma variável aleatória contínua, que é descrita pela densidade de probabilidade

A distribuição normal também é chamada de lei de Gauss.

A lei da distribuição normal é central para a teoria da probabilidade. Isso se deve ao fato de que essa lei se manifesta em todos os casos em que uma variável aleatória é resultado da ação de um grande número de fatores diferentes. Todas as outras leis de distribuição se aproximam da lei normal.

Pode-se mostrar facilmente que os parâmetros e incluídos na densidade de distribuição são, respectivamente, a esperança matemática e o desvio padrão da variável aleatória X.

Encontre a função de distribuição F(x).

O gráfico de densidade de distribuição normal é chamado curva normal ou Curva de Gauss.

Uma curva normal tem as seguintes propriedades:

1) A função é definida em todo o eixo numérico.

2) Para todos X a função de distribuição aceita apenas valores positivos.

3) O eixo OX é a assíntota horizontal do gráfico de densidade de probabilidade, uma vez que com um aumento ilimitado no valor absoluto do argumento X, o valor da função tende a zero.

4) Encontre o extremo da função.

Porque no y' > 0 no x< m e você< 0 no x > m, então no ponto x = t a função tem um máximo igual a .

5) A função é simétrica em relação a uma linha reta x = a, Porque diferença

(x - um) entra na função de densidade de distribuição ao quadrado.

6) Para encontrar os pontos de inflexão do gráfico, encontramos a segunda derivada da função densidade.

No x = m+ s e x = m- s a segunda derivada é igual a zero, e ao passar por esses pontos muda de sinal, ou seja nestes pontos a função tem uma inflexão.

Nesses pontos, o valor da função é .

Vamos construir um gráfico da função densidade de distribuição.

Os gráficos foram construídos para t=0 e três valores possíveis do desvio padrão s = 1, s = 2 e s = 7. Como você pode ver, à medida que o valor do desvio padrão aumenta, o gráfico fica mais plano e o valor máximo diminui.

Se um uma> 0, então o gráfico se deslocará na direção positiva se uma < 0 – в отрицательном.

No uma= 0 e s = 1 a curva é chamada normalizado. Equação de Curva Normalizada:

Por brevidade, dizemos que CV X obedece à lei N(m, s), i.e. X ~ N(m,s). Os parâmetros mes coincidem com as características principais da distribuição: m = m X , s = s X = . Se SV X ~ N(0, 1), então é chamado valor normal padronizado. DF é chamado de valor normal padronizado Função Laplace e é indicado como Ф(x). Ele pode ser usado para calcular probabilidades de intervalo para a distribuição normal N(m, s):

P(x 1 £ X< x 2) = Ф - Ф .

Ao resolver problemas em uma distribuição normal, muitas vezes é necessário usar valores tabulares da função Laplace. Como a função de Laplace satisfaz a relação F(-x) = 1 - F(x), então basta ter valores tabulares da função F(x) apenas para valores de argumentos positivos.

Para a probabilidade de atingir um intervalo simétrico em relação à expectativa matemática, a seguinte fórmula é verdadeira: P(|X - m X |< e) = 2×F(e/s) - 1.

Os momentos centrais da distribuição normal satisfazem a relação recursiva: m n +2 = (n+1)s 2 m n , n = 1, 2, ... . Isso implica que todos os momentos centrais de ordem ímpar são iguais a zero (já que m 1 = 0).

Encontre a probabilidade de que uma variável aleatória distribuída de acordo com a lei normal caia em um determinado intervalo.

Indicar

Porque integral não é expressa em termos de funções elementares, então a função é levada em consideração

,

que é chamado Função Laplace ou integral de probabilidade.

Os valores desta função para vários valores X calculados e apresentados em tabelas especiais.

Abaixo está um gráfico da função de Laplace.

A função Laplace tem as seguintes propriedades:

2) F(- X) = - F( X);

A função de Laplace também é chamada função de erro e denotar erf x.

Ainda em uso normalizado a função de Laplace, que está relacionada com a função de Laplace pela relação:

Abaixo está um gráfico da função de Laplace normalizada.

Ao considerar a distribuição normal, distingue-se um caso especial importante, conhecido como regra de três sigma.

Vamos escrever a probabilidade de que o desvio de uma variável aleatória normalmente distribuída da expectativa matemática seja menor que um determinado valor D:

Se aceitarmos D = 3s, obtemos usando as tabelas de valores da função Laplace:

Aqueles. a probabilidade de que uma variável aleatória se desvie de sua expectativa matemática por um valor maior que três vezes o desvio padrão é praticamente zero.

Essa regra é chamada regra de três sigma.

Na prática, considera-se que se para qualquer variável aleatória a regra de três sigma for satisfeita, então essa variável aleatória tem distribuição normal.

Exemplo. O trem é composto por 100 vagões. A massa de cada vagão é uma variável aleatória distribuída de acordo com a lei normal com expectativa matemática uma= 65 te desvio padrão s = 0,9 t. A locomotiva pode transportar um trem com peso não superior a 6600 t, caso contrário, é necessário anexar uma segunda locomotiva. Encontre a probabilidade de que a segunda locomotiva não seja necessária.

A segunda locomotiva não é necessária se o desvio da massa do trem do esperado (100 × 65 = 6500) não exceder 6600 - 6500 = 100 toneladas.

Porque a massa de cada vagão tem distribuição normal, então a massa de todo o trem também será distribuída normalmente.

Nós temos:

Exemplo. Uma variável aleatória normalmente distribuída X é dada por seus parâmetros - a \u003d 2 - esperança matemática es = 1 – desvio padrão. É necessário escrever a densidade de probabilidade e construir seu gráfico, encontrar a probabilidade de X tomar um valor do intervalo (1; 3), encontrar a probabilidade de X desviar (módulo) da expectativa matemática em não mais que 2.

A densidade de distribuição tem a forma:

Vamos construir um gráfico:

Vamos encontrar a probabilidade de acertar uma variável aleatória no intervalo (1; 3).

Encontre a probabilidade de que a variável aleatória se desvie da expectativa matemática por um valor não maior que 2.

O mesmo resultado pode ser obtido usando a função de Laplace normalizada.

Aula 8 Lei dos grandes números(Seção 2)

Plano de aula

Teorema do limite central (formulação geral e formulação particular para variáveis ​​aleatórias independentes identicamente distribuídas).

A desigualdade de Chebyshev.

A lei dos grandes números na forma de Chebyshev.

O conceito de frequência de eventos.

Compreensão estatística da probabilidade.

A lei dos grandes números na forma de Bernoulli.

O estudo das regularidades estatísticas permitiu estabelecer que sob certas condições o comportamento total de um grande número de variáveis ​​aleatórias quase perde seu caráter aleatório e se torna regular (ou seja, desvios aleatórios de algum comportamento médio se cancelam). Em particular, se a influência na soma dos termos individuais for uniformemente pequena, a lei da distribuição da soma se aproxima do normal. A formulação matemática desta afirmação é dada em um grupo de teoremas chamado lei dos grandes números.

LEI DOS GRANDES NÚMEROS- um princípio geral, em virtude do qual a ação combinada de fatores aleatórios leva, sob certas condições muito gerais, a um resultado quase independente do acaso. O primeiro exemplo da operação desse princípio é a convergência da frequência de ocorrência de um evento aleatório com sua probabilidade com o aumento do número de tentativas (frequentemente usado na prática, por exemplo, ao usar a frequência de ocorrência de qualquer qualidade do respondente na amostra como uma estimativa amostral da probabilidade correspondente).

Essência lei dos grandes númerosé que com um grande número de experimentos independentes, a frequência de ocorrência de algum evento está próxima de sua probabilidade.

Teorema do limite central (CLT) (na formulação de Lyapunov A.M. para RVs identicamente distribuídos). Se RVs independentes aos pares X 1 , X 2 , ..., X n , ... têm a mesma lei de distribuição com características numéricas finitas M = me D = s 2 , então para n ® ¥ a lei de distribuição do RV indefinidamente aproxima-se da lei normal N(n×m, ).

Consequência. Se na condição do teorema CB , então como n ® ¥ a lei de distribuição de SW Y se aproxima da lei normal N(m, s/ ) indefinidamente.

Teorema de De Moivre-Laplace. Seja SV K o número de “sucessos” em n tentativas de acordo com o esquema de Bernoulli. Então, para n ® ¥ e um valor fixo da probabilidade de “sucesso” em uma tentativa p, a lei de distribuição de RV K aproxima-se indefinidamente da lei normal N(n×p, ).

Consequência. Se na condição do teorema, em vez de SV K, considerarmos SV K/n - a frequência de “sucessos” em n tentativas de acordo com o esquema de Bernoulli, então sua lei de distribuição para n ® ¥ e um valor fixo de p se aproximam a lei normal N(p, ) indefinidamente.

Comente. Seja SV K o número de “sucessos” em n tentativas de acordo com o esquema de Bernoulli. A lei de distribuição de tal SW é a lei binomial. Então, como n ® ¥, a lei binomial tem duas distribuições limite:

n distribuição Poisson(para n ® ¥ e l = n×p = const);

n distribuição Gaussiano N(n×p, ) (para n ® ¥ ep = const).

Exemplo. A probabilidade de “sucesso” em uma tentativa é apenas p = 0,8. Quantas tentativas devem ser feitas para que, com uma probabilidade de pelo menos 0,9, possamos esperar que a frequência observada de “sucesso” nas tentativas de acordo com o esquema de Bernoulli se desvie da probabilidade p em não mais que e = 0,01?

Decisão. Para comparação, resolvemos o problema de duas maneiras.

Na teoria da probabilidade, um número bastante grande de várias leis de distribuição é considerado. Para resolver problemas relacionados à construção de gráficos de controle, apenas alguns deles são de interesse. O mais importante deles é lei de distribuição normal, que é usado para construir gráficos de controle usados ​​em controle quantitativo, ou seja quando estamos lidando com uma variável aleatória contínua. A lei de distribuição normal ocupa uma posição especial entre outras leis de distribuição. Isso é explicado pelo fato de que, em primeiro lugar, é mais frequentemente encontrado na prática e, em segundo lugar, é a lei limitante, à qual outras leis de distribuição se aproximam em condições típicas muito frequentemente encontradas. Quanto à segunda circunstância, foi provado na teoria da probabilidade que a soma de um número suficientemente grande de variáveis ​​aleatórias independentes (ou fracamente dependentes) sujeitas a quaisquer leis de distribuição (sujeitas a certas restrições muito não rígidas) obedece aproximadamente à lei normal , e isso é realizado com maior precisão quanto maior for o número de variáveis ​​aleatórias somadas. A maioria das variáveis ​​aleatórias encontradas na prática, como, por exemplo, erros de medição, podem ser representadas como a soma de um número muito grande de termos relativamente pequenos - erros elementares, cada um dos quais é causado pela ação de uma causa independente independente dos outros. A lei normal ocorre quando a variável aleatória Xé o resultado de um grande número de fatores diferentes. Cada fator separadamente pelo valor X influencia um pouco, e é impossível especificar qual deles influencia mais do que os outros.

Distribuição normal(Distribuição Laplace–Gauss) é a distribuição de probabilidade de uma variável aleatória contínua X tal que a densidade de distribuição de probabilidade em - ¥<х< + ¥ принимает действительное значение:

exp (3)

Ou seja, a distribuição normal é caracterizada por dois parâmetros m e s, onde m é a esperança matemática; s é o desvio padrão da distribuição normal.

valor de s 2 é a variância da distribuição normal.

A expectativa matemática m caracteriza a posição do centro de distribuição, e o desvio padrão s (RMS) é uma característica de dispersão (Fig. 3).

f(x) f(x)


Figura 3 - Funções densidade da distribuição normal com:

a) diferentes expectativas matemáticas m; b) diferentes RMS s.

Assim, o valor μ é determinado pela posição da curva de distribuição no eixo x. Dimensão μ - o mesmo que a dimensão da variável aleatória X. À medida que a expectativa matemática aumenta, ambas as funções se movem paralelamente para a direita. Com variância decrescente s 2 a densidade torna-se cada vez mais concentrada em torno de m, enquanto a função de distribuição torna-se cada vez mais acentuada.

O valor de σ determina a forma da curva de distribuição. Como a área sob a curva de distribuição deve sempre permanecer igual à unidade, à medida que σ aumenta, a curva de distribuição se torna mais plana. Na fig. 3.1 mostra três curvas para diferentes σ: σ1 = 0,5; σ2 = 1,0; σ3 = 2,0.

Figura 3.1 - Funções densidade da distribuição normal com diferentes RMS.

A função de distribuição (função integral) tem a forma (Fig. 4):

(4)

Figura 4 - Funções de distribuição normal integral (a) e diferencial (b)

De particular importância é a transformação linear de uma variável aleatória normalmente distribuída X, após o qual uma variável aleatória é obtida Z com expectativa matemática 0 e variância 1. Tal transformação é chamada de normalização:

Isso pode ser feito para todas as variáveis ​​aleatórias. A normalização permite que todas as variantes possíveis da distribuição normal sejam reduzidas a um caso: m = 0, s = 1.

A distribuição normal com m = 0, s = 1 é chamada distribuição normal normalizada (padronizada).

distribuição normal padrão(distribuição padrão de Laplace-Gauss ou distribuição normal normalizada) é a distribuição de probabilidade de uma variável aleatória normal padronizada Z, cuja densidade de distribuição é igual a:

em - ¥<z< + ¥

Valores de função Ф(z)é determinado pela fórmula:

(7)

Valores de função Ф(z) e densidade f(z) distribuição normal normalizada são calculadas e resumidas em tabelas (tabuladas). A tabela é compilada apenas para valores positivos zÉ por isso:

F (z) = 1Ф (z) (8)

Usando essas tabelas, pode-se determinar não apenas os valores da função e densidade da distribuição normal normalizada para um determinado z, mas também os valores da função de distribuição normal geral, pois:

; (9)

. 10)

Em muitos problemas relacionados a variáveis ​​aleatórias normalmente distribuídas, é necessário determinar a probabilidade de acertar uma variável aleatória X, sujeito à lei normal com parâmetros m e s, para uma determinada área. Tal site pode ser, por exemplo, um campo de tolerância para um parâmetro do valor superior você ao fundo eu.

A probabilidade de cair no intervalo de X 1 a X 2 pode ser determinado pela fórmula:

Assim, a probabilidade de acertar uma variável aleatória (valor do parâmetro) X no campo de tolerância é determinado pela fórmula

Pode-se encontrar a probabilidade de que uma variável aleatória X estará dentro de µ k s . Valores obtidos para k=1,2 e 3 são os seguintes (veja também a Fig. 5):

Assim, se algum valor aparecer fora da região de três sigma, que contém 99,73% de todos os valores possíveis, e a probabilidade de tal evento ocorrer é muito pequena (1:270), deve-se considerar que o valor em questão acabou ser muito pequeno ou muito grande não por variação aleatória, mas por interferência significativa no próprio processo, capaz de causar mudanças na natureza da distribuição.

A área situada dentro dos limites de três sigma também é chamada de área de tolerância estatística máquina ou processo relevante.