Estimativas para a expectativa matemática e variância. Estimativa da expectativa matemática e variância para a amostra

Seja uma variável aleatória X com expectativa matemática m e dispersão D, enquanto ambos os parâmetros são desconhecidos. Acima da magnitude X produzido N experimentos independentes, que resultaram em um conjunto de N resultados numéricos x 1 , x 2 , …, x N. Como estimativa da expectativa matemática, é natural propor a média aritmética dos valores observados

(1)

Aqui como XI valores específicos (números) obtidos como resultado de N experimentos. Se pegarmos outros (independentes dos anteriores) N experimentos, então, obviamente, obteremos um valor diferente. Se você pegar mais N experimentos, obteremos mais um novo valor. Denotado por XI variável aleatória resultante de euª experiência, então as realizações XI serão os números obtidos como resultado desses experimentos. É óbvio que a variável aleatória XI terá a mesma densidade de distribuição de probabilidade que a variável aleatória original X. Também assumimos que as variáveis ​​aleatórias XI e Xj são independentes em eu, não igual j(vários experimentos independentes em relação uns aos outros). Portanto, reescrevemos a fórmula (1) em uma forma (estatística) diferente:

(2)

Vamos mostrar que a estimativa é imparcial:

Assim, a expectativa matemática da média amostral é igual à verdadeira expectativa matemática da variável aleatória m. Este é um fato bastante previsível e compreensível. Portanto, a média amostral (2) pode ser tomada como uma estimativa da expectativa matemática de uma variável aleatória. Agora surge a pergunta: o que acontece com a variância da estimativa de expectativa à medida que o número de experimentos aumenta? Cálculos analíticos mostram que

onde é a variância da estimativa da expectativa matemática (2), e D- variância verdadeira da variável aleatória X.

Do exposto, segue-se que com o aumento da N(número de experimentos) a variância da estimativa diminui, ou seja, quanto mais resumimos as implementações independentes, mais próximo do valor esperado chegamos à estimativa.


Estimativas de variância matemática

À primeira vista, a estimativa mais natural parece ser

(3)

onde é calculado pela fórmula (2). Vamos verificar se a estimativa é imparcial. A fórmula (3) pode ser escrita da seguinte forma:

Substituímos a expressão (2) nesta fórmula:

Vamos encontrar a expectativa matemática da estimativa de variância:

(4)

Como a variância de uma variável aleatória não depende de qual é a expectativa matemática da variável aleatória, tomaremos a expectativa matemática igual a 0, ou seja, m = 0.

(5)
no .(6)

A necessidade de estimar a expectativa matemática com base em resultados de testes aparece em problemas em que o resultado do experimento é descrito por uma variável aleatória e assume-se que o indicador de qualidade do objeto em estudo é a expectativa matemática dessa variável aleatória. Por exemplo, a expectativa matemática do tempo de atividade de um sistema pode ser tomada como um indicador de confiabilidade e, ao avaliar a eficiência da produção, a expectativa matemática do número de bons produtos etc.

O problema de estimar a esperança matemática é formulado como segue. Suponha que para determinar o valor desconhecido da variável aleatória X, supõe-se que n faça medições independentes e livres de erros sistemáticos X x X 2 ,..., X pág.É necessário escolher a melhor estimativa da expectativa matemática.

A melhor e mais comum estimativa da expectativa matemática na prática é a média aritmética dos resultados do teste

também chamado estatística ou média da amostra.

Vamos mostrar que a estimativa tx satisfaz todos os requisitos para a avaliação de qualquer parâmetro.

1. Segue da expressão (5.10) que

ou seja, pontuação t"x- estimativa imparcial.

2. De acordo com o teorema de Chebyshev, a média aritmética dos resultados do teste converge em probabilidade para a expectativa matemática, ou seja,

Consequentemente, a estimativa (5.10) é uma estimativa consistente da expectativa.

3. Variação da estimativa tx, igual

À medida que o tamanho da amostra aumenta, n diminui indefinidamente. Está provado que se uma variável aleatória X está sujeita à lei da distribuição normal, então para qualquer P a variância (5.11) será a mínima possível, e a estimativa tx- estimativa efetiva da expectativa matemática. Conhecer a variância da estimativa torna possível fazer um julgamento sobre a precisão da determinação do valor desconhecido da expectativa matemática usando essa estimativa.

Como estimativa da expectativa matemática, a média aritmética é usada se os resultados da medição forem igualmente precisos (variâncias D, eu = 1, 2, ..., P são iguais em todas as dimensões). No entanto, na prática, é preciso lidar com tarefas em que os resultados das medições não são iguais (por exemplo, durante os testes, as medições são feitas por instrumentos diferentes). Neste caso, a estimativa para a esperança matemática tem a forma

Onde é o peso da i-ésima medida.

Na fórmula (5.12), o resultado de cada medição é incluído com seu próprio peso Com.. Portanto, a avaliação dos resultados da medição tx chamado média ponderada.

Pode-se mostrar que a estimativa (5.12) é uma estimativa imparcial, consistente e eficiente da expectativa. A variância mínima da estimativa é dada por


Ao realizar experimentos com modelos de computador, problemas semelhantes surgem quando as estimativas são encontradas a partir dos resultados de várias séries de testes e o número de testes em cada série é diferente. Por exemplo, duas séries de testes foram realizadas com um volume página 1 e n 2 , segundo cujos resultados as estimativas t xi e tx_. A fim de melhorar a precisão e a confiabilidade da determinação da expectativa matemática, os resultados dessas séries de testes são combinados. Para fazer isso, use a expressão (5.12)

Ao calcular os coeficientes C, em vez das variâncias D, são substituídas suas estimativas obtidas a partir dos resultados dos testes em cada série.

Uma abordagem semelhante também é usada para determinar a probabilidade de um evento aleatório ocorrer com base nos resultados de uma série de testes.

Para estimar a expectativa matemática de uma variável aleatória X, além da média amostral, outras estatísticas podem ser utilizadas. Na maioria das vezes, os membros da série variacional são usados ​​para esses fins, ou seja, estatísticas de pedidos, com base nas quais as estimativas são construídas,

satisfazendo os principais requisitos, a saber, consistência e imparcialidade.

Suponha que a série de variação contenha n = 2k membros. Então, qualquer uma das médias pode ser tomada como uma estimativa da expectativa matemática:

Em que dedo do pé a média

nada mais é do que a mediana estatística da distribuição da variável aleatória X, pois a igualdade óbvia ocorre

A vantagem da mediana estatística é que ela está livre da influência de observações anômalas, o que é inevitável quando se utiliza a primeira média, ou seja, a média das séries de menor e maior número de variação.

Com um tamanho de amostra ímpar P = 2k- 1 mediana estatística é o elemento do meio, ou seja, para-º membro da série de variação Eu = xk.

Existem distribuições para as quais a média aritmética não é uma estimativa efetiva da expectativa matemática, por exemplo, a distribuição de Laplace. Pode-se mostrar que para a distribuição de Laplace, a estimativa efetiva da média é a mediana amostral.

Está provado que se uma variável aleatória X tem uma distribuição normal, então com um tamanho de amostra suficientemente grande, a lei de distribuição da mediana estatística é próxima do normal com características numéricas

Da comparação das fórmulas (5.11) e (5.14) conclui-se que a dispersão da mediana estatística é 1,57 vezes maior do que a dispersão da média aritmética. Portanto, a média aritmética como estimativa da expectativa matemática é muito mais eficaz do que a mediana estatística. No entanto, devido à simplicidade dos cálculos, insensibilidade a resultados de medição anômalos (“contaminação” da amostra), na prática, a mediana estatística é utilizada como estimativa da expectativa matemática.

Deve-se notar que para distribuições simétricas contínuas, a média e a mediana são as mesmas. Portanto, a mediana estatística pode servir como uma boa estimativa da expectativa matemática apenas para uma distribuição simétrica da variável aleatória.

Para distribuições assimétricas, a mediana estatística Eu tem um viés significativo em relação à expectativa matemática, portanto, é inadequado para sua estimativa.

Seja uma variável aleatória X com expectativa matemática m e dispersão D, enquanto ambos os parâmetros são desconhecidos. Acima da magnitude X produzido N experimentos independentes, que resultaram em um conjunto de N resultados numéricos x 1 , x 2 , …, x N. Como estimativa da expectativa matemática, é natural propor a média aritmética dos valores observados

(1)

Aqui como XI valores específicos (números) obtidos como resultado de N experimentos. Se pegarmos outros (independentes dos anteriores) N experimentos, então, obviamente, obteremos um valor diferente. Se você pegar mais N experimentos, obteremos mais um novo valor. Denotado por XI variável aleatória resultante de euª experiência, então as realizações XI serão os números obtidos como resultado desses experimentos. É óbvio que a variável aleatória XI terá a mesma densidade de distribuição de probabilidade que a variável aleatória original X. Também assumimos que as variáveis ​​aleatórias XI e Xj são independentes em eu, não igual j(vários experimentos independentes em relação uns aos outros). Portanto, reescrevemos a fórmula (1) em uma forma (estatística) diferente:

(2)

Vamos mostrar que a estimativa é imparcial:

Assim, a expectativa matemática da média amostral é igual à verdadeira expectativa matemática da variável aleatória m. Este é um fato bastante previsível e compreensível. Portanto, a média amostral (2) pode ser tomada como uma estimativa da expectativa matemática de uma variável aleatória. Agora surge a pergunta: o que acontece com a variância da estimativa de expectativa à medida que o número de experimentos aumenta? Cálculos analíticos mostram que

onde é a variância da estimativa da expectativa matemática (2), e D- variância verdadeira da variável aleatória X.

Do exposto, segue-se que com o aumento da N(número de experimentos) a variância da estimativa diminui, ou seja, quanto mais resumimos as implementações independentes, mais próximo do valor esperado chegamos à estimativa.


Estimativas de variância matemática

À primeira vista, a estimativa mais natural parece ser

(3)

onde é calculado pela fórmula (2). Vamos verificar se a estimativa é imparcial. A fórmula (3) pode ser escrita da seguinte forma:

Substituímos a expressão (2) nesta fórmula:

Vamos encontrar a expectativa matemática da estimativa de variância:

(4)

Como a variância de uma variável aleatória não depende de qual é a expectativa matemática da variável aleatória, tomaremos a expectativa matemática igual a 0, ou seja, m = 0.

(5)
no .(6)

Deixe uma variável aleatória com expectativa matemática desconhecida e variância ser submetida a experimentos independentes que produziram resultados - . Vamos calcular estimativas consistentes e imparciais para os parâmetros e .

Como estimativa para a expectativa matemática, tomamos a média aritmética dos valores experimentais

. (2.9.1)

De acordo com a lei dos grandes números, essa estimativa é próspero , com magnitude em probabilidade. A mesma estimativa é imparcial , na medida em que

. (2.9.2)

A variação desta estimativa é

. (2.9.3)

Pode-se mostrar que para uma distribuição normal, esta estimativa é eficiente . Para outras leis, isso pode não ser o caso.

Vamos agora estimar a variância. Vamos primeiro escolher uma fórmula para estimar dispersão estatística

. (2.9.4)

Vamos verificar a consistência da estimativa de variância. Vamos abrir os colchetes na fórmula (2.9.4)

.

Para , o primeiro termo converge em probabilidade para a quantidade , no segundo - para . Assim, nossa estimativa converge em probabilidade para a variância

,

daí ela é próspero .

Vamos checar imparcialidade estimativas para a quantidade. Para fazer isso, substituímos a expressão (2.9.1) na fórmula (2.9.4) e levamos em consideração que as variáveis ​​aleatórias independente

,

. (2.9.5)

Vamos passar na fórmula (2.9.5) para flutuações de variáveis ​​aleatórias

Expandindo os colchetes, temos

,

. (2.9.6)

Vamos calcular a esperança matemática do valor (2.9.6), levando em conta que

. (2.9.7)

A relação (2.9.7) mostra que o valor calculado pela fórmula (2.9.4) não é um estimador imparcial para dispersão. Sua expectativa matemática não é igual, mas um pouco menor. Tal estimativa leva a um erro sistemático descendente. Para eliminar tal viés, é necessário introduzir uma correção multiplicando não o valor . Então, tal variância estatística corrigida pode servir como uma estimativa imparcial para a variância

. (2.9.8)

Essa estimativa é tão consistente quanto a estimativa , porque para .

Na prática, em vez da estimativa (2.9.8), às vezes é mais conveniente usar uma estimativa equivalente relacionada ao segundo momento estatístico inicial

. (2.9.9)

As estimativas (2.9.8), (2.9.9) não são eficientes. Pode-se mostrar que, no caso de uma distribuição normal, eles serão assintoticamente eficiente (quando tenderá para o valor mínimo possível).

Assim, é possível formular as seguintes regras para o processamento de material estatístico limitado. Se em experimentos independentes a variável aleatória assume os valores com expectativa e variância matemática desconhecidas, então, para determinar esses parâmetros, deve-se usar estimativas aproximadas

(2.9.10)

Fim do trabalho -

Este tópico pertence a:

Notas de aula sobre matemática estatística matemática teoria da probabilidade

Departamento de Matemática Superior e Informática .. notas de aula .. em matemática ..

Caso necessite de material adicional sobre este tema, ou não tenha encontrado o que procurava, recomendamos utilizar a busca em nosso banco de trabalhos:

O que faremos com o material recebido:

Se este material foi útil para você, você pode salvá-lo em sua página nas redes sociais:

Todos os tópicos desta seção:

Teoria da probabilidade
A teoria da probabilidade é um ramo da matemática que estuda os padrões de fenômenos de massa aleatórios. O acaso é um fenômeno que

Definição estatística de probabilidade
Um evento é um fenômeno aleatório que, como resultado da experiência, pode ou não aparecer (fenômeno de dois valores). Designar eventos em letras latinas maiúsculas

Espaço de eventos elementares
Seja um conjunto de eventos associado a alguma experiência, e: 1) como resultado da experiência, um e apenas um

Ações em eventos
A soma de dois eventos e

Permutações
O número de diferentes permutações de elementos é indicado

Acomodações
Colocação de elementos por

Combinações
Uma combinação de elementos

A fórmula para adicionar probabilidades de eventos incompatíveis
Teorema. A probabilidade da soma de dois eventos incompatíveis é igual à soma das probabilidades desses eventos. (1

Fórmula de adição de probabilidade para eventos arbitrários
Teorema. A probabilidade da soma de dois eventos é igual à soma das probabilidades desses eventos sem a probabilidade de seu produto.

Fórmula de multiplicação de probabilidade
Sejam dados dois eventos. Considere um evento

Fórmula de Probabilidade Total
Seja um grupo completo de eventos incompatíveis, eles são chamados de hipóteses. Considere algum evento

Fórmula de probabilidades de hipóteses (Bayes)
Considere novamente - o grupo completo de hipóteses incompatíveis e o evento

Fórmula de Poisson assintótica
Nos casos em que o número de tentativas é grande e a probabilidade de ocorrência de um evento

Variáveis ​​discretas aleatórias
Um valor aleatório é uma quantidade que, quando o experimento é repetido, pode assumir valores numéricos desiguais. A variável aleatória é chamada discreta,

Variáveis ​​contínuas aleatórias
Se, como resultado de um experimento, uma variável aleatória pode assumir qualquer valor de um determinado segmento ou de todo o eixo real, ela é chamada de contínua. lei

Função de densidade de probabilidade de uma variável contínua aleatória
Deixe ser. Considere um ponto e dê um incremento

Características numéricas de variáveis ​​aleatórias
Variáveis ​​aleatórias discretas ou contínuas são consideradas completamente especificadas se suas leis de distribuição forem conhecidas. De fato, conhecendo as leis da distribuição, sempre se pode calcular a probabilidade de acertar

Quantis de variáveis ​​aleatórias
Quantil da ordem de uma variável contínua aleatória

Expectativa matemática de variáveis ​​aleatórias
A expectativa matemática de uma variável aleatória caracteriza seu valor médio. Todos os valores da variável aleatória são agrupados em torno desse valor. Considere primeiro uma variável discreta aleatória

Desvio padrão e variância de variáveis ​​aleatórias
Considere primeiro uma variável discreta aleatória. Características numéricas de moda, mediana, quantis e expectativa matemática

Momentos de variáveis ​​aleatórias
Além da expectativa matemática e da variância, a teoria da probabilidade utiliza características numéricas de ordens superiores, que são chamadas de momentos de variáveis ​​aleatórias.

Teoremas sobre características numéricas de variáveis ​​aleatórias
Teorema 1. A esperança matemática de uma variável não aleatória é igual a esse próprio valor. Prova: Deixe

Lei de distribuição binomial

lei de distribuição de Poisson
Seja uma variável discreta aleatória tomando os valores

Lei de distribuição uniforme
A lei uniforme de distribuição de uma variável aleatória contínua é a lei da função densidade de probabilidade, que

Lei de distribuição normal
A lei normal de distribuição de uma variável contínua aleatória é a lei da função densidade

Lei de distribuição exponencial
A distribuição exponencial ou exponencial de uma variável aleatória é usada em tais aplicações da teoria da probabilidade como teoria das filas, teoria da confiabilidade

Sistemas de variáveis ​​aleatórias
Na prática, nas aplicações da teoria das probabilidades, muitas vezes temos que lidar com problemas nos quais os resultados de um experimento são descritos não por uma variável aleatória, mas por várias variáveis ​​aleatórias ao mesmo tempo.

Sistema de duas variáveis ​​discretas aleatórias
Deixe que duas variáveis ​​discretas aleatórias formem um sistema. Valor aleatório

Sistema de duas variáveis ​​contínuas aleatórias
Agora, seja o sistema formado por duas variáveis ​​contínuas aleatórias. A lei de distribuição deste sistema é chamada provavelmente

Leis condicionais de distribuição
Let e ​​variáveis ​​contínuas aleatórias dependentes

Características numéricas de um sistema de duas variáveis ​​aleatórias
O momento inicial da ordem do sistema de variáveis ​​aleatórias

Sistema de várias variáveis ​​aleatórias
Os resultados obtidos para um sistema de duas variáveis ​​aleatórias podem ser generalizados para o caso de sistemas constituídos por um número arbitrário de variáveis ​​aleatórias. Seja o sistema formado pelo conjunto

Distribuição normal de um sistema de duas variáveis ​​aleatórias
Considere um sistema de duas variáveis ​​contínuas aleatórias. A lei de distribuição deste sistema é a lei de distribuição normal

Teoremas de limite da teoria da probabilidade
O principal objetivo da disciplina de teoria da probabilidade é estudar os padrões de fenômenos de massa aleatórios. A prática mostra que a observação de uma massa de fenômenos aleatórios homogêneos revelando

A desigualdade de Chebyshev
Considere uma variável aleatória com expectativa matemática

Teorema de Chebyshev
Se as variáveis ​​aleatórias são independentes aos pares e têm variâncias finitas limitadas na população

Teorema de Bernoulli
Com um aumento ilimitado no número de experimentos, a frequência de ocorrência de um evento converge em probabilidade para a probabilidade de um evento

Teorema do limite central
Ao adicionar variáveis ​​aleatórias com quaisquer leis de distribuição, mas com variações limitadas no agregado, a lei de distribuição

Principais tarefas da estatística matemática
As leis da teoria da probabilidade discutidas acima são uma expressão matemática de padrões reais que realmente existem em vários fenômenos de massa aleatórios. estudo

Uma estatística simples. Função de distribuição estatística
Considere uma variável aleatória cuja lei de distribuição é desconhecida. Obrigatório com base na experiência

Linha estatística. gráfico de barras
Com um grande número de observações (da ordem de centenas), a população em geral torna-se inconveniente e trabalhosa para o registro de material estatístico. Para maior clareza e compacidade, material estatístico

Características numéricas da distribuição estatística
Na teoria da probabilidade, várias características numéricas das variáveis ​​aleatórias foram consideradas: expectativa matemática, dispersão, momentos iniciais e centrais de várias ordens. Números semelhantes

Escolha da distribuição teórica pelo método dos momentos
Em qualquer distribuição estatística, inevitavelmente há elementos de aleatoriedade associados ao número limitado de observações. Com um grande número de observações, esses elementos de aleatoriedade são suavizados,

Testando a plausibilidade da hipótese sobre a forma da lei de distribuição
Deixe a distribuição estatística dada ser aproximada por alguma curva teórica ou

Critérios de consentimento
Considere um dos testes de ajuste mais comumente usados, o chamado teste de Pearson. Presumir

Estimativas pontuais para parâmetros de distribuição desconhecidos
Em p.p. 2.1. - 2.7 consideramos detalhadamente as formas de resolver o primeiro e o segundo problemas principais da estatística matemática. Estas são as tarefas de determinar as leis de distribuição de variáveis ​​aleatórias de acordo com dados experimentais

Intervalo de confiança. Probabilidade de confiança
Na prática, com um pequeno número de experimentos em uma variável aleatória, uma substituição aproximada de um parâmetro desconhecido

Seja uma variável aleatória X, e seus parâmetros são a expectativa matemática uma e variância são desconhecidos. Sobre o valor de X, foram realizados experimentos independentes, que deram os resultados x 1, x 2, x n.

Sem diminuir a generalidade do raciocínio, vamos considerar diferentes esses valores da variável aleatória. Consideraremos os valores x 1, x 2, x n como variáveis ​​aleatórias independentes e identicamente distribuídas X 1, X 2, X n .

O método mais simples de estimação estatística - o método de substituição e analogia - consiste no fato de que, como estimativa de uma ou outra característica numérica (média, variância, etc.) da população geral, é tomada a característica correspondente da distribuição da amostra - a característica da amostra.

Pelo método de substituição como uma estimativa da esperança matemática umaé necessário tomar a expectativa matemática da distribuição da amostra - a média amostral. Assim, obtemos

Para testar a imparcialidade e a consistência da média amostral como estimativas uma, considere esta estatística em função do vetor escolhido (X 1, X 2, X n). Levando em conta que cada um dos valores X 1, X 2, X n tem a mesma lei de distribuição que o valor X, concluímos que as características numéricas dessas quantidades e o valor de X são os mesmos: M(X eu) = M(X) = uma, D(X eu) = D(X) = , eu = 1, 2, n , onde X i são variáveis ​​aleatórias coletivamente independentes.

Conseqüentemente,

Assim, por definição, obtemos que é a estimativa imparcial uma, e como D()®0 como n®¥, então em virtude do teorema do parágrafo anterior é uma estimativa consistente da expectativa uma a população em geral.

A eficiência ou ineficiência da estimativa depende da forma da lei de distribuição da variável aleatória X. Pode-se provar que se o valor X é distribuído de acordo com a lei normal, então a estimativa é eficiente. Para outras leis de distribuição, isso pode não ser o caso.

Estimativa imparcial da variância geralé a variância da amostra corrigida

,

Como , onde é a variância geral. Sério,

A estimativa s -- 2 para a variância geral também é consistente, mas não eficiente. No entanto, no caso de uma distribuição normal, ela é “assintoticamente eficiente”, ou seja, à medida que n aumenta, a razão de sua variância para o mínimo possível se aproxima indefinidamente.

Então, dada uma amostra da distribuição F( x) variável aleatória X com expectativa matemática desconhecida uma e dispersão , então para calcular os valores desses parâmetros, temos o direito de usar as seguintes fórmulas aproximadas:

uma ,

.

Aqui x-i- - opções de amostragem, n- i - - opções de frequência x i , - - tamanho da amostra.
Para calcular a variância da amostra corrigida, a fórmula é mais conveniente


.

Para simplificar o cálculo, é aconselhável mudar para opções condicionais (é vantajoso tomar a variante inicial localizada no meio da série de variação intervalar como c). Então

, .

estimativa de intervalo

Acima, consideramos a questão de estimar um parâmetro desconhecido uma um número. Chamamos essas estimativas de estimativas pontuais. Eles têm a desvantagem de que, com um tamanho amostral pequeno, podem diferir significativamente dos parâmetros estimados. Portanto, para se ter uma ideia da proximidade entre um parâmetro e sua estimativa, as chamadas estimativas intervalares são introduzidas na estatística matemática.

Seja uma estimativa pontual q * encontrada na amostra para o parâmetro q. Normalmente, os pesquisadores pré-atribuem alguma probabilidade g suficientemente grande (por exemplo, 0,95; 0,99 ou 0,999) de modo que um evento com probabilidade g possa ser considerado praticamente certo, e levantam a questão de encontrar tal valor e > 0 para o qual

.

Modificando esta igualdade, temos:

e neste caso diremos que o intervalo ]q * - e; q * + e[ cobre o parâmetro estimado q com probabilidade g.

Intervalo ]q * -e; q * +e [ é chamado intervalo de confiança .

A probabilidade g é chamada confiabilidade (probabilidade de confiança) estimativa de intervalo.

As extremidades do intervalo de confiança, ou seja, os pontos q * -e e q * +e são chamados limites de confiança .

O número e é chamado precisão da avaliação .

Como exemplo do problema de determinação de limites de confiança, considere a questão de estimar a expectativa matemática de uma variável aleatória X, que possui uma lei de distribuição normal com parâmetros uma e s, ou seja X = N( uma, S). A esperança matemática neste caso é igual a uma. De acordo com as observações X 1 , X 2 , X n calcule a média e avaliação dispersão s 2 .

Acontece que de acordo com os dados da amostra, é possível construir uma variável aleatória

que tem uma distribuição de Student (ou distribuição t) com n = n -1 graus de liberdade.

Vamos usar a Tabela A.1.3 e encontrar para a probabilidade dada g e o número n o número t g tal que a probabilidade

P(|t(n)|< t g) = g,

.

Depois de fazer transformações óbvias, obtemos

O procedimento para aplicar o critério F é o seguinte:

1. É feita uma suposição sobre a distribuição normal das populações. A um dado nível de significância a, a hipótese nula H 0 é formulada: s x 2 = s y 2 sobre a igualdade das variâncias gerais de populações normais sob a hipótese concorrente H 1: s x 2 > s y 2 .

2. Duas amostras independentes são obtidas das populações X e Y de n x e n y, respectivamente.

3. Calcule os valores das variâncias amostrais corrigidas s x 2 e s y 2 (os métodos de cálculo são discutidos em §13.4). A maior das dispersões (s x 2 ou s y 2) é designada s 1 2, a menor - s 2 2.

4. O valor do critério F é calculado de acordo com a fórmula F obs = s 1 2 / s 2 2 .

5. De acordo com a tabela de pontos críticos da distribuição Fisher - Snedecor, para um determinado nível de significância a e o número de graus de liberdade n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 é o número de graus de liberdade de uma variância corrigida maior), o ponto crítico é encontrado F cr (a, n 1, n 2).

Observe que a Tabela A.1.7 mostra os valores críticos do critério F unicaudal. Portanto, se um critério bilateral é aplicado (H 1: s x 2 ¹ s y 2), então o ponto crítico à direita F cr (a / 2, n 1, n 2) é procurado pelo nível de significância a / 2 (metade do especificado) e o número de graus de liberdade n 1 e n 2 (n 1 - o número de graus de liberdade de maior dispersão). O ponto crítico canhoto pode não ser encontrado.

6. Conclui-se que se o valor calculado do critério F for maior ou igual ao crítico (F obs ³ F cr), então as variâncias diferem significativamente em um determinado nível de significância. Caso contrário (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Tarefa 15.1. O consumo de matérias-primas por unidade de produção de acordo com a tecnologia antiga era:

Nova tecnologia:

Supondo que as populações gerais correspondentes X e Y tenham distribuições normais, verifique se o consumo de matérias-primas para tecnologias novas e antigas não difere em variabilidade, se tomarmos o nível de significância a = 0,1.

Decisão. Atuamos na ordem indicada acima.

1. Avaliaremos a variabilidade do consumo de matérias-primas para novas e antigas tecnologias em termos de valores de dispersão. Assim, a hipótese nula tem a forma H 0: s x 2 = s y 2 . Como hipótese concorrente, aceitamos a hipótese H 1: s x 2 ¹ s y 2, pois não temos certeza de antemão de que qualquer uma das variâncias gerais seja maior que a outra.

2-3. Encontre as variâncias da amostra. Para simplificar os cálculos, vamos para as opções condicionais:

u i = x i - 307, v i = y i - 304.

Vamos organizar todos os cálculos na forma das seguintes tabelas:

você eu eu eu e você eu eu 2 m i (u i +1) 2 eu eu n eu v eu n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Controle: å m i u i 2 + 2å m i u i + m i = Controle: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Encontre as variações de amostra corrigidas:

4. Compare as variações. Encontre a razão entre a maior variância corrigida e a menor:

.

5. Por condição, a hipótese concorrente tem a forma s x 2 ¹ s y 2 , portanto, a região crítica é bilateral, e ao encontrar o ponto crítico, deve-se tomar níveis de significância que sejam metade do dado.

De acordo com a Tabela A.1.7, pelo nível de significância a/2 = 0,1/2 = 0,05 e o número de graus de liberdade n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, encontramos o ponto crítico F cr ( 0,05; 12; 8) = 3,28.

6. Uma vez que F obl.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Acima, ao testar as hipóteses, assumiu-se que a distribuição das variáveis ​​aleatórias em estudo era normal. No entanto, estudos especiais mostraram que os algoritmos propostos são muito estáveis ​​(especialmente com grandes tamanhos de amostra) no que diz respeito ao desvio da distribuição normal.