Hipótese sobre a igualdade de dois valores médios. Testando hipóteses estatísticas sobre igualdade de médias

Considere o mesmo problema do parágrafo 3.4 anterior, mas apenas sob a condição de que os tamanhos da amostra e sejam pequenos (menos de 30). Nesse caso, a substituição das variâncias gerais e em (3.15) pelas variâncias amostrais corrigidas e pode levar a um grande erro no valor de , e, consequentemente, a um grande erro no estabelecimento da área de aceitação do hipótese H0. No entanto, se houver confiança de que o desconhecido general e são os mesmos(por exemplo, se forem comparados os tamanhos médios de dois lotes de peças fabricadas na mesma máquina), então é possível, usando a distribuição de Student, neste caso construir um critério para testar a hipótese H0 X e S. Para fazer isso, introduza uma variável aleatória

, (3.16)

(3.17)

A média das variâncias amostrais corrigidas e , que serve como uma estimativa pontual das variâncias gerais desconhecidas idênticas e . Como se vê (ver , p. 180), se a hipótese nula for verdadeira, H0 valor aleatório T tem uma distribuição de Student com graus de liberdade, independentemente dos valores e tamanhos de amostra. Se a hipótese H0 verdade, a diferença deve ser pequena. Ou seja, o valor experimental T Exp. quantidades T deve ser pequeno. Ou seja, deve estar dentro de alguns limites. Se ultrapassar esses limites, consideraremos uma refutação da hipótese H0, e vamos permitir isso com uma probabilidade igual ao nível de significância dado α .

Assim, a área de aceitação da hipótese H0 será algum intervalo em que os valores da variável aleatória T deve acertar com probabilidade 1- α :

O valor definido pela igualdade (3,18), para diferentes níveis de significância α e vários números K graus de liberdade T pode ser encontrada na tabela de pontos críticos da distribuição de Student (Tabela 4 do Anexo). Isto irá encontrar o intervalo para aceitar a hipótese H0. E se o valor experimental T Valor exp T cai nesse intervalo - a hipótese H0 aceitar. Não cai - não aceite.

Nota 1. Se não houver razão para considerar as variâncias gerais e as quantidades iguais X e S, então neste caso, para testar a hipótese H0 sobre a igualdade das expectativas matemáticas das quantidades X e S o uso do teste t de Student acima é permitido. Só agora a magnitude T número K graus de liberdade devem ser considerados iguais não , mas iguais (ver )

(3.19)

Se as variâncias da amostra corrigida diferirem significativamente, então o segundo termo no último colchete de (3,19) é pequeno comparado a 0,5, de modo que a expressão (3,19) comparada à expressão reduz o número de graus de liberdade de uma variável aleatória T quase o dobro. E isso leva a uma expansão significativa do intervalo para aceitar a hipótese H0 e, consequentemente, a um estreitamento significativo da área crítica de rejeição desta hipótese. E isso é bastante justo, pois o grau de dispersão dos possíveis valores da diferença será determinado principalmente pela dispersão dos valores de uma das quantidades X e S, que tem uma grande variação. Ou seja, a informação de uma amostra com uma variância menor, por assim dizer, desaparece, o que leva a uma maior incerteza nas conclusões sobre a hipótese H0 .

Exemplo 4. De acordo com os dados da tabela, compare a produção média de leite de vacas alimentadas com diferentes dietas. Ao testar a hipótese nula H0 sobre a igualdade da produção média de leite, aceite o nível de significância α =0,05.

O número de vacas alimentadas com a dieta

(Metas)

Produção média diária de leite em termos de teor de gordura básica

(kg/cabeça)

Desvio padrão da produção diária de leite das vacas

(kg/cabeça)

. Como os dados tabulares fornecidos foram obtidos com base em pequenas amostras com volumes = 10 e = 8, para comparar as expectativas matemáticas da produção média diária de leite de vacas que receberam uma e outra ração alimentar, devemos usar a teoria descrita neste parágrafo. Para isso, em primeiro lugar, descobriremos se as variâncias amostrais corrigidas encontradas =(3,8)2=14,44 e =(4,2)2=17,64 nos permitem considerar as variâncias gerais e iguais. Para fazer isso, usamos o critério de Fisher-Snedekor (ver parágrafo 3.3). Nós temos:

De acordo com a tabela de pontos críticos da distribuição Fischer-Snedekor para α =0,05; K1 =8-1=7 e K2 =10-1=9 encontrar

E já que , então não temos razão neste nível de significância α =0,05 rejeitar a hipótese H0 sobre a igualdade de variâncias gerais e .

Agora, de acordo com (3.17) e (3.16), calculamos o valor experimental da quantidade T:

A seguir, pela fórmula encontrar número K graus de liberdade T: K=10+8-2=16. Depois disso para n0+8-2=16. odes (3.16) calculamos o valor experimental de T: α =0,05 e K\u003d 16 de acordo com a tabela de pontos críticos da distribuição de Student (Tabela 4 do Apêndice) encontramos: \u003d 2.12. Assim, o intervalo para aceitar a hipótese H0 sobre a igualdade das produções médias de leite das vacas recebendo as dietas nº 1 e nº 2 é o intervalo = (-2,12; 2,12). E como = - 0,79 cai nesse intervalo, não temos motivos para rejeitar a hipótese H0 . Ou seja, temos o direito de supor que a diferença nas rações alimentares não afeta a produção média diária de leite das vacas.

Observação 2. Nos parágrafos 3.4 e 3.5 discutidos acima, a hipótese nula foi considerada H0 sobre igualdade M(X)=M(S) sob a hipótese alternativa H1 sobre sua desigualdade: M(X)≠M(S). Mas a hipótese alternativa H1 pode haver outros, por exemplo, M(S)>M(X). Na prática, este caso ocorrerá quando alguma melhoria (fator positivo) for introduzida, o que nos permite contar com um aumento nos valores médios de uma variável aleatória normalmente distribuída S comparado com os valores da quantidade normalmente distribuída X. Por exemplo, um novo aditivo alimentar foi introduzido na dieta das vacas, o que permite contar com um aumento na produção média de leite das vacas; uma cobertura adicional foi introduzida sob a cultura, o que permite contar com um aumento no rendimento médio da cultura, etc. E eu gostaria de saber se esse fator introduzido é significativo (significativo) ou insignificante. Então, no caso de grandes volumes e Amostras (ver parágrafo 3.4) como critério para a validade da hipótese H0 Considere uma variável aleatória normalmente distribuída

Em um determinado nível de significância α Hipótese H0 sobre igualdade M(X) e M(S) será rejeitado se o valor experimental da quantidade for positivo e maior, onde

Uma vez que, sob a validade da hipótese H0 M(Z)= 0, então

A comparação das médias de duas populações é de grande importância prática. Na prática, muitas vezes há um caso em que o resultado médio de uma série de experimentos difere do resultado médio de outra série. Nesse caso, surge a questão se a discrepância observada entre as médias pode ser explicada pelos inevitáveis ​​erros aleatórios do experimento, ou se é causada por certas regularidades. Na indústria, a tarefa de comparar médias surge frequentemente na amostragem da qualidade dos produtos fabricados em diferentes instalações ou sob diferentes regimes tecnológicos, na análise financeira - ao comparar o nível de rentabilidade de vários ativos, etc.

Vamos formular a tarefa. Sejam duas populações caracterizadas por médias gerais e variâncias conhecidas e. É necessário testar a hipótese sobre a igualdade das médias gerais, ou seja, :=. Para testar a hipótese, duas amostras independentes de volumes e foram retiradas dessas populações, para as quais foram encontradas as médias aritméticas e variâncias amostrais. Com tamanhos amostrais suficientemente grandes, as médias amostrais e têm uma lei de distribuição aproximadamente normal, respectivamente, e .Se a hipótese for verdadeira, a diferença - tem uma lei de distribuição normal com expectativa matemática e dispersão.

Portanto, quando a hipótese é cumprida, as estatísticas

tem uma distribuição normal padrão N(0; 1).

Testando hipóteses sobre valores numéricos de parâmetros

Hipóteses sobre valores numéricos ocorrem em vários problemas. Sejam os valores de algum parâmetro de produtos produzidos pela máquina de linha automática, e seja o valor nominal dado deste parâmetro. Cada valor individual pode, é claro, desviar-se de alguma forma do valor nominal dado. Obviamente, para verificar as configurações corretas desta máquina, é necessário certificar-se de que o valor médio do parâmetro para os produtos produzidos nela corresponderá ao valor nominal, ou seja, testar uma hipótese contra uma alternativa, ou, ou

Com uma configuração arbitrária da máquina, pode ser necessário testar a hipótese de que a precisão dos produtos de fabricação para um determinado parâmetro, dado pela dispersão, é igual a um determinado valor, ou seja, ou, por exemplo, o fato de que a proporção de produtos defeituosos produzidos pela máquina é igual ao valor dado p 0 , ou seja. etc.

Problemas semelhantes podem surgir, por exemplo, na análise financeira, quando, de acordo com os dados da amostra, é necessário estabelecer se o retorno de um ativo de um determinado tipo ou carteira de títulos pode ser considerado, ou seu risco igual a um determinado número; ou, com base nos resultados de uma auditoria seletiva de documentos semelhantes, você precisa ter certeza se a porcentagem de erros cometidos pode ser considerada igual ao valor de face, etc.

No caso geral, hipóteses desse tipo têm a forma, onde é um determinado parâmetro da distribuição em estudo, e é a área de seus valores específicos, consistindo em um caso particular de um valor.

Teste de hipótese estatística: hipótese de médias iguais para duas amostras

O trabalho é de natureza auxiliar, devendo servir como fragmento de outros trabalhos laboratoriais.

Nenhuma pesquisa sociológica competente pode prescindir de hipóteses. De um modo geral, pode-se dizer geralmente que seu objetivo principal é refutar ou confirmar qualquer suposição do pesquisador sobre a realidade social com base nos dados empíricos que ele coletou. Apresentamos uma hipótese, coletamos dados e tiramos uma conclusão com base em material estatístico. Mas é essa cadeia de hipóteses-dados-conclusão que contém muitas perguntas que quase qualquer pesquisador iniciante enfrenta. A principal dessas questões é a seguinte: como traduzir a hipótese por nós apresentada em linguagem matemática para que ela possa então ser correlacionada com uma matriz estatística e, processada pelos métodos da estatística matemática, ser refutada ou confirmada? Aqui tentaremos responder a essa pergunta usando o exemplo de teste de hipóteses sobre a igualdade de médias.

Testando hipóteses estatísticas sobre igualdade de médias

Uma hipótese estatística refere-se a vários tipos de suposições sobre a natureza ou parâmetros da distribuição de uma variável aleatória que pode ser testada com base nos resultados de uma amostra aleatória.

Deve-se ter em mente que testar uma hipótese estatística é de natureza probabilística. Assim como nunca podemos ter 100% de certeza de que qualquer parâmetro da amostra corresponde ao parâmetro da população, nunca podemos dizer absolutamente se a hipótese que apresentamos é verdadeira ou falsa.

Para testar uma hipótese estatística, você precisa do seguinte:

1. Converter a hipótese significativa em estatística: formular a hipótese estatística nula e alternativa.

2. Defina dependências ou nossas amostras independentes.

3. Determine o volume das amostras.

4. Selecione um critério.

5. Escolha um nível de significância que controle a probabilidade aceitável de um erro Tipo I e determine a faixa de valores aceitáveis.

7. Rejeite ou aceite a hipótese nula.

Agora vamos olhar para cada um dos seis pontos com mais detalhes.

Declaração da hipótese

Em problemas estatísticos, muitas vezes é necessário comparar as médias de duas amostras diferentes. . Por exemplo, podemos estar interessados ​​na diferença entre os salários médios de homens e mulheres, as idades médias de certos grupos<А>e<В>etc. Ou, formando dois grupos experimentais independentes, podemos comparar suas médias para ver quão diferentes, digamos, são os efeitos de duas drogas diferentes na pressão arterial, ou quanto o tamanho do grupo afeta as notas dos alunos. Às vezes acontece que dividimos a população em dois grupos em pares, ou seja, estamos lidando com gêmeos, casais ou a mesma pessoa antes e depois de algum experimento, etc. Para ficar mais claro, vejamos exemplos típicos em que vários critérios para a igualdade de médias são aplicados.

Exemplo 1. A empresa desenvolveu dois medicamentos diferentes que baixam a pressão arterial (vamos chamá-los de medicamentos X e S) e quer saber se os efeitos dessas drogas são ou não diferentes em pacientes com hipertensão. Das 50 pessoas com a doença correspondente, 20 são selecionadas aleatoriamente e essas 20 são divididas aleatoriamente em dois grupos de 10 pessoas. O primeiro grupo usa a droga por uma semana X, a segunda - droga S. Em seguida, a pressão arterial é medida em todos os pacientes. Hipótese substantiva apresentada: drogas X e Y têm efeitos diferentes sobre a pressão arterial de pacientes.

Exemplo #2. O pesquisador quer saber como a duração da aula afeta o desempenho dos alunos. Suponha que ele tenha escolhido o seguinte caminho: de 200 alunos, ele escolheu aleatoriamente 50 pessoas e monitorou seu progresso por um mês. Ele então estendeu as palestras em 10 minutos e no mês seguinte observou o progresso dos mesmos 50 alunos. Em seguida, ele comparou os resultados de cada aluno antes e depois de aumentar a duração da palestra. Hipótese substantiva apresentada: A duração da palestra afeta o desempenho do aluno.

Exemplo #3. De 200 alunos, 80 pessoas foram selecionadas aleatoriamente, e essas 80 pessoas foram divididas em dois grupos de 40. A um grupo foi feita uma pergunta sem definição:<Сколько вы готовы заплатить за натуральный йогурт?>, e ao segundo grupo foi feita uma pergunta sobre a instalação:<Сколько вы готовы заплатить за натуральный йогурт, если известно, что люди, потребляющие йогуртовые культуры, страдают на 10-15% меньше от заболеваний желудка?>A pesquisadora assumiu que as informações positivas sobre o produto contidas na segunda pergunta influenciariam o respondente, e as pessoas que respondessem a pergunta com a instalação estariam dispostas a pagar mais pelo iogurte do que aquelas que responderam a pergunta sem a instalação. Hipótese substantiva apresentada: colocar a pergunta influencia a resposta do entrevistado.

Diante de nós estão três exemplos, cada um dos quais demonstra a formulação de uma hipótese significativa. Agora vamos transformar nossas hipóteses significativas em estatísticas, mas primeiro, vamos falar um pouco sobre hipóteses estatísticas em geral.

A abordagem mais comum para formular hipóteses estatísticas é apresentar duas hipóteses bilaterais:

Como pode ser visto na fórmula, a hipótese nula diz que algum parâmetro da amostra ou, digamos, a diferença entre os parâmetros de duas amostras é igual a um certo número uma. A hipótese alternativa afirma o contrário: o parâmetro que nos interessa não é igual a uma. Assim, essas duas hipóteses contêm todos os resultados possíveis.

Também é possível formular hipóteses unilaterais:

Às vezes, essas hipóteses acabam sendo mais significativas. Geralmente ocorrem quando a probabilidade de nosso parâmetro ser maior (ou menor) umaé zero, o que significa que é impossível.

Agora formulamos as hipóteses estatísticas nulas e alternativas para nossos três exemplos.

Tabela número 1.

Exemplo 1

Exemplo #2

Exemplo #3

As drogas X e Y têm efeitos diferentes sobre a pressão arterial em pacientes

A duração da palestra afeta o desempenho do aluno

Fazer uma pergunta influencia a resposta do entrevistado

A tarefa do pesquisador

4. Encontre a média aritmética das diferenças para todos os alunos, denotada

Hipótese nula

O significado da hipótese nula

e as médias das populações gerais das quais são retiradas as amostras com as médias. A hipótese nula diz que o efeito de ambas as drogas sobre a pressão é insignificante em média, e mesmo que as médias amostrais não sejam iguais, isso se deve apenas a erro de amostragem ou outros motivos alheios ao nosso controle.

Média das diferenças para estudantes na população geral. A hipótese nula diz que de fato não há diferença entre a nota média de um aluno antes e depois de um aumento na duração da palestra, e mesmo que a média amostral das diferenças seja diferente de zero, isso se deve apenas à amostragem erro ou outros motivos fora do nosso controle

Como é o mesmo que no exemplo nº 1, as explicações podem ser encontradas na primeira coluna (veja o exemplo 1)

Hipótese alternativa

Conclusão sobre a hipótese de conteúdo

Se aceitarmos a hipótese nula de que as drogas têm o mesmo efeito (não há diferença entre as médias), rejeitamos a hipótese de conteúdo, caso contrário, aceitamos a hipótese de conteúdo

Se aceitarmos a hipótese nula de que a duração da aula não afeta o desempenho, rejeitamos a hipótese do conteúdo e vice-versa

Se aceitarmos a hipótese nula - a questão não afeta a escolha do respondente, rejeitamos a hipótese de conteúdo e vice-versa.

Um dos casos mais simples de testar uma hipótese estatística é testar a igualdade entre a média populacional e algum valor dado. O valor dado é algum número fixo µ 0 obtido não de seletiva dados. As hipóteses são as seguintes.

H 0: µ = µ 0 - a hipótese nula afirma que a média desconhecida da população µ é exatamente igual ao valor dado µ 0 .

H 1: µ µ 0 - a hipótese alternativa afirma que a média da população desconhecida µ não é igual ao valor dado µ 0 .

Observe que, na verdade, existem três números diferentes envolvidos aqui que têm a ver com a média:

§ µ é a média populacional desconhecida que você está interessado;

§ µ 0 - dado o valor contra o qual a hipótese está sendo testada;

§ - média amostral conhecida, que é utilizada para decidir sobre a aceitação da hipótese. Desses três números, apenas esse valor é uma variável aleatória, pois é calculado a partir dos dados da amostra. notar que é uma estimativa e, portanto, representa µ.

O teste de hipóteses consiste em comparar dois valores conhecidos e µ 0 . Se esses valores diferirem mais do que seria esperado ao acaso, então a hipótese nula µ = µ 0 é rejeitada porque fornece informações sobre a média desconhecida µ. Se os valores e µ 0 estiverem próximos o suficiente, então a hipótese nula µ = µ 0 é aceita. Mas o que significa “os valores estão próximos”? Onde está o limite necessário? A proximidade deve ser determinada com base no valor, pois esse erro padrão determina o grau de aleatoriedade. Assim, se µ 0 e são separados por um número suficiente de erros padrão, então esta é uma evidência convincente de que µ não é igual a µ 0 .

Existir dois vários métodos para testar a hipótese e obter o resultado. O primeiro o método usa os intervalos de confiança discutidos no capítulo anterior. Este é um método mais fácil porque (a) você já sabe como construir e interpretar um intervalo de confiança, e (b) o intervalo de confiança é simples de interpretar porque é expresso nas mesmas unidades que os dados (por exemplo, dólares, número de pessoas , o número de avarias). Segundo método (baseado em t-estatísticas) é mais tradicional, mas menos intuitivo, pois consiste em calcular um indicador que não é medido nas mesmas unidades dos dados, comparando o valor resultante com o correspondente crítico valor da tabela t e, em seguida, tire uma conclusão.

Verificando se a média é igual a um determinado valor.

As amostras são retiradas de uma população que tem distribuição normal, os dados são independentes.

O valor do critério é calculado pela fórmula:

onde N é o tamanho da amostra;

S 2 - variância amostral empírica;

A - o valor estimado do valor médio;

X é o valor médio.

O número de graus de liberdade para o teste t V = n-1.

Zero nova hipótese

H 0: X \u003d A vs. H A: X≠A. A hipótese nula sobre a igualdade das médias é rejeitada se o valor absoluto do valor do critério for maior que o α/2% superior do ponto da distribuição t tomada com V graus de liberdade, ou seja, quando │t│ > tvα/2.

H 0: X< А против Н А: X >A. A hipótese nula é rejeitada se o valor do critério for maior que o ponto α% superior da distribuição t tomada com V graus de liberdade, ou seja, quando │t│> t vα .

H 0: X>A vs. H A: X< А. Нулевая гипотеза отвергается, если критериальное значение меньше нижней α% точки t-распределения, взятого с V степенями свободы.

O critério é estável para pequenos desvios da distribuição normal.

Exemplo

Considere o exemplo mostrado na Fig. 5.10. Digamos que precisamos testar a hipótese de que a média amostral (células 123:130) é igual a 0,012.

Primeiro encontramos a média amostral (=MÉDIA(123:130) em I31) e a variância (=VAR(I23:I30) em I32). Em seguida, calculamos os valores critérios (=(131-0,012)*ROOT(133)/132) e críticos (=STEUDRASP(0,025;133-1)). Como o valor do critério (24,64) é maior que o valor crítico (2,84), a hipótese sobre a igualdade da média 0,012 é rejeitada.

Figura 5.10 Comparando valor médio com constante

1. testar hipóteses sobre médias e variâncias usando os testes paramétricos de Fisher e Cochran (tabela 5.4);

2. testar a hipótese sobre a igualdade das médias com variâncias desiguais das amostras (para isso, retire 1 ou 2 valores em uma das amostras da sua versão) (tabela 5.4);

3. verificar a hipótese de que a média é igual ao valor dado A (tabela 5.5) e os dados da 1ª coluna para a variante.

Tabela 5.4

Opções de tarefa

Dados do experimento
Opção
2,3 2,6 2,2 2,1 2,5 2,6
1,20 1,42 17,3 23,5 2,37 2,85 35,2 26,1 2,1 2,6
5,63 5,62 26,1 27,0 5,67 2,67 35,9 25,8 5,1 5,63
2,34 2,37 23,9 23,3 2,35 2,34 33,6 23,8 2,34 2,38
7,71 7,90 28,0 25,2 2,59 2,58 35,7 26,0 7,63 7,6,1
1,2 1,6 1,7 2,6 1,9 2,8
1,13 1,15 21,6 21,2 2,13 2,16 31,7 1,12 1,12
1,45 1,47 24,7 24,8 2,45 2,47 34,8 24,5 1,49 1,45
3,57 3,59 25,9 25,7 2,55 2,59 36,0 25,7 3,58 3,58
3,3 3,6 2,5 2,4 3,4 3,5
Dados do experimento
Opção
7,3 7,6 12,2 12,1 3,5 4,6
6,20 6,42 217,3 230,5 12,37 12,85 75,2 86,1 3,1 4,6
7,63 5,62 264,1 278,0 15,67 14,67 75,9 75,8 5,1 5,63
6,34 5,37 233,9 236,3 12,35 12,34 73,6 73,8 3,34 4,38
7,71 7,90 281,0 255,2 12,59 12,58 85,7 86,0 3,63 4,6,1
6,2 6,6 11,7 12,6 3,9 4,8
4,13 4,15 251,6 261,2 12,13 12,16 71,7 5,12 4,12
5,45 6,47 244,7 247,8 12,45 12,47 74,8 84,5 3,49 4,45
5,57 5,59 250,9 255,7 12,55 12,59 86,0 85,7 3,58 3,58
5,3 5,6 12,5 12,4 3,4 3,5

Tabela 5.5

Um valor

Opções
2,2 2,2 2,2 6,5 12,2 3,5

Você pode usar seus dados experimentais como os dados iniciais na tarefa.

O relatório deve conter cálculos de características estatísticas.

Perguntas do teste:

1. Quais problemas estatísticos são resolvidos no estudo de processos tecnológicos na indústria alimentícia?

2. Como são comparadas as características estatísticas das variáveis ​​aleatórias?

3. Nível de significância e nível de confiança com a confiabilidade da avaliação dos dados experimentais.

4. Como as hipóteses estatísticas são testadas usando testes de adequação?

5. O que determina o poder do critério de bondade de ajuste para a análise de amostras experimentais?

6. Como é feita a seleção de um critério de resolução de problemas de análise de processos tecnológicos de produção de alimentos?

7. Como é feita a classificação dos critérios de concordância para análise de amostras dos resultados de estudos de processos tecnológicos de produção de alimentos?

8. Quais são os requisitos para amostragem dos resultados de pesquisas sobre processos tecnológicos para produção de alimentos?