Mana Whitney. Mann-Whitney U-critério em tese, curso e trabalho de mestrado em psicologia

Critério U Mann - Whitney

Atribuindo um critério. O critério é projetado para avaliar as diferenças entre dois amostras por nível qualquer característica que possa ser quantificada. Permite distinguir entre pequena amostras quando P 1, n 2 > 3 ou p L \u003d 2, p 2\u003e 5, e é mais poderoso que o critério Q Rosenbaum.

Este método determina se a área de valores sobrepostos entre duas séries é pequena o suficiente. Lembramos que chamamos a 1ª linha (amostra, grupo) a linha de valores em que os valores, segundo uma estimativa preliminar, são maiores, e a 2ª linha é aquela em que supostamente são menores.

Quanto menor a área de cruzamento, mais provável é que diferenças confiável. Essas diferenças às vezes são chamadas de diferenças de localização duas amostras. O valor empírico do critério reflete quão grande é a zona de coincidência entre as linhas. É por isso quanto menos t/3Mn, especialmenteé provável que as diferenças confiável.

Hipóteses.

O nível de inteligência não verbal no grupo de estudantes de física é maior do que no grupo de estudantes de psicologia.

Representação gráfica de um critérioVOCÊ. Pa fig. 7.25 apresenta três das muitas opções possíveis para a razão de duas séries de valores.

Na opção (a), a segunda linha é mais baixa que a primeira e as linhas quase não se cruzam. Área de sobreposição ( S j) muito pequeno para obscurecer as diferenças entre as linhas. Há uma chance de que as diferenças entre eles sejam significativas. Podemos determinar isso exatamente usando o critério VOCÊ.

Na variante (b), a segunda linha também é menor que a primeira, mas a área de sobreposição de valores para as duas linhas é bastante extensa (5 2). Pode ainda não atingir um valor crítico, quando as diferenças terão de ser reconhecidas como insignificantes. Mas se isso é assim só pode ser determinado pelo cálculo exato do critério VOCÊ.

Na opção (c), a segunda linha é mais baixa que a primeira, mas a sobreposição é tão extensa (5 3) que as diferenças entre as linhas são obscurecidas.

Arroz. 7.25.

em duas amostras

Observação. A sobreposição (5 t , S 2 , *$z) indica as áreas de possível sobreposição. Restrições de critériosVOCÊ.

  • 1. Cada amostra deve conter pelo menos três observações: n v p 2 > 3; é permitido que haja duas observações em uma amostra, mas então deve haver pelo menos 5 delas na segunda.
  • 2. Cada amostra não deve conter mais de 60 observações; pl, 2 w, n 2 > 20 a classificação torna-se bastante trabalhosa.

Vamos retornar aos resultados de uma pesquisa com estudantes das faculdades físicas e psicológicas da Universidade de Leningrado usando o método de D. Veksler para medir a inteligência verbal e não verbal. Usando o critério Q Rosenbaum, foi determinado com alto nível de significância que o nível de inteligência verbal na amostra de alunos da Faculdade de Física é maior. Vamos agora tentar estabelecer se esse resultado se reproduz ao comparar amostras de acordo com o nível de inteligência não verbal. Os dados são dados na tabela.

2 está abaixo do nível da característica na amostra 1 em um nível significativamente significativo. Quanto menor o valor você, quanto maior a significância das diferenças.

Agora vamos fazer todo esse trabalho no material do nosso exemplo. Como resultado do trabalho em 1-6 etapas do algoritmo, construiremos uma tabela (Tabela 7.4).

Tabela 7.4

Cálculo de somas de classificação para amostras de estudantes de faculdades físicas e psicológicas

Estudantes de física (P = 14)

Estudantes de psicologia (n= 12)

Pontuação de inteligência não verbal

Média 107,2

A quantidade total de classificações: 165 + 186 = 351. A quantidade calculada de acordo com a fórmula (5.1) é a seguinte:

Observa-se a igualdade dos valores reais e estimados. Vemos que em termos de nível de inteligência não verbal, uma amostra de estudantes de psicologia é mais “superior”. É esta amostra que responde por uma grande soma de classificação: 186. Agora estamos prontos para formular hipóteses estatísticas:

Auto 0: um grupo de estudantes de psicologia não supera um grupo de estudantes de física em termos de inteligência não verbal;

Eu: um grupo de estudantes de psicologia supera um grupo de estudantes de física em termos de inteligência não verbal.

De acordo com o próximo passo do algoritmo, determinamos o valor empírico você :

Porque no nosso caso p l * p 2, calcule o valor empírico você e para a soma de segunda ordem (165), substituindo na fórmula (7.4) o valor correspondente p.x.:

De acordo com o Apêndice 8, determinamos os valores críticos para pl = 14, n 2 = 12:

Lembramos que o critério você é uma das duas exceções à regra geral para decidir se as diferenças são significativas, ou seja, podemos afirmar diferenças significativas se (/ emp U Kp 0 05 (a temp = 60, e sp > U Kf) cerca de,05).

Consequentemente, H 0 é tomado da seguinte forma: um grupo de estudantes de psicologia não excede um grupo de estudantes de física em termos de nível de inteligência não verbal.

Prestemos atenção ao fato de que, para este caso, o critério Q de Rosenbaum não é aplicável, pois a faixa de variabilidade no grupo de físicos é mais ampla do que no grupo de psicólogos: tanto os valores mais altos quanto os mais baixos de não -a inteligência verbal recai sobre o grupo de físicos (ver Tabela 7.4).

Este método estatístico foi proposto por Frank Wilcoxon (ver foto) em 1945. No entanto, em 1947, o método foi aprimorado e expandido por H. B. Mann e D. R. Whitney, de modo que o teste U é mais comumente referido por seus nomes.

O critério é projetado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medida quantitativamente. Ele permite identificar diferenças entre pequenas amostras quando n 1 ,n 2 ≥3 ou n 1 =2, n 2 ≥5, e é mais poderoso que o teste de Rosenbaum.

Descrição do teste U de Mann-Whitney

Existem várias maneiras de usar o critério e várias opções para tabelas de valores críticos correspondentes a esses métodos (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ).

Este método determina se a área de valores sobrepostos entre duas séries é pequena o suficiente. Lembramos que chamamos a 1ª linha (amostra, grupo) a linha de valores em que os valores, segundo uma estimativa preliminar, são maiores, e a 2ª linha é aquela em que supostamente são menores.

Quanto menor a área de cruzamento, maior a probabilidade de as diferenças serem significativas. Às vezes, essas diferenças são chamadas de diferenças na localização de duas amostras (Welkowitz J. et al., 1982).

O valor empírico do critério U reflete o quão grande é a zona de coincidência entre as linhas. Portanto, quanto menor U emp, mais provável é que as diferenças sejam significativas.

Hipóteses U - Teste de Mann-Whitney

H0: O nível do atributo no grupo 2 não é inferior ao nível do atributo no grupo 1.
H1: O nível da característica no grupo 2 é inferior ao nível da característica no grupo 1.

Limitações do teste U de Mann-Whitney

1. Cada amostra deve conter pelo menos 3 observações: n 1 ,n 2 ≥ З; é permitido que haja 2 observações em uma amostra, mas então deve haver pelo menos 5 delas na segunda.

2. Cada amostra não deve conter mais de 60 observações; n 1 , n 2 ≤ 60.

Cálculo automático do teste U de Mann-Whitney

Passo 1

Insira os dados da primeira amostra na primeira coluna (“Amostra 1”) e os dados da segunda amostra na segunda coluna (“Amostra 2”). Os dados são inseridos um número por linha; sem espaços, lacunas, etc. Apenas números são inseridos. Os números fracionários são inseridos com um "." (ponto). Após preencher as colunas, clique no botão "Passo 2" para calcular automaticamente o teste U de Mann-Whitney.

Teste U de Mann-Whitney(Inglês) Teste U de Mann-Whitney) é um teste estatístico usado para avaliar as diferenças entre duas amostras independentes em termos do nível de qualquer característica, medido quantitativamente. Permite detectar diferenças no valor de um parâmetro entre pequenas amostras.

Teste de soma de postos de Wilcoxon ). Menos comum: o critério para o número de inversões.

História

Este método para detectar diferenças entre amostras foi proposto em 1945 por Frank Wilcoxon ( F. WilcoxonH.B. Mann) e D. R. Whitney ( D. R. Whitney

Descrição do critério

  1. Não deve haver valores correspondentes nos dados da amostra (todos os números são diferentes) ou deve haver muito poucas correspondências (até 10).

Usando um critério

  1. Compile uma única série classificada de ambas as amostras comparadas, organizando seus elementos de acordo com o grau de crescimento do recurso e atribuindo uma classificação mais baixa ao valor mais baixo. O número total de fileiras será igual a: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) onde n 1 (\displaystyle n_(1)) é o número de elementos na primeira amostra e n 2 (\displaystyle n_(2)) - o número de elementos na segunda amostra.
  2. Divida uma única série classificada em duas, consistindo em unidades da primeira e segunda amostras, respectivamente. Calcule separadamente a soma das classificações que caíram na participação dos elementos da primeira amostra e separadamente - na participação dos elementos da segunda amostra. Definir grande de duas somas de classificação (T x (\displaystyle T_(x))) correspondentes a uma amostra com n x (\displaystyle n_(x)) elementos.
  3. Determine o valor do teste U de Mann-Whitney usando a fórmula: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
  4. De acordo com a tabela para o nível de significância estatística selecionado, determine o valor crítico do critério para os dados n 1 (\displaystyle n_(1)) e n 2 (\displaystyle n_(2)) . Se o valor recebido for U (\displaystyle U) menos tabular ou igual a ela, então é reconhecida a existência de uma diferença significativa entre o nível da característica nas amostras consideradas (uma hipótese alternativa é aceita). Se o valor resultante U (\displaystyle U) for maior que o valor da tabela, a hipótese nula é aceita. A significância das diferenças é maior, quanto menor for o valor de U (\displaystyle U) .
  5. Se a hipótese nula for verdadeira, o critério tem a expectativa M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1)\cdot n_(2))(2)) ) e variância D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1)\cdot n_(2)\cdot (n_) (1)+ n_(2)+1))(12))) e com uma quantidade suficientemente grande de dados de amostra (n 1 > 19 , n 2 > 19) (\displaystyle (n_(1)>19,\; n_(2)>19 )) é distribuído quase normalmente.

Tabela de valores críticos

  • Cálculo dos valores críticos do teste U de Mann-Whitney para amostras maiores que 20 (N>20) (downlink de 10-02-2017 )

Teste de Mann-Whitney: exemplo, tabela

Um critério em estatística matemática é uma regra estrita segundo a qual uma hipótese com um certo nível de significância é aceita ou rejeitada. Para construí-lo, você precisa encontrar uma determinada função. Deve depender dos resultados finais do experimento, ou seja, dos valores encontrados empiricamente. É esta função que será uma ferramenta para avaliar a discrepância entre as amostras.

Valor estatisticamente significativo. Informação geral

A significância estatística é uma quantidade que é improvável de ocorrer por acaso. Seus indicadores mais extremos também são insignificantes. Diz-se que uma diferença é estatisticamente significativa se houver dados que provavelmente não ocorrerão se a diferença não existir. Mas isso não significa de forma alguma que essa diferença deva necessariamente ser grande e significativa.

O nível de significância estatística do teste

Este termo deve ser entendido como a probabilidade de rejeitar a hipótese nula se ela for verdadeira. Isso também é chamado de erro do tipo I ou uma decisão de falso positivo. Na maioria dos casos, o processo depende de um valor-p ("valor-pi"). Esta é a probabilidade acumulada ao observar o nível do critério estatístico. Ela, por sua vez, é calculada a partir da amostra no momento da aceitação da hipótese nula. A suposição será rejeitada se este valor de p for menor que o nível declarado pelo analista. A significância do valor do teste depende diretamente desse indicador: quanto menor, mais motivos para rejeitar a hipótese, respectivamente.
O nível de significância é geralmente denotado pela letra b (alfa). Indicadores populares entre especialistas: 0,1%, 1%, 5% e 10%. Se, digamos, for dito que as chances de coincidência são de 1 em 1000, então estamos definitivamente falando sobre o nível de 0,1% da significância estatística de uma variável aleatória. Diferentes níveis b têm seus prós e contras. Se a pontuação for menor, então a hipótese alternativa é mais provável de ser significativa. No entanto, existe o risco de que a falsa suposição nula não seja rejeitada. Pode-se concluir que a escolha do nível b ótimo depende do equilíbrio "significação-poder" ou, consequentemente, do trade-off das probabilidades de decisões de falso positivo e falso negativo. Um sinônimo de "significado estatístico" na literatura nacional é o termo "confiabilidade".

Definição de hipótese nula

Em estatística matemática, essa é uma suposição testada quanto à consistência com dados empíricos já em estoque. Na maioria dos casos, a hipótese nula é a hipótese de que não há correlação entre as variáveis ​​em estudo ou que não há diferenças de homogeneidade nas distribuições em estudo. Na pesquisa padrão, um matemático tenta refutar a hipótese nula, ou seja, provar que ela não é consistente com dados experimentais. Além disso, deve haver uma suposição alternativa, que é tomada em vez do zero um.

Definição de chave

O critério U (Mann-Whitney) em estatística matemática permite avaliar as diferenças entre duas amostras. Eles podem ser dados de acordo com o nível de alguma característica, que é medida quantitativamente. Este método é ideal para estimar diferenças em pequenas amostras. Este critério simples foi proposto por Frank Wilcoxon em 1945. E já em 1947, o método foi revisado e complementado pelos cientistas H. B. Mann e D. R. Whitney, cujos nomes são chamados até hoje. O critério de Mann-Whitney em psicologia, matemática, estatística e muitas outras ciências é um dos elementos fundamentais da fundamentação matemática dos resultados da pesquisa teórica.

Descrição

O teste de Mann-Whitney é um método relativamente simples, sem parâmetros. Seu poder é significativo. É significativamente maior do que o poder do Rosenbaum Q-test. O método avalia quão pequena é a área de valores cruzados entre amostras, ou seja, entre a série ranqueada de valores do primeiro e segundo conjuntos. Quanto menor o valor do critério, mais provável é que as discrepâncias dos valores dos parâmetros sejam confiáveis. Para aplicar corretamente o critério U (Mann-Whitney), não se deve esquecer algumas limitações. Cada amostra deve conter pelo menos 3 valores de recurso. É possível que em um caso haja dois valores, mas no segundo caso deve haver pelo menos cinco deles. Nas amostras estudadas, deve haver um número mínimo de indicadores correspondentes. Todos os números devem ser diferentes idealmente.

Uso

Como usar o teste de Mann-Whitney corretamente? A tabela compilada por este método contém determinados valores críticos. O primeiro passo é criar uma única série de ambas as amostras correspondentes, que é então classificada. Ou seja, os elementos são alinhados de acordo com o grau de crescimento do atributo, e uma classificação mais baixa é atribuída a um valor mais baixo. Como resultado, obtemos o seguinte número total de classificações:

N = N1 + N2,

onde os valores N1 e N2 são o número de unidades contidas na primeira e segunda amostras, respectivamente. Além disso, uma única série de valores classificados é dividida em duas categorias. Unidades, respectivamente, da primeira e segunda amostras. Agora, a soma das classificações dos valores na primeira e segunda linhas é calculada por sua vez. O maior deles (Tx) é determinado, o que corresponde a uma amostra com nx uns. Para usar ainda mais o método de Wilcoxon, seu valor é calculado pelo método a seguir. É necessário descobrir na tabela para o nível de significância escolhido o valor crítico deste critério para N1 e N2 especificamente tomados.
O indicador resultante pode ser menor ou igual ao valor da tabela. Neste caso, afirma-se uma diferença significativa nos níveis da característica nas amostras estudadas. Se o valor obtido for maior que o valor da tabela, então a hipótese nula é aceita. Ao calcular o teste de Mann-Whitney, deve-se notar que se a hipótese nula for verdadeira, o teste terá uma média e uma variância. Observe que para volumes suficientemente grandes de dados de amostra, o método é considerado quase normalmente distribuído. A significância das diferenças é quanto maior, menor o valor do teste de Mann-Whitney.

Valores do critério Pearson (critério)

  1. Tabelas de probabilidades associadas aos valores do teste de Mann-Whitney.

Tabelas de probabilidades associadas aos valores do teste de Mann-Whitney. Para o valor experimental do critério (o menor dos dois valores) e tamanhos de amostra, encontre a probabilidade de que ambos os grupos pertençam à mesma população geral. Assim, um valor de baixa probabilidade, por exemplo, P

    Tabela 3

  1. Tabela 4

  2. Tabela 5

    1. Tabela 6

  1. Tabela de valores críticos do teste de Mann-Whitney para o nível de significância.

Se , então a diferença entre as amostras é significativa para , ou seja, a hipótese nula deve ser rejeitada.

N 2

N 1

2. U - Teste de Mann-Whitney

O critério é projetado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medida quantitativamente. Ele permite detectar diferenças entre pequenas amostras quando n1 e n2 são maiores ou iguais a 3 (ou n1 = 2, e n2 é maior ou igual a 5.)

O método determina se a área de valores sobrepostos entre duas séries é pequena o suficiente. Quanto menor essa área, mais provável é que as diferenças sejam significativas. O valor empírico (realmente obtido) do critério U reflete quão grande é a zona de coincidência entre as linhas. Quanto menor o Uemp., mais provável é que as diferenças sejam significativas.

Hipóteses.

Mas: O nível do atributo no grupo 2 não é inferior ao nível do atributo no grupo 1.

H1: O nível da característica no grupo 2 é inferior ao nível da característica no grupo 1.

Limitações do critério U.

1. Deve haver pelo menos 3 observações em cada amostra ou, em casos extremos, é permitida uma proporção de 2 para 5 ou mais.

2. Não deve haver mais de 60 observações em cada amostra.

Algoritmo para cálculo do critério U - Mann-Whitney.

1. Transfira todos os dados da amostra para cartões individuais (nos quais será refletido em cores ou de alguma outra forma a qual das amostras o valor pertence).

2. Disponha todas as cartas em uma linha comum à medida que o sinal aumenta, independentemente de qual amostra elas pertençam.

3. Classifique (de acordo com o algoritmo de classificação) os valores nas cartas, atribuindo uma classificação mais baixa ao valor mais baixo. Deve haver n1 + n2 classificações no total (o tamanho da primeira amostra + o tamanho da segunda amostra).

4. Reorganize os cartões em duas filas, com base em pertencer à amostra 1 ou à amostra 2.

6. Determine a maior das duas somas de classificação.

7. Determine o valor de U pela fórmula:

8. Determine a partir das tabelas os valores críticos de U, de acordo com isso, aceite ou rejeite a hipótese nº.

3. H - Critério de Kruskal - Wallis

O critério H é usado para avaliar diferenças na severidade da característica analisada simultaneamente entre três, quatro ou mais amostras. Ele permite identificar o grau de alteração da característica nas amostras, sem indicar, no entanto, a direção dessas alterações.

O critério baseia-se no princípio de que quanto menor a sobreposição das amostras, maior o nível de significância. H emp . Deve-se enfatizar que pode haver um número diferente de sujeitos nas amostras, embora nas tarefas abaixo seja dado um número igual de sujeitos nas amostras.

Trabalhar com dados começa com o fato de que todas as amostras são combinadas condicionalmente na ordem de ocorrência dos valores em uma amostra, e os valores dessa amostra combinada são classificados. Em seguida, os ranks obtidos são afixados aos dados da amostra original e a soma dos ranks é calculada separadamente para cada amostra. O critério é baseado na seguinte ideia – se as diferenças entre as amostras são insignificantes, então as somas das classificações não diferirão significativamente umas das outras e vice-versa.

Valor H emp calculado pela fórmula:

H emp

Onde Né o número total de membros da amostra generalizada;

n i é o número de membros em cada amostra individual;

são os quadrados das somas dos ranks para cada amostra.

Ao determinar os valores críticos do critério para quatro ou mais amostras, use a tabela para o critério hee-quadrado, tendo calculado previamente o número de graus de liberdade v por c = 4. Então v = c- 1 = 4 – 1=3..

Ressaltamos que se utilizarmos critérios que nos permitam comparar apenas duas séries de valores, então o resultado obtido acima exigiria seis comparações - a primeira amostra com a segunda, terceira, etc.

Para usar o critério H as seguintes condições devem ser atendidas:

1. A medição deve ser feita em uma escala de ordem, intervalos ou razões.

2. As amostras devem ser independentes.

3. É permitido um número diferente de sujeitos nas amostras comparadas.

4. Ao comparar três amostras, é permitido que uma delas contenha n = 3, e nos outros dois n = 2. No entanto, neste caso, as diferenças podem ser registradas apenas ao nível de significância de 5%.

5. A Tabela 9 do Apêndice é fornecida para apenas três amostras e ( n 1n 2, n H), £ 5, ou seja, o número máximo de sujeitos nas três amostras pode ser menor e igual a 5.

6. Com um número maior de amostras e um número diferente de sujeitos em cada amostra, você deve usar a tabela para o critério hee-quadrado. Neste caso, o número de graus de liberdade é determinado pela fórmula: v = Com - 1, onde Com - o número de amostras correspondentes.

O teste U de Mann-Whitney é:

Teste U de Mann-Whitney

Teste U de Mann-Whitney

Teste U de Mann-Whitney(Inglês) Teste U de Mann-Whitney) é um critério estatístico usado para avaliar as diferenças entre duas amostras em termos do nível de alguma característica, medido quantitativamente. Permite detectar diferenças no valor de um parâmetro entre pequenas amostras.

Outros nomes: teste de Mann-Whitney-Wilcoxon Mann-Whitney-Wilcoxon, MWW), o teste de soma de postos de Wilcoxon (eng. Teste de soma de postos de Wilcoxon) ou o teste de Wilcoxon-Mann-Whitney (eng. Teste de Wilcoxon-Mann-Whitney).

História

Este método de detecção de diferenças entre amostras foi proposto em 1945 por Frank Wilcoxon ( F. Wilcoxon). Em 1947 foi substancialmente revisto e ampliado por H. B. Mann ( H.B. Mann) e D. R. Whitney ( D. R. Whitney), por cujos nomes costuma ser chamado hoje.

Descrição do critério

Um teste não paramétrico simples. O poder do teste é maior do que o do Rosenbaum Q-test.

Este método determina se a área de valores de sobreposição entre duas séries (a série classificada de valores de parâmetros na primeira amostra e a mesma na segunda amostra) é pequena o suficiente. Quanto menor o valor do critério, mais provável é que as diferenças entre os valores dos parâmetros nas amostras sejam significativas.

Limitações de Aplicabilidade do Critério

  1. Cada uma das amostras deve conter pelo menos 3 valores de característica. É permitido que em uma amostra haja dois valores, mas na segunda haja pelo menos cinco.
  2. Não deve haver valores correspondentes nos dados da amostra (todos os números são diferentes) ou deve haver muito poucas correspondências.

Usando um critério

Para aplicar o teste U de Mann-Whitney, você precisa realizar as seguintes operações.

  • Cálculo automático do teste U de Mann-Whitney

Tabela de valores críticos

  • Tabela de valores críticos do teste U de Mann-Whitney
  • Valores Críticos para o Mann - Whitney U-Test.

Veja também

  • O teste de Kruskal-Wallis é uma generalização multivariada do teste U de Mann-Whitney.

Literatura

  • Mann H.B., Whitney D.R. Em um teste de se uma das duas variáveis ​​aleatórias é estocasticamente maior que a outra. // Anais de Estatística Matemática. - 1947. - Nº 18. - P. 50-60.
  • Wilcoxon F. Comparações individuais por métodos de classificação. // Boletim Biométrico 1. - 1945. - P. 80-83.
  • Gubler E.V., Genkin A.A. Aplicação de critérios estatísticos não paramétricos na investigação biomédica. - L., 1973.
  • Sidorenko E.V. Métodos de processamento matemático em psicologia. - São Petersburgo, 2002.

Fundação Wikimedia. 2010.

  • U-954
  • mulheres de ponto U

Veja o que é o "Mann-Whitney U-test" em outros dicionários:

    Teste U de Mann- Teste U Mann Whitney (eng. Mann Whitney U test) é um teste estatístico usado para avaliar as diferenças entre duas amostras independentes em termos do nível de qualquer característica, medido quantitativamente. Permite identificar ... ... Wikipédia

    Teste U de Mann-Whitney- (Teste U do Eng. Mann Whitney) teste estatístico não paramétrico usado para avaliar as diferenças entre duas amostras em termos do nível de qualquer traço, medido quantitativamente. Permite identificar diferenças no valor de um parâmetro entre pequenas ... Wikipedia

    Teste de Mann-Whitney

    Teste de Mann-Whitney-Wilcoxon- O teste Mann Whitney U é um teste estatístico não paramétrico usado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medido quantitativamente. Permite identificar diferenças de significado ... Wikipedia

    Teste de Mann-Whitney-Wilcoxon- O teste Mann Whitney U é um teste estatístico não paramétrico usado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medido quantitativamente. Permite identificar diferenças de significado ... Wikipedia

    Teste de Mann Whitney- - Tópicos de telecomunicações, conceitos básicos EN Mann Whitney U test ... Guia técnico do tradutor

    Teste de Wilcoxon-Mann-Whitney- O teste Mann Whitney U é um teste estatístico não paramétrico usado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medido quantitativamente. Permite identificar diferenças de significado ... Wikipedia

    Teste de Wilcoxon-Mann-Whitney- O teste Mann Whitney U é um teste estatístico não paramétrico usado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medido quantitativamente. Permite identificar diferenças de significado ... Wikipedia

    Teste de soma de classificação de Wilcoxon- O teste Mann Whitney U é um teste estatístico não paramétrico usado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medido quantitativamente. Permite identificar diferenças de significado ... Wikipedia

    Teste de soma de classificação de Wilcoxon- O teste Mann Whitney U é um teste estatístico não paramétrico usado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medido quantitativamente. Permite identificar diferenças de significado ... Wikipedia

Livros

  • Estatísticas e selos, Vladimir Savelyev. Neste livro, você aprenderá o que são variância e desvio padrão, como encontrar o teste t de Student e o teste U de Mann-Whitney, para que são usadas as análises de regressão e fator, ... Mais Compre por 280 rublos e-book

O critério U é de primeira ordem, portanto é invariante em relação a qualquer transformação monótona da escala de medição.

Outros nomes: teste de Mann-Whitney-Wilcoxon (Mann-Whitney-Wilcoxon, MWW), teste de soma de postos de Wilcoxon ou teste de Wilcoxon-Mann-Whitney (WMW).

Exemplos de tarefas

Exemplo 1 A primeira amostra são os pacientes que foram tratados com o medicamento A. A segunda amostra são os pacientes que foram tratados com o medicamento B. Os valores nas amostras são algumas características da eficácia do tratamento (o nível do metabólito no sangue, temperatura três dias após o início do tratamento, a duração da recuperação, o número de leitos hospitalares). dias, etc.) É necessário descobrir se há uma diferença significativa na eficácia dos medicamentos A e B, ou as diferenças são puramente aleatórios e são explicados pela variação "natural" da característica selecionada.

Exemplo 2 A primeira amostra são os campos tratados com o método cultural A. A segunda amostra são os campos tratados com o método cultural B. Os valores nas amostras são o rendimento. É necessário descobrir se um dos métodos é mais eficaz que o outro, ou se as diferenças de rendimento se devem a fatores aleatórios.

Exemplo 3 A primeira amostra são os dias em que foi realizada uma promoção do tipo A (etiquetas vermelhas com desconto) no supermercado. A segunda amostra são os dias da promoção tipo B (cada quinto pacote é grátis). Os valores nas amostras são um indicador da eficácia da promoção (volume de vendas ou receita em rublos). É necessário descobrir qual tipo de promoção é mais eficaz.

Descrição do critério

Duas amostras são dadas.

Suposições adicionais:

Às vezes é erroneamente considerado que o teste U testa a hipótese nula de medianas iguais em duas amostras. Existem distribuições para as quais a hipótese é verdadeira, mas suas medianas são diferentes.

O teste U pode ser usado para testar a hipótese de deslocamento como uma alternativa , onde é alguma constante diferente de zero. Com esta alternativa, o teste U é consistente. É aconselhável usá-lo se forem realizadas duas séries de medições de dois valores de uma determinada grandeza física com o mesmo instrumento. Neste caso, a função de distribuição descreve os erros de medição de um valor e outro. No entanto, em muitas aplicações (econometria em particular) não há nenhuma razão específica para supor que a distribuição da segunda amostra apenas muda, mas não muda de nenhuma outra forma.

O teste U é um análogo não paramétrico do teste t de Student. Se as amostras forem normais, então é preferível aplicar o teste t de Student mais poderoso para testar a hipótese de deslocamento.

História

Este método de detecção de diferenças entre amostras foi proposto em 1945 por Frank Wilcoxon. Foi substancialmente revisto e ampliado em 1947 por Mann e Whitney, por cujos nomes é comumente referido hoje.

Literatura

  1. Mann H.B., Whitney D.R. Em um teste de se uma das duas variáveis ​​aleatórias é estocasticamente maior que a outra. // Anais de Estatística Matemática. - 1947, nº 18. - P. 50-60.
  2. Wilcoxon F. Comparações individuais por métodos de classificação. // Boletim Biométrico 1. 1945. - Pág. 80-83.
  3. Orlov A. I. Econometria. - M.: Exame, 2003. - 576 p. (§4.5 Que hipóteses podem ser testadas usando o teste de Wilcoxon de duas amostras?)
  4. Kobzar A.I. Estatística matemática aplicada. - M.: Fizmatlit, 2006. - 816 p.

Teste de Mann-Whitney representa uma alternativa não paramétrica ao teste t para amostras independentes. Sua vantagem é que abandonamos a hipótese de distribuição normal e variâncias iguais. É essencial que os dados sejam medidos pelo menos em escala ordinal.

O STATISTICA assume que os dados estão organizados da mesma forma que os testes in e t para amostras independentes. O arquivo deve conter uma variável de código (independente) que tenha pelo menos dois códigos diferentes para identificar de forma exclusiva se cada observação pertence a um determinado grupo.

Suposições e interpretação. Teste de Mann-Whitney assume que as variáveis ​​em questão são medidas pelo menos em uma escala ordinal (classificada). A interpretação do teste é essencialmente semelhante à interpretação dos resultados do teste t para amostras independentes, exceto que o teste U é calculado como a soma dos indicadores de comparação pareada dos elementos da primeira amostra com os elementos da segunda amostra. Teste U - a alternativa não paramétrica mais poderosa (sensível) teste t para amostras independentes; na verdade, em alguns casos é ainda mais poderoso que o teste t.

Se o tamanho da amostra for maior que 20, então a distribuição amostral para a estatística U converge rapidamente para uma distribuição normal (ver Siegel, 1956). Assim, juntamente com a estatística U, serão mostrados o valor z (para uma distribuição normal) e o valor p correspondente.

Probabilidades exatas para amostras pequenas. Para amostras pequenas, o STATISTICA calculará a probabilidade exata associada à estatística U correspondente. Essa probabilidade é baseada na contagem de todos os valores possíveis de U dado o número de observações em duas amostras (ver Dinneen & Blakesley, 1973). O programa reportará (na última coluna da tabela de resultados) o valor 2 * p, onde p é igual a 1 menos a probabilidade cumulativa (unicaudal) da estatística U correspondente. Observe que isso geralmente não leva a uma grande subestimação da significância estatística dos efeitos relevantes (ver Siegel, 1956).

A estatística de teste se parece com isso.

Onde C- Estatisticas Wilcoxon projetado para testar a mesma hipótese

por outro lado

Então as estatísticas você conta o número total de casos em que os elementos da segunda amostra superam os elementos da primeira amostra. Se a hipótese estiver correta, então

Teste de Mann-Whitney assume que as variáveis ​​em questão são medidas pelo menos em uma escala ordinal (classificada). A interpretação do teste é essencialmente a mesma que a interpretação dos resultados t-critérios para amostras independentes, exceto que o critério U é calculado como a soma dos indicadores de comparação pareada dos elementos da primeira amostra com os elementos da segunda amostra. Teste U - a alternativa não paramétrica mais poderosa (sensível) t-critérios para amostras independentes; na verdade, em alguns casos, tem ainda mais poder do que t-critério.

Se o tamanho da amostra for maior que 20, então a distribuição amostral para a estatística U converge rapidamente para uma distribuição normal. Portanto, juntamente com a estatística U, o valor z (para uma distribuição normal) e o correspondente p-significado.

Instruções detalhadas sobre como usar os critérios podem ser encontradas posteriormente na seção de exemplo de aplicação.

Exemplo

Vamos testar a hipótese de que as amostras independentes comparadas pertencem à mesma população geral usando o teste U não paramétrico de Mann-Whitney. Vamos comparar os resultados obtidos no exemplo de Estatística Básica e teste t de Student para a 2ª e 3ª colunas da tabela de teste t de Student com os resultados da comparação não paramétrica.

Para calcular o teste U de Wilcoxon, organizamos as variantes das amostras comparadas em ordem crescente em uma série generalizada e atribuímos classificações de 1 a n1 + n2 às variantes da série generalizada. A primeira linha representa as variantes da primeira amostra, a segunda - a segunda amostra, a terceira - as classificações correspondentes na série generalizada:





















Deve-se notar que, se houver opções idênticas, elas recebem uma classificação média, mas o valor da última classificação deve ser igual a n1 + n2 (no nosso caso, 20). Esta regra é usada para verificar se a classificação está correta.

Separadamente para cada amostra, calculamos a soma das classificações de suas variantes R1 e R2. No nosso caso:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Para verificar a exatidão dos cálculos, você pode usar outra regra: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). No nosso caso, R1 + R2 = 210.

Estatísticas U1 = 69 - 10*11/2 = 14; U2 \u003d 141 - 10 * 11/2 \u003d 86.

Para testar o teste unicaudal, selecionamos a estatística mínima U1 = 14 e comparamos com o valor crítico para n1 = n2 = 10 e o nível de significância de 1% igual a 19.

Como o valor calculado do critério é menor que o tabular, a hipótese nula é rejeitada no nível de significância escolhido, e as diferenças entre as amostras são consideradas estatisticamente significativas. Assim, a conclusão sobre a existência de diferenças, feita pelo teste paramétrico de Student, é confirmada por este método não paramétrico.