Mana Whitney. Mann-Whitney U-critério em tese, curso e trabalho de mestrado em psicologia

Critério U Mann - Whitney

Atribuindo um critério. O critério é projetado para avaliar as diferenças entre dois amostras por nível qualquer característica que possa ser quantificada. Permite distinguir entre pequena amostras quando P 1, n 2 > 3 ou p L \u003d 2, p 2\u003e 5, e é mais poderoso que o critério Q Rosenbaum.

Este método determina se a área de valores sobrepostos entre duas séries é pequena o suficiente. Lembramos que chamamos a 1ª linha (amostra, grupo) a linha de valores em que os valores, segundo uma estimativa preliminar, são maiores, e a 2ª linha é aquela em que supostamente são menores.

Quanto menor a área de cruzamento, mais provável é que diferenças confiável. Essas diferenças às vezes são chamadas de diferenças de localização duas amostras. O valor empírico do critério reflete quão grande é a zona de coincidência entre as linhas. É por isso quanto menos t/3Mn, especialmenteé provável que as diferenças confiável.

Hipóteses.

O nível de inteligência não verbal no grupo de estudantes de física é maior do que no grupo de estudantes de psicologia.

Representação gráfica de um critérioVOCÊ. Pa fig. 7.25 apresenta três das muitas opções possíveis para a razão de duas séries de valores.

Na opção (a), a segunda linha é mais baixa que a primeira e as linhas quase não se cruzam. Área de sobreposição ( S j) muito pequeno para obscurecer as diferenças entre as linhas. Há uma chance de que as diferenças entre eles sejam significativas. Podemos determinar isso exatamente usando o critério VOCÊ.

Na variante (b), a segunda linha também é menor que a primeira, mas a área de sobreposição de valores para as duas linhas é bastante extensa (5 2). Pode ainda não atingir um valor crítico, quando as diferenças terão de ser reconhecidas como insignificantes. Mas se isso é assim só pode ser determinado pelo cálculo exato do critério VOCÊ.

Na opção (c), a segunda linha é mais baixa que a primeira, mas a sobreposição é tão extensa (5 3) que as diferenças entre as linhas são obscurecidas.

Arroz. 7.25.

em duas amostras

Observação. A sobreposição (5 t , S 2 , *$z) indica as áreas de possível sobreposição. Restrições de critériosVOCÊ.

1. Cada amostra deve conter pelo menos três observações: n v p 2 > 3; é permitido que haja duas observações em uma amostra, mas então deve haver pelo menos 5 delas na segunda.
2. Cada amostra não deve conter mais de 60 observações; pl, 2 w, n 2 > 20 a classificação torna-se bastante trabalhosa.

Vamos retornar aos resultados de uma pesquisa com estudantes das faculdades físicas e psicológicas da Universidade de Leningrado usando o método de D. Veksler para medir a inteligência verbal e não verbal. Usando o critério Q Rosenbaum, foi determinado com alto nível de significância que o nível de inteligência verbal na amostra de alunos da Faculdade de Física é maior. Vamos agora tentar estabelecer se esse resultado se reproduz ao comparar amostras de acordo com o nível de inteligência não verbal. Os dados são dados na tabela.

2 está abaixo do nível da característica na amostra 1 em um nível significativamente significativo. Quanto menor o valor você, quanto maior a significância das diferenças.

Agora vamos fazer todo esse trabalho no material do nosso exemplo. Como resultado do trabalho em 1-6 etapas do algoritmo, construiremos uma tabela (Tabela 7.4).

Tabela 7.4

Cálculo de somas de classificação para amostras de estudantes de faculdades físicas e psicológicas

Estudantes de física (P = 14)		Estudantes de psicologia (n= 12)
		Pontuação de inteligência não verbal























Média 107,2

A quantidade total de classificações: 165 + 186 = 351. A quantidade calculada de acordo com a fórmula (5.1) é a seguinte:

Observa-se a igualdade dos valores reais e estimados. Vemos que em termos de nível de inteligência não verbal, uma amostra de estudantes de psicologia é mais “superior”. É esta amostra que responde por uma grande soma de classificação: 186. Agora estamos prontos para formular hipóteses estatísticas:

Auto 0: um grupo de estudantes de psicologia não supera um grupo de estudantes de física em termos de inteligência não verbal;

Eu: um grupo de estudantes de psicologia supera um grupo de estudantes de física em termos de inteligência não verbal.

De acordo com o próximo passo do algoritmo, determinamos o valor empírico você :

Porque no nosso caso p l * p 2, calcule o valor empírico você e para a soma de segunda ordem (165), substituindo na fórmula (7.4) o valor correspondente p.x.:

De acordo com o Apêndice 8, determinamos os valores críticos para pl = 14, n 2 = 12:

Lembramos que o critério você é uma das duas exceções à regra geral para decidir se as diferenças são significativas, ou seja, podemos afirmar diferenças significativas se (/ emp U Kp 0 05 (a temp = 60, e sp > U Kf) cerca de,05).

Consequentemente, H 0 é tomado da seguinte forma: um grupo de estudantes de psicologia não excede um grupo de estudantes de física em termos de nível de inteligência não verbal.

Prestemos atenção ao fato de que, para este caso, o critério Q de Rosenbaum não é aplicável, pois a faixa de variabilidade no grupo de físicos é mais ampla do que no grupo de psicólogos: tanto os valores mais altos quanto os mais baixos de não -a inteligência verbal recai sobre o grupo de físicos (ver Tabela 7.4).

Este método estatístico foi proposto por Frank Wilcoxon (ver foto) em 1945. No entanto, em 1947, o método foi aprimorado e expandido por H. B. Mann e D. R. Whitney, de modo que o teste U é mais comumente referido por seus nomes.

O critério é projetado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medida quantitativamente. Ele permite identificar diferenças entre pequenas amostras quando n 1 ,n 2 ≥3 ou n 1 =2, n 2 ≥5, e é mais poderoso que o teste de Rosenbaum.

Descrição do teste U de Mann-Whitney

Existem várias maneiras de usar o critério e várias opções para tabelas de valores críticos correspondentes a esses métodos (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ).

Quanto menor a área de cruzamento, maior a probabilidade de as diferenças serem significativas. Às vezes, essas diferenças são chamadas de diferenças na localização de duas amostras (Welkowitz J. et al., 1982).

O valor empírico do critério U reflete o quão grande é a zona de coincidência entre as linhas. Portanto, quanto menor U emp, mais provável é que as diferenças sejam significativas.

Hipóteses U - Teste de Mann-Whitney

H0: O nível do atributo no grupo 2 não é inferior ao nível do atributo no grupo 1.
H1: O nível da característica no grupo 2 é inferior ao nível da característica no grupo 1.

Limitações do teste U de Mann-Whitney

1. Cada amostra deve conter pelo menos 3 observações: n 1 ,n 2 ≥ З; é permitido que haja 2 observações em uma amostra, mas então deve haver pelo menos 5 delas na segunda.

2. Cada amostra não deve conter mais de 60 observações; n 1 , n 2 ≤ 60.

Cálculo automático do teste U de Mann-Whitney

Passo 1

Insira os dados da primeira amostra na primeira coluna (“Amostra 1”) e os dados da segunda amostra na segunda coluna (“Amostra 2”). Os dados são inseridos um número por linha; sem espaços, lacunas, etc. Apenas números são inseridos. Os números fracionários são inseridos com um "." (ponto). Após preencher as colunas, clique no botão "Passo 2" para calcular automaticamente o teste U de Mann-Whitney.

Teste U de Mann-Whitney(Inglês) Teste U de Mann-Whitney) é um teste estatístico usado para avaliar as diferenças entre duas amostras independentes em termos do nível de qualquer característica, medido quantitativamente. Permite detectar diferenças no valor de um parâmetro entre pequenas amostras.

Teste de soma de postos de Wilcoxon ). Menos comum: o critério para o número de inversões.

História

Este método para detectar diferenças entre amostras foi proposto em 1945 por Frank Wilcoxon ( F. WilcoxonH.B. Mann) e D. R. Whitney ( D. R. Whitney

Descrição do critério

Não deve haver valores correspondentes nos dados da amostra (todos os números são diferentes) ou deve haver muito poucas correspondências (até 10).

Usando um critério

Compile uma única série classificada de ambas as amostras comparadas, organizando seus elementos de acordo com o grau de crescimento do recurso e atribuindo uma classificação mais baixa ao valor mais baixo. O número total de fileiras será igual a: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) onde n 1 (\displaystyle n_(1)) é o número de elementos na primeira amostra e n 2 (\displaystyle n_(2)) - o número de elementos na segunda amostra.
Divida uma única série classificada em duas, consistindo em unidades da primeira e segunda amostras, respectivamente. Calcule separadamente a soma das classificações que caíram na participação dos elementos da primeira amostra e separadamente - na participação dos elementos da segunda amostra. Definir grande de duas somas de classificação (T x (\displaystyle T_(x))) correspondentes a uma amostra com n x (\displaystyle n_(x)) elementos.
Determine o valor do teste U de Mann-Whitney usando a fórmula: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
De acordo com a tabela para o nível de significância estatística selecionado, determine o valor crítico do critério para os dados n 1 (\displaystyle n_(1)) e n 2 (\displaystyle n_(2)) . Se o valor recebido for U (\displaystyle U) menos tabular ou igual a ela, então é reconhecida a existência de uma diferença significativa entre o nível da característica nas amostras consideradas (uma hipótese alternativa é aceita). Se o valor resultante U (\displaystyle U) for maior que o valor da tabela, a hipótese nula é aceita. A significância das diferenças é maior, quanto menor for o valor de U (\displaystyle U) .
Se a hipótese nula for verdadeira, o critério tem a expectativa M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1)\cdot n_(2))(2)) ) e variância D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1)\cdot n_(2)\cdot (n_) (1)+ n_(2)+1))(12))) e com uma quantidade suficientemente grande de dados de amostra (n 1 > 19 , n 2 > 19) (\displaystyle (n_(1)>19,\; n_(2)>19 )) é distribuído quase normalmente.

Tabela de valores críticos

Cálculo dos valores críticos do teste U de Mann-Whitney para amostras maiores que 20 (N>20) (downlink de 10-02-2017 )

Teste de Mann-Whitney: exemplo, tabela

Um critério em estatística matemática é uma regra estrita segundo a qual uma hipótese com um certo nível de significância é aceita ou rejeitada. Para construí-lo, você precisa encontrar uma determinada função. Deve depender dos resultados finais do experimento, ou seja, dos valores encontrados empiricamente. É esta função que será uma ferramenta para avaliar a discrepância entre as amostras.

Valor estatisticamente significativo. Informação geral

A significância estatística é uma quantidade que é improvável de ocorrer por acaso. Seus indicadores mais extremos também são insignificantes. Diz-se que uma diferença é estatisticamente significativa se houver dados que provavelmente não ocorrerão se a diferença não existir. Mas isso não significa de forma alguma que essa diferença deva necessariamente ser grande e significativa.

O nível de significância estatística do teste

Este termo deve ser entendido como a probabilidade de rejeitar a hipótese nula se ela for verdadeira. Isso também é chamado de erro do tipo I ou uma decisão de falso positivo. Na maioria dos casos, o processo depende de um valor-p ("valor-pi"). Esta é a probabilidade acumulada ao observar o nível do critério estatístico. Ela, por sua vez, é calculada a partir da amostra no momento da aceitação da hipótese nula. A suposição será rejeitada se este valor de p for menor que o nível declarado pelo analista. A significância do valor do teste depende diretamente desse indicador: quanto menor, mais motivos para rejeitar a hipótese, respectivamente.
O nível de significância é geralmente denotado pela letra b (alfa). Indicadores populares entre especialistas: 0,1%, 1%, 5% e 10%. Se, digamos, for dito que as chances de coincidência são de 1 em 1000, então estamos definitivamente falando sobre o nível de 0,1% da significância estatística de uma variável aleatória. Diferentes níveis b têm seus prós e contras. Se a pontuação for menor, então a hipótese alternativa é mais provável de ser significativa. No entanto, existe o risco de que a falsa suposição nula não seja rejeitada. Pode-se concluir que a escolha do nível b ótimo depende do equilíbrio "significação-poder" ou, consequentemente, do trade-off das probabilidades de decisões de falso positivo e falso negativo. Um sinônimo de "significado estatístico" na literatura nacional é o termo "confiabilidade".

Definição de hipótese nula

Em estatística matemática, essa é uma suposição testada quanto à consistência com dados empíricos já em estoque. Na maioria dos casos, a hipótese nula é a hipótese de que não há correlação entre as variáveis em estudo ou que não há diferenças de homogeneidade nas distribuições em estudo. Na pesquisa padrão, um matemático tenta refutar a hipótese nula, ou seja, provar que ela não é consistente com dados experimentais. Além disso, deve haver uma suposição alternativa, que é tomada em vez do zero um.

Definição de chave

O critério U (Mann-Whitney) em estatística matemática permite avaliar as diferenças entre duas amostras. Eles podem ser dados de acordo com o nível de alguma característica, que é medida quantitativamente. Este método é ideal para estimar diferenças em pequenas amostras. Este critério simples foi proposto por Frank Wilcoxon em 1945. E já em 1947, o método foi revisado e complementado pelos cientistas H. B. Mann e D. R. Whitney, cujos nomes são chamados até hoje. O critério de Mann-Whitney em psicologia, matemática, estatística e muitas outras ciências é um dos elementos fundamentais da fundamentação matemática dos resultados da pesquisa teórica.

Descrição

O teste de Mann-Whitney é um método relativamente simples, sem parâmetros. Seu poder é significativo. É significativamente maior do que o poder do Rosenbaum Q-test. O método avalia quão pequena é a área de valores cruzados entre amostras, ou seja, entre a série ranqueada de valores do primeiro e segundo conjuntos. Quanto menor o valor do critério, mais provável é que as discrepâncias dos valores dos parâmetros sejam confiáveis. Para aplicar corretamente o critério U (Mann-Whitney), não se deve esquecer algumas limitações. Cada amostra deve conter pelo menos 3 valores de recurso. É possível que em um caso haja dois valores, mas no segundo caso deve haver pelo menos cinco deles. Nas amostras estudadas, deve haver um número mínimo de indicadores correspondentes. Todos os números devem ser diferentes idealmente.

Uso

Como usar o teste de Mann-Whitney corretamente? A tabela compilada por este método contém determinados valores críticos. O primeiro passo é criar uma única série de ambas as amostras correspondentes, que é então classificada. Ou seja, os elementos são alinhados de acordo com o grau de crescimento do atributo, e uma classificação mais baixa é atribuída a um valor mais baixo. Como resultado, obtemos o seguinte número total de classificações:

N = N1 + N2,

onde os valores N1 e N2 são o número de unidades contidas na primeira e segunda amostras, respectivamente. Além disso, uma única série de valores classificados é dividida em duas categorias. Unidades, respectivamente, da primeira e segunda amostras. Agora, a soma das classificações dos valores na primeira e segunda linhas é calculada por sua vez. O maior deles (Tx) é determinado, o que corresponde a uma amostra com nx uns. Para usar ainda mais o método de Wilcoxon, seu valor é calculado pelo método a seguir. É necessário descobrir na tabela para o nível de significância escolhido o valor crítico deste critério para N1 e N2 especificamente tomados.
O indicador resultante pode ser menor ou igual ao valor da tabela. Neste caso, afirma-se uma diferença significativa nos níveis da característica nas amostras estudadas. Se o valor obtido for maior que o valor da tabela, então a hipótese nula é aceita. Ao calcular o teste de Mann-Whitney, deve-se notar que se a hipótese nula for verdadeira, o teste terá uma média e uma variância. Observe que para volumes suficientemente grandes de dados de amostra, o método é considerado quase normalmente distribuído. A significância das diferenças é quanto maior, menor o valor do teste de Mann-Whitney.

Valores do critério Pearson (critério)

Tabelas de probabilidades associadas aos valores do teste de Mann-Whitney.

Tabelas de probabilidades associadas aos valores do teste de Mann-Whitney. Para o valor experimental do critério (o menor dos dois valores) e tamanhos de amostra, encontre a probabilidade de que ambos os grupos pertençam à mesma população geral. Assim, um valor de baixa probabilidade, por exemplo, P

Tabela 3

Tabela 4

Tabela 5

Tabela 6

Tabela de valores críticos do teste de Mann-Whitney para o nível de significância.

Se , então a diferença entre as amostras é significativa para , ou seja, a hipótese nula deve ser rejeitada.

N 2

N 1

2. U - Teste de Mann-Whitney

O critério é projetado para avaliar as diferenças entre duas amostras em termos do nível de qualquer característica, medida quantitativamente. Ele permite detectar diferenças entre pequenas amostras quando n1 e n2 são maiores ou iguais a 3 (ou n1 = 2, e n2 é maior ou igual a 5.)

O método determina se a área de valores sobrepostos entre duas séries é pequena o suficiente. Quanto menor essa área, mais provável é que as diferenças sejam significativas. O valor empírico (realmente obtido) do critério U reflete quão grande é a zona de coincidência entre as linhas. Quanto menor o Uemp., mais provável é que as diferenças sejam significativas.

Hipóteses.

Mas: O nível do atributo no grupo 2 não é inferior ao nível do atributo no grupo 1.

H1: O nível da característica no grupo 2 é inferior ao nível da característica no grupo 1.

Limitações do critério U.

1. Deve haver pelo menos 3 observações em cada amostra ou, em casos extremos, é permitida uma proporção de 2 para 5 ou mais.

2. Não deve haver mais de 60 observações em cada amostra.

Algoritmo para cálculo do critério U - Mann-Whitney.

1. Transfira todos os dados da amostra para cartões individuais (nos quais será refletido em cores ou de alguma outra forma a qual das amostras o valor pertence).

2. Disponha todas as cartas em uma linha comum à medida que o sinal aumenta, independentemente de qual amostra elas pertençam.

3. Classifique (de acordo com o algoritmo de classificação) os valores nas cartas, atribuindo uma classificação mais baixa ao valor mais baixo. Deve haver n1 + n2 classificações no total (o tamanho da primeira amostra + o tamanho da segunda amostra).

4. Reorganize os cartões em duas filas, com base em pertencer à amostra 1 ou à amostra 2.

6. Determine a maior das duas somas de classificação.

7. Determine o valor de U pela fórmula:

8. Determine a partir das tabelas os valores críticos de U, de acordo com isso, aceite ou rejeite a hipótese nº.

3. H - Critério de Kruskal - Wallis

O critério H é usado para avaliar diferenças na severidade da característica analisada simultaneamente entre três, quatro ou mais amostras. Ele permite identificar o grau de alteração da característica nas amostras, sem indicar, no entanto, a direção dessas alterações.

O critério baseia-se no princípio de que quanto menor a sobreposição das amostras, maior o nível de significância. H emp . Deve-se enfatizar que pode haver um número diferente de sujeitos nas amostras, embora nas tarefas abaixo seja dado um número igual de sujeitos nas amostras.

Trabalhar com dados começa com o fato de que todas as amostras são combinadas condicionalmente na ordem de ocorrência dos valores em uma amostra, e os valores dessa amostra combinada são classificados. Em seguida, os ranks obtidos são afixados aos dados da amostra original e a soma dos ranks é calculada separadamente para cada amostra. O critério é baseado na seguinte ideia – se as diferenças entre as amostras são insignificantes, então as somas das classificações não diferirão significativamente umas das outras e vice-versa.

Valor H emp calculado pela fórmula:

H emp

Onde Né o número total de membros da amostra generalizada;

n i é o número de membros em cada amostra individual;

são os quadrados das somas dos ranks para cada amostra.

Ao determinar os valores críticos do critério para quatro ou mais amostras, use a tabela para o critério hee-quadrado, tendo calculado previamente o número de graus de liberdade v por c = 4. Então v = c- 1 = 4 – 1=3..

Ressaltamos que se utilizarmos critérios que nos permitam comparar apenas duas séries de valores, então o resultado obtido acima exigiria seis comparações - a primeira amostra com a segunda, terceira, etc.

Para usar o critério H as seguintes condições devem ser atendidas:

1. A medição deve ser feita em uma escala de ordem, intervalos ou razões.

2. As amostras devem ser independentes.

3. É permitido um número diferente de sujeitos nas amostras comparadas.

4. Ao comparar três amostras, é permitido que uma delas contenha n = 3, e nos outros dois n = 2. No entanto, neste caso, as diferenças podem ser registradas apenas ao nível de significância de 5%.

5. A Tabela 9 do Apêndice é fornecida para apenas três amostras e ( n 1n 2, n H), £ 5, ou seja, o número máximo de sujeitos nas três amostras pode ser menor e igual a 5.

6. Com um número maior de amostras e um número diferente de sujeitos em cada amostra, você deve usar a tabela para o critério hee-quadrado. Neste caso, o número de graus de liberdade é determinado pela fórmula: v = Com - 1, onde Com - o número de amostras correspondentes.

O teste U de Mann-Whitney é:

Teste U de Mann-Whitney

Teste U de Mann-Whitney(Inglês) Teste U de Mann-Whitney) é um critério estatístico usado para avaliar as diferenças entre duas amostras em termos do nível de alguma característica, medido quantitativamente. Permite detectar diferenças no valor de um parâmetro entre pequenas amostras.

Outros nomes: teste de Mann-Whitney-Wilcoxon Mann-Whitney-Wilcoxon, MWW), o teste de soma de postos de Wilcoxon (eng. Teste de soma de postos de Wilcoxon) ou o teste de Wilcoxon-Mann-Whitney (eng. Teste de Wilcoxon-Mann-Whitney).