Mann Whitney. Mann-Whitney U-Kriterium in Diplomarbeit, Kurs und Masterarbeit in Psychologie

Kriterium U Mann - Whitney

Kriterium zuweisen. Das Kriterium dient der Bewertung der Unterschiede zwischen zwei Proben von eben jede Eigenschaft, die quantifiziert werden kann. Es ermöglicht Ihnen, zwischen zu unterscheiden klein Proben wann P 1, n 2 > 3 oder p L \u003d 2, p 2\u003e 5 und ist mächtiger als das Kriterium Q Rosenbaum.

Diese Methode bestimmt, ob der Bereich überlappender Werte zwischen zwei Serien klein genug ist. Wir erinnern uns, dass wir die 1. Reihe (Probe, Gruppe) die Reihe von Werten nennen, in der die Werte nach einer vorläufigen Schätzung höher sind, und die 2. Reihe diejenige ist, in der sie angeblich niedriger sind.

Je kleiner der Crossover-Bereich, desto wahrscheinlicher ist das Unterschiede zuverlässig. Diese Unterschiede werden manchmal als Unterschiede in bezeichnet Lage zwei Proben. Der Erfahrungswert des Kriteriums gibt wieder, wie groß der Koinzidenzbereich zwischen den Zeilen ist. Deshalb je weniger t/ 3Mn , Umso mehr es ist wahrscheinlich, dass die Unterschiede zuverlässig.

Hypothesen.

Das Niveau der nonverbalen Intelligenz ist in der Gruppe der Physikstudierenden höher als in der Gruppe der Psychologiestudierenden.

Grafische Darstellung eines KriteriumsU. Pa Abb. 7.25 stellt drei der vielen möglichen Optionen für das Verhältnis zweier Wertereihen vor.

Bei Option (a) ist die zweite Reihe niedriger als die erste, und die Reihen schneiden sich fast nicht. Overlay-Bereich ( S j) zu klein, um Unterschiede zwischen Zeilen zu verdecken. Es besteht die Möglichkeit, dass die Unterschiede zwischen ihnen signifikant sind. Das können wir mit dem Kriterium genau bestimmen U.

Bei Variante (b) ist die zweite Reihe auch niedriger als die erste, aber der Bereich der sich überschneidenden Werte für die beiden Reihen ist ziemlich umfangreich (5 2). Es darf noch keinen kritischen Wert erreichen, bei dem die Unterschiede als unbedeutend anerkannt werden müssen. Ob dem so ist, lässt sich aber nur durch genaue Berechnung des Kriteriums feststellen U.

Bei Option (c) ist die zweite Reihe niedriger als die erste, aber die Überlappung ist so groß (5 3), dass die Unterschiede zwischen den Reihen verdeckt werden.

Reis. 7.25.

in zwei Proben

Notiz. Die Überlappung (5 t , S 2 , *$z) gibt die Bereiche möglicher Überlappung an. KriterienbeschränkungenU.

  • 1. Jede Probe muss mindestens drei Beobachtungen enthalten: n v p 2 > 3; zwei Beobachtungen in einer Stichprobe sind erlaubt, in der zweiten müssen es dann aber mindestens 5 sein.
  • 2. Jede Stichprobe sollte nicht mehr als 60 Beobachtungen enthalten; p l, p 2 w, n 2 > 20 Rangordnung wird ziemlich mühsam.

Kehren wir zu den Ergebnissen einer Umfrage unter Studenten der physikalischen und psychologischen Fakultäten der Leningrader Universität zurück, die die Methode von D. Veksler zur Messung der verbalen und nonverbalen Intelligenz verwendeten. Verwendung des Kriteriums Q Rosenbaum wurde mit hoher Signifikanz festgestellt, dass das Niveau der verbalen Intelligenz in der Stichprobe der Studierenden der Fakultät für Physik höher ist. Versuchen wir nun festzustellen, ob sich dieses Ergebnis beim Vergleich von Stichproben nach dem Grad der nonverbalen Intelligenz reproduziert. Die Daten sind in der Tabelle angegeben.

2 liegt auf einem signifikant signifikanten Niveau unter dem Niveau des Merkmals in Probe 1. Je kleiner der Wert du, desto höher die Signifikanz der Unterschiede.

Lassen Sie uns nun all diese Arbeit an dem Material unseres Beispiels durchführen. Als Ergebnis der Arbeit an 1-6 Schritten des Algorithmus werden wir eine Tabelle erstellen (Tabelle 7.4).

Tabelle 7.4

Berechnung von Rangsummen für Stichproben von Studierenden physikalischer und psychologischer Fakultäten

Physikstudenten (P = 14)

Studenten der Psychologie (n= 12)

Punktzahl der nonverbalen Intelligenz

Durchschnitt 107,2

Die Gesamtanzahl der Ränge: 165 + 186 = 351. Die berechnete Anzahl gemäß der Formel (5.1) ist wie folgt:

Es wird auf die Gleichheit der tatsächlichen und geschätzten Beträge geachtet. Wir sehen, dass in Bezug auf das Niveau der nonverbalen Intelligenz eine Stichprobe von Psychologiestudenten „höher“ ist. Es ist diese Stichprobe, die eine große Rangsumme ausmacht: 186. Jetzt sind wir bereit, statistische Hypothesen zu formulieren:

Selbst 0: Eine Gruppe von Psychologiestudenten übertrifft eine Gruppe von Physikstudenten in Bezug auf nonverbale Intelligenz nicht;

Ich: Eine Gruppe von Psychologiestudenten übertrifft eine Gruppe von Physikstudenten in Bezug auf nonverbale Intelligenz.

Gemäß dem nächsten Schritt des Algorithmus ermitteln wir den Erfahrungswert U :

Denn in unserem Fall p l * p 2, Berechne den Erfahrungswert U und für die zweite Rangsumme (165), Einsetzen des entsprechenden in Formel (7.4). p x.:

Gemäß Anlage 8 ermitteln wir die kritischen Werte für p l = 14, n2 = 12:

Wir erinnern uns, dass das Kriterium U ist eine von zwei Ausnahmen von der allgemeinen Regel zur Entscheidung, ob Unterschiede signifikant sind, nämlich wir können signifikante Unterschiede angeben, wenn (/ emp U Kp 0 05 (bei Temp = 60, und sp > U Kf) ungefähr, 05).

Folglich, H 0 wird wie folgt angenommen: Die Gruppe der Psychologiestudierenden übertrifft die Gruppe der Physikstudierenden hinsichtlich des Niveaus der nonverbalen Intelligenz nicht.

Beachten wir, dass für diesen Fall das Rosenbaum-Q-Kriterium nicht anwendbar ist, da die Schwankungsbreite in der Gruppe der Physiker größer ist als in der Gruppe der Psychologen: sowohl die höchsten als auch die niedrigsten Werte von non -verbale Intelligenz fallen auf die Gruppe der Physiker (siehe Tabelle 7.4) .

Diese statistische Methode wurde 1945 von Frank Wilcoxon (siehe Foto) vorgeschlagen. 1947 wurde die Methode jedoch von H. B. Mann und D. R. Whitney verbessert und erweitert, sodass der U-Test häufiger mit ihren Namen bezeichnet wird.

Das Kriterium dient dazu, die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines beliebigen Merkmals, quantitativ gemessen, zu bewerten. Er ermöglicht es Ihnen, Unterschiede zwischen kleinen Stichproben zu identifizieren, wenn n 1 , n 2 ≥ 3 oder n 1 = 2, n 2 ≥ 5, und ist leistungsfähiger als der Rosenbaum-Test.

Beschreibung des Mann-Whitney-U-Tests

Es gibt mehrere Möglichkeiten, das Kriterium zu verwenden, und mehrere Optionen für Tabellen kritischer Werte, die diesen Methoden entsprechen (Gubler E. V., 1978; Runion R., 1982; Zakharov V. P., 1985; McCall R., 1970; Krauth J., 1988 ) .

Diese Methode bestimmt, ob der Bereich überlappender Werte zwischen zwei Serien klein genug ist. Wir erinnern uns, dass wir die 1. Reihe (Probe, Gruppe) die Reihe von Werten nennen, in der die Werte nach einer vorläufigen Schätzung höher sind, und die 2. Reihe diejenige ist, in der sie angeblich niedriger sind.

Je kleiner der Crossover-Bereich ist, desto wahrscheinlicher sind die Unterschiede signifikant. Manchmal werden diese Unterschiede als Unterschiede in der Position zweier Proben bezeichnet (Welkowitz J. et al., 1982).

Der Erfahrungswert des U-Kriteriums gibt wieder, wie groß der Koinzidenzbereich zwischen den Zeilen ist. Daher ist es umso wahrscheinlicher, dass die Unterschiede signifikant sind, je kleiner U emp ist.

Hypothesen U - Mann-Whitney-Test

H0: Die Stufe des Attributs in Gruppe 2 ist nicht niedriger als die Stufe des Attributs in Gruppe 1.
H1: Das Merkmalsniveau in Gruppe 2 ist niedriger als das Merkmalsniveau in Gruppe 1.

Einschränkungen des Mann-Whitney-U-Tests

1. Jede Stichprobe muss mindestens 3 Beobachtungen enthalten: n 1 ,n 2 ≥ ‡; es dürfen 2 Beobachtungen in einer Probe sein, aber dann müssen es mindestens 5 davon in der zweiten sein.

2. Jede Stichprobe sollte nicht mehr als 60 Beobachtungen enthalten; n1, n2 ≤ 60.

Automatische Berechnung des Mann-Whitney U-Tests

Schritt 1

Tragen Sie die Daten der ersten Probe in die erste Spalte („Probe 1“) und die Daten der zweiten Probe in die zweite Spalte („Probe 2“) ein. Daten werden mit einer Zahl pro Zeile eingegeben; keine Leerzeichen, Lücken etc. Es werden nur Zahlen eingegeben. Bruchzahlen werden mit einem "." (Punkt). Klicken Sie nach dem Ausfüllen der Spalten auf die Schaltfläche "Schritt 2", um den Mann-Whitney-U-Test automatisch zu berechnen.

Mann-Whitney U-Test(Englisch) Mann-Whitney U-Test) ist ein statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei unabhängigen Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht es Ihnen, Unterschiede im Wert eines Parameters zwischen kleinen Stichproben zu erkennen.

Wilcoxon-Rangsummentest ). Weniger verbreitet: das Kriterium für die Anzahl der Inversionen.

Geschichte

Diese Methode zum Nachweis von Unterschieden zwischen Proben wurde 1945 von Frank Wilcoxon ( F. WilcoxonH. B. Mann) und D. R. Whitney ( DR Whitney

Beschreibung des Kriteriums

  1. Es sollten keine übereinstimmenden Werte in den Beispieldaten vorhanden sein (alle Zahlen sind unterschiedlich) oder es sollten nur sehr wenige solcher Übereinstimmungen vorhanden sein (bis zu 10).

Verwendung eines Kriteriums

  1. Stellen Sie aus beiden verglichenen Stichproben eine einzelne Rangfolge zusammen, ordnen Sie ihre Elemente entsprechend dem Wachstumsgrad des Merkmals an und weisen Sie dem niedrigeren Wert einen niedrigeren Rang zu. Die Gesamtzahl der Ränge ist gleich: N = n 1 + n 2 , (\displaystyle N=n_(1)+n_(2),) wobei n 1 (\displaystyle n_(1)) die Anzahl der Elemente ist im ersten Beispiel und n 2 (\displaystyle n_(2)) - die Anzahl der Elemente im zweiten Beispiel.
  2. Teilen Sie eine einzelne Rangfolge in zwei Reihen auf, die aus Einheiten der ersten bzw. zweiten Stichprobe bestehen. Berechnen Sie separat die Summe der Ränge, die auf den Anteil der Elemente der ersten Stichprobe fielen, und separat - auf den Anteil der Elemente der zweiten Stichprobe. Definieren groß von zwei Rangsummen (T x (\displaystyle T_(x))) entsprechend einer Stichprobe mit n x (\displaystyle n_(x)) Elementen.
  3. Bestimmen Sie den Wert des Mann-Whitney-U-Tests mit der Formel: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . (\displaystyle U=n_(1)\cdot n_(2)+(\frac (n_(x)\cdot (n_(x)+1))(2))-T_(x).)
  4. Bestimmen Sie anhand der Tabelle für das ausgewählte statistische Signifikanzniveau den kritischen Wert des Kriteriums für die Daten n 1 (\displaystyle n_(1)) und n 2 (\displaystyle n_(2)) . Wenn der empfangene Wert U (\displaystyle U) ist weniger tabellarisch oder gleich, dann wird das Vorhandensein eines signifikanten Unterschieds zwischen dem Niveau des Merkmals in den betrachteten Stichproben erkannt (eine Alternativhypothese wird akzeptiert). Wenn der resultierende Wert U (\displaystyle U) größer als der Tabellenwert ist, wird die Nullhypothese akzeptiert. Die Signifikanz der Unterschiede ist umso größer, je kleiner der Wert von U (\displaystyle U) ist.
  5. Wenn die Nullhypothese wahr ist, hat das Kriterium den Erwartungswert M (U) = n 1 ⋅ n 2 2 (\displaystyle M(U)=(\frac (n_(1)\cdot n_(2))(2)) ) und Varianz D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 (\displaystyle D(U)=(\frac (n_(1)\cdot n_(2)\cdot (n_ (1)+ n_(2)+1))(12))) und mit ausreichend vielen Beispieldaten (n 1 > 19 , n 2 > 19) (\displaystyle (n_(1)>19,\; n_(2)>19 )) ist fast normalverteilt.

Tabelle der kritischen Werte

  • Berechnung der kritischen Werte des Mann-Whitney U-Tests für Proben größer als 20 (N>20) (Downlink vom 02.10.2017)

Mann-Whitney-Test: Beispiel, Tabelle

Ein Kriterium in der mathematischen Statistik ist eine strenge Regel, nach der eine Hypothese mit einem bestimmten Signifikanzniveau akzeptiert oder abgelehnt wird. Um es zu bauen, müssen Sie eine bestimmte Funktion finden. Sie sollte von den Endergebnissen des Experiments abhängen, also von empirisch gefundenen Werten. Es ist diese Funktion, die ein Werkzeug zum Bewerten der Diskrepanz zwischen Proben sein wird.

Statistisch signifikanter Wert. Allgemeine Information

Statistische Signifikanz ist eine Größe, die wahrscheinlich nicht zufällig auftritt. Seine extremeren Indikatoren sind ebenfalls unbedeutend. Ein Unterschied wird als statistisch signifikant bezeichnet, wenn es Daten gibt, die wahrscheinlich nicht auftreten, vorausgesetzt, dass diese Unterschiede nicht existieren. Das heißt aber keineswegs, dass dieser Unterschied unbedingt groß und signifikant sein muss.

Das Niveau der statistischen Signifikanz des Tests

Dieser Term ist als die Wahrscheinlichkeit zu verstehen, die Nullhypothese abzulehnen, falls sie wahr ist. Dies wird auch als Typ-I-Fehler oder falsch positive Entscheidung bezeichnet. In den meisten Fällen stützt sich der Prozess auf einen p-Wert ("pi-Wert"). Dies ist die kumulative Wahrscheinlichkeit bei Einhaltung des Niveaus des statistischen Kriteriums. Sie wiederum wird aus der Stichprobe zum Zeitpunkt der Annahme der Nullhypothese berechnet. Die Annahme wird verworfen, wenn dieser p-Wert unter dem vom Analysten angegebenen Niveau liegt. Die Signifikanz des Testwerts hängt direkt von diesem Indikator ab: Je kleiner er ist, desto mehr Grund, die Hypothese zu verwerfen.
Das Signifikanzniveau wird üblicherweise mit dem Buchstaben b (Alpha) bezeichnet. Beliebte Indikatoren unter Spezialisten: 0,1 %, 1 %, 5 % und 10 %. Wenn beispielsweise gesagt wird, dass die Wahrscheinlichkeit des Zufalls 1 zu 1000 beträgt, dann sprechen wir definitiv von der Höhe von 0,1 % der statistischen Signifikanz einer Zufallsvariablen. Verschiedene B-Levels haben ihre Vor- und Nachteile. Wenn die Punktzahl niedriger ist, ist es wahrscheinlicher, dass die Alternativhypothese signifikant ist. Es besteht jedoch das Risiko, dass die falsche Nullschätzung nicht zurückgewiesen wird. Daraus lässt sich schließen, dass die Wahl des optimalen b-Niveaus von der „Signifikanz-Potenz“-Balance bzw. dem Trade-off der Wahrscheinlichkeiten falsch positiver und falsch negativer Entscheidungen abhängt. Ein Synonym für „statistische Signifikanz“ in der heimischen Literatur ist der Begriff „Reliabilität“.

Definition der Nullhypothese

In der mathematischen Statistik ist dies eine Annahme, die mit bereits vorliegenden empirischen Daten auf Konsistenz geprüft wird. In den meisten Fällen ist die Nullhypothese die Hypothese, dass es keine Korrelation zwischen den untersuchten Variablen gibt oder dass es keine Homogenitätsunterschiede in den untersuchten Verteilungen gibt. In der Standardforschung versucht ein Mathematiker, die Nullhypothese zu widerlegen, d. h. zu beweisen, dass sie nicht mit experimentellen Daten übereinstimmt. Außerdem muss es eine alternative Annahme geben, die anstelle der Nullannahme genommen wird.

Schlüsseldefinition

Mit dem U-Kriterium (Mann-Whitney) in der mathematischen Statistik können Sie die Unterschiede zwischen zwei Stichproben auswerten. Sie können entsprechend dem Grad eines Merkmals angegeben werden, das quantitativ gemessen wird. Diese Methode ist ideal zum Schätzen von Unterschieden in kleinen Stichproben. Dieses einfache Kriterium wurde 1945 von Frank Wilcoxon vorgeschlagen. Und bereits 1947 wurde die Methode von den Wissenschaftlern H. B. Mann und D. R. Whitney, deren Namen sie bis heute trägt, überarbeitet und ergänzt. Das Mann-Whitney-Kriterium in Psychologie, Mathematik, Statistik und vielen anderen Wissenschaften ist eines der grundlegenden Elemente der mathematischen Fundierung von Ergebnissen theoretischer Forschung.

Beschreibung

Der Mann-Whitney-Test ist eine relativ einfache Methode ohne Parameter. Seine Macht ist bedeutend. Sie ist deutlich höher als die Power des Rosenbaum Q-Tests. Das Verfahren wertet aus, wie klein der Bereich der Kreuzwerte zwischen Stichproben ist, nämlich zwischen den gereihten Wertereihen der ersten und zweiten Menge. Je kleiner der Kriteriumswert ist, desto wahrscheinlicher ist es, dass die Abweichungen der Parameterwerte zuverlässig sind. Um das U-Kriterium (Mann-Whitney) korrekt anzuwenden, sollte man einige Einschränkungen nicht vergessen. Jede Stichprobe muss mindestens 3 Merkmalswerte enthalten. Es ist möglich, dass es in einem Fall zwei Werte gibt, aber im zweiten Fall müssen es mindestens fünf sein. In den untersuchten Stichproben sollte eine Mindestanzahl übereinstimmender Indikatoren vorhanden sein. Alle Zahlen sollten idealerweise unterschiedlich sein.

Verwendungszweck

Wie wendet man den Mann-Whitney-Test richtig an? Die nach diesem Verfahren erstellte Tabelle enthält bestimmte kritische Werte. Der erste Schritt besteht darin, eine einzelne Serie aus beiden übereinstimmenden Stichproben zu erstellen, die dann geordnet wird. Das heißt, die Elemente werden gemäß dem Wachstumsgrad des Attributs aufgereiht, und ein niedrigerer Rang wird einem niedrigeren Wert zugewiesen. Als Ergebnis erhalten wir die folgende Gesamtzahl von Rängen:

N = N1 + N2,

wobei die Werte N1 und N2 die Anzahl der Einheiten sind, die in der ersten bzw. zweiten Stichprobe enthalten sind. Ferner wird eine einzelne Rangfolge von Werten in zwei Kategorien unterteilt. Einheiten jeweils aus der ersten und zweiten Probe. Nun wird wiederum die Summe der Ränge der Werte in der ersten und zweiten Zeile berechnet. Der größte davon (Tx) wird ermittelt, was einer Stichprobe mit nx Einheiten entspricht. Um die Wilcoxon-Methode weiter zu verwenden, wird ihr Wert nach der folgenden Methode berechnet. Aus der Tabelle muss für das gewählte Signifikanzniveau der kritische Wert dieses Kriteriums für konkret genommene N1 und N2 ermittelt werden.
Der resultierende Indikator kann kleiner oder gleich dem Wert aus der Tabelle sein. In diesem Fall wird ein signifikanter Unterschied in den Niveaus des Merkmals in den untersuchten Stichproben festgestellt. Ist der erhaltene Wert größer als der Tabellenwert, wird die Nullhypothese akzeptiert. Bei der Berechnung des Mann-Whitney-Tests ist zu beachten, dass der Test bei wahrer Nullhypothese sowohl einen Mittelwert als auch eine Varianz hat. Beachten Sie, dass die Methode für ausreichend große Probendatenmengen als nahezu normalverteilt angesehen wird. Die Signifikanz von Unterschieden ist umso höher, je geringer der Wert des Mann-Whitney-Tests ist.

Werte des Pearson-Kriteriums (Kriterium)

  1. Wahrscheinlichkeitstabellen, die den Werten des Mann-Whitney-Tests zugeordnet sind.

Wahrscheinlichkeitstabellen, die den Werten des Mann-Whitney-Tests zugeordnet sind. Ermitteln Sie für den experimentellen Wert des Kriteriums (der kleinere der beiden Werte) und die Stichprobenumfänge die Wahrscheinlichkeit, dass beide Gruppen zur gleichen Grundgesamtheit gehören. Somit ist ein niedriger Wahrscheinlichkeitswert, beispielsweise P

    Tisch 3

  1. Tabelle 4

  2. Tabelle 5

    1. Tabelle 6

  1. Tabelle der kritischen Werte des Mann-Whitney-Tests für das Signifikanzniveau.

Wenn , dann ist der Unterschied zwischen den Stichproben signifikant für , das heißt, die Nullhypothese sollte verworfen werden.

N 2

N 1

2. U - Mann-Whitney-Test

Das Kriterium dient dazu, die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines beliebigen Merkmals, quantitativ gemessen, zu bewerten. Damit können Sie Unterschiede zwischen kleinen Stichproben erkennen, wenn n1 und n2 größer oder gleich 3 sind (oder n1 = 2 und n2 dann größer oder gleich 5 ist).

Die Methode bestimmt, ob der Bereich überlappender Werte zwischen zwei Serien klein genug ist. Je kleiner dieser Bereich ist, desto wahrscheinlicher ist es, dass die Unterschiede signifikant sind. Der empirische (tatsächlich erhaltene) Wert des U-Kriteriums gibt wieder, wie groß der Koinzidenzbereich zwischen den Reihen ist. Je niedriger Uemp., desto wahrscheinlicher ist es, dass die Unterschiede signifikant sind.

Hypothesen.

Aber: Das Niveau des Attributs in Gruppe 2 ist nicht niedriger als das Niveau des Attributs in Gruppe 1.

H1: Das Merkmalsniveau in Gruppe 2 ist niedriger als das Merkmalsniveau in Gruppe 1.

Einschränkungen des U-Kriteriums.

1. Es müssen mindestens 3 Beobachtungen in jeder Probe vorliegen, oder in extremen Fällen ist ein Verhältnis von 2 zu 5 oder mehr zulässig.

2. In jeder Stichprobe sollten nicht mehr als 60 Beobachtungen vorhanden sein.

Algorithmus zur Berechnung des Kriteriums U - Mann-Whitney.

1. Übertragen Sie alle Probendaten auf einzelne Karten (auf denen farblich oder anderweitig wiedergegeben wird, zu welcher der Proben der Wert gehört).

2. Legt alle Karten in einer gemeinsamen Reihe mit zunehmendem Vorzeichen aus, egal zu welcher Stichprobe sie gehören.

3. Ordnen Sie (gemäß dem Rangordnungsalgorithmus) die Werte auf den Karten, indem Sie dem niedrigeren Wert einen niedrigeren Rang zuweisen. Es sollte insgesamt n1 + n2 Ränge geben (die Größe der ersten Stichprobe + die Größe der zweiten Stichprobe).

4. Ordnen Sie die Karten neu in zwei Reihen an, basierend auf der Zugehörigkeit zu Muster 1 oder Muster 2.

6. Bestimmen Sie die größere der beiden Rangsummen.

7. Bestimmen Sie den Wert von U nach der Formel:

8. Bestimmen Sie aus den Tabellen die kritischen Werte von U, akzeptieren Sie die Hypothese Nr. oder lehnen Sie sie ab.

3. H - Kruskal - Wallis-Kriterium

Das H-Kriterium wird verwendet, um Unterschiede im Schweregrad des analysierten Merkmals gleichzeitig zwischen drei, vier oder mehr Proben zu bewerten. Es ermöglicht Ihnen, den Grad der Veränderung des Merkmals in den Proben zu identifizieren, ohne jedoch die Richtung dieser Veränderungen anzugeben.

Das Kriterium basiert auf dem Prinzip, dass das Signifikanzniveau umso höher ist, je geringer die Stichprobenüberlappung ist. H emp . Es sollte betont werden, dass es in den Stichproben eine unterschiedliche Anzahl von Fächern geben kann, obwohl in den folgenden Aufgaben eine gleiche Anzahl von Fächern in den Stichproben angegeben ist.

Das Arbeiten mit Daten beginnt damit, dass alle Stichproben in der Reihenfolge der auftretenden Werte zu einer Stichprobe bedingt kombiniert und die Werte dieser kombinierten Stichprobe in eine Rangfolge gebracht werden. Dann werden die erhaltenen Ränge an die ursprünglichen Probendaten angehängt und die Summe der Ränge wird für jede Probe separat berechnet. Dem Kriterium liegt folgende Überlegung zugrunde – wenn die Unterschiede zwischen den Stichproben unbedeutend sind, dann werden sich die Rangsummen nicht signifikant voneinander unterscheiden und umgekehrt.

Wert H emp berechnet nach der Formel:

H emp

Wo N ist die Gesamtzahl der Mitglieder in der verallgemeinerten Stichprobe;

n i ist die Anzahl der Mitglieder in jeder einzelnen Stichprobe;

sind die Quadrate der Rangsummen für jede Stichprobe.

Verwenden Sie bei der Bestimmung der kritischen Werte des Kriteriums für vier oder mehr Proben die Tabelle für das Kriterium hi-Quadrat, nachdem zuvor die Anzahl der Freiheitsgrade berechnet wurde v zum c = 4. Dann v = c - 1 = 4 – 1=3..

Wir betonen, dass, wenn wir Kriterien verwenden, die es uns erlauben, nur zwei Wertereihen zu vergleichen, das oben erhaltene Ergebnis sechs Vergleiche erfordern würde - die erste Probe mit der zweiten, dritten usw.

Um das Kriterium zu verwenden H folgende Bedingungen sind zu beachten:

1. Die Messung muss auf einer Skala von Ordnungen, Intervallen oder Verhältnissen erfolgen.

2. Proben müssen unabhängig sein.

3. Eine unterschiedliche Anzahl von Probanden in den Vergleichsstichproben ist zulässig.

4. Beim Vergleich von drei Proben darf eine davon enthalten sein n = 3 und in den anderen beiden n = 2. In diesem Fall können die Unterschiede jedoch nur auf dem 5%-Signifikanzniveau erfasst werden.

5. Tabelle 9 des Anhangs wird nur für drei Proben bereitgestellt und ( n 1n 2, n H), £ 5, d. h. die maximale Anzahl von Probanden in allen drei Stichproben kann kleiner oder gleich 5 sein.

6. Bei einer größeren Anzahl von Stichproben und einer unterschiedlichen Anzahl von Probanden in jeder Stichprobe sollten Sie die Tabelle für das Kriterium verwenden hi-Quadrat. In diesem Fall wird die Anzahl der Freiheitsgrade durch die Formel bestimmt: v = Mit - 1, wo Mit - die Anzahl der übereinstimmenden Proben.

Der Mann-Whitney U-Test ist:

Mann-Whitney U-Test

Mann-Whitney U-Test

Mann-Whitney U-Test(Englisch) Mann-Whitney U-Test) ist ein statistisches Kriterium, das verwendet wird, um die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht es Ihnen, Unterschiede im Wert eines Parameters zwischen kleinen Stichproben zu erkennen.

Andere Namen: Mann-Whitney-Wilcoxon-Test Mann-Whitney-Wilcoxon, MWW), der Wilcoxon-Rangsummentest (engl. Wilcoxon-Rangsummentest) oder der Wilcoxon-Mann-Whitney-Test (engl. Wilcoxon-Mann-Whitney-Test).

Geschichte

Diese Methode zum Nachweis von Unterschieden zwischen Proben wurde 1945 von Frank Wilcoxon ( F. Wilcoxon). 1947 wurde es von H. B. Mann grundlegend überarbeitet und erweitert ( H. B. Mann) und D. R. Whitney ( DR Whitney), unter deren Namen es heute üblicherweise genannt wird.

Beschreibung des Kriteriums

Ein einfacher nichtparametrischer Test. Die Power des Tests ist höher als die des Rosenbaum Q-Tests.

Diese Methode bestimmt, ob der Bereich überlappender Werte zwischen zwei Reihen (Rangfolge von Parameterwerten in der ersten Stichprobe und gleich in der zweiten Stichprobe) klein genug ist. Je kleiner der Kriteriumswert ist, desto wahrscheinlicher ist es, dass die Unterschiede zwischen den Parameterwerten in den Stichproben signifikant sind.

Einschränkungen der Anwendbarkeit des Kriteriums

  1. Jede der Stichproben muss mindestens 3 Merkmalswerte enthalten. Es ist erlaubt, dass in einer Probe zwei Werte vorkommen, in der zweiten aber mindestens fünf.
  2. Es sollten keine übereinstimmenden Werte in den Beispieldaten vorhanden sein (alle Zahlen sind unterschiedlich) oder es sollten nur sehr wenige solcher Übereinstimmungen vorhanden sein.

Verwendung eines Kriteriums

Um den Mann-Whitney-U-Test anzuwenden, müssen Sie die folgenden Operationen durchführen.

  • Automatische Berechnung des Mann-Whitney U-Tests

Tabelle der kritischen Werte

  • Tabelle der kritischen Werte des Mann-Whitney-U-Tests
  • Kritische Werte für den Mann-Whitney-U-Test.

siehe auch

  • Der Kruskal-Wallis-Test ist eine multivariate Verallgemeinerung des Mann-Whitney-U-Tests.

Literatur

  • Mann H. B., Whitney D. R. Bei einem Test, ob eine von zwei Zufallsvariablen stochastisch größer ist als die andere. // Annalen der mathematischen Statistik. - 1947. - Nr. 18. - S. 50-60.
  • Wilcoxon F. Individuelle Vergleiche nach Ranking-Methoden. // Biometrics Bulletin 1. - 1945. - S. 80-83.
  • Gubler E. V., Genkin A. A. Anwendung nichtparametrischer statistischer Kriterien in der biomedizinischen Forschung. -L., 1973.
  • Sidorenko E.V. Methoden der mathematischen Verarbeitung in der Psychologie. - St. Petersburg, 2002.

Wikimedia-Stiftung. 2010.

  • U-954
  • U-Punkt-Frauen

Sehen Sie in anderen Wörterbüchern, was der "Mann-Whitney U-Test" ist:

    Mann U-Test- U-Test Mann Whitney (dt. Mann-Whitney-U-Test) ist ein statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei unabhängigen Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht es Ihnen, ... ... Wikipedia zu identifizieren

    Mann-Whitney-U-Test- (Eng. Mann Whitney U-Test) Nichtparametrischer statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei Proben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht es Ihnen, Unterschiede im Wert eines Parameters zwischen kleinen ... Wikipedia zu identifizieren

    Mann-Whitney-Test

    Mann-Whitney-Wilcoxon-Test- Der Mann-Whitney-U-Test ist ein nichtparametrischer statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht das Erkennen von Bedeutungsunterschieden ... Wikipedia

    Mann-Whitney-Wilcoxon-Test- Der Mann-Whitney-U-Test ist ein nichtparametrischer statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht das Erkennen von Bedeutungsunterschieden ... Wikipedia

    Mann-Whitney-Test- - Telekommunikationsthemen, grundlegende Konzepte DE Mann Whitney U-Test ... Leitfaden für technische Übersetzer

    Wilcoxon-Mann-Whitney-Test- Der Mann-Whitney-U-Test ist ein nichtparametrischer statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht das Erkennen von Bedeutungsunterschieden ... Wikipedia

    Wilcoxon-Mann-Whitney-Test- Der Mann-Whitney-U-Test ist ein nichtparametrischer statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht das Erkennen von Bedeutungsunterschieden ... Wikipedia

    Wilcoxon-Rangsummentest- Der Mann-Whitney-U-Test ist ein nichtparametrischer statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht das Erkennen von Bedeutungsunterschieden ... Wikipedia

    Wilcoxon-Rangsummentest- Der Mann-Whitney-U-Test ist ein nichtparametrischer statistischer Test, der verwendet wird, um die Unterschiede zwischen zwei Stichproben in Bezug auf das Niveau eines Merkmals zu bewerten, das quantitativ gemessen wird. Ermöglicht das Erkennen von Bedeutungsunterschieden ... Wikipedia

Bücher

  • Statistiken und Siegel, Vladimir Savelyev. In diesem Buch erfahren Sie, was Varianz und Standardabweichung sind, wie man den Student-t-Test und den Mann-Whitney-U-Test findet, wofür Regressions- und Faktoranalysen verwendet werden, ... Mehr Kaufen Sie für 280 Rubel E-Book

Das U-Kriterium hat einen Rang eins, ist also invariant gegenüber jeder monotonen Transformation der Messskala.

Andere Bezeichnungen: Mann-Whitney-Wilcoxon-Test (Mann-Whitney-Wilcoxon, MWW), Wilcoxon-Rangsummentest oder Wilcoxon-Mann-Whitney-Test (WMW).

Aufgabenbeispiele

Beispiel 1 Die erste Probe sind Patienten, die mit Medikament A behandelt wurden. Die zweite Probe sind Patienten, die mit Medikament B behandelt wurden. Die Werte in den Proben sind einige Merkmale der Wirksamkeit der Behandlung (Stoffwechselspiegel im Blut, Temperatur). drei Tage nach Beginn der Behandlung, die Dauer der Genesung, die Anzahl der Krankenhausbetten) Tage usw.) Es ist erforderlich, herauszufinden, ob es einen signifikanten Unterschied in der Wirksamkeit der Medikamente A und B gibt oder ob die Unterschiede bestehen rein zufällig und erklären sich aus der „natürlichen“ Varianz des gewählten Merkmals.

Beispiel 2 Die erste Stichprobe sind die mit Kulturmethode A behandelten Felder. Die zweite Stichprobe sind die mit Kulturmethode B behandelten Felder. Die Werte in den Proben sind der Ertrag. Es gilt herauszufinden, ob eine der Methoden effektiver ist als die andere oder ob die Ertragsunterschiede auf Zufallsfaktoren zurückzuführen sind.

Beispiel 3 Die erste Stichprobe sind die Tage, an denen im Supermarkt eine Aktion vom Typ A (rote Preisschilder mit Rabatt) durchgeführt wurde. Die zweite Probe sind die Tage der Aktion Typ B (jede fünfte Packung ist kostenlos). Die Werte in den Mustern sind ein Indikator für die Wirksamkeit der Aktion (Verkaufsvolumen oder Umsatz in Rubel). Es gilt herauszufinden, welche Art der Förderung effektiver ist.

Beschreibung des Kriteriums

Es werden zwei Proben gegeben.

Zusätzliche Vermutungen:

Es wird manchmal fälschlicherweise angenommen, dass der U-Test die Nullhypothese gleicher Mediane in zwei Stichproben testet. Es gibt Verteilungen, für die die Hypothese zutrifft, aber ihre Mediane sind unterschiedlich.

U-Kriterium kann verwendet werden, um die Verschiebungshypothese als Alternative zu testen, wobei eine Konstante ungleich Null ist. Mit dieser Alternative ist der U-Test konsistent. Es ist ratsam, es zu verwenden, wenn zwei Messreihen von zwei Werten einer bestimmten physikalischen Größe mit demselben Instrument durchgeführt werden. In diesem Fall beschreibt die Verteilungsfunktion die Messfehler eines Wertes und eines anderen. In vielen Anwendungen (insbesondere der Ökonometrie) gibt es jedoch keinen besonderen Grund anzunehmen, dass sich die Verteilung der zweiten Stichprobe nur verschiebt, sich aber sonst nicht verändert.

Der U-Test ist ein nichtparametrisches Analogon des Student-t-Tests. Wenn die Stichproben normal sind, ist es vorzuziehen, den leistungsfähigeren Student-t-Test anzuwenden, um die Verschiebungshypothese zu testen.

Geschichte

Diese Methode zum Nachweis von Unterschieden zwischen Proben wurde 1945 von Frank Wilcoxon vorgeschlagen. Es wurde 1947 von Mann und Whitney, unter deren Namen es heute allgemein genannt wird, grundlegend überarbeitet und erweitert.

Literatur

  1. Mann H. B., Whitney D. R. Bei einem Test, ob eine von zwei Zufallsvariablen stochastisch größer ist als die andere. // Annalen der mathematischen Statistik. - 1947, Nr. 18. - S. 50-60.
  2. Wilcoxon F. Individuelle Vergleiche nach Ranking-Methoden. // Biometrics Bulletin 1. 1945. - Pp. 80–83.
  3. Orlow A.I.Ökonometrie. - M.: Klausur, 2003. - 576 S. (§4.5 Welche Hypothesen können mit dem Zwei-Stichproben-Wilcoxon-Test getestet werden?)
  4. Kobzar A.I. Angewandte mathematische Statistik. - M.: Fizmatlit, 2006. - 816 S.

Mann-Whitney-Test stellt eine nichtparametrische Alternative zum t-Test für unabhängige Stichproben dar. Ihr Vorteil ist, dass wir auf die Annahme einer Normalverteilung und gleicher Varianzen verzichten. Wesentlich ist, dass die Daten mindestens auf einer Ordinalskala gemessen werden.

STATISTICA geht davon aus, dass die Daten genauso angeordnet sind wie in- und t-Tests für unabhängige Stichproben. Die Datei muss eine (unabhängige) Codevariable enthalten, die mindestens zwei verschiedene Codes hat, um eindeutig zu identifizieren, ob jede Beobachtung zu einer bestimmten Gruppe gehört.

Annahmen und Interpretation. Mann-Whitney-Test geht davon aus, dass die betreffenden Variablen mindestens auf einer ordinalen Skala (Rangfolge) gemessen werden. Die Interpretation des Tests ähnelt im Wesentlichen der Interpretation der Ergebnisse des t-Tests für unabhängige Stichproben, außer dass der U-Test als Summe der Indikatoren des paarweisen Vergleichs der Elemente der ersten Stichprobe mit den Elementen der berechnet wird zweite Probe. U-Test - die leistungsfähigste (empfindlichste) nichtparametrische Alternative t-Test für unabhängige Stichproben; in manchen Fällen ist er sogar noch aussagekräftiger als der t-Test.

Wenn der Stichprobenumfang größer als 20 ist, konvergiert die Stichprobenverteilung für die U-Statistik schnell gegen eine Normalverteilung (siehe Siegel, 1956). Daher werden zusammen mit der U-Statistik der z-Wert (für eine Normalverteilung) und der entsprechende p-Wert angezeigt.

Exakte Wahrscheinlichkeiten für kleine Stichproben. Für kleine Stichproben berechnet STATISTICA die exakte Wahrscheinlichkeit, die der entsprechenden U-Statistik zugeordnet ist. Diese Wahrscheinlichkeit basiert auf der Zählung aller möglichen Werte von U bei gegebener Anzahl von Beobachtungen in zwei Stichproben (siehe Dinneen & Blakesley, 1973). Das Programm meldet (in der letzten Spalte der Ergebnistabelle) den Wert 2 * p, wobei p gleich 1 minus der kumulativen (einseitigen) Wahrscheinlichkeit der entsprechenden U-Statistik ist. Beachten Sie, dass dies in der Regel nicht zu einer großen Unterschätzung der statistischen Signifikanz der relevanten Effekte führt (siehe Siegel, 1956).

Die Teststatistik sieht so aus.

wo W- Statistiken Wilcoxon entwickelt, um dieselbe Hypothese zu testen

sonst

Also die Statistik U zählt die Gesamtzahl der Fälle, in denen die Elemente der zweiten Stichprobe die Elemente der ersten Stichprobe überwiegen. Wenn die Hypothese stimmt, dann

Mann-Whitney-Test geht davon aus, dass die betreffenden Variablen mindestens auf einer ordinalen Skala (Rangfolge) gemessen werden. Die Interpretation des Tests entspricht im Wesentlichen der Interpretation der Ergebnisse t-Kriterien für unabhängige Stichproben, außer dass das U-Kriterium als Summe der Indikatoren des paarweisen Vergleichs der Elemente der ersten Stichprobe mit den Elementen der zweiten Stichprobe berechnet wird. U-Test - die leistungsfähigste (empfindlichste) nichtparametrische Alternative t-Kriterien für unabhängige Stichproben; Tatsächlich hat es in einigen Fällen sogar mehr Kraft als t-Kriterium.

Wenn der Stichprobenumfang größer als 20 ist, konvergiert die Stichprobenverteilung für die U-Statistik schnell zu einer Normalverteilung. Daher zusammen mit der U-Statistik, dem z-Wert (für eine Normalverteilung) und dem entsprechenden p-Bedeutung.

Detaillierte Anweisungen zur Verwendung der Kriterien finden Sie weiter unten im Abschnitt Anwendungsbeispiel.

Beispiel

Lassen Sie uns die Hypothese testen, dass die verglichenen unabhängigen Stichproben zur gleichen Grundgesamtheit gehören, indem wir den nichtparametrischen Mann-Whitney-U-Test verwenden. Vergleichen wir die im Beispiel Basic Statistics und Student's t-Test erhaltenen Ergebnisse für die 2. und 3. Spalte der Student's t-Test-Tabelle mit den Ergebnissen des nichtparametrischen Vergleichs.

Zur Berechnung des Wilcoxon-U-Tests ordnen wir die Varianten der verglichenen Stichproben in aufsteigender Reihenfolge zu einer verallgemeinerten Reihe an und weisen den Varianten der verallgemeinerten Reihe Ränge von 1 bis n1 + n2 zu. Die erste Zeile stellt die Varianten der ersten Stichprobe dar, die zweite - die zweite Stichprobe, die dritte - die entsprechenden Ränge in der verallgemeinerten Reihe:





















Es ist zu beachten, dass identischen Optionen ein durchschnittlicher Rang zugewiesen wird, der Wert des letzten Rangs jedoch gleich n1 + n2 sein muss (in unserem Fall 20). Diese Regel wird verwendet, um zu überprüfen, ob das Ranking korrekt ist.

Für jede Stichprobe berechnen wir separat die Summe der Ränge ihrer R1- und R2-Varianten. In unserem Fall:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Um die Richtigkeit der Berechnungen zu überprüfen, können Sie eine andere Regel verwenden: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). In unserem Fall ist R1 + R2 = 210.

Statistik U1 = 69 - 10*11/2 = 14; U2 \u003d 141 - 10 * 11/2 \u003d 86.

Um den einseitigen Test zu testen, wählen wir die minimale Statistik U1 = 14 und vergleichen sie mit dem kritischen Wert für n1 = n2 = 10 und dem 1%-Signifikanzniveau gleich 19.

Da der berechnete Wert des Kriteriums kleiner als der tabellarische Wert ist, wird die Nullhypothese auf dem gewählten Signifikanzniveau verworfen und die Unterschiede zwischen den Stichproben als statistisch signifikant betrachtet. Somit wird die Schlussfolgerung über das Vorhandensein von Unterschieden, die unter Verwendung des parametrischen Student-Tests getroffen wurde, unter Verwendung dieses nicht-parametrischen Verfahrens bestätigt.