Statistisch gültige Daten. Das Konzept der statistischen Signifikanz

In den Tabellen der Ergebnisse statistischer Berechnungen in Hausarbeiten, Diplom- u Masterarbeiten in der Psychologie gibt es immer einen Indikator "p".

Beispielsweise gem Forschungsschwerpunkte Unterschiede in der Sinnhaftigkeit des Lebens bei Jungen und Mädchen im Jugendalter wurden errechnet.

Mittlere Bedeutung

Mann-Whitney-U-Test

Grad der statistischen Signifikanz (p)

Jungen (20 Personen)

Mädchen

(5 Personen)

Ziele

28,9

35,2

17,5

0,027*

Verfahren

30,1

32,0

38,5

0,435

Ergebnis

25,2

29,0

29,5

0,164

Ort der Kontrolle - "Ich"

20,3

23,6

0,067

Ort der Kontrolle - "Leben"

30,4

33,8

27,5

0,126

Sinn des Lebens

98,9

111,2

0,103

* - Unterschiede sind statistisch signifikant (S0,05)

Die rechte Spalte gibt den Wert von "p" an und anhand seines Wertes kann festgestellt werden, ob die Unterschiede in der Sinnhaftigkeit des zukünftigen Lebens bei Jungen und Mädchen signifikant oder nicht signifikant sind. Die Regel ist einfach:

  • Wenn das statistische Signifikanzniveau „p“ kleiner oder gleich 0,05 ist, schließen wir daraus, dass die Unterschiede signifikant sind. In der obigen Tabelle sind die Unterschiede zwischen Jungen und Mädchen signifikant in Bezug auf den Indikator „Ziele“ – Sinnhaftigkeit des Lebens in der Zukunft. Bei Mädchen ist dieser Indikator statistisch signifikant höher als bei Jungen.
  • Wenn das statistische Signifikanzniveau "p" größer als 0,05 ist, dann wird gefolgert, dass die Unterschiede nicht signifikant sind. In der obigen Tabelle sind die Unterschiede zwischen Jungen und Mädchen für alle anderen Indikatoren außer für den ersten nicht signifikant.

Woher kommt das statistische Signifikanzniveau "p".

Das Niveau der statistischen Signifikanz wird berechnet statistisches Programm zusammen mit der Berechnung statistisches Kriterium. In diesen Programmen können Sie auch eine kritische Grenze für das statistische Signifikanzniveau festlegen und die entsprechenden Indikatoren werden vom Programm hervorgehoben.

Beispielsweise können Sie im Programm STATISTICA bei der Berechnung von Korrelationen die p-Grenze beispielsweise auf 0,05 setzen, und alle statistisch signifikanten Beziehungen werden rot hervorgehoben.

Wenn die Berechnung des statistischen Kriteriums manuell durchgeführt wird, wird das Signifikanzniveau "p" bestimmt, indem der Wert des erhaltenen Kriteriums mit dem kritischen Wert verglichen wird.

Was zeigt das statistische Signifikanzniveau "p".

Alle statistischen Berechnungen sind Näherungswerte. Das Niveau dieser Annäherung bestimmt das "r". Das Signifikanzniveau wird geschrieben als Dezimalbrüche, zum Beispiel 0,023 oder 0,965. Wenn wir diese Zahl mit 100 multiplizieren, erhalten wir den Indikator p in Prozent: 2,3 % und 96,5 %. Diese Prozentsätze spiegeln die Wahrscheinlichkeit wider, dass unsere Annahme einer Beziehung, beispielsweise zwischen Aggressivität und Angst, falsch ist.

Also, Korrelationskoeffizient 0,58 zwischen Aggressivität und Ängstlichkeit ergibt sich bei einem statistischen Signifikanzniveau von 0,05 oder einer Irrtumswahrscheinlichkeit von 5 %. Was genau bedeutet das?

Die gefundene Korrelation bedeutet, dass in unserer Stichprobe folgendes Muster beobachtet wird: Je höher die Aggressivität, desto höher die Angst. Das heißt, wenn wir zwei Teenager nehmen und einer mehr Angst hat als der andere, dann können wir, wenn wir um die positive Korrelation wissen, sagen, dass dieser Teenager auch eine höhere Aggressivität haben wird. Aber da in der Statistik alles ungefähr ist, geben wir zu, dass wir einen Fehler machen können, und die Wahrscheinlichkeit eines Fehlers beträgt 5%. Das heißt, nachdem wir in dieser Gruppe von Jugendlichen 20 solcher Vergleiche durchgeführt haben, können wir uns bei der Vorhersage über das Ausmaß der Aggressivität einmal irren, wenn wir die Angst kennen.

Welches statistische Signifikanzniveau ist besser: 0,01 oder 0,05

Das Niveau der statistischen Signifikanz spiegelt die Irrtumswahrscheinlichkeit wider. Daher ist das Ergebnis bei p=0,01 genauer als bei p=0,05.

BEI psychologische Forschung zwei akzeptable Niveaus der statistischen Signifikanz der Ergebnisse werden akzeptiert:

p=0,01 - hohe Zuverlässigkeit des Ergebnisses vergleichende Analyse oder Analyse von Beziehungen;

p=0,05 - ausreichende Genauigkeit.

Ich hoffe, dieser Artikel wird Ihnen helfen, selbst eine Psychologiearbeit zu schreiben. Wenn Sie Hilfe benötigen, wenden Sie sich bitte an (alle Arten von Arbeiten in der Psychologie; statistische Berechnungen).

Statistische Signifikanz

Die Ergebnisse, die mit einem bestimmten Forschungsverfahren erzielt werden, werden genannt statistisch signifikant wenn die Wahrscheinlichkeit ihres zufälligen Auftretens sehr gering ist. Dieses Konzept kann am Beispiel des Münzwurfs verdeutlicht werden. Angenommen, eine Münze wird 30 Mal geworfen; Es kam 17 Mal Kopf und 13 Mal Zahl. ist es sinnvoll Ist dies eine Abweichung vom erwarteten Ergebnis (15 Kopf und 15 Zahl) oder ist dies ein Zufall? Um diese Frage zu beantworten, können Sie zum Beispiel dieselbe Münze 30 Mal hintereinander werfen und gleichzeitig notieren, wie oft sich das Verhältnis von Kopf und Zahl von 17:13 wiederholt. Die statistische Auswertung erspart uns diesen langwierigen Prozess. Mit seiner Hilfe lässt sich nach den ersten 30 Münzwürfen die mögliche Anzahl zufälliger Vorkommen von 17 Kopf und 13 Zahl abschätzen. Eine solche Schätzung wird als probabilistische Aussage bezeichnet.

BEI Wissenschaftliche Literatur in der Betriebsorganisationspsychologie probabilistische Aussage in mathematische Form bezeichnet durch den Ausdruck R(Wahrscheinlichkeit)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0,01). Diese Tatsache ist wichtig für das Verständnis der Literatur, sollte aber nicht so verstanden werden, dass es sinnlos ist, Beobachtungen zu machen, die diesen Standards nicht genügen. Sogenannte nicht signifikante Forschungsergebnisse (zufällig gewonnene Beobachtungen). mehr ein- oder fünfmal von 100) kann sehr nützlich sein, um Trends zu erkennen und als Leitfaden für zukünftige Forschung.

Es sollte auch beachtet werden, dass nicht alle Psychologen mit traditionellen Standards und Verfahren einverstanden sind (z. B. Cohen, 1994; Sauley & Bedeian, 1989). Probleme im Zusammenhang mit Messungen sind selbst Hauptthema die Arbeit vieler Forscher, die die Genauigkeit von Messmethoden und die zugrunde liegenden Voraussetzungen untersuchen bestehende Methoden und Standards sowie die Entwicklung neuer Schaber und Instrumente. Vielleicht wird die Forschung in dieser Größenordnung irgendwann in der Zukunft zu einer Änderung der traditionellen Standards zur Bewertung der statistischen Signifikanz führen, und diese Änderungen werden universelle Akzeptanz finden. (Das fünfte Kapitel der American Psychological Association bringt Psychologen zusammen, die sich auf das Studium von Assessments, Messungen und Statistiken spezialisiert haben.)

In Forschungsberichten ist eine probabilistische Aussage wie z R< 0,05, aufgrund einiger Statistiken das heißt, eine Zahl, die als Ergebnis einer bestimmten Reihe mathematischer Rechenverfahren erhalten wird. Eine probabilistische Bestätigung erhält man, indem man diese Statistiken mit Daten aus speziellen Tabellen vergleicht, die zu diesem Zweck veröffentlicht werden. In der arbForschung werden Statistiken wie z r, F, t, r>(lesen Sie "Chi-Quadrat") und R(lesen Sie "mehrere R"). In jedem Fall können die aus der Analyse einer Reihe von Beobachtungen gewonnenen Statistiken (eine Zahl) mit den Zahlen aus der veröffentlichten Tabelle verglichen werden. Danach ist es möglich, eine probabilistische Aussage über die Wahrscheinlichkeit zu formulieren, diese Zahl zufällig zu erhalten, also einen Rückschluss auf die Signifikanz der Beobachtungen zu ziehen.

Um die in diesem Buch beschriebenen Studien zu verstehen, reicht es aus, ein klares Verständnis des Konzepts der statistischen Signifikanz zu haben und nicht unbedingt zu wissen, wie die oben genannten Statistiken berechnet werden. Es wäre jedoch nützlich, eine Annahme zu diskutieren, die all diesen Verfahren zugrunde liegt. Dies ist die Annahme, dass alle beobachteten Variablen ungefähr verteilt sind normales Gesetz. Darüber hinaus fallen beim Lesen von Berichten über arForschung oft drei weitere Begriffe auf, die spielen wichtige Rolle Zuerst die Korrelation Korrelation, zweitens die Determinanten-/Prädiktorvariable und "ANOVA" ( Varianzanalyse), drittens eine Gruppe statistischer Methoden unter gemeinsamen Namen„Metaanalyse“.

ZUVERLÄSSIGKEIT STATISTISCH

- Englisch Glaubwürdigkeit/Gültigkeit, statistisch; Deutsch Validität, statistische. Konsistenz, Objektivität und fehlende Zweideutigkeit in einem statistischen Test oder in C.L. Satz von Messungen. D. s. kann getestet werden, indem derselbe Test (oder Fragebogen) zu demselben Thema wiederholt wird, um zu sehen, ob dieselben Ergebnisse erzielt werden; oder Vergleich verschiedene Teile Tests, die dasselbe Objekt messen sollen.

Antinazi. Enzyklopädie der Soziologie, 2009

Sehen Sie, was "STATISTISCHE ZUVERLÄSSIGKEIT" in anderen Wörterbüchern ist:

    ZUVERLÄSSIGKEIT STATISTISCH- Englisch. Glaubwürdigkeit/Gültigkeit, statistisch; Deutsch Validität, statistische. Konsistenz, Objektivität und Unzweideutigkeit in einem statistischen Test oder in einer s. Satz von Messungen. D. s. kann durch Wiederholung desselben Tests verifiziert werden (oder ... ... Wörterbuch in Soziologie

    In der Statistik wird ein Wert als statistisch signifikant bezeichnet, wenn die Wahrscheinlichkeit seines Auftretens durch Zufall oder noch extremere Werte gering ist. Unter dem Extrem wird dabei der Grad der Abweichung der Teststatistik von der Nullhypothese verstanden. Der Unterschied heißt ... ... Wikipedia

    physikalisches Phänomen statistische Stabilität dass mit einer Erhöhung des Stichprobenumfangs die Häufigkeit steigt Zufälliges Ereignis oder Durchschnitt physikalische Größe tendiert zu einer festen Zahl. Das Phänomen der Statistik ... ... Wikipedia

    ZUVERLÄSSIGKEIT VON UNTERSCHIED (Ähnlichkeit)- Analytik Statistisches Verfahren Bestimmung des Signifikanzniveaus von Unterschieden oder Ähnlichkeiten zwischen Stichproben gemäß den untersuchten Indikatoren (Variablen) ... Modern Bildungsprozess: grundlegende Konzepte und Begriffe

    BERICHTERSTATTUNG, STATISTISCH Großes Buchhaltungswörterbuch

    BERICHTERSTATTUNG, STATISTISCH- Staatsform statistische Beobachtung, in dem die zuständigen Behörden von Unternehmen (Organisationen und Institutionen) die von ihnen benötigten Informationen in Form von gesetzlich vorgeschriebenen Meldeunterlagen (Statistikmeldungen) für ... Großes Wirtschaftslexikon

    Die Wissenschaft, die die Methoden der systematischen Beobachtung von untersucht Massenphänomene soziales Leben Menschen, die Erstellung ihrer numerischen Beschreibungen und die wissenschaftliche Verarbeitung dieser Beschreibungen. Theoretische Statistik ist also eine Wissenschaft ... ... Enzyklopädisches Wörterbuch F. Brockhaus und I.A. Efron

    Korrelationskoeffizient- (Korrelationskoeffizient) Der Korrelationskoeffizient ist ein statistischer Indikator für die Abhängigkeit von zwei zufällige Variablen Definition des Korrelationskoeffizienten, Arten von Korrelationskoeffizienten, Eigenschaften des Korrelationskoeffizienten, Berechnung und Anwendung ... ... Enzyklopädie des Investors

    Statistiken- (Statistik) Statistik ist eine allgemeine theoretische Wissenschaft, die quantitative Veränderungen in Phänomenen und Prozessen untersucht. Regierungsstatistik, Statistikdienste, Rosstat (Goskomstat), statistische Daten, Anfragestatistiken, Verkaufsstatistiken, ... ... Enzyklopädie des Investors

    Korrelation- (Korrelation) Korrelation ist eine statistische Beziehung zwischen zwei oder mehr Zufallsvariablen.Begriff der Korrelation, Arten der Korrelation, Korrelationskoeffizient, Korrelationsanalyse, Preiskorrelation, Korrelation Währungspaare Forex-Inhalte… … Enzyklopädie des Investors

Bücher

  • Forschung in Mathematik und Mathematik in der Forschung: Methodische Sammlung zu Forschungsaktivitäten von Studenten, Borzenko V.I.. Die Sammlung enthält methodische Entwicklungen in der Organisation anwendbar Forschungstätigkeit Studenten. Der erste Teil der Sammlung widmet sich der Anwendung des Forschungsansatzes in…

Vor dem Sammeln und Studieren von Daten entscheiden experimentelle Psychologen normalerweise, wie die Daten statistisch analysiert werden. Häufig legt der Forscher ein Signifikanzniveau fest, definiert als Statistik, Oben ( oder darunter), die Werte enthält, die es uns ermöglichen, den Einfluss von Faktoren als nicht zufällig zu betrachten. Forscher stellen dieses Niveau normalerweise in Form eines probabilistischen Ausdrucks dar.

In vielen psychologische Experimente es kann ausgedrückt werden als " Stufe 0,05" oder " Stufe 0,01". Dies bedeutet, dass zufällige Ergebnisse nur mit einer bestimmten Häufigkeit auftreten 0,05 (1 von 1 mal) oder 0,01 (1 von 100 Mal). Die Ergebnisse der statistischen Analyse von Daten, die ein vorgegebenes Kriterium erfüllen ( sei es 0,05, 0,01 oder sogar 0,001), werden im Folgenden als statistisch signifikant bezeichnet.

Es sollte beachtet werden, dass das Ergebnis möglicherweise nicht statistisch signifikant, aber dennoch von Interesse ist. Oft, insbesondere bei Vorstudien oder Experimenten mit einer kleinen Anzahl von Probanden oder wenn limitierte Anzahl Beobachtungen, erreichen die Ergebnisse möglicherweise nicht das Niveau der statistischen Signifikanz, deuten aber darauf hin, dass in weitere Nachforschungen mit genauerer Steuerung und mehr Beobachtungen werden zuverlässiger. Gleichzeitig muss der Experimentator sehr vorsichtig sein in seinem Wunsch, die Bedingungen des Experiments gezielt zu ändern, um das gewünschte Ergebnis um jeden Preis zu erreichen.

In einem anderen Beispiel eines 2x2-Plans Ji verwendeten zwei Arten von Fächern und zwei Arten von Aufgaben, um die Wirkung von Spezialwissen auf das Auswendiglernen von Informationen zu untersuchen.

In meinem Arbeitszimmer Ji studierte Zahlenauswendiglernen und Schachfiguren (Variable A) Kinder auf Sesseln RECARO Junger Sport und Erwachsene ( Variable B), das heißt, nach dem Plan 2x2. Die Kinder waren 10 Jahre alt und gut im Schach, während die Erwachsenen neu im Spiel waren. Die erste Aufgabe bestand darin, sich die Position der Figuren auf dem Brett zu merken, wie sie während des normalen Spiels sein würde, und sie wiederherzustellen, nachdem die Figuren entfernt wurden. Ein weiterer Teil dieser Aufgabe bestand darin, sich eine Standardreihe von Zahlen zu merken, wie dies normalerweise bei der Bestimmung des IQ der Fall ist.

Es stellt sich heraus, dass spezielles Wissen, wie z. B. die Fähigkeit, Schach zu spielen, das Merken von Informationen in diesem Bereich erleichtert, dies jedoch nicht tut großer Einfluss Zahlen zu merken. Erwachsene, die nicht allzu erfahren in der Weisheit des alten Spiels sind, erinnern sich weniger Figuren, aber beim Auswendiglernen von Zahlen sind sie erfolgreicher.

Im Hauptteil des Berichts Ji gibt statistische Analyse, was die präsentierten Ergebnisse mathematisch bestätigt.

Der 2x2-Versuchsplan ist der einfachste aller faktoriellen Versuchspläne. Eine Erhöhung der Anzahl von Faktoren oder Niveaus einzelner Faktoren verkompliziert diese Pläne erheblich.

Aufgabe 3. Fünf Vorschulkinder werden einem Test unterzogen. Die Zeit für die Lösung jeder Aufgabe ist festgelegt. Gibt es statistisch signifikante Unterschiede zwischen den Lösungszeiten? die ersten drei Testgegenstände?

Anzahl der Fächer

Referenzmaterial

Diese Aufgabe basiert auf der Theorie der Varianzanalyse. Im allgemeinen Fall besteht die Aufgabe der Varianzanalyse darin, diejenigen Faktoren zu identifizieren, die einen signifikanten Einfluss auf das Ergebnis des Experiments haben. Die Varianzanalyse kann verwendet werden, um die Mittelwerte mehrerer Stichproben zu vergleichen, wenn die Anzahl der Stichproben mehr als zwei beträgt. Dazu dient die Einweg-Varianzanalyse.

Zur Lösung der gestellten Aufgaben wird folgendes angenommen. Wenn die Abweichungen der erhaltenen Werte des Optimierungsparameters im Falle des Einflusses von Faktoren von den Abweichungen der Ergebnisse ohne Einfluss von Faktoren abweichen, wird ein solcher Faktor als signifikant anerkannt.

Wie der Problemstellung zu entnehmen ist, werden hier Verfahren zur Prüfung statistischer Hypothesen verwendet, nämlich das Problem der Prüfung zweier empirischer Varianzen. Daher basiert die Varianzanalyse auf der Überprüfung von Varianzen durch das Fisher-Kriterium. Bei dieser Aufgabe ist es notwendig zu prüfen, ob die Unterschiede zwischen der Lösungszeit der ersten drei Aufgaben Test von jedem der sechs Kinder im Vorschulalter.

Die Nullhypothese (Grundhypothese) heißt H o. Das Wesen von e wird auf die Annahme reduziert, dass die Differenz zwischen den verglichenen Parametern Null ist (daher der Name der Hypothese - Null) und dass die beobachteten Unterschiede zufällig sind.

Eine konkurrierende (alternative) Hypothese heißt H 1 , die der Null-Hypothese widerspricht.

Lösung:

Unter Verwendung der Methode der Varianzanalyse auf einem Signifikanzniveau von α = 0,05 testen wir die Nullhypothese (Hо) über das Vorhandensein statistisch signifikanter Unterschiede zwischen dem Zeitpunkt der Lösung der ersten drei Aufgaben des Tests bei sechs Vorschulkindern.

Betrachten Sie die Aufgabenbedingungstabelle, in der wir die durchschnittliche Zeit finden, um jede der drei Testaufgaben zu lösen

Anzahl der Fächer

Faktorstufen

Zeit zum Lösen der ersten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der zweiten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der dritten Aufgabe des Tests (in Sek.).

Gruppendurchschnitt

Ermittlung des Gesamtdurchschnitts:

Um die Signifikanz der Zeitunterschiede jedes Tests zu berücksichtigen, wird die gesamte Stichprobenvarianz in zwei Teile unterteilt, von denen der erste als Faktorvarianz und der zweite als Residuum bezeichnet wird

Berechnen Sie mithilfe der Formel die Gesamtsumme der quadrierten Abweichungen der Variante vom Gesamtdurchschnitt

oder , wobei p die Anzahl der Zeitmessungen zum Lösen von Testaufgaben ist, q die Anzahl der Probanden. Dazu erstellen wir eine Option für eine Tabelle mit Quadraten

Anzahl der Fächer

Faktorstufen

Zeit zum Lösen der ersten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der zweiten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der dritten Aufgabe des Tests (in Sek.).