Explicarea calculului criteriului studentului. Statistici de bază și testul t Student

Criteriul elevuluipentru mostre independente

testul t al elevului ( t-testul elevului sau pur și simplu " t-test") este folosit dacă trebuie să comparați doar două grupuri semne cantitative cu o distribuție normală (un caz special de analiză a varianței). Notă: acest criteriu nu poate fi utilizat la compararea mai multor grupuri în perechi; în acest caz, trebuie aplicată analiza varianței. Folosirea eronată a testului t al lui Student crește probabilitatea de a „dezvălui” diferențe inexistente. De exemplu, în loc să recunoaștem mai multe tratamente ca fiind la fel de eficiente (sau ineficiente), unul dintre ele este declarat cel mai bun.

Două evenimente sunt numite independente dacă apariția unuia dintre ele nu afectează în niciun fel apariția celuilalt. În mod similar, două colecții pot fi numite independente dacă proprietățile uneia dintre ele nu sunt în niciun fel legate de proprietățile celeilalte.

Exemplu de execuție t-test in programul STATISTICA.

Femeile sunt în medie mai mici decât bărbații, cu toate acestea, acest lucru nu este rezultatul faptului că bărbații au vreo influență asupra femeilor - punctul aici este caracteristicile genetice ale sexului. Prin intermediul t- Testul trebuie să verifice dacă există o diferență semnificativă statistic între valorile medii de înălțime în grupurile de bărbați și femei. (În scopuri educaționale, presupunem că datele de înălțime urmează o distribuție normală și, prin urmare t- testul aplicabil).

Figura 1. Un exemplu de formatare a datelor pentru execuție t-

Acordați atenție modului în care datele sunt formatate în Figura 1. Ca și în cazul graficelor, cum ar fiWhiskerplot sau Box-whiskerplot, există două variabile în tabel: una dintre ele este gruparea (variabila de grupare) ("Sex") - conține coduri (soț și soții) care permit programului să determine care dintre datele de înălțime aparține cărei grupe; al doilea – așa-numitul. variabilă dependentă (variabilă dependentă) ("Creștere") - conține datele analizate efective. Cu toate acestea, la executaret-Un test pentru mostre independente în programul STATISTICA este posibil și într-o altă opțiune de proiectare - datele pentru fiecare dintre grupuri („Bărbați” și „Femei”) pot fi introduse în coloane separate (Figura 2).

Figura 2. O altă opțiune pentru formatarea datelor pentru execuție t- test pentru mostre independente

Pentru executare t-testați pentru mostre independente, trebuie să efectuați următorii pași:

1-a. Rulați modulul t- testați din meniu Statistici > Statistici de bază/Tabele > t-Test, independent, pe grupuri(dacă există o variabilă de grupare în tabelul de date, vezi Figura 3)​

SAU

1-b. Rulați modulul t- testați din meniu Statistici > Statistici de bază/Tabele > t-test, independent, prin variabile(dacă datele sunt introduse în coloane separate, vezi Figura 4).

Următorul descrie un caz de testare în care există o variabilă de grupare în tabelul de date.

2. În fereastra care se deschide, faceți clic pe butonul Variabileși spuneți programului care dintre variabilele tabelului foaie de calcul este grupare și care este dependentă (Figurile 5-6).

Figura 5. Selectarea variabilelor pentru a le include t-Test

Figura 6. Fereastra cu in variabilele selectate de condus t-Test

3. Apăsați butonulRezumat: teste T.

Figura 7. Rezultate t- teste pentru probe independente

Ca rezultat, programul va emite un registru de lucruCaiet de lucru, care conține un tabel cu rezultatelet-test (Figura 7 ). Acest tabel are mai multe coloane:

  • Rău(masculin) - valoarea medie a creșterii în grupul „Bărbați”;
  • Rău(femei) - valoarea medie a creșterii în grupul „Femei”;
  • t- valoare: valoare calculată de program t-Criteriul elevului;
  • df- numărul de grade de libertate;
  • P- probabilitatea de validitate a ipotezei că valorile medii comparate nu diferă. De fapt, acesta este cel mai important rezultat al analizei, deoarece este valoarea P spune dacă ipoteza testată este adevărată. În exemplul nostru, P > 0,05, din care putem concluziona că nu există diferențe semnificative statistic între înălțimea bărbaților și femeilor.
  • N valabil(masculin) - dimensiunea eșantionului „Bărbați”;
  • N valabil(femei) - dimensiunea eșantionului „Femei”;
  • Std. dev. (masculin) - abaterea standard a eșantionului „Bărbați”;
  • Std. dev. (femei) - abaterea standard a eșantionului „Femei”;
  • Raportul F, variațiile- valoarea testului F Fisher, care este utilizat pentru a testa ipoteza de egalitate a varianţelor în eşantioanele comparate;
  • P, Variante- probabilitatea de validitate a ipotezei că varianţele eşantioanelor comparate nu diferă.

Cel mai adesea în cercetarea psihologică, sarcinile sunt observate pentru a identifica diferențele între două sau mai multe grupuri de semne. Clarificarea unor astfel de diferențe la nivelul mediilor aritmetice este luată în considerare în analiza statisticii primare. Cu toate acestea, se pune întrebarea cât de fiabile sunt aceste diferențe și dacă pot fi extinse (extrapolate) la întreaga populație. Pentru a rezolva această problemă, ei folosesc cel mai adesea (în condiția unei distribuții normale sau apropiate de normal) criteriul t (criteriul studentului), care este conceput pentru a afla cât de semnificativ diferă indicatorii unui eșantion de subiecți de altul (pentru exemplu, când subiecții primesc în urma testării unui grup scoruri mai mari decât reprezentanții celuilalt). Acesta este un criteriu parametric, are două forme principale:

1) fără legătură (impar) t - un criteriu menit să afle dacă există diferențe între scorurile obținute la utilizarea aceluiași test pentru a testa două grupuri formate din persoane diferite. De exemplu, aceasta poate fi o comparație a nivelului de inteligență sau stabilitatea neuropsihică, anxietatea elevilor de succes și nereușiți sau o comparație a elevilor de diferite clase, vârste, niveluri sociale etc., pe aceste motive. Pot exista eșantioane heterosexuale, multinaționale, precum și subeșantioane în probele studiate, selectate în funcție de un anumit atribut. Criteriul se numește „neînrudit” deoarece grupurile comparate sunt formate din persoane diferite;

2) conectat (pereche) t - un criteriu utilizat pentru a compara indicatorii a două grupuri, între elementele cărora există o relație specifică. Aceasta înseamnă că fiecărui element din primul grup îi corespunde un element al celui de-al doilea grup, similar cu acesta într-un anumit parametru de interes pentru cercetător. Cel mai adesea, parametrii acelorași persoane sunt comparați înainte și după un anumit eveniment sau acțiune (de exemplu, în procesul de realizare a unui studiu longitudinal sau a unui experiment formativ). Prin urmare, acest criteriu este utilizat pentru a compara performanța acelorași indivizi înainte și după examinare, experiment sau trecerea unui anumit timp.

Dacă datele nu sunt distribuite în mod normal, utilizați teste neparametrice echivalente cu testul t: testul Mann-Whitney, echivalent cu un test t impar, și testul Wilcoxon cu două eșantioane, echivalent cu un test t pereche.

Cu ajutorul testelor t și echivalentelor lor neparametrice, se pot compara doar rezultatele a două grupuri obținute folosind același test. Cu toate acestea, în unele cazuri devine necesară compararea mai multor grupuri sau evaluări de mai multe tipuri. Acest lucru se poate face în etape prin împărțirea sarcinii în mai multe perechi de comparații (de exemplu, dacă trebuie să comparați grupurile A, B și Y în funcție de rezultatele testelor X și Y, apoi folosind criteriul t, mai întâi comparați grupurile A și B conform rezultatelor testului X, apoi A și B conform rezultatelor testului C, A și C conform rezultatelor testului X etc.). Cu toate acestea, aceasta este o metodă care necesită foarte mult timp, așa că se recurge la o metodă mai complexă de analiză a varianței.

Metoda de evaluare a fiabilității diferențelor de medii aritmetice printr-un test parametric Student destul de eficient este concepută pentru a rezolva una dintre problemele cel mai des observate în prelucrarea datelor - identificarea fiabilității diferențelor dintre două sau mai multe serii de valori. O astfel de evaluare este adesea necesară în analiza comparativă a grupurilor polare. ele se deosebesc pe baza severității diferite a unei anumite trăsături țintă (caracteristică) a fenomenului studiat. De regulă, analiza începe cu calcularea statisticilor primare ale grupurilor selectate ", apoi se evaluează semnificația diferențelor. Testul t al lui Student este calculat prin formula:

Valoarea testului Student pentru trei niveluri de semnificație (statistică) de încredere (p) este dată în cărțile de referință despre statistica matematică. Numărul de grade de libertate este determinat de formula:

Cu dimensiunea eșantionului în scădere (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Decizia privind fiabilitatea diferențelor se ia dacă valoarea calculată a lui t depășește valoarea tabelară pentru un anumit număr de grade de libertate (d (v)). În publicații sau rapoarte științifice se indică cel mai înalt nivel de semnificație dintre cele trei: p<0,05; р <0,01; р <0,001.

Pentru orice valoare numerică a criteriului de semnificație a diferenței dintre medii, acest indicator nu evaluează gradul diferenței relevate (se evaluează prin însăși diferența dintre medii), ci doar semnificația sa statistică, adică dreptul de a extinde concluzia obținută pe baza unei comparații a probelor că există o diferență față de întregul fenomen (întregul proces) în ansamblu. Un criteriu de diferență calculată scăzut nu poate servi ca dovadă a absenței unei diferențe între două trăsături (fenomene), deoarece semnificația (semnificația) sa depinde nu numai de valoarea medie, ci și de numărul de eșantioane comparate. El subliniază nu absența unei diferențe, ci faptul că, cu o astfel de dimensiune a eșantionului, este nesigur din punct de vedere statistic: există o șansă foarte mare ca diferența în aceste condiții să fie aleatorie, iar probabilitatea fiabilității sale este foarte mică.

Tabelul 2.17. Limite de încredere pentru testul t al lui Student (testul t) pentru f grade de libertate

a timpului mediu de finalizare a sarcinii în a doua încercare (comparativ cu prima încercare) nu este semnificativ.

Această expresie nu este echivalentă cu o afirmație despre omogenitatea statistică a celor două eșantioane care sunt comparate. În plus, aplicarea testului Student în cazul unor astfel de eșantioane inegale nu este deloc corectă din punct de vedere matematic și, desigur, afectează rezultatul final cu privire la nefiabilitatea diferențelor Xav = 9,1 și Xav = 8,5. Folosind acest criteriu, nu gradul de apropiere a două medii este evaluat, ci repartizarea sau transportul cu plasă este considerată aleatorie (la un anumit nivel de semnificație). .

unde f este gradul de libertate, care este definit ca

Exemplu . Două grupuri de elevi au fost instruite după două metode diferite. La finalul instruirii, li s-a dat un test pe tot parcursul cursului. Este necesar să se evalueze cât de semnificative sunt diferențele în cunoștințele dobândite. Rezultatele testelor sunt prezentate în tabelul 4.

Tabelul 4

Calculați media eșantionului, varianța și abaterea standard:

Determinați valoarea lui t p cu formula t p = 0,45

Conform tabelului 1 (vezi Anexa), găsim valoarea critică t k pentru nivelul de semnificație p = 0,01

Concluzie: deoarece valoarea calculată a criteriului este mai mică decât valoarea critică de 0,45<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

Algoritm pentru calcularea testului t Student pentru eșantioane dependente de măsurători

1. Determinați valoarea calculată a criteriului t folosind formula

, Unde

2. Calculaţi gradul de libertate f

3. Determinați valoarea critică a testului t conform tabelului 1 din apendice.

4. Comparați valorile calculate și critice ale criteriului t. Dacă valoarea calculată este mai mare sau egală cu valoarea critică, atunci ipoteza egalității mediilor din cele două eșantioane de modificare este respinsă (Dar). În toate celelalte cazuri, este luată la un anumit nivel de semnificație.

U- criteriuMană- Whitney

Scopul criteriului

Criteriul este conceput pentru a evalua diferențele dintre două eșantioane neparametrice în ceea ce privește nivelul oricărei trăsături, măsurat cantitativ. Vă permite să identificați diferențele dintre eșantioanele mici atunci când n< 30.

Descrierea criteriului

Această metodă determină dacă aria de suprapunere a valorilor dintre două serii este suficient de mică. Cu cât această zonă este mai mică, cu atât este mai probabil ca diferențele să fie semnificative. Valoarea empirică a criteriului U reflectă cât de mare este zona de coincidență dintre rânduri. Prin urmare, cu cât U este mai mic, cu atât este mai probabil ca diferențele să fie semnificative.

Ipoteze

DAR: Nivelul caracteristicii din grupul 2 nu este mai mic decât nivelul caracteristicii din grupul 1.

HI: Nivelul trăsăturii din grupul 2 este mai scăzut decât nivelul trăsăturii din grupul 1.

Algoritm pentru calcularea criteriului Mann-Whitney (u)

    Transferați toate datele subiecților pe carduri individuale.

    Marcați cartonașele subiecților din eșantionul 1 cu o culoare, să spunem roșu, și toate cartonașele din eșantionul 2 cu o alta, de exemplu, albastru.

    Așezați toate cărțile într-un singur rând în funcție de gradul de creștere al atributului, indiferent de probă căreia îi aparțin, ca și cum am lucra cu un eșantion mare.


unde n 1 este numărul de subiecți din eșantionul 1;

n 2 - numărul de subiecți din eșantionul 2,

T x - cea mai mare dintre cele două sume rand;

n x - numărul de subiecți din grupul cu o sumă mai mare de ranguri.

9. Determinați valorile critice ale lui U conform tabelului 2 (vezi Anexa).

Dacă U emp.> U kr0,05, atunci ipoteza But este acceptată. Dacă U emp. ≤ U cr, atunci este respins. Cu cât valoarea U este mai mică, cu atât este mai mare fiabilitatea diferențelor.

Exemplu. Comparați eficacitatea a două metode de predare în două grupuri. Rezultatele testelor sunt prezentate în tabelul 5.

Tabelul 5

Să transferăm toate datele într-un alt tabel, evidențiind datele celui de-al doilea grup cu o subliniere și să facem clasarea eșantionului total (a se vedea algoritmul de clasare din ghidurile pentru sarcina 3).

Valori

Aflați suma rangurilor a două eșantioane și alegeți-l pe cel mai mare dintre ele: T x = 113

Să calculăm valoarea empirică a criteriului după formula 2: U p = 30.

Să determinăm valoarea critică a criteriului din Tabelul 2 din Anexă la un nivel de semnificație p = 0,05: U k = 19.

Concluzie: întrucât valoarea calculată a criteriuluiUeste mai mare decât nivelul critic la nivelul de semnificație p = 0,05 și 30 > 19, atunci ipoteza egalității mijloacelor este acceptată și diferențele de metode de predare sunt nesemnificative..

Testarea unei ipoteze statistice vă permite să faceți o concluzie riguroasă despre caracteristicile populației generale pe baza datelor eșantionului. Ipotezele sunt diferite. Una dintre ele este ipoteza despre medie (așteptarea matematică). Esența sa este de a face o concluzie corectă despre unde media generală poate sau nu să se bazeze doar pe eșantionul disponibil (nu vom ști niciodată adevărul exact, dar putem restrânge cercul de căutare).

Este descrisă abordarea generală a testării ipotezelor, deci direct la obiect. Să presupunem mai întâi că eșantionul este extras dintr-un set normal de variabile aleatoare X cu media generală μ și dispersie σ2(Știu, știu că acest lucru nu se întâmplă, dar nu trebuie să mă întrerupeți!). Media aritmetică a acestui eșantion este în mod evident ea însăși o variabilă aleatorie. Dacă extragem multe astfel de mostre și calculăm mediile pentru ele, atunci vor avea și așteptările matematice μ și

Apoi variabila aleatoare

Se pune întrebarea: media generală cu o probabilitate de 95% va fi în ±1,96 s x. Cu alte cuvinte, sunt distribuțiile variabilelor aleatoare

echivalent.

Pentru prima dată această întrebare a fost ridicată (și rezolvată) de un chimist care lucra la fabrica de bere Guinness din Dublin (Irlanda). Numele chimistului era William Seeley Gosset și a luat mostre de bere pentru analiză chimică. La un moment dat, se pare, William a început să aibă vagi îndoieli cu privire la distribuția mediilor. S-a dovedit a fi puțin mai răspândit decât ar trebui să fie o distribuție normală.

După ce a strâns o justificare matematică și a calculat valorile funcției de distribuție pe care a descoperit-o, chimistul din Dublin William Gosset a scris o notă care a fost publicată în numărul din martie 1908 al revistei Biometrics (editor-șef - Karl Pearson) . pentru că Guinness a interzis cu strictețe să dezvăluie secretele fabricării berii, Gosset a semnat sub pseudonimul Student.

În ciuda faptului că K. Pearson inventase deja distribuția, totuși, ideea generală a normalității încă domina. Nimeni nu avea să creadă că distribuția estimărilor eșantionului ar putea să nu fie normală. Prin urmare, articolul lui W. Gosset a rămas practic neobservat și uitat. Și doar Ronald Fisher a apreciat descoperirea lui Gosset. Fischer a folosit noua distribuție în lucrarea sa și i-a dat numele Distribuția t a studentului. Criteriul de testare a ipotezelor, respectiv, a devenit Testul t al elevului. Deci a avut loc o „revoluție” în statistică, care a pășit în era analizei datelor eșantionului. A fost o scurtă digresiune în istorie.

Să vedem ce a putut vedea W. Gosset. Să generăm 20 de mii de eșantioane normale din 6 observații cu medie ( X) 50 și abaterea standard ( σ ) 10. Apoi normalizăm mediile eșantionului folosind varianță generală:

Grupăm cele 20 de mii de medii rezultate în intervale de 0,1 lungime și calculăm frecvențele. Să reprezentăm pe o diagramă distribuțiile de frecvență actuale (Normă) și teoretice (ENorm) ale mijloacelor eșantionului.

Punctele (frecvențele observate) aproape coincid cu linia (frecvențele teoretice). Acest lucru este de înțeles, deoarece datele sunt preluate de la aceeași populație generală, iar diferențele sunt doar erori de eșantionare.

Să facem un nou experiment. Normalizăm mediile folosind varianța eșantionului.

Să numărăm din nou frecvențele și să le trasăm pe diagramă ca puncte, lăsând linia distribuției normale standard pentru comparație. Să notăm frecvența empirică a mediilor, să zicem, prin scrisoare t.

Se poate observa că distribuțiile de data aceasta nu sunt foarte asemănătoare. Aproape, da, dar nu la fel. Cozile au devenit mai „grele”.

Gosset-Student nu avea cea mai recentă versiune de MS Excel, dar exact acesta este efectul pe care l-a observat. De ce este așa? Explicația este că variabila aleatoare

depinde nu numai de eroarea de eșantionare (numărător), ci și de eroarea standard a mediei (numitorului), care este și o variabilă aleatorie.

Să ne dăm seama puțin ce distribuție ar trebui să aibă o astfel de variabilă aleatoare. În primul rând, trebuie să vă amintiți (sau să învățați) ceva din statisticile matematice. Există o astfel de teoremă Fisher, care spune că într-un eșantion dintr-o distribuție normală:

1. mediu Xși varianța eșantionului s2 sunt mărimi independente;

2. Raportul dintre eșantion și varianța generală, înmulțit cu numărul de grade de libertate, are o distribuție χ 2(chi-pătrat) cu același număr de grade de libertate, i.e.

Unde k- numărul de grade de libertate (în engleză degrees of freedom (d.f.))

Multe alte rezultate din statistica modelelor normale se bazează pe această lege.

Să revenim la distribuția mediei. Împărțiți numărătorul și numitorul expresiei

pe σX̅. obține

Numătorul este o variabilă aleatorie normală standard (notăm ξ (xi)). Numitorul poate fi exprimat din teorema Fisher.

Apoi expresia originală va lua forma

Aceasta este în termeni generali (raportul studentului). Este deja posibil să derivăm direct funcția de distribuție, deoarece sunt cunoscute distribuțiile ambelor variabile aleatoare din această expresie. Să lăsăm această plăcere în seama matematicienilor.

Funcția de distribuție t a lui Student are o formulă destul de greu de înțeles, așa că nu are sens să o analizăm. Oricum, nimeni nu-l folosește, pentru că. probabilitățile sunt date în tabele speciale ale distribuției lui Student (uneori numite tabele cu coeficienții lui Student) sau sunt transformate în formule PC.

Deci, înarmat cu noi cunoștințe, veți putea înțelege definiția oficială a distribuției Student.
O variabilă aleatoare care se supune distribuției Studentului cu k gradele de libertate este raportul dintre variabile aleatoare independente

Unde ξ distribuite conform legii normale standard și χ 2k supuse distribuirii χ 2 c k grade de libertate.

Astfel, formula criteriului Studentului pentru media aritmetică

Există un caz special al relației studenților

Din formula și definiție rezultă că distribuția testului t Student depinde doar de numărul de grade de libertate.

La k Testul > 30 t practic nu diferă de distribuția normală standard.

Spre deosebire de chi-pătrat, testul t poate fi cu una sau două cozi. De obicei, se utilizează două fețe, presupunând că abaterea poate apărea în ambele direcții de la medie. Dar dacă starea problemei permite abaterea doar într-o direcție, atunci este rezonabil să se aplice un criteriu unilateral. Acest lucru crește puțin puterea, tk. la un nivel de semnificație fix, valoarea critică se apropie ușor de zero.

Condiții de aplicare a testului t Student

În ciuda faptului că descoperirea lui Student a făcut la un moment dat o revoluție în statistică, testul t este încă destul de limitat în aplicabilitatea sa, deoarece în sine provine din presupunerea unei distribuții normale a datelor originale. Dacă datele nu sunt normale (ceea ce este de obicei cazul), atunci testul t nu va mai avea o distribuție Student. Cu toate acestea, datorită funcționării teoremei limitei centrale, media, chiar și pentru datele nenormale, capătă rapid o distribuție în formă de clopot.

Luați în considerare, de exemplu, datele care au o înclinare pronunțată spre dreapta, cum ar fi o distribuție chi-pătrat cu 5 grade de libertate.

Acum să creăm 20 de mii de eșantioane și să observăm cum se modifică distribuția mijloacelor în funcție de mărimea acestora.

Diferența este destul de vizibilă în eșantioane mici de până la 15-20 de observații. Dar apoi dispare repede. Astfel, anormalitatea distribuției este, desigur, nu bună, dar nu critică.

Cel mai mult, criteriul t este „frică” de valori aberante, de exemplu. abateri anormale. Să luăm 20 de mii de eșantioane normale din 15 observații și să adăugăm o valoare anormală la unele dintre ele.

Poza este nefericită. Frecvențele reale ale mediilor sunt foarte diferite de cele teoretice. Utilizarea distribuției t într-o astfel de situație devine o întreprindere foarte riscantă.

Deci, în eșantioane nu foarte mici (din 15 observații), testul t este relativ rezistent la distribuția nenormală a datelor inițiale. Dar valorile aberante din date distorsionează puternic distribuția testului t, care, la rândul său, poate duce la erori de inferență statistică, astfel încât observațiile anormale ar trebui eliminate. Adesea, toate valorile care se încadrează în afara ±2 abateri standard de la medie sunt eliminate din eșantion.

Un exemplu de testare a ipotezei așteptărilor matematice folosind testul t Student în MS Excel

Excel are mai multe funcții legate de distribuția t. Să le luăm în considerare.

STUDENT.DIST - distribuția t „clasică” a lui Student. Intrarea este valoarea criteriului t, numărul de grade de libertate și opțiunea (0 sau 1) care determină ceea ce trebuie calculat: densitatea sau valoarea funcției. La ieșire, obținem, respectiv, densitatea sau probabilitatea ca variabila aleatoare să fie mai mică decât criteriul t specificat în argument.

STUDENT.DIST.2X - distribuție în două sensuri. Valoarea absolută (modulo) a criteriului t și numărul de grade de libertate sunt date ca argument. La ieșire, obținem probabilitatea de a obține această valoare sau chiar mai multă valoare a criteriului t, adică nivelul de semnificație real (p-level).

STUDENT.DIST.RH - distributie t dreptaci. Deci, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PX(2;5) = 0,05097. Dacă testul t este pozitiv, atunci probabilitatea rezultată este de nivel p.

STUDENT.INV - folosit pentru a calcula inversul din partea stângă a distribuției t. Argumentul este probabilitatea și numărul de grade de libertate. La ieșire, obținem valoarea criteriului t corespunzătoare acestei probabilități. Probabilitatea este numărată la stânga. Prin urmare, nivelul de semnificație în sine este necesar pentru coada stângă α , iar pentru dreapta 1 - α .

STUDENT.ORD.2X este reciproca distribuției Studentului cu două cozi, adică. valoarea t-test (modulo). Nivelul de semnificație este, de asemenea, dat ca intrare. α . Numai că de această dată, numărătoarea inversă este din ambele părți în același timp, deci probabilitatea este distribuită pe două cozi. Deci, STUDENT.OBR (1-0,025; 5) \u003d STUDENT. OBR. 2X (0,05; 5) \u003d 2,57058

STUDENT.TEST este o funcție de testare a ipotezei despre egalitatea așteptărilor matematice în două eșantioane. Înlocuiește o grămadă de calcule, pentru că. este suficient să specificați doar două intervale cu date și încă câțiva parametri. Ieșirea este p-level.

ÎNCREDEREA ELEVULUI - calculul intervalului de încredere al mediei, ținând cont de distribuția t.

Să luăm în considerare un astfel de exemplu de antrenament. Compania ambalează ciment în saci de 50 kg. Din cauza întâmplării, într-un singur sac, este permisă o oarecare abatere de la masa așteptată, dar media generală ar trebui să rămână de 50 kg. Departamentul de control al calității a cântărit aleatoriu 9 saci și a obținut următoarele rezultate: greutate medie ( X) s-a ridicat la 50,3 kg, abaterea standard ( s) - 0,5 kg.

Este rezultatul în concordanță cu ipoteza nulă că media generală este de 50 kg? Cu alte cuvinte, este posibil să obțineți un astfel de rezultat din pură întâmplare, dacă echipamentul funcționează corect și produce o umplere medie de 50 kg? Dacă ipoteza nu este respinsă, atunci diferența obținută se încadrează în gama de fluctuații aleatorii, dar dacă ipoteza este respinsă, atunci, cel mai probabil, a avut loc o defecțiune în setările aparatului care umple pungile. Trebuie verificat și reglat.

O condiție scurtă în notația general acceptată arată astfel.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Există motive să presupunem că distribuția ocupării bagajelor urmează o distribuție normală (sau nu diferă mult de aceasta). Deci, pentru a testa ipoteza așteptărilor matematice, puteți utiliza testul t al lui Student. Pot apărea abateri aleatorii în orice direcție, deci este necesar un test t cu două cozi.

În primul rând, aplicăm mijloace antediluviane: calcularea manuală a testului t și compararea acestuia cu o valoare critică de tabel. Testul t estimat:

Acum să determinăm dacă numărul rezultat depășește nivelul critic la nivelul semnificației α = 0,05. Să folosim tabelul de distribuție t al Studentului (disponibil în orice manual de statistică).

Coloanele arată probabilitatea părții drepte a distribuției, rândurile arată numărul de grade de libertate. Ne interesează un test t cu două fețe cu un nivel de semnificație de 0,05, care este echivalent cu valoarea t pentru jumătate din nivelul de semnificație din dreapta: 1 - 0,05 / 2 = 0,975. Numărul de grade de libertate este dimensiunea eșantionului minus 1, adică 9 - 1 = 8. La intersecție, găsim valoarea tabelară a testului t - 2,306. Dacă am folosi distribuția normală standard, atunci punctul critic ar fi 1,96, dar aici este mai mult, deoarece distribuția t pe eșantioane mici are o formă mai aplatizată.

Comparăm valoarea reală (1,8) și valoarea tabelară (2,306). Criteriul calculat s-a dovedit a fi mai mic decât cel tabelar. Prin urmare, datele disponibile nu contrazic ipoteza H 0 conform căreia media generală este de 50 kg (dar nici nu o dovedesc). Asta este tot ce putem afla folosind tabelele. Puteți, desigur, să încercați în continuare să găsiți nivelul p, dar va fi aproximativ. Și, de regulă, p-level este folosit pentru a testa ipotezele. Deci, să trecem la Excel.

Nu există nicio funcție gata făcută pentru calcularea testului t în Excel. Dar acest lucru nu este înfricoșător, deoarece formula t-test a Studentului este destul de simplă și poate fi construită cu ușurință chiar într-o celulă Excel.

Am primit același 1.8. Să găsim mai întâi valoarea critică. Luăm alfa 0,05, criteriul este cu două fețe. Avem nevoie de o funcție a valorii inverse a distribuției t pentru ipoteza cu două cozi STUDENT.OBR.2X.

Valoarea rezultată taie regiunea critică. Testul t observat nu se încadrează în el, așa că ipoteza nu este respinsă.

Totuși, acesta este același mod de a testa o ipoteză cu o valoare de tabel. Va fi mai informativ să se calculeze nivelul p, adică. probabilitatea de a obține abaterea observată sau chiar mai mare de la media de 50 kg dacă această ipoteză este corectă. Veți avea nevoie de o funcție de distribuție a Studentului pentru ipoteza cu două cozi STUDENT.DIST.2X.

Nivelul P este egal cu 0,1096, care este mai mult decât nivelul de semnificație permis de 0,05 - nu respingem ipoteza. Dar acum putem judeca gradul de probă. Nivelul P s-a dovedit a fi destul de aproape de nivelul atunci când ipoteza este respinsă, iar acest lucru duce la gânduri diferite. De exemplu, eșantionul era prea mic pentru a detecta o abatere semnificativă.

Să presupunem că, după un timp, departamentul de control a decis din nou să verifice cum a fost menținut standardul de umplere a sacului. De data aceasta, pentru o mai mare fiabilitate, nu au fost selectate 9, ci 25 de pungi. Este intuitiv clar că răspândirea mediei va scădea și, prin urmare, șansele de a găsi o defecțiune în sistem devin mai mari.

Să presupunem că au fost obținute aceleași valori ale mediei și abaterii standard pentru eșantion ca prima dată (50,3 și, respectiv, 0,5). Să calculăm testul t.


Valoarea critică pentru 24 de grade de libertate și α = 0,05 este 2,064. Imaginea de mai jos arată că testul t se încadrează în zona respingerii ipotezei.

Se poate concluziona că, cu o probabilitate de încredere de peste 95%, media generală diferă de 50 kg. Pentru a fi mai convingător, să ne uităm la p-level (ultima linie din tabel). Probabilitatea de a obține o medie cu această abatere sau chiar mai mare de la 50, dacă ipoteza este corectă, este de 0,0062, sau 0,62%, ceea ce este aproape imposibil cu o singură măsurare. În general, respingem ipoteza ca fiind improbabilă.

Calcularea unui interval de încredere utilizând distribuția t a studentului

O altă metodă statistică strâns legată de testarea ipotezelor este calculul intervalelor de încredere. Dacă valoarea corespunzătoare ipotezei nule se încadrează în intervalul obținut, atunci aceasta este echivalentă cu faptul că ipoteza nulă nu este respinsă. În caz contrar, ipoteza este respinsă cu nivelul de încredere corespunzător. În unele cazuri, analiștii nu testează deloc ipotezele în forma clasică, ci calculează doar intervale de încredere. Această abordare vă permite să extrageți și mai multe informații utile.

Să calculăm intervalele de încredere pentru media la 9 și 25 de observații. Pentru a face acest lucru, vom folosi funcția Excel ÎNCREDERE.STUDENT. Aici, destul de ciudat, totul este destul de simplu. În argumentele funcției, trebuie să specificați doar nivelul de semnificație α , abaterea standard a eșantionului și dimensiunea eșantionului. La ieșire, obținem jumătatea lățimii intervalului de încredere, adică valoarea care trebuie pusă deoparte de ambele părți ale mediei. După ce facem calculele și desenăm o diagramă vizuală, obținem următoarele.

După cum se vede, la un eșantion de 9 observații, valoarea lui 50 se încadrează în intervalul de încredere (ipoteza nu este respinsă), iar la 25 de observații nu se încadrează (ipoteza este respinsă). Totodată, în experimentul cu 25 de saci, se poate argumenta că, cu o probabilitate de 97,5%, media generală depășește 50,1 kg (limita inferioară a intervalului de încredere este de 50,094 kg). Și acestea sunt informații destul de valoroase.

Astfel, am rezolvat aceeași problemă în trei moduri:

1. O abordare străveche, comparând valoarea calculată și tabelară a criteriului t
2. Mai modern, prin calcularea nivelului p, adăugând un grad de încredere în respingerea ipotezei.
3. Și mai informativ prin calcularea intervalului de încredere și obținerea valorii minime a mediei generale.

Este important de reținut că testul t se referă la metode parametrice, deoarece bazată pe o distribuție normală (are doi parametri: medie și varianță). Prin urmare, pentru aplicarea sa cu succes, cel puțin normalitatea aproximativă a datelor inițiale și absența valorilor aberante sunt importante.

În sfârșit, vă propun să vizionați un videoclip despre cum să efectuați calcule legate de testul t Student în Excel.

Poveste

Acest criteriu a fost dezvoltat de William Gossett pentru a evalua calitatea berii la Guinness. În legătură cu obligațiile față de companie de nedezvăluire a secretelor comerciale (conducerea Guinness a considerat o astfel de utilizare a aparatului statistic în munca lor), articolul lui Gosset a fost publicat în 1908 în revista Biometrics sub pseudonimul „Student” (Student). .

Cerințe de date

Pentru a aplica acest criteriu, este necesar ca datele originale să aibă o distribuție normală. În cazul aplicării unui test cu două eșantioane pentru probe independente, este, de asemenea, necesar să se respecte condiția de egalitate a variațiilor. Există, totuși, alternative la testul t al lui Student pentru situații cu varianțe inegale.

Test t cu două eșantioane pentru probe independente

În cazul unei mărimi a eșantionului ușor diferite, se aplică o formulă de aproximare simplificată:

În cazul în care dimensiunea eșantionului diferă semnificativ, se aplică o formulă mai complexă și mai precisă:

Unde M 1 ,M 2 - medii aritmetice, σ 1 ,σ 2 - abateri standard, și N 1 ,N 2 - dimensiunile probei.

Testul t cu două eșantioane pentru probe dependente

Pentru a calcula valoarea empirică a testului t în situația de testare a unei ipoteze despre diferențele dintre două eșantioane dependente (de exemplu, două eșantioane ale aceluiași test cu un interval de timp), se utilizează următoarea formulă:

Unde M d este diferența medie de valori și σ d este abaterea standard a diferenţelor.

Numărul de grade de libertate se calculează ca

Test t cu o singură probă

Este folosit pentru a testa ipoteza despre diferența dintre valoarea medie și o valoare cunoscută:

Numărul de grade de libertate se calculează ca

Analogi neparametrici

Un analog al testului cu două eșantioane pentru probe independente este testul U Mann-Whitney. Pentru situația cu probe dependente, analogii sunt testul semnului și testul T Wilcoxon

Calculul automat al testului t al lui Student


Fundația Wikimedia. 2010 .

Vedeți ce este „testul T al elevului” în alte dicționare:

    Criteriul elevului t-k- Criteriul elevului, t k. * Criteriul elevului, t k. * Criteriul elevului sau t c. sau S. t testează un test statistic pentru semnificația diferenței dintre mediile comparate. Este determinat de raportul dintre această diferență și eroarea diferenței: Pentru valorile lui t… … Genetica. Dicţionar enciclopedic

    Testul T al lui Student este un nume general pentru o clasă de metode de testare statistică a ipotezelor (teste statistice) bazate pe comparație cu distribuția lui Student. Cele mai frecvente cazuri de aplicare a criteriului t sunt legate de testarea egalității ...... Wikipedia

    Criteriul elevului- Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: engl. Testul studentului rus. Criteriul elevului... Žemės ūkio augalų selekcijos și sėklininkystės terminų žodynas

    Criteriul elevului- Un test statistic în care, presupunând ipoteza nulă, statisticile utilizate corespund unei distribuții t (distribuția t a lui Student). Notă. Iată exemple de aplicare a acestui criteriu: 1. verificarea egalității mediei a ... ... Dicţionar de statistică sociologică

    CRITERIUL STUDENTULUI- Indicator biometric al semnificației diferenței (td) dintre valorile medii a două grupuri comparate de animale (M1 și M2) pentru orice trăsătură. Fiabilitatea diferenței este determinată de formula: Valoarea rezultată a td este comparată cu ... ... Termeni și definiții utilizate în reproducerea, genetica și reproducerea animalelor de fermă

    CRITERIUL STUDENTULUI- evaluează apropierea a două valori medii în ceea ce privește atribuirea sau neatribuirea aleatorie (la un anumit nivel de semnificație), răspunzând la întrebarea dacă valorile medii diferă semnificativ statistic una de alta)