მოსწავლის კრიტერიუმის გაანგარიშების ახსნა. ძირითადი სტატისტიკა და სტუდენტის t-ტესტი

სტუდენტის კრიტერიუმიდამოუკიდებელი ნიმუშებისთვის

სტუდენტის t-ტესტი ( -სტუდენტური ტესტი ან უბრალოდ" -ტესტი") გამოიყენება თუ შედარება გჭირდებათ მხოლოდ ორი ჯგუფირაოდენობრივი ნიშნები ნორმალური განაწილებით (დისპერსიის ანალიზის განსაკუთრებული შემთხვევა). შენიშვნა: ეს კრიტერიუმი არ შეიძლება გამოყენებულ იქნას რამდენიმე ჯგუფის წყვილებში შედარებისას; ამ შემთხვევაში უნდა იქნას გამოყენებული დისპერსიის ანალიზი. სტუდენტის t-ტესტის არასწორად გამოყენება ზრდის არარსებული განსხვავებების „გამოვლენის“ ალბათობას. მაგალითად, იმის ნაცვლად, რომ რამდენიმე მკურნალობა თანაბრად ეფექტური (ან არაეფექტური) იყოს, ერთ-ერთი მათგანი საუკეთესოდ არის გამოცხადებული.

ორ მოვლენას უწოდებენ დამოუკიდებელ მოვლენას, თუ ერთი მათგანის დადგომა არანაირად არ მოქმედებს მეორის დადგომაზე. ანალოგიურად, ორ კოლექციას შეიძლება ეწოდოს დამოუკიდებელი, თუ ერთი მათგანის თვისებები არანაირად არ არის დაკავშირებული მეორის თვისებებთან.

შესრულების მაგალითი -ტესტი პროგრამა STATISTICA-ში.

ქალები საშუალოდ უფრო დაბალია ვიდრე მამაკაცები, თუმცა ეს არ არის იმის შედეგი, რომ მამაკაცებს აქვთ რაიმე გავლენა ქალებზე - აქ საქმე სქესის გენეტიკურ მახასიათებლებშია. მეშვეობით t-ტესტმა უნდა შეამოწმოს, არის თუ არა სტატისტიკურად მნიშვნელოვანი განსხვავება მამაკაცთა და ქალთა ჯგუფებში საშუალო სიმაღლის მნიშვნელობებს შორის. (საგანმანათლებლო მიზნებისთვის, ჩვენ ვვარაუდობთ, რომ სიმაღლის მონაცემები მიჰყვება ნორმალურ განაწილებას და შესაბამისად t-ტესტის გამოყენებადი).

სურათი 1. მონაცემთა ფორმატირების მაგალითი შესასრულებლად t-

ყურადღება მიაქციეთ, თუ როგორ ხდება მონაცემების ფორმატირება ნახაზ 1-ზევისკერიან ყუთი-ულვაში, ცხრილში ორი ცვლადია: ერთი მათგანია დაჯგუფება (დაჯგუფების ცვლადი) ("სექსი") - შეიცავს კოდებს (ქმარი და ცოლები), რომლებიც საშუალებას აძლევს პროგრამას განსაზღვროს სიმაღლის მონაცემებიდან რომელი რომელ ჯგუფს ეკუთვნის; მეორე - ე.წ. დამოკიდებული ცვლადი (დამოკიდებული ცვლადი) („ზრდა“) - შეიცავს რეალურად გაანალიზებულ მონაცემებს. თუმცა შესრულებისასt-STATISTICA პროგრამაში დამოუკიდებელი ნიმუშების ტესტი ასევე შესაძლებელია დიზაინის სხვა ვარიანტშიც - თითოეული ჯგუფის მონაცემები ("კაცები" და "ქალები") შეიძლება შევიდეს ცალკეულ სვეტებში (სურათი 2).

სურათი 2. კიდევ ერთი ვარიანტი მონაცემთა ფორმატირების შესასრულებლად t-ტესტი დამოუკიდებელი ნიმუშებისთვის

აღსრულებისთვის t-ტესტი დამოუკიდებელი ნიმუშებისთვის, თქვენ უნდა შეასრულოთ შემდეგი ნაბიჯები:

1-ა. გაუშვით მოდული t-ტესტი მენიუდან სტატისტიკა > ძირითადი სტატისტიკა/ცხრილები > -ტესტი, დამოუკიდებელი, ჯგუფების მიხედვით(თუ მონაცემთა ცხრილში არის დაჯგუფების ცვლადი, იხილეთ სურათი 3).

ან

1-ბ. გაუშვით მოდული t-ტესტი მენიუდან სტატისტიკა > ძირითადი სტატისტიკა/ცხრილები > -ტესტი, დამოუკიდებელი, ცვლადების მიხედვით(თუ მონაცემები შეყვანილია ცალკეულ სვეტებში, იხილეთ სურათი 4).

ქვემოთ აღწერილია ტესტის შემთხვევა, სადაც არის დაჯგუფების ცვლადი მონაცემთა ცხრილში.

2. ფანჯარაში, რომელიც იხსნება, დააჭირეთ ღილაკს ცვლადებიდა უთხარით პროგრამას ცხრილის რომელი ცვლადი ცხრილიარის დაჯგუფება და რომელია დამოკიდებული (სურათები 5-6).

სურათი 5. ცვლადების არჩევა ჩასართავად -ტესტი

ნახაზი 6. ფანჯარა in შერჩეული ცვლადები ჩასატარებლად -ტესტი

3. დააჭირეთ ღილაკსრეზიუმე: T-ტესტები.

სურათი 7. შედეგები - ტესტები დამოუკიდებელი ნიმუშებისთვის

შედეგად, პროგრამა გამოსცემს სამუშაო წიგნსსამუშაო წიგნი, რომელიც შეიცავს ცხრილს შედეგებით-ტესტი (სურათი 7 ). ამ ცხრილს აქვს რამდენიმე სვეტი:

  • ნიშნავს(კაცი) - ზრდის საშუალო მნიშვნელობა ჯგუფში "კაცები";
  • ნიშნავს(ქალები) - ზრდის საშუალო მნიშვნელობა ჯგუფში "ქალები";
  • t- ღირებულება: პროგრამით გამოთვლილი ღირებულება -სტუდენტის კრიტერიუმი;
  • დფ- თავისუფლების ხარისხების რაოდენობა;
  • - ჰიპოთეზის მართებულობის ალბათობა, რომ შედარებითი საშუალო მნიშვნელობები არ განსხვავდება. სინამდვილეში, ეს არის ანალიზის ყველაზე მნიშვნელოვანი შედეგი, რადგან ეს არის ღირებულება გვეუბნება არის თუ არა შემოწმებული ჰიპოთეზა სიმართლე. ჩვენს მაგალითში P > 0.05, საიდანაც შეგვიძლია დავასკვნათ, რომ არ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავებები მამაკაცისა და ქალის სიმაღლეს შორის.
  • მოქმედი ნ(კაცი) - ნიმუშის ზომა "კაცები";
  • მოქმედი ნ(ქალები) - ნიმუშის ზომა "ქალები";
  • წმ. dev. (კაცი) - ნიმუშის სტანდარტული გადახრა "კაცები";
  • წმ. dev. (ქალები) - ნიმუშის "ქალები" სტანდარტული გადახრა;
  • F- თანაფარდობა, ვარიაციები- ფიშერის F-ტესტის მნიშვნელობა, რომელიც გამოიყენება შედარებულ ნიმუშებში დისპერსიების ტოლობის ჰიპოთეზის შესამოწმებლად;
  • P, ვარიაციები- ჰიპოთეზის მართებულობის ალბათობა, რომ შედარებული ნიმუშების ვარიაციები არ განსხვავდება.

ყველაზე ხშირად ფსიქოლოგიურ კვლევაში ვლინდება ამოცანები ნიშნების ორ ან მეტ ჯგუფს შორის განსხვავებების დასადგენად. ასეთი განსხვავებების გარკვევა არითმეტიკული საშუალებების დონეზე განიხილება პირველადი სტატისტიკის ანალიზში. თუმცა, ჩნდება კითხვა, რამდენად სანდოა ეს განსხვავებები და შეიძლება თუ არა მათი გავრცელება (ექსტრაპოლაცია) მთელ მოსახლეობაზე. ამ პრობლემის გადასაჭრელად, ისინი ყველაზე ხშირად იყენებენ (ნორმალური ან ნორმალურთან ახლოს განაწილების პირობებში) t - კრიტერიუმს (სტუდენტის კრიტერიუმი), რომელიც შექმნილია იმის გასარკვევად, თუ რამდენად მნიშვნელოვნად განსხვავდება საგნების ერთი ნიმუშის ინდიკატორები მეორისგან ( მაგალითად, როდესაც სუბიექტები ტესტირების შედეგად იღებენ ერთი ჯგუფის უფრო მაღალ ქულებს, ვიდრე მეორის წარმომადგენლები). ეს არის პარამეტრული კრიტერიუმი, აქვს ორი ძირითადი ფორმა:

1) დაუკავშირებელი (კენტი) t - კრიტერიუმი, რომელიც შექმნილია იმის გასარკვევად, არის თუ არა განსხვავებები მიღებულ ქულებს შორის ერთი და იგივე ტესტის გამოყენებისას სხვადასხვა ადამიანებისგან ჩამოყალიბებული ორი ჯგუფის შესამოწმებლად. მაგალითად, ეს შეიძლება იყოს ინტელექტის დონის ან ნეიროფსიქიკური სტაბილურობის, წარმატებული და წარუმატებელი სტუდენტების შფოთვის, ან სხვადასხვა კლასის, ასაკის, სოციალური დონის სტუდენტების და ა.შ. შედარება ამ საფუძველზე. შესწავლილ ნიმუშებში შეიძლება იყოს ჰეტეროსექსუალური, მრავალეროვნული ნიმუშები, ასევე ქვენიმუშები, შერჩეული გარკვეული ატრიბუტის მიხედვით. კრიტერიუმს უწოდებენ „არაკავშირს“, რადგან შედარებული ჯგუფები ყალიბდება სხვადასხვა ადამიანებისგან;

2) დაკავშირებული (დაწყვილებული) t - კრიტერიუმი, რომელიც გამოიყენება ორი ჯგუფის მაჩვენებლების შესადარებლად, რომელთა ელემენტებს შორის არის კონკრეტული კავშირი. ეს ნიშნავს, რომ პირველი ჯგუფის თითოეული ელემენტი შეესაბამება მეორე ჯგუფის ელემენტს, მის მსგავსს მკვლევარის ინტერესის გარკვეულ პარამეტრში. ყველაზე ხშირად, ერთი და იგივე პირების პარამეტრები შედარებულია გარკვეული მოვლენის ან მოქმედების წინ და შემდეგ (მაგალითად, გრძივი კვლევის ან ფორმირების ექსპერიმენტის ჩატარების პროცესში). ამიტომ, ეს კრიტერიუმი გამოიყენება ერთიდაიგივე პირების მუშაობის შესადარებლად გამოკვლევამდე, ექსპერიმენტამდე ან გარკვეული დროის გასვლის შემდეგ.

თუ მონაცემები ნორმალურად არ არის განაწილებული, გამოიყენეთ t-ტესტის ექვივალენტური არაპარამეტრული ტესტები: Mann-Whitney ტესტი, კენტი t-ტესტის ექვივალენტური და Wilcoxon-ის ორი ნიმუშის ტესტი, დაწყვილებული t-ტესტის ექვივალენტური.

t-ტესტებისა და მათი არაპარამეტრული ეკვივალენტების დახმარებით შეიძლება მხოლოდ ერთი და იმავე ტესტის გამოყენებით მიღებული ორი ჯგუფის შედეგების შედარება. თუმცა, ზოგიერთ შემთხვევაში საჭირო ხდება რამდენიმე ჯგუფის ან რამდენიმე ტიპის შეფასების შედარება. ეს შეიძლება გაკეთდეს ეტაპობრივად, დავალების რამდენიმე წყვილ შედარებად დაყოფით (მაგალითად, თუ საჭიროა A, B და Y ჯგუფების შედარება X და Y ტესტების შედეგების მიხედვით, შემდეგ t-კრიტერიუმის გამოყენებით, ჯერ შეადარეთ ჯგუფები. A და B X ტესტის შედეგების მიხედვით, შემდეგ A და B ტესტის C, A და C X ტესტის შედეგების მიხედვით და ა.შ.). თუმცა, ეს ძალიან შრომატევადი მეთოდია, ამიტომ მიმართავენ დისპერსიის ანალიზის უფრო რთულ მეთოდს.

არითმეტიკული საშუალებების განსხვავებების სანდოობის შეფასების მეთოდი საკმაოდ ეფექტური პარამეტრული სტუდენტური ტესტით შექმნილია მონაცემთა დამუშავებისას ყველაზე ხშირად დაფიქსირებული ერთ-ერთი პრობლემის გადასაჭრელად - მნიშვნელობების ორ ან მეტ სერიას შორის განსხვავებების სანდოობის დადგენა. ასეთი შეფასება ხშირად საჭიროა პოლარული ჯგუფების შედარებითი ანალიზის დროს. ისინი გამოირჩევიან შესასწავლი ფენომენის გარკვეული სამიზნე მახასიათებლის (მახასიათებლის) განსხვავებული სიმძიმის მიხედვით. როგორც წესი, ანალიზი იწყება შერჩეული ჯგუფების პირველადი სტატისტიკის გამოთვლით, შემდეგ ფასდება განსხვავებების მნიშვნელობა. სტუდენტის t-ტესტი გამოითვლება ფორმულით:

სტუდენტის ტესტის მნიშვნელობა სამი დონის ნდობის (სტატისტიკური) მნიშვნელოვნებისთვის (p) მოცემულია მათემატიკური სტატისტიკის საცნობარო წიგნებში. თავისუფლების ხარისხების რაოდენობა განისაზღვრება ფორმულით:

ნიმუშის ზომის შემცირებით (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

განსხვავებების სანდოობაზე გადაწყვეტილება მიიღება იმ შემთხვევაში, თუ t-ის გამოთვლილი მნიშვნელობა აღემატება ცხრილის მნიშვნელობას თავისუფლების ხარისხის გარკვეული რაოდენობისთვის (d (v)). პუბლიკაციებში ან სამეცნიერო ანგარიშებში მიუთითეთ სამის მნიშვნელობის უმაღლესი დონე: გვ<0,05; р <0,01; р <0,001.

საშუალებებს შორის სხვაობის მნიშვნელოვნების კრიტერიუმის ნებისმიერი რიცხვითი მნიშვნელობისთვის, ეს მაჩვენებელი არ აფასებს გამოვლენილი სხვაობის ხარისხს (ის ფასდება საშუალებებს შორის არსებული სხვაობით), არამედ მხოლოდ მის სტატისტიკურ მნიშვნელობას, ე.ი. ნიმუშების შედარების საფუძველზე მიღებული დასკვნის გავრცელების უფლება, რომ არსებობს განსხვავება მთლიან ფენომენთან (მთელ პროცესთან) მთლიანობაში. დაბალი გამოთვლილი სხვაობის კრიტერიუმი არ შეიძლება გახდეს ორ მახასიათებელს (ფენომენს) შორის განსხვავების არარსებობის მტკიცებულება, რადგან მისი მნიშვნელობა (მნიშვნელობა) დამოკიდებულია არა მხოლოდ საშუალო მნიშვნელობაზე, არამედ შედარებული ნიმუშების რაოდენობაზეც. ის მიუთითებს არა სხვაობის არარსებობაზე, არამედ იმაზე, რომ ასეთი ნიმუშის ზომით ის სტატისტიკურად არასანდოა: არსებობს ძალიან დიდი შანსი, რომ განსხვავება ამ პირობებში იყოს შემთხვევითი და მისი სანდოობის ალბათობა ძალიან მცირეა.

ცხრილი 2.17. ნდობის ლიმიტები სტუდენტის t-ტესტისთვის (t-ტესტი) თავისუფლების f ხარისხისთვის

დავალების შესრულების საშუალო დრო მეორე მცდელობაში (პირველ საცდელთან შედარებით) არ არის სანდო.

ეს გამოთქმა არ არის შედარებული ორი ნიმუშის სტატისტიკური ჰომოგენურობის შესახებ განცხადებას. გარდა ამისა, სტუდენტის ტესტის გამოყენება ასეთი არათანაბარი ნიმუშების შემთხვევაში არ არის საკმაოდ სწორი მათემატიკურად და, რა თქმა უნდა, გავლენას ახდენს საბოლოო შედეგზე Xav = 9.1 და Xav = 8.5 განსხვავებების არასანდოობის შესახებ. ამ კრიტერიუმის გამოყენებით ისინი არ აფასებენ ორი საშუალო სიახლოვის ხარისხს, არამედ განიხილავენ დავალებას ან სენის ტარებას შემთხვევით (მნიშვნელობის მოცემულ დონეზე). .

სადაც f არის თავისუფლების ხარისხი, რომელიც განისაზღვრება როგორც

მაგალითი . სტუდენტების ორი ჯგუფი ტრენინგს ჩაუტარდა ორი განსხვავებული მეთოდით. ტრენინგის დასასრულს მათ მთელი კურსის განმავლობაში ჩაუტარდათ ტესტირება. აუცილებელია შევაფასოთ რამდენად მნიშვნელოვანი განსხვავებაა შეძენილ ცოდნაში. ტესტის შედეგები მოცემულია ცხრილში 4.

ცხრილი 4

გამოთვალეთ ნიმუშის საშუალო, ვარიაცია და სტანდარტული გადახრა:

განსაზღვრეთ t p-ის მნიშვნელობა t p = 0,45 ფორმულით

ცხრილი 1-ის მიხედვით (იხ. დანართი), ჩვენ ვპოულობთ კრიტიკულ მნიშვნელობას t k მნიშვნელოვნების დონისთვის p = 0.01

დასკვნა: ვინაიდან კრიტერიუმის გამოთვლილი მნიშვნელობა ნაკლებია 0,45 კრიტიკულ მნიშვნელობაზე<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

ალგორითმი გაზომვების დამოკიდებულ ნიმუშებზე Student-ის t-ტესტის გამოსათვლელად

1. განსაზღვრეთ t-კრიტერიუმის გამოთვლილი მნიშვნელობა ფორმულის გამოყენებით

, სად

2. გამოთვალეთ თავისუფლების ხარისხი ვ

3. განსაზღვრეთ t-ტესტის კრიტიკული მნიშვნელობა დანართის 1-ლი ცხრილის მიხედვით.

4. შეადარეთ t-კრიტერიუმის გამოთვლილი და კრიტიკული მნიშვნელობები. თუ გამოთვლილი მნიშვნელობა მეტია ან ტოლია კრიტიკულ მნიშვნელობაზე, მაშინ ორი ცვლილების ნიმუშში საშუალების თანასწორობის ჰიპოთეზა უარყოფილია (მაგრამ). ყველა სხვა შემთხვევაში იგი აღებულია მნიშვნელობის მოცემულ დონეზე.

U- კრიტერიუმიმანანა- უიტნი

კრიტერიუმის მიზანი

კრიტერიუმი შექმნილია იმისათვის, რომ შეაფასოს განსხვავებები ორ არაპარამეტრულ ნიმუშს შორის რაოდენობრივად გაზომილი რომელიმე მახასიათებლის დონის მიხედვით. ის საშუალებას გაძლევთ განსაზღვროთ განსხვავებები მცირე ნიმუშებს შორის, როდესაც n< 30.

კრიტერიუმის აღწერა

ეს მეთოდი განსაზღვრავს, არის თუ არა გადაფარვის მნიშვნელობების ფართობი ორ სერიას შორის საკმარისად მცირე. რაც უფრო მცირეა ეს ტერიტორია, მით უფრო სავარაუდოა, რომ განსხვავებები მნიშვნელოვანი იყოს. U კრიტერიუმის ემპირიული მნიშვნელობა ასახავს თუ რამდენად დიდია დამთხვევის ზონა მწკრივებს შორის. ამიტომ, რაც უფრო მცირეა U, მით უფრო სავარაუდოა, რომ განსხვავებები მნიშვნელოვანი იყოს.

ჰიპოთეზები

BUT: 2 ჯგუფში მახასიათებლის დონე არ არის დაბალი, ვიდრე 1 ჯგუფის მახასიათებლის დონე.

HI: თვისების დონე მე-2 ჯგუფში უფრო დაბალია, ვიდრე 1 ჯგუფის თვისების დონე.

მან-უიტნის კრიტერიუმის გამოთვლის ალგორითმი (u)

    სუბიექტების ყველა მონაცემი გადაიტანეთ ინდივიდუალურ ბარათებზე.

    მონიშნეთ 1 ნიმუშის საგნების ბარათები ერთი ფერით, ვთქვათ წითელი, და ყველა ბარათი 2 ნიმუშიდან მეორეთი, მაგალითად, ლურჯი.

    დაალაგეთ ყველა კარტი ერთ რიგში ატრიბუტის ზრდის ხარისხის მიხედვით, მიუხედავად იმისა, თუ რომელ ნიმუშს მიეკუთვნება, თითქოს ერთ დიდ ნიმუშზე ვმუშაობდეთ.


სადაც n 1 არის საგნების რაოდენობა ნიმუშში 1;

n 2 - სუბიექტების რაოდენობა ნიმუშში 2,

T x - ორი რანდის ჯამიდან უფრო დიდი;

n x - ჯგუფში წოდებების უფრო დიდი ჯამის მქონე სუბიექტების რაოდენობა.

9. განსაზღვრეთ U-ის კრიტიკული მნიშვნელობები მე-2 ცხრილის მიხედვით (იხ. დანართი).

თუ U emp.> U kr0.05, მაშინ ჰიპოთეზა მაგრამ მიღებულია. თუ U emp. ≤ U cr, მაშინ ის უარყოფილია. რაც უფრო მცირეა U მნიშვნელობა, მით უფრო მაღალია განსხვავებების სანდოობა.

მაგალითი. შეადარეთ სწავლების ორი მეთოდის ეფექტურობა ორ ჯგუფში. ტესტის შედეგები მოცემულია ცხრილში 5.

ცხრილი 5

მოდით გადავიტანოთ ყველა მონაცემი სხვა ცხრილში, გამოვყოთ მეორე ჯგუფის მონაცემები ხაზგასმით და გავაკეთოთ მთლიანი ნიმუშის რეიტინგი (იხილეთ რეიტინგის ალგორითმი მე-3 დავალების სახელმძღვანელოში).

ღირებულებები

იპოვეთ ორი ნიმუშის რიგების ჯამი და აირჩიეთ მათგან ყველაზე დიდი: T x = 113

გამოვთვალოთ კრიტერიუმის ემპირიული მნიშვნელობა ფორმულის მიხედვით 2: U p = 30.

მოდით განვსაზღვროთ კრიტერიუმის კრიტიკული მნიშვნელობა დანართის მე-2 ცხრილიდან მნიშვნელოვნების დონეზე p = 0,05: U k = 19.

დასკვნა: ვინაიდან კრიტერიუმის გამოთვლილი მნიშვნელობაUმეტია კრიტიკულ დონეზე მნიშვნელოვნების დონეზე p = 0.05 და 30 > 19, მაშინ მიღებულია საშუალებების თანასწორობის ჰიპოთეზა და სწავლების მეთოდებში განსხვავებები უმნიშვნელოა..

სტატისტიკური ჰიპოთეზის ტესტირება საშუალებას გაძლევთ გააკეთოთ მკაცრი დასკვნა ზოგადი პოპულაციის მახასიათებლების შესახებ, ნიმუშის მონაცემების საფუძველზე. ჰიპოთეზები განსხვავებულია. ერთ-ერთი მათგანია ჰიპოთეზა საშუალოზე (მათემატიკური მოლოდინი). მისი არსი არის სწორი დასკვნის გაკეთება იმის შესახებ, თუ სად შეიძლება იყოს ან არ იყოს ზოგადი საშუალო დაფუძნებული მხოლოდ ხელმისაწვდომ ნიმუშზე (ჩვენ ვერასდროს გავიგებთ ზუსტ სიმართლეს, მაგრამ შეგვიძლია შევამციროთ საძიებო წრე).

აღწერილია ჰიპოთეზების ტესტირების ზოგადი მიდგომა, ასე რომ პირდაპირ საქმეზე. ჯერ დავუშვათ, რომ ნიმუში შედგენილია შემთხვევითი ცვლადების ნორმალური ნაკრებიდან Xსაერთო საშუალოდ μ და დისპერსიას σ2(ვიცი, ვიცი, რომ ასე არ ხდება, მაგრამ ჩემი შეწყვეტა არ გჭირდებათ!). ამ ნიმუშის საშუალო არითმეტიკული აშკარად შემთხვევითი ცვლადია. თუ ბევრ ასეთ ნიმუშს ამოვიღებთ და გამოვთვლით მათ საშუალო მაჩვენებლებს, მაშინ მათაც ექნებათ მათემატიკური მოლოდინი. μ და

შემდეგ შემთხვევითი ცვლადი

ჩნდება კითხვა: იქნება თუ არა ზოგადი საშუალო 95% ალბათობით ±1,96 ფარგლებში. s x̅. სხვა სიტყვებით რომ ვთქვათ, არის შემთხვევითი ცვლადების განაწილება

ექვივალენტი.

პირველად ეს კითხვა წამოაყენა (და გადაჭრა) ქიმიკოსმა, რომელიც მუშაობდა გინესის ლუდის ქარხანაში დუბლინში (ირლანდია). ქიმიკოსს ერქვა უილიამ სილი გოსეტი და მან აიღო ლუდის ნიმუშები ქიმიური ანალიზისთვის. რაღაც მომენტში, როგორც ჩანს, უილიამს გაუჩნდა ბუნდოვანი ეჭვები საშუალოების განაწილების შესახებ. აღმოჩნდა ცოტა უფრო გაშლილი ვიდრე ნორმალური განაწილება უნდა იყოს.

შეაგროვა მათემატიკური დასაბუთება და გამოთვალა მის მიერ აღმოჩენილი განაწილების ფუნქციის მნიშვნელობები, დუბლინელმა ქიმიკოსმა უილიამ გოსეტმა დაწერა შენიშვნა, რომელიც გამოქვეყნდა ჟურნალის Biometrics-ის 1908 წლის მარტის ნომერში (მთავარი რედაქტორი - კარლ პირსონი). . იმიტომ რომ გინესმა კატეგორიულად აკრძალა ლუდის მომზადების საიდუმლოების გაცემა, გოსეტმა ხელი მოაწერა ფსევდონიმით სტუდენტი.

მიუხედავად იმისა, რომ კ. პირსონმა უკვე გამოიგონა განაწილება, მიუხედავად ამისა, ნორმალურობის ზოგადი იდეა მაინც დომინირებდა. არავინ აპირებდა იფიქროს, რომ ნიმუშის შეფასებების განაწილება შეიძლება არ იყოს ნორმალური. ამიტომ, W. Gosset-ის სტატია პრაქტიკულად შეუმჩნეველი და დავიწყებული დარჩა. და მხოლოდ რონალდ ფიშერმა დააფასა გოსეტის აღმოჩენა. ფიშერმა გამოიყენა ახალი დისტრიბუცია თავის ნაშრომში და დაარქვა მას სახელი სტუდენტური t-განაწილება. ჰიპოთეზების შემოწმების კრიტერიუმი, შესაბამისად, გახდა სტუდენტის t-ტესტი. ასე რომ, მოხდა "რევოლუცია" სტატისტიკაში, რომელიც გადავიდა ნიმუშის მონაცემების ანალიზის ეპოქაში. ეს იყო მოკლე გადახვევა ისტორიაში.

ვნახოთ, რას ხედავდა W. Gosset. 6 დაკვირვებიდან გამოვმუშაოთ 20 ათასი ნორმალური ნიმუში საშუალოდ ( ) 50 და სტანდარტული გადახრა ( σ ) 10. შემდეგ ჩვენ ნორმალიზდება ნიმუშის საშუალებების გამოყენებით ზოგადი განსხვავება:

მიღებულ 20 ათას საშუალოს ვაჯგუფებთ 0,1 სიგრძის ინტერვალებად და ვიანგარიშებთ სიხშირეებს. მოდით გამოვსახოთ ნიმუშის საშუალებების რეალური (ნორმა) და თეორიული (ENorm) სიხშირის განაწილება დიაგრამაზე.

წერტილები (დაკვირვებული სიხშირეები) თითქმის ემთხვევა ხაზს (თეორიული სიხშირეები). ეს გასაგებია, რადგან მონაცემები აღებულია ერთი და იგივე პოპულაციისგან და განსხვავებები მხოლოდ შერჩევის შეცდომებია.

მოდით გავაკეთოთ ახალი ექსპერიმენტი. ჩვენ ნორმალიზდება საშუალოდ გამოყენებით ნიმუშის განსხვავება.

მოდით, ისევ დავთვალოთ სიხშირეები და დავხატოთ ისინი დიაგრამაზე წერტილების სახით, შედარებისთვის დავტოვოთ ნორმალური ნორმალური განაწილების ხაზი. მოდით აღვნიშნოთ საშუალოების ემპირიული სიხშირე, ვთქვათ, ასოს საშუალებით .

ჩანს, რომ დისტრიბუციები ამჯერად არ არის ძალიან მსგავსი. დახურე, დიახ, მაგრამ არა იგივე. კუდები უფრო "მძიმე" გახდა.

Gosset-Student-ს არ ჰქონდა MS Excel-ის უახლესი ვერსია, მაგრამ სწორედ ეს ეფექტი შენიშნა. რატომ არის ასე? ახსნა არის ის, რომ შემთხვევითი ცვლადი

დამოკიდებულია არა მხოლოდ შერჩევის შეცდომაზე (მრიცხველი), არამედ საშუალოს სტანდარტულ შეცდომაზე (მნიშვნელი), რომელიც ასევე შემთხვევითი ცვლადია.

მოდით გავარკვიოთ, რა განაწილება უნდა ჰქონდეს ასეთ შემთხვევით ცვლადს. პირველ რიგში, თქვენ უნდა გახსოვდეთ (ან ისწავლოთ) რაღაც მათემატიკური სტატისტიკიდან. არსებობს ფიშერის თეორემა, რომელიც ამბობს, რომ ნორმალური განაწილების ნიმუშში:

1. საშუალო და ნიმუშის განსხვავება s2არის დამოუკიდებელი რაოდენობა;

2. ნიმუშისა და ზოგადი დისპერსიის შეფარდება, გამრავლებული თავისუფლების ხარისხების რაოდენობაზე, აქვს განაწილება χ 2(ჩი-კვადრატი) იგივე რაოდენობის თავისუფლების ხარისხით, ე.ი.

სადაც - თავისუფლების ხარისხების რაოდენობა (ინგლისურად თავისუფლების ხარისხი (d.f.))

ამ კანონს ეფუძნება მრავალი სხვა შედეგი ნორმალური მოდელების სტატისტიკაში.

დავუბრუნდეთ საშუალოს განაწილებას. გაყავით გამოხატვის მრიცხველი და მნიშვნელი

ზე σX̅. მიიღეთ

მრიცხველი არის სტანდარტული ნორმალური შემთხვევითი ცვლადი (ჩვენ აღვნიშნავთ ξ (xi)). მნიშვნელი შეიძლება გამოისახოს ფიშერის თეორემიდან.

შემდეგ ორიგინალური გამოხატულება მიიღებს ფორმას

ეს არის ზოგადი თვალსაზრისით (სტუდენტის თანაფარდობა). მისი განაწილების ფუნქციის უშუალოდ გამოყვანა უკვე შესაძლებელია, რადგან ცნობილია ორივე შემთხვევითი ცვლადის განაწილება ამ გამოსახულებაში. ეს სიამოვნება მათემატიკოსებს მივატოვოთ.

Student-ის t-განაწილების ფუნქციას აქვს საკმაოდ რთული გასაგები ფორმულა, ამიტომ მის ანალიზს აზრი არ აქვს. ყოველ შემთხვევაში, არავინ იყენებს მას, რადგან. ალბათობები მოცემულია სტუდენტის განაწილების სპეციალურ ცხრილებში (ზოგჯერ მას უწოდებენ სტუდენტის კოეფიციენტების ცხრილებს), ან ისინი ჩაქუჩით კომპიუტერულ ფორმულებში.

ასე რომ, ახალი ცოდნით შეიარაღებული, თქვენ შეძლებთ გაიგოთ სტუდენტური განაწილების ოფიციალური განმარტება.
შემთხვევითი ცვლადი, რომელიც ემორჩილება სტუდენტის განაწილებას თავისუფლების ხარისხი არის დამოუკიდებელი შემთხვევითი ცვლადების თანაფარდობა

სადაც ξ განაწილებული სტანდარტული ნორმალური კანონის მიხედვით და χ 2 კგანაწილებას ექვემდებარება χ 2თავისუფლების ხარისხები.

ამრიგად, სტუდენტის კრიტერიუმის ფორმულა არითმეტიკული საშუალოსთვის

არის სტუდენტური ურთიერთობის განსაკუთრებული შემთხვევა

ფორმულიდან და განმარტებიდან გამომდინარეობს, რომ სტუდენტის t-ტესტის განაწილება დამოკიდებულია მხოლოდ თავისუფლების ხარისხების რაოდენობაზე.

ზე > 30 t-ტესტი პრაქტიკულად არ განსხვავდება სტანდარტული ნორმალური განაწილებისგან.

ჩი-კვადრატისგან განსხვავებით, t-ტესტი შეიძლება იყოს ერთი ან ორკუდიანი. ჩვეულებრივ გამოიყენება ორმხრივი, იმ ვარაუდით, რომ გადახრა შეიძლება მოხდეს საშუალოდან ორივე მიმართულებით. მაგრამ თუ პრობლემის მდგომარეობა საშუალებას იძლევა გადახრა მხოლოდ ერთი მიმართულებით, მაშინ გონივრული იქნება ცალმხრივი კრიტერიუმის გამოყენება. ეს ოდნავ ზრდის სიმძლავრეს, tk. ფიქსირებული მნიშვნელოვნების დონეზე, კრიტიკული მნიშვნელობა ოდნავ უახლოვდება ნულს.

Student's t-ტესტზე გამოყენების პირობები

მიუხედავად იმისა, რომ სტუდენტის აღმოჩენამ ერთ დროს რევოლუცია მოახდინა სტატისტიკაში, t-ტესტი ჯერ კიდევ საკმაოდ შეზღუდულია მისი გამოყენებადობით, რადგან თავად გამომდინარეობს თავდაპირველი მონაცემების ნორმალური განაწილების დაშვებიდან. თუ მონაცემები არ არის ნორმალური (რაც ჩვეულებრივ ხდება), მაშინ t-ტესტს აღარ ექნება Student-ის განაწილება. თუმცა, ცენტრალური ლიმიტის თეორემის მოქმედების გამო, საშუალო, თუნდაც არანორმალური მონაცემებისთვის, სწრაფად იძენს ზარისებურ განაწილებას.

განვიხილოთ, მაგალითად, მონაცემები, რომლებსაც აქვთ გამოხატული დახრილობა მარჯვნივ, როგორიცაა chi-კვადრატის განაწილება 5 გრადუსიანი თავისუფლებით.

ახლა შევქმნათ 20 ათასი ნიმუში და დავაკვირდეთ როგორ იცვლება საშუალებების განაწილება მათი ზომის მიხედვით.

განსხვავება საკმაოდ შესამჩნევია მცირე ნიმუშებში 15-20 დაკვირვებამდე. მაგრამ შემდეგ ის სწრაფად ქრება. ამრიგად, განაწილების არანორმალურობა, რა თქმა უნდა, არ არის კარგი, მაგრამ არა კრიტიკული.

ყველაზე მეტად, t-კრიტერიუმი "ეშინია" outliers, ე.ი. არანორმალური გადახრები. ავიღოთ 15 დაკვირვების 20 ათასი ნორმალური ნიმუში და ზოგიერთ მათგანს დავუმატოთ ერთი შემთხვევითი გამონაკლისი.

სურათი უკმაყოფილოა. საშუალოების რეალური სიხშირეები ძალიან განსხვავდება თეორიულიდან. t-დისტრიბუციის გამოყენება ასეთ სიტუაციაში ხდება ძალიან სარისკო წამოწყება.

ასე რომ, არც თუ ისე მცირე ნიმუშებში (15 დაკვირვებიდან), t-ტესტი შედარებით მდგრადია საწყისი მონაცემების არანორმალური განაწილების მიმართ. მაგრამ მონაცემების უკიდეგანო ნიშნები ძლიერ ამახინჯებს t-ტესტის განაწილებას, რამაც, თავის მხრივ, შეიძლება გამოიწვიოს სტატისტიკური დასკვნის შეცდომები, ამიტომ ანომალიური დაკვირვებები უნდა აღმოიფხვრას. ხშირად, ყველა მნიშვნელობა, რომელიც ცდება საშუალოდან ±2 სტანდარტული გადახრების მიღმა, ამოღებულია ნიმუშიდან.

მათემატიკური მოლოდინის ჰიპოთეზის ტესტირების მაგალითი Student-ის t-ტესტის გამოყენებით MS Excel-ში

Excel-ს აქვს რამდენიმე ფუნქცია, რომელიც დაკავშირებულია t-განაწილებასთან. განვიხილოთ ისინი.

STUDENT.DIST - "კლასიკური" მარცხენამხრივი სტუდენტური t-განაწილება. შეყვანა არის t-კრიტერიუმის მნიშვნელობა, თავისუფლების გრადუსების რაოდენობა და ვარიანტი (0 ან 1), რომელიც განსაზღვრავს რა უნდა გამოითვალოს: სიმკვრივე ან ფუნქციის მნიშვნელობა. გამოსავალზე ვიღებთ, შესაბამისად, სიმკვრივეს ან ალბათობას, რომ შემთხვევითი ცვლადი ნაკლები იქნება არგუმენტში მითითებულ t-კრიტერიუმზე.

STUDENT.DIST.2X - ორმხრივი განაწილება. არგუმენტად მოცემულია t კრიტერიუმის აბსოლუტური მნიშვნელობა (მოდული) და თავისუფლების გრადუსების რაოდენობა. გამოსავალზე ვიღებთ t-კრიტერიუმის ამ ან კიდევ უფრო მეტი მნიშვნელობის მიღების ალბათობას, ე.ი. ფაქტობრივი მნიშვნელოვნების დონე (p-დონე).

STUDENT.DIST.RH - მარჯვენა ხელის t-განაწილება. ასე რომ, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PX(2;5) = 0.05097. თუ t-ტესტი დადებითია, მაშინ ალბათობა არის p-დონე.

STUDENT.INV - გამოიყენება t-განაწილების მარცხენა რეციპროკულის გამოსათვლელად. არგუმენტი არის ალბათობა და თავისუფლების ხარისხების რაოდენობა. გამოსავალზე ვიღებთ t-კრიტერიუმის მნიშვნელობას, რომელიც შეესაბამება ამ ალბათობას. ალბათობა დათვლილია მარცხნივ. ამიტომ, მარცხენა კუდისთვის საჭიროა თავად მნიშვნელობის დონე α და მარჯვნივ 1 - α .

STUDENT.ORD.2X არის ორკუდიანი სტუდენტის განაწილების ორმხრივი, ე.ი. t-ტესტის მნიშვნელობა (მოდული). მნიშვნელოვნების დონე ასევე მოცემულია როგორც შეყვანა. α . მხოლოდ ამ დროს, ათვლა ორივე მხრიდან არის ერთდროულად, ასე რომ, ალბათობა ნაწილდება ორ კუდზე. ასე რომ, STUDENT.OBR (1-0.025; 5) \u003d STUDENT. OBR. 2X (0.05; 5) \u003d 2.57058

STUDENT.TEST არის ფუნქცია მათემატიკური მოლოდინების თანასწორობის შესახებ ჰიპოთეზის შესამოწმებლად ორ ნიმუშში. ცვლის გამოთვლების თაიგულს, რადგან. საკმარისია მხოლოდ ორი დიაპაზონის მითითება მონაცემებით და კიდევ რამდენიმე პარამეტრით. გამომავალი არის p-დონე.

STUDENT CONFIDENCE - საშუალოს ნდობის ინტერვალის გამოთვლა t-განაწილების გათვალისწინებით.

განვიხილოთ ასეთი ტრენინგის მაგალითი. კომპანია ცემენტს 50 კგ-იან პაკეტებში აწყობს. შემთხვევითობის გამო, ერთ ტომარაში დასაშვებია გარკვეული გადახრა მოსალოდნელი მასისგან, მაგრამ საერთო საშუალო უნდა დარჩეს 50 კგ. ხარისხის კონტროლის განყოფილებამ შემთხვევით აწონა 9 ტომარა და მიიღო შემდეგი შედეგები: საშუალო წონა ( ) შეადგინა 50,3 კგ, სტანდარტული გადახრა ( ) - 0,5 კგ.

შეესაბამება თუ არა შედეგი ნულოვან ჰიპოთეზას, რომ საერთო საშუალო არის 50 კგ? ანუ შესაძლებელია თუ არა სრულიად შემთხვევით ასეთი შედეგის მიღება, თუ აპარატურა მუშაობს გამართულად და აწარმოებს საშუალოდ 50 კგ ავსებას? თუ ჰიპოთეზა არ არის უარყოფილი, მაშინ მიღებული განსხვავება ჯდება შემთხვევითი რყევების დიაპაზონში, მაგრამ თუ ჰიპოთეზა უარყოფილია, მაშინ, სავარაუდოდ, მოხდა მარცხი იმ აპარატის პარამეტრებში, რომელიც ავსებს ჩანთებს. საჭიროა მისი შემოწმება და დარეგულირება.

ზოგადად მიღებული ნოტაციის მოკლე პირობა ასე გამოიყურება.

H0: μ = 50 კგ

H1: μ ≠ 50 კგ

არსებობს საფუძველი ვივარაუდოთ, რომ ჩანთების დაკავების განაწილება მიჰყვება ნორმალურ განაწილებას (ან დიდად არ განსხვავდება მისგან). ასე რომ, მათემატიკური მოლოდინის ჰიპოთეზის შესამოწმებლად, შეგიძლიათ გამოიყენოთ Student-ის t-ტესტი. შემთხვევითი გადახრები შეიძლება მოხდეს ორივე მიმართულებით, ამიტომ საჭიროა ორმხრივი t-ტესტი.

პირველ რიგში, ჩვენ ვიყენებთ ანტიდალუვიურ საშუალებებს: ხელით გამოვთვალოთ t-ტესტი და შევადაროთ ცხრილის კრიტიკულ მნიშვნელობას. სავარაუდო t-ტესტი:

ახლა განვსაზღვროთ, სცილდება თუ არა მიღებული რიცხვი კრიტიკულ დონეს მნიშვნელოვნების დონეზე α = 0.05. გამოვიყენოთ სტუდენტის t-განაწილების ცხრილი (ხელმისაწვდომია სტატისტიკის ნებისმიერ სახელმძღვანელოში).

სვეტები აჩვენებს განაწილების მარჯვენა მხარის ალბათობას, სტრიქონები აჩვენებს თავისუფლების ხარისხების რაოდენობას. ჩვენ გვაინტერესებს ორმხრივი t-ტესტი მნიშვნელოვნების დონით 0,05, რომელიც უდრის t-მნიშვნელობის ნახევრისთვის მარჯვნივ: 1 - 0,05 / 2 = 0,975. თავისუფლების გრადუსების რაოდენობა არის ნიმუშის ზომა მინუს 1, ე.ი. 9 - 1 = 8. გადაკვეთაზე ვპოულობთ t-ტესტის ტაბულურ მნიშვნელობას - 2.306. თუ გამოვიყენებდით სტანდარტულ ნორმალურ განაწილებას, მაშინ კრიტიკული წერტილი იქნებოდა 1.96, მაგრამ აქ უფრო მეტია, რადგან t-განაწილებას მცირე ნიმუშებზე აქვს უფრო გაბრტყელებული ფორმა.

ჩვენ ვადარებთ რეალურ (1.8) და ცხრილის მნიშვნელობას (2.306). გამოთვლილი კრიტერიუმი ცხრილზე ნაკლები აღმოჩნდა. მაშასადამე, არსებული მონაცემები არ ეწინააღმდეგება H 0 ჰიპოთეზას, რომ საერთო საშუალო არის 50 კგ (მაგრამ არც ადასტურებს ამას). ეს არის ყველაფერი, რაც შეგვიძლია გავარკვიოთ ცხრილების გამოყენებით. თქვენ, რა თქმა უნდა, შეგიძლიათ კვლავ სცადოთ p- დონის პოვნა, მაგრამ ეს იქნება მიახლოებითი. და, როგორც წესი, p- დონე გამოიყენება ჰიპოთეზების შესამოწმებლად. მოდით გადავიდეთ Excel-ზე.

არ არსებობს მზა ფუნქცია Excel-ში t-ტესტის გამოსათვლელად. მაგრამ ეს არ არის საშინელი, რადგან Student's t-test ფორმულა საკმაოდ მარტივია და ადვილად აშენდება პირდაპირ Excel-ის უჯრედში.

იგივე 1.8 მივიღე. ჯერ ვიპოვოთ კრიტიკული მნიშვნელობა. ვიღებთ ალფა 0.05-ს, კრიტერიუმი ორმხრივია. ჩვენ გვჭირდება t-განაწილების შებრუნებული მნიშვნელობის ფუნქცია STUDENT.OBR.2X ორკუდიანი ჰიპოთეზასთვის.

მიღებული მნიშვნელობა წყვეტს კრიტიკულ რეგიონს. დაკვირვებული t-ტესტი მასში არ ჯდება, ამიტომ ჰიპოთეზა არ არის უარყოფილი.

თუმცა, ეს იგივე გზაა ჰიპოთეზის შესამოწმებლად ცხრილის მნიშვნელობით. უფრო ინფორმაციული იქნება p- დონის გამოთვლა, ე.ი. დაკვირვებული ან კიდევ უფრო დიდი გადახრის მიღების ალბათობა 50 კგ საშუალოდან, თუ ეს ჰიპოთეზა სწორია. დაგჭირდებათ სტუდენტის განაწილების ფუნქცია STUDENT.DIST.2X ორმხრივი ჰიპოთეზასთვის.

P-დონე უდრის 0,1096-ს, რაც მეტია დასაშვებ მნიშვნელოვნების დონეზე 0,05 - ჰიპოთეზას არ უარვყოფთ. მაგრამ ახლა ჩვენ შეგვიძლია ვიმსჯელოთ მტკიცებულების ხარისხზე. P- დონე აღმოჩნდა საკმაოდ ახლოს იმ დონესთან, როდესაც ჰიპოთეზა უარყოფილია და ეს იწვევს სხვადასხვა აზრებს. მაგალითად, რომ ნიმუში ძალიან მცირე იყო მნიშვნელოვანი გადახრის აღმოსაჩენად.

დავუშვათ, გარკვეული პერიოდის შემდეგ კონტროლის განყოფილებამ კვლავ გადაწყვიტა შეემოწმებინა, როგორ შენარჩუნდა ჩანთების შევსების სტანდარტი. ამჯერად მეტი საიმედოობისთვის შეირჩა არა 9, არამედ 25 ჩანთა. ინტუიციურად ნათელია, რომ საშუალოს გავრცელება შემცირდება და, შესაბამისად, სისტემაში წარუმატებლობის აღმოჩენის შანსი უფრო დიდი ხდება.

ვთქვათ, რომ ნიმუშის საშუალო და სტანდარტული გადახრის იგივე მნიშვნელობები იქნა მიღებული, როგორც პირველად (50.3 და 0.5, შესაბამისად). გამოვთვალოთ t-ტესტი.


კრიტიკული მნიშვნელობა თავისუფლების 24 გრადუსისთვის და α = 0.05 არის 2.064. ქვემოთ მოყვანილი სურათი აჩვენებს, რომ t-ტესტი ვარდება ჰიპოთეზის უარყოფის არეალში.

შეიძლება დავასკვნათ, რომ 95%-ზე მეტი ნდობის ალბათობით საერთო საშუალო 50 კგ-დან განსხვავდება. უფრო დამაჯერებლად, მოდით გადავხედოთ p- დონეს (ცხრილის ბოლო ხაზი). 50-დან ამ ან კიდევ უფრო დიდი გადახრით საშუალოს მიღების ალბათობა, თუ ჰიპოთეზა სწორია, არის 0,0062, ანუ 0,62%, რაც პრაქტიკულად შეუძლებელია ერთი გაზომვით. ზოგადად, ჩვენ უარვყოფთ ჰიპოთეზას, როგორც ნაკლებად სავარაუდოა.

ნდობის ინტერვალის გამოთვლა სტუდენტის t-განაწილების გამოყენებით

ჰიპოთეზის ტესტირებასთან მჭიდროდ დაკავშირებული კიდევ ერთი სტატისტიკური მეთოდია ნდობის ინტერვალების გაანგარიშება. თუ ნულოვანი ჰიპოთეზის შესაბამისი მნიშვნელობა ხვდება მიღებულ ინტერვალში, მაშინ ეს უდრის იმ ფაქტს, რომ ნულოვანი ჰიპოთეზა არ არის უარყოფილი. წინააღმდეგ შემთხვევაში, ჰიპოთეზა უარყოფილია შესაბამისი ნდობის დონით. ზოგიერთ შემთხვევაში, ანალიტიკოსები საერთოდ არ ამოწმებენ ჰიპოთეზებს კლასიკური ფორმით, არამედ მხოლოდ ითვლის ნდობის ინტერვალებს. ეს მიდგომა საშუალებას გაძლევთ მიიღოთ კიდევ უფრო სასარგებლო ინფორმაცია.

გამოვთვალოთ ნდობის ინტერვალები საშუალოსთვის 9 და 25 დაკვირვებაზე. ამისთვის გამოვიყენებთ Excel ფუნქციას TRUST.STUDENT. აქ, უცნაურად საკმარისია, ყველაფერი საკმაოდ მარტივია. ფუნქციის არგუმენტებში თქვენ უნდა მიუთითოთ მხოლოდ მნიშვნელობის დონე α , ნიმუშის სტანდარტული გადახრა და ნიმუშის ზომა. გამოსავალზე ვიღებთ ნდობის ინტერვალის ნახევრად სიგანეს, ანუ მნიშვნელობას, რომელიც უნდა გამოვყოთ საშუალოს ორივე მხარეს. გამოთვლების გაკეთების და ვიზუალური დიაგრამის შედგენის შემდეგ ვიღებთ შემდეგს.

როგორც ჩანს, 9 დაკვირვების ნიმუშით 50-ის მნიშვნელობა ხვდება ნდობის ინტერვალში (ჰიპოთეზა არ არის უარყოფილი), ხოლო 25 დაკვირვებით ის არ ვარდება (ჰიპოთეზა უარყოფილია). ამავდროულად, 25 ტომრით ექსპერიმენტში შეიძლება ითქვას, რომ 97,5%-იანი ალბათობით, საერთო საშუალო 50,1 კგ-ს აჭარბებს (დარწმუნების ინტერვალის ქვედა ზღვარი არის 50,094 კგ). და ეს საკმაოდ ღირებული ინფორმაციაა.

ამრიგად, ჩვენ გადავწყვიტეთ იგივე პრობლემა სამი გზით:

1. უძველესი მიდგომა, t-კრიტერიუმის გამოთვლილი და ტაბულური მნიშვნელობის შედარება
2. უფრო თანამედროვე, p- დონის გამოთვლით, ჰიპოთეზის უარყოფაში დამაჯერებლობის ხარისხის დამატების გზით.
3. კიდევ უფრო ინფორმაციული ნდობის ინტერვალის გამოთვლით და ზოგადი საშუალო მინიმალური მნიშვნელობის მიღებით.

მნიშვნელოვანია გვახსოვდეს, რომ t-ტესტი ეხება პარამეტრულ მეთოდებს, რადგან ნორმალური განაწილების საფუძველზე (მას აქვს ორი პარამეტრი: საშუალო და დისპერსიული). აქედან გამომდინარე, მისი წარმატებული გამოყენებისთვის მნიშვნელოვანია საწყისი მონაცემების მიახლოებითი ნორმალურობა და გამოკვეთის არარსებობა.

და ბოლოს, მე ვთავაზობ ვიდეოს ყურებას, თუ როგორ უნდა განახორციელოთ გამოთვლები სტუდენტის t-ტესტთან Excel-ში.

ამბავი

ეს კრიტერიუმი შეიმუშავა უილიამ გოსეტმა გინესში ლუდის ხარისხის შესაფასებლად. კომპანიის წინაშე სავაჭრო საიდუმლოების არ გამჟღავნების ვალდებულებებთან დაკავშირებით (გინესის ხელმძღვანელობამ განიხილა სტატისტიკური აპარატის ასეთი გამოყენება სამუშაოებში), გოსეტის სტატია გამოქვეყნდა 1908 წელს ჟურნალში Biometrics ფსევდონიმით "სტუდენტი" (სტუდენტი) .

მონაცემთა მოთხოვნები

ამ კრიტერიუმის გამოსაყენებლად აუცილებელია ორიგინალურ მონაცემებს ნორმალური განაწილება ჰქონდეს. დამოუკიდებელ ნიმუშებზე ორსაარჩევნო ტესტის გამოყენების შემთხვევაში ასევე აუცილებელია დისპერსიების თანასწორობის პირობის დაცვა. თუმცა, არსებობს სტუდენტური t-ტესტის ალტერნატივები არათანაბარი დისპერსიების მქონე სიტუაციებისთვის.

ორი ნიმუშის t-ტესტი დამოუკიდებელი ნიმუშებისთვის

ოდნავ განსხვავებული ნიმუშის ზომის შემთხვევაში გამოიყენება გამარტივებული მიახლოების ფორმულა:

იმ შემთხვევაში, თუ ნიმუშის ზომა მნიშვნელოვნად განსხვავდება, უფრო რთული და ზუსტი ფორმულა გამოიყენება:

სად 1 , 2 - არითმეტიკული საშუალებები, σ 1 ,σ 2 - სტანდარტული გადახრები და 1 , 2 - ნიმუშის ზომები.

ორი ნიმუშის t-ტესტი დამოკიდებული ნიმუშებისთვის

t-ტესტის ემპირიული მნიშვნელობის გამოსათვლელად ორ დამოკიდებულ ნიმუშს შორის განსხვავებების შესახებ ჰიპოთეზის ტესტირების სიტუაციაში (მაგალითად, ერთი და იმავე ტესტის ორი ნიმუში დროის ინტერვალით), გამოიყენება შემდეგი ფორმულა:

სადაც არის მნიშვნელობების საშუალო სხვაობა და σ არის განსხვავებების სტანდარტული გადახრა.

თავისუფლების გრადუსების რაოდენობა გამოითვლება როგორც

ერთი ნიმუშის t-ტესტი

იგი გამოიყენება ჰიპოთეზის შესამოწმებლად საშუალო მნიშვნელობასა და ზოგიერთ ცნობილ მნიშვნელობას შორის სხვაობის შესახებ:

თავისუფლების გრადუსების რაოდენობა გამოითვლება როგორც

არაპარამეტრული ანალოგები

დამოუკიდებელი ნიმუშებისთვის ორი ნიმუშის ტესტის ანალოგი არის Mann-Whitney U-ტესტი. დამოკიდებული ნიმუშების სიტუაციისთვის, ანალოგები არის ნიშნის ტესტი და Wilcoxon T-ტესტი

Student's t-ტესტის ავტომატური გამოთვლა


ფონდი ვიკიმედია. 2010 წ.

ნახეთ, რა არის „სტუდენტის T-ტესტი“ სხვა ლექსიკონებში:

    მოსწავლის კრიტერიუმი თ-კ- სტუდენტის კრიტერიუმი, ტ კ * სტუდენტის კრიტერიუმი, ტ კ. * სტუდენტის კრიტერიუმი ან ტ ც. ან S.t ტესტი სტატისტიკური ტესტი შედარებულ საშუალებებს შორის სხვაობის მნიშვნელოვნებისთვის. იგი განისაზღვრება ამ სხვაობის თანაფარდობით სხვაობის შეცდომით: t…… გენეტიკა. ენციკლოპედიური ლექსიკონი

    Student's T ტესტი არის ზოგადი სახელწოდება მეთოდის კლასისთვის ჰიპოთეზების სტატისტიკური ტესტირების (სტატისტიკური ტესტები) დაფუძნებული Student-ის განაწილებასთან შედარებაზე. t კრიტერიუმის გამოყენების ყველაზე გავრცელებული შემთხვევები დაკავშირებულია თანასწორობის ტესტირებასთან ... ... ვიკიპედიაში

    სტუდენტის კრიტერიუმი- Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. ატიტიკმენის: ინგლ. სტუდენტური ტესტი rus. სტუდენტის კრიტერიუმი... Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    სტუდენტის კრიტერიუმი- სტატისტიკური ტესტი, რომელშიც ნულოვანი ჰიპოთეზის დაშვებით, გამოყენებული სტატისტიკა შეესაბამება t განაწილებას (სტუდენტის t-განაწილება). Შენიშვნა. აქ მოცემულია ამ კრიტერიუმის გამოყენების მაგალითები: 1. საშუალოს ტოლობის შემოწმება ... ... სოციოლოგიური სტატისტიკის ლექსიკონი

    სტუდენტური კრიტერიუმი- ცხოველთა ორი შედარებული ჯგუფის (M1 და M2) საშუალო მნიშვნელობებს შორის სხვაობის (td) მნიშვნელობის ბიომეტრიული მაჩვენებელი ნებისმიერი მახასიათებლისთვის. სხვაობის სანდოობა განისაზღვრება ფორმულით: td-ის მიღებული მნიშვნელობა შედარებულია ... ... ტერმინები და განმარტებები, რომლებიც გამოიყენება მეურნეობის ცხოველების მოშენების, გენეტიკასა და რეპროდუქციაში

    სტუდენტური კრიტერიუმი- აფასებს ორი საშუალო მნიშვნელობის სიახლოვეს შემთხვევითობის მინიჭების ან არ მიკუთვნების თვალსაზრისით (მნიშვნელობის მოცემულ დონეზე), პასუხობს კითხვაზე, განსხვავდება თუ არა საშუალო მნიშვნელობები სტატისტიკურად მნიშვნელოვნად ერთმანეთისგან)