სტატისტიკის პარამეტრული და არაპარამეტრული მეთოდები. სტატისტიკური მონაცემების ანალიზის პარამეტრული და არაპარამეტრული პროცედურები

ზემოთ განხილული სტატისტიკური ჰიპოთეზების შეფასების ზოგადი სტრატეგია, პირველ რიგში, განსაზღვრავს მათემატიკური სტატისტიკის ე.წ. პარამეტრული მეთოდების გამოყენებას.

პარამეტრული მეთოდებიეფუძნება ზოგიერთ, როგორც წესი, საკმაოდ სავარაუდო დაშვებას შემთხვევითი ცვლადის განაწილების ბუნების შესახებ. ჩვეულებრივ, ექსპერიმენტული მონაცემების ანალიზისას გამოყენებული პარამეტრული მეთოდები ეფუძნება დაშვებას, რომ ამ მონაცემების განაწილება ნორმალურია. ამ დაშვების შედეგია შესწავლილი განაწილების პარამეტრების შეფასების საჭიროება. ამრიგად, შემდეგი შემთხვევის შემთხვევაში -მოსწავლის ტესტი ასეთი სავარაუდო პარამეტრებია მათემატიკური მოლოდინი და დისპერსიული. ზოგიერთ შემთხვევაში, კეთდება დამატებითი ვარაუდები იმის შესახებ, თუ როგორ უკავშირდება ერთმანეთს სხვადასხვა ნიმუშებში შემთხვევითი ცვლადის განაწილების დამახასიათებელი პარამეტრები. ამრიგად, სტუდენტის ტესტში, რომელიც ხშირად გამოიყენება მონაცემთა ორი სერიის საშუალო მნიშვნელობების (მოლოდინის) შესადარებლად მათი ჰომოგენურობის ან ჰეტეროგენურობისთვის, კეთდება დამატებითი ვარაუდი შემთხვევითი ცვლადების განაწილების დისპერსიების ჰომოგენურობის შესახებ. ორი ზოგადი პოპულაცია, საიდანაც ეს მონაცემები იქნა ამოღებული.

პარამეტრული მონაცემთა ანალიზის მეთოდების უპირატესობა არის ის ფაქტი, რომ მათ აქვთ საკმაოდ მაღალი სიმძლავრე. ქვეშ ტესტი ძალა გაითვალისწინეთ მისი უნარი, თავიდან აიცილოს მეორე სახის, ან β- შეცდომები. რაც უფრო მცირეა β- შეცდომა, მით უფრო მაღალია ტესტის სიმძლავრე. სხვა სიტყვებით რომ ვთქვათ, ტესტის სიმძლავრე = 1 - β.

პარამეტრული ტესტების ან კრიტერიუმების მაღალი სიმძლავრე განპირობებულია იმით, რომ ეს მეთოდები მოითხოვს, რომ ხელმისაწვდომი მონაცემები იყოს აღწერილი მეტრიკული მასშტაბი. მოგეხსენებათ, მეტრულ სკალებში შედის ინტერვალის მასშტაბი და თანაფარდობის მასშტაბი, რომელსაც ზოგჯერ აბსოლუტურ მასშტაბსაც უწოდებენ. ინტერვალის მასშტაბი საშუალებას აძლევს მკვლევარს გაარკვიოს არა მხოლოდ ნიმუშის ელემენტების თანასწორობის ან უთანასწორობის მიმართებები (როგორც ეს საშუალებას იძლევა სახელის მასშტაბი ) და არა მხოლოდ წესრიგის ურთიერთობები (როგორც ეს იძლევა ამის საშუალებას შეკვეთის მასშტაბი ), არამედ შეაფასეთ ინტერვალების ეკვივალენტობა. აბსოლუტური მასშტაბი გარდა ამისა, ის საშუალებას გაძლევთ შეაფასოთ გაზომვის დროს მიღებულ კომპლექტის ელემენტებს შორის ურთიერთობების ეკვივალენტობა. ამიტომ მეტრულ სასწორებს მოიხსენიებენ, როგორც ძლიერ საზომ სასწორებს. ამ სიმძლავრის გამო, პარამეტრული მეთოდები საშუალებას იძლევა უფრო ზუსტად გამოხატოს განსხვავებები შემთხვევითი ცვლადის განაწილებაში იმ პირობით, რომ ტყვია ან ალტერნატიული ჰიპოთეზები ჭეშმარიტია.

აქვე უნდა აღინიშნოს, რომ ზოგადად, სტატისტიკის პარამეტრული მეთოდები უფრო განვითარებულია მათემატიკური სტატისტიკის თეორიაში და ამიტომ გამოიყენება ბევრად უფრო ფართოდ. თითქმის ნებისმიერი ექსპერიმენტული შედეგი შეიძლება შეფასდეს რომელიმე ამ მეთოდის გამოყენებით. სწორედ ეს მეთოდებია ძირითადად გათვალისწინებული სტატისტიკური მონაცემების ანალიზის სახელმძღვანელოებსა და სახელმძღვანელოებში.

ამავდროულად, სტატისტიკაში პარამეტრული ანალიზის მეთოდების გამოყენებასთან დაკავშირებული სირთულეები არის ის, რომ ზოგიერთ შემთხვევაში აპრიორული ვარაუდები შესასწავლი შემთხვევითი ცვლადების განაწილების ბუნების შესახებ შესაძლოა არასწორი აღმოჩნდეს. და ეს შემთხვევები ძალიან დამახასიათებელია ფსიქოლოგიური კვლევისთვის გარკვეულ სიტუაციებში.

ასე რომ, თუ შევადარებთ ორ ნიმუშს გამოყენებით -სტუდენტური ტესტი, თქვენ შეგიძლიათ აღმოაჩინოთ, რომ ჩვენი მონაცემების განაწილება განსხვავდება ნორმალურიდან და დისპერსიები ორ ნიმუშში მნიშვნელოვნად განსხვავდება. ამ შემთხვევაში პარამეტრული Student-ის ტესტის გამოყენებამ შეიძლება გარკვეულწილად დაამახინჯოს ის დასკვნები, რომლის გაკეთებაც მკვლევარს სურს. ეს საფრთხე იზრდება, თუ გამოთვლილი სტატისტიკის მნიშვნელობები აღმოჩნდება, რომ ახლოსაა იმ კვანტილების საზღვრებთან, რომლებიც გამოიყენება ჰიპოთეზების მისაღებად ან უარყოფისთვის. უმეტეს შემთხვევაში, თუმცა, როგორც, მაგალითად, გამოყენების შემთხვევაში -ტესტი, თეორიულად მოცემული ვარაუდებიდან ზოგიერთი გადახრა არ არის კრიტიკული სანდო სტატისტიკური დასკვნისთვის. სხვა შემთხვევაში, ასეთმა გადახრებმა შეიძლება სერიოზული საფრთხე შეუქმნას ასეთ დასკვნას. შემდეგ მკვლევარებს შეუძლიათ შეიმუშაონ სპეციალური პროცედურები, რომლებსაც შეუძლიათ გადაწყვეტილების მიღების პროცედურის კორექტირება სტატისტიკური ჰიპოთეზების ჭეშმარიტების შესახებ. ამ პროცედურების მიზანია გვერდის ავლით ან შემსუბუქდეს გამოყენებული სტატისტიკის პარამეტრული მოდელების ზედმეტად მკაცრი მოთხოვნები.

მკვლევარის ასეთი ქმედებების ერთ-ერთი ვარიანტი, როდესაც ის აღმოაჩენს, რომ მიღებული მონაცემები განსხვავდება მისი პარამეტრებისგან, რაც მითითებულია გამოყენებული პარამეტრული ტესტის სტრუქტურულ მოდელში, შეიძლება იყოს ამ მონაცემების სასურველ ფორმაში გადაქცევის მცდელობა. მაგალითად, როგორც აღინიშნა თავში. 1, რეაქციის დროის გაზომვისას, შესაძლებელია მისი განაწილების ასიმეტრიის მაღალი მნიშვნელობის თავიდან აცილება, თუ ანალიზისთვის გამოყენებული იქნება მიღებული მნიშვნელობების ლოგარითმები და არა თავად რეაქციის დროის მნიშვნელობები.

კიდევ ერთი ვარიანტია უარი თქვას ნებისმიერი აპრიორი დაშვების გამოყენებაზე შემთხვევითი ცვლადის განაწილების ბუნების შესახებ ზოგად პოპულაციაში. და ეს ნიშნავს მათემატიკური სტატისტიკის პარამეტრული მეთოდების უარყოფას არაპარამეტრულის სასარგებლოდ.

არაპარამეტრულიმათემატიკური სტატისტიკის მეთოდებს უწოდებენ, რომლებშიც არ კეთდება აპრიორი ვარაუდები შესასწავლი მონაცემების განაწილების ბუნების შესახებ და არ კეთდება ვარაუდები გაანალიზებული სიდიდეების განაწილების პარამეტრების თანაფარდობაზე. ეს არის ამ მეთოდების მთავარი უპირატესობა.

არაპარამეტრული სტატისტიკის უპირატესობა სრულად ვლინდება, როდესაც ექსპერიმენტში მიღებული შედეგები უფრო სუსტი სახით არის წარმოდგენილი. არამეტრული მასშტაბი, წარმოადგენს რეიტინგის შედეგებს. ასეთ მასშტაბს ე.წ შეკვეთის მასშტაბი. რა თქმა უნდა, ზოგიერთ შემთხვევაში, მკვლევარს შეუძლია გადაიყვანოს ეს მონაცემები უფრო მძლავრ ინტერვალურ შკალად, მონაცემთა ნორმალიზების პროცედურების გამოყენებით, მაგრამ, როგორც წესი, ამ სიტუაციაში საუკეთესო ვარიანტია სტატისტიკური ანალიზისთვის სპეციალურად შექმნილი არაპარამეტრული ტესტების გამოყენება.

როგორც წესი, არაპარამეტრული სტატისტიკის ტესტები გულისხმობს რანგის ჯამების არსებული თანაფარდობების შეფასებას ორ ან მეტ ნიმუშში და ამის საფუძველზე ყალიბდება დასკვნა ამ ნიმუშების თანაფარდობის შესახებ. ასეთი ტესტების მაგალითებია ნიშნის ტესტი, ვილკოქსონის ხელმოწერილი რანგის ტესტი, ისევე, როგორც მანის U-ტესტი უიტნი, რომლებიც გამოიყენება პარამეტრულის ანალოგად -სტუდენტური ტესტი.

ამავდროულად, თუ გაზომვის შედეგები უფრო ძლიერი მასშტაბით არის წარმოდგენილი, არაპარამეტრული სტატისტიკის გამოყენება ნიშნავს მონაცემების ზოგიერთი ინფორმაციის უარყოფას. ამის შედეგია ამ მეთოდების თანდაყოლილი მეორე სახის შეცდომის გაზრდის საშიშროება.

ამრიგად, არაპარამეტრული სტატისტიკის მეთოდები უფრო კონსერვატიულია, ვიდრე პარამეტრული სტატისტიკის მეთოდები. მათი გამოყენება უფრო მეტად ემუქრება მეორე სახის შეცდომით, ე.ი. სიტუაცია, როდესაც მკვლევარი, მაგალითად, ვერ აღმოაჩენს განსხვავებას ორ ნიმუშს შორის, როდესაც ასეთი განსხვავებები რეალურად ხდება. სხვა სიტყვებით რომ ვთქვათ, ასეთი მეთოდები ნაკლებად ძლიერია ვიდრე პარამეტრული მეთოდები. ამიტომ, ჩვეულებრივ, უპირატესობა ენიჭება პარამეტრული სტატისტიკის გამოყენებას ექსპერიმენტული მონაცემების ანალიზში, გარდა მარტივი რანჟირებისა.

სისტემების მოდელების აგების საკითხების გადაჭრისას, სისტემას შემადგენელი ელემენტების პარამეტრების შესახებ საწყისი ინფორმაციის გენერირების ამოცანა განსაკუთრებით აქტუალურია. საწყისი ინფორმაციის სიზუსტე და სანდოობა განსაზღვრავს სისტემების გაანალიზებული მახასიათებლების შეფასების სიზუსტეს, ფუნქციონირების სტრატეგიების ოპტიმიზაციისა და მათი შენარჩუნების წესების გამოთვლების სიზუსტეს, მომავალში სისტემის ქცევის პროგნოზირებასთან დაკავშირებული პრობლემების გადაჭრას. და სხვა საკითხები. ელემენტების პარამეტრების შესახებ საწყისი ინფორმაციის ფორმირებისას, როგორც წესი, საფუძვლად იღება სისტემების შემოწმების დროს მიღებული ინფორმაცია და მისი მუშაობის გამოცდილების შესწავლა. სხვა სიტყვებით რომ ვთქვათ, საფუძვლად არის მიღებული ინფორმაცია სისტემის კომპონენტების ქცევის შესახებ მისი მუშაობის პროცესში.

ელემენტების, შეკრებების, კომპონენტების საწყისი ინდიკატორების ანალიზი, რომელიც ხორციელდება ექსპლუატაციის, ტესტირების, დიზაინის შემუშავების ეტაპებზე, ხორციელდება შემდეგი საკითხების გადასაჭრელად:

    კომპონენტების შესწავლილი მახასიათებლების რეალური მნიშვნელობების დადგენა მათი ფაქტობრივი მუშაობის პირობებში;

    ელემენტების შესწავლილ მახასიათებლებსა და მათ სამოქმედო პირობებს შორის კავშირის დადგენა, გარე ზემოქმედების შესწავლილ მაჩვენებლებზე ზემოქმედების ანალიზი;

    ახლად შექმნილი აღჭურვილობის ქცევის პროგნოზირება.

ამრიგად, ამ პრობლემების გადასაჭრელად, პირველ რიგში,

აუცილებელია კონტროლის ორგანიზება აღჭურვილობის ქცევაზე მისი ექსპლუატაციის რეალურ პირობებში. მომავალში ობიექტების ექსპლუატაციის დროს მიღებული ინფორმაცია გამოიყენება სისტემების მოდელების შესაქმნელად, რომლებისთვისაც ტარდება ანალიზი.

ექსპერიმენტული კვლევების ჩატარებისას მნიშვნელოვან როლს თამაშობს ობიექტებზე დაკვირვების შედეგად მიღებული ინფორმაცია, რომელთა ქცევაც ალბათური ხასიათისაა. ასეთი სისტემების შესწავლა ხორციელდება გამომავალი პარამეტრების განხორციელების შედეგების მიხედვით, რომლებიც შემთხვევითი ცვლადებია. ყველაზე ზოგადი მახასიათებელი, რომელიც აღწერს ერთგანზომილებიანი შემთხვევითი ცვლადის ქცევას, არის მისი განაწილების სიმკვრივე / (0- შემთხვევითი ცვლადის განაწილების სიმკვრივის ცოდნა, შეიძლება ცალსახად განისაზღვროს ისეთი მახასიათებლები, როგორიცაა რაიმე მოვლენის განხორციელების ალბათობა, ინტენსივობა მოვლენის დადგომა, საშუალო დრო მოვლენათა რეალიზაციას შორის და ა.შ. წარმოგიდგენთ ფორმულებს, რომლებიც შესაძლებელს ხდის შესაბამისი ინდიკატორების შეფასებას.

დროთა განმავლობაში მოვლენის დადგომის ალბათობა განისაზღვრება ფორმულით

Q(t) = F(t)=\f(t)dt.

პრაქტიკაში, განაწილების ფუნქციით განსაზღვრული რაოდენობა ხშირად გამოიყენება შემდეგნაირად:

მაგალითად, სანდოობის თეორიაში, ავარიის გარეშე მუშაობის ალბათობა განისაზღვრება ამ გზით.

მოვლენის რეალიზაციას შორის საშუალო დრო განისაზღვრება მიმართებიდან

T a =]tf(f)dt=]p(t)dt.

მოვლენის ინტენსივობა შეიძლება განისაზღვროს ფორმულით

"_/(f)_ClF) მე _ dP(უ) 1 P(t)dt P(t)dt Pit)"

ამრიგად, შემთხვევითი ცვლადის სიმკვრივის ან განაწილების ფუნქციის ცოდნა, ჩვენ შეგვიძლია გავაგრძელოთ რთული სისტემის მახასიათებლების განსაზღვრა. პრაქტიკაში, განაწილების ფუნქცია ხშირად უცნობია. ის უნდა აღდგეს შემთხვევითი ცვლადის განხორციელების სტატისტიკური მონაცემების მიხედვით. ვინაიდან დაკვირვების შედეგების სტატისტიკა ყოველთვის შეზღუდული ფორმით არის წარმოდგენილი, განაწილების ფუნქციის აღდგენა შესაძლებელია გარკვეული სანდოობით. ამიტომ, თუ განაწილების ფუნქცია შეფასებულია გარკვეული შეცდომით,

ურია

(X - ) 2 ^ 2a 2

" (x-t ) 2 ^ 2 2

მოდით გამოვთვალოთ ნაწილობრივი წარმოებულები:

(ტ, მ,) _ 1

(ტ, ტ, ) _ 2

r r \

2 შესახებ 2

\ /-ჯ

მაშინ სისტემის მახასიათებლების გამოთვლაც შეცდომით განხორციელდება.

რთული სისტემების ინდიკატორების შეფასების სიზუსტე ხასიათდება დისპერსიის სიდიდით. დაე, საჭირო გახდეს გარკვეული ინდიკატორის შეფასება R(t). მოდით ვაჩვენოთ, თუ როგორ განისაზღვრება განსხვავება მის შეფასებაში. ჩვენ ვივარაუდებთ, რომ მაჩვენებელი R(t ) განისაზღვრება განაწილების ფუნქციის მეშვეობით. მოდით, განაწილების ფუნქცია დამოკიდებული იყოს ჰაერის ორ პარამეტრზე. ორი პარამეტრიანი ფუნქციების მაგალითებია ნორმალური განაწილება, შეკვეცილი ნორმალური, ლოგი-ნორმალური, გამა განაწილება, ვეიბულის განაწილება და მრავალი სხვა. ასე რომ მოდით F(t) = F(t, ა, რ). შესაბამისად, რთული სისტემის სავარაუდო მაჩვენებელი შეიძლება წარმოდგენილი იყოს როგორც ფუნქციური F(t) = F(t, a, r):

K(r) = K = K(f,a,p).

მოდით დავშალოთ შეფასება ( უ) შევიდა ტეილორის სერიაში a, p წერტილში და ჩვენ შემოვიფარგლებით სამი ტერმინით:

i(0 = K(0+^®(a-a)+^®(p-p).

ამ გამონათქვამის ორივე ნაწილზე ვიყენებთ დისპერსიის გამოთვლის ოპერაციას

(t-) 2

-ტ ექსპ

Ნორმალური დისტრიბუცია

ნორმალური განაწილების კანონის სიმკვრივეს აქვს ფორმა

(ტ, მ, დაახლოებით)= 1 -7=- J ექსპ

(ტ, შემდეგ)= -y=- J ექსპ

(ტ-მ)

2o 2

მოვლენის რეალიზაციას შორის საშუალო დრო განისაზღვრება ფორმის მიხედვით

(ტ- მ) 2 2 2

სადაც cov(a, P) არის კოვარიანტობა ჰაერის პარამეტრებს შორის. ამრიგად, გარკვეული ინდიკატორის დისპერსიის შესაფასებლად აუცილებელია ამ ინდიკატორის ნაწილობრივი წარმოებულების დადგენა განაწილების კანონის პარამეტრებთან და განსხვავება განაწილების კანონის პარამეტრების შეფასებისას.

განიხილება ნაწილობრივი წარმოებულების განსაზღვრის საკითხები ზემოაღნიშნული ინდიკატორებისთვის კონკრეტული განაწილების კანონებისთვის, ქვემოთ აღწერილი იქნება განაწილების კანონების პარამეტრების შეფასებების დისპერსიის განსაზღვრა.

მაგალითად, განვიხილოთ სავარაუდო ინდიკატორის ნაწილობრივი წარმოებულების განმარტება ნორმალური კანონის განაწილების კანონის პარამეტრებთან მიმართებაში.

Ґ ( t-m) 2 ^

2 2 წლიდან

შესაბამისად, ნაწილობრივი წარმოებულები განისაზღვრება როგორც

(მ,) 1 7

-- - = - ვ=~ ექსპ

V2nab

(, ) მე

მე=

2 ~\

2 0

\ /

და ბოლოს, ღონისძიების ინტენსივობისთვის გვაქვს

X(t, t, o) = -

ცალკუდიანი დამსხვრეული ნორმალური განაწილება

შეკვეცილი ნორმალური კანონის განაწილების სიმკვრივე ცალმხრივი შეკვეცით მარცხნივ 0 წერტილში აქვს ფორმა

/ (ტ-მ ) 2 ^ 2 2

\ І2on

(X - t) 2 2a 2

\І2po(

ნაწილობრივი წარმოებულების გამონათქვამებს აქვთ ფორმა

dX (ტ, მ, ა ) _ (ტ, მ, ა )" (ლ -ფ (ტ, მ,ო))-ფ (ტ, მ, ო )[ ლ-ფ (ტ, მ, ო )]"

2

თან = -

(*-იუ 2 2 კომერსანტი

შესახებyj2nb

, ., თ-მ ᲛᲔ ( თ-მ ) 2

(fW O ra =Ir=-T ex PV

Ґ , h2 4 ვ

( t-m) 2

( 2 მ

2 2

\

2 წმ 7

\ /ჯ

"a2

და 2

2

[( თ-მ ) 2 - 2 ] 2ლ/2ლ 3

(თ-მ)

x

(SCH,ბ) = \-{

(ტ -მ) 2ა 2

2O 2

\ =

(t-m)ექსპ

ექსპ

2 2 on 3

შემოვიღოთ აღნიშვნა:

R= J ექსპ

ამრიგად, წარმოდგენილია ფორმულები ნორმალური კანონის განაწილების კანონის პარამეტრების შესაბამისი წარმოებული ინდიკატორების დასადგენად. ნორმალური განაწილების განზოგადება არის შეკვეცილი ნორმალური განაწილება. განვიხილოთ ცალმხრივი შეკვეცილი ნორმალური განაწილების გამოყენება რთული სისტემების ინდიკატორების შეფასების პრობლემებში. სისტემური ანალიზის რიგ პრობლემებში შემთხვევითი პარამეტრები დადებითად არის განსაზღვრული. ამის მაგალითია სანდოობის თეორიის პრობლემები, რომლებშიც შემთხვევით პარამეტრებს აქვთ განმარტების დომენი 0-დან, მაგალითად, მუშაობის დრო წარუმატებლობამდე არის დადებითი განსაზღვრული მნიშვნელობა. ამ შემთხვევაში, არალეგალურია ნორმალური განაწილების კანონის გამოყენება ამ შემთხვევითი ცვლადების აღსაწერად. ასეთ სიტუაციებში გამოიყენება მარცხნივ შეკვეცილი ნორმალური განაწილება. განვიხილოთ ეს შემთხვევა სანდოობის მაჩვენებლების შეფასებასთან დაკავშირებით.

(x-c) 2 2

( X - U-U

dx; = ექსპ

შესაბამის წარმოებულებს აქვთ ფორმა

Ґ 2\ .ჰლ

2 კომერსანტი

რ,"

(Q-Rf

სადაც შესაბამისი კომპონენტები განისაზღვრება ფორმულებით

მოვლენის რეალიზაციას შორის საშუალო დრო განისაზღვრება ფორმულით

2 2

/ . .і \ (*-იუ

/ სთ' ^

ლ/ც ლ/ც fG G-M-

(QW =^ ექსპ

I^lbᲛᲔ-ბ ჯბ

მოდი აღვნიშნოთ მრიცხველი მეშვეობით ლ.

შესაბამისი წარმოებულები გამოითვლება ფორმულებით

log-ნორმალური განაწილება

ლოგარითმულად ნორმალური განაწილება ემორჩილება შემთხვევით ცვლადს ტ, რომლის ლოგარითმი განაწილებულია ნორმალური კანონის მიხედვით. ლოგ-ნორმალური კანონის განაწილების სიმკვრივეს აქვს ფორმა

KMY) _ i;q-% Jf_urz _______

"-!ლი )

/ 2 N .th! 2fc

მოტყუებაKQ ულ.

-^ , ა, -ყოფილი პ

განაწილების ფუნქციას აქვს ფორმა

2 2

და ბოლოს, მოვლენების წარმოშობის ინტენსივობა ტოლია

(*-10 2 AT

2

სადაცAT= კომერსანტი 1 .

დავწეროთ ფორმულები სანდოობის მაჩვენებლების დასადგენად

(X -მ-) 2 2 კომერსანტი

(x -\მე .? 2 კომერსანტი

dx-ჯექსპშესახებ

I „(*, I, D) \u003d I - Jexp

ჩვენ წარმოგიდგენთ აღნიშვნას

შესაბამის წარმოებულებს აქვთ ფორმა

(*-იუ

= ექსპ

2 \

( (მე-ჰ) 2 AT

ლნ(; , ნ.დ) _ 1 ენ - nB

P „Jt,\i,B) 1გვ-ნ

განვსაზღვროთ ინტენსივობის წარმოებულები პარამეტრების მიმართ

დკyM(t,№) _ M^jQ-R)- (-RY 11 EC(Q-R) 2 :

უჰin


( (ბატონი)2

წარუმატებლობის საშუალო დროის დასადგენად გამოიყენეთ ფორმულა

(Ქალბატონი. 2

11 =-m^exp

; (ბ-ლ)"= ექსპ

და ბოლო გამოთქმა

წარმოებულები ტოლია

dtლაC, , AT) 1 (in ,

მოდით დავწეროთ გამონათქვამი უშედეგო ოპერაციის ალბათობისთვის

წარუმატებლობის სიჩქარის განსაზღვრის გამოხატულებას აქვს ფორმა \ჯტ,\მე, ბ) = -

P B (t, a, b) = exp\

მოდით გამოვთვალოთ ამ გამოხატვის წარმოებულები განაწილების პარამეტრებთან მიმართებაში:

<У2дВ I 2 AT

P^(t,a,b) _ b დიახ ა

(ტ,, ) _

ნაწილობრივი წარმოებულები განისაზღვრება გამონათქვამებიდან

CL^V) _

^ 2

tjbw in ექს|

(lnf- |X) 2 2 AT

სად (/ln(0)

7 B(a ^) = J ex P

(ინფ-(X) 2 2 AT

T B (a, b)_~ r b(t

* (ტ"In

\ დ, E7v(a ^ e

dK»ShV) (0 ) " (მე - (0 )- / ლ. (მე- უ))"

EV 2

*

წარუმატებლობის მაჩვენებელი არის

(^ -" , ა

წარმოებულებს პარამეტრებთან მიმართებაში აქვთ ფორმა

ის,ა,)

(1 - „„) = - I n Vii exp

_ (ᲛᲔ- (X) 2 AT

^ა,) 2

Xinია, ბ)_Ґ"

დიახ~ა 2

,

ვეიბულის განაწილება

ვეიბულის განაწილების სიმკვრივეს აქვს ფორმა

f B (t,a,b) = -(-

გამა განაწილება

გამა განაწილების სიმკვრივე იწერება შემდეგნაირად

F B (t, a, b) = 1-ექსპ

შესაბამისად, განაწილების ფუნქციას აქვს ფორმა

x, ა *

(ტ,X,a) = ვX~ " exn(-Xx) dx.

უშეცდომოდ მუშაობის ალბათობა გამოითვლება ფორმულით

( , X , ა) = მე fexp(-Xx)dx.

წარმოებულები პარამეტრების მიმართ არის

і і OcX a4 Jx a4 exp (-Xx) Jx-X a J x ექსპ ( -Xx)dx

X(g,a,X) _ (ვ ( 'Xa)) - / (, X,); ეა 2

J exp(-Xx)(a - Xx)dx \

[!-,F r (ZAa)];=-

DR (ტ, X , ა) _ X 1

პა) ი

DR ^ დიახ ა) = ~ გ^ა) მე * ~" ex P(-^t r (a)(ta ^ - 111 0 - Г"(а)]Жс, სადაც Г(а) = J X ~ " ექსპ (- Xt)dt \u003d J Z a " 1 exp (-r)<&; Г(а) = J г“"’ exp(-z) In 4

წარუმატებლობის საშუალო დრო განისაზღვრება ფორმულით

G r (o, X) \u003d J ^ - xp(-Xt)dმე =~.

oG(a) X

შესაბამისი წარმოებულებია

dt (ოჰ ) dG ( , X) _ 1 ეჰ.X 2 დიახ~X"

წარუმატებლობის მაჩვენებელი დაფიქსირებულია

X -" xp (- xt )

X(ტ,, X) =

(ვ (ტ , X , ა )) = ^-y-^-[(X a InXf a "exp (- Xt)+X 1 Infexp(-Xt))-

X 1 V a " 1 exp(-Xf)r„ (a)];

G a ((X)X a Jjr a "1 exp (-Xx) Jx-

ტ ტX Xj X a '1 ექსპ (-Xx)dx +X a Jx a 1 Injfexp (-Xx)dx

ამრიგად, მიიღება გამონათქვამები, რომლებიც საშუალებას იძლევა გადაჭრას სიზუსტის შეფასების პრობლემები რთული სისტემების ინდიკატორების განსაზღვრაში. განხილულია განაწილების კანონები, რომლებიც ყველაზე ხშირად გამოიყენება სისტემის ანალიზში. მიიღება სისტემების ძირითადი მაჩვენებლების განსაზღვრის ფორმულები და გამოითვლება ინდიკატორების პირველი ნაწილობრივი წარმოებულები შესაბამისი განაწილების კანონების პარამეტრების მიხედვით. შემდეგი საკითხი, რომელიც გადასაწყვეტია, არის არჩეული განაწილების კანონის პარამეტრების შეფასების საკითხი. ვნახოთ, როგორ მოგვარდება ეს პრობლემა.

წარმოებულები პარამეტრებთან მიმართებაში განისაზღვრება როგორც

X ( ტ, ა , x) _ (ვ(ტX ა) ) \ -/ (, X, ა) 2

სადაც ^ " 1 "pW-X-r-exp(-Xr)

სტატისტიკური სასწორები

კვლევის მონაცემების სტატისტიკური დამუშავება

სტატისტიკური მონაცემები გამოიყენება ფსიქოლოგიური კვლევის მასალების დამუშავებისას ექსპერიმენტში მიღებული რაოდენობრივი მონაცემებიდან რაც შეიძლება მეტი სასარგებლო ინფორმაციის ამოღების მიზნით.

გარკვეული სტატისტიკური მეთოდების გამოყენება განისაზღვრება იმით, თუ რომელ სტატისტიკურ შკალას განეკუთვნება მიღებული მასალა.

სახელების მასშტაბი.ეს მასშტაბი მოიცავს მასალებს, რომლებშიც შესწავლილი ობიექტები ერთმანეთისგან განსხვავდება მათი ხარისხით და თანმიმდევრობა არ არის მნიშვნელოვანი. მაგალითად, კონფერენციის მონაწილეთა განაწილება. ასეთი მასალების სტატისტიკური დამუშავებისას მხედველობაში უნდა იქნას მიღებული თითოეული ობიექტის ერთეულების რაოდენობა.

შეკვეთის მასშტაბი.ობიექტების თანმიმდევრობა არის აქცენტი. სტატისტიკაში ეს მასშტაბი მოიცავს ისეთ კვლევით მასალებს, რომლებშიც განიხილება ერთ ან რამდენიმე კლასს მიკუთვნებული ობიექტები, მაგრამ ერთმანეთის შედარებისას განსხვავდებიან: მეტი - ნაკლები, უფრო მაღალი - ქვედა და ა.შ.

შეკვეთის მასშტაბის ტიპიური მახასიათებლების ჩვენების უმარტივესი გზა არის ნებისმიერი სპორტული შეჯიბრის შედეგების ნახვა. ისინი თანმიმდევრულად ჩამოთვლიან მონაწილეებს, რომლებმაც დაიკავეს, შესაბამისად, პირველი, მეორე, მესამე და სხვა პოზიციები.

ადგილის მიხედვით და ინფორმაცია სპორტსმენების რეალური მიღწევების შესახებ უკანა პლანზე გადადის, ან არ არის.

ინტერვალის მასშტაბი.იგი მოიცავს ისეთ მასალებს, რომლებშიც შესწავლილი ობიექტის რაოდენობრივი შეფასება მოცემულია ფიქსირებულ ერთეულებში. ინტერვალების მასშტაბის შესაბამის მასალებს უნდა ჰქონდეთ საზომი ერთეული, რომელიც მისი იდენტური იყო ყველა განმეორებითი გაზომვისთვის.

ურთიერთობის მასშტაბი.ეს მასშტაბი მოიცავს მასალებს, რომლებიც ითვალისწინებენ არა მხოლოდ ფიქსირებული ერთეულების რაოდენობას , როგორც ინტერვალების სკალაში, არამედ ერთმანეთში მიღებული ჯამური შედეგების შეფარდებით. ასეთ ურთიერთობებთან მუშაობისთვის, თქვენ უნდა გქონდეთ გარკვეული აბსოლუტური წერტილი, საიდანაც ტარდება ათვლა.

თუ მკვლევარის ხელთ არსებული მონაცემები, უფრო დეტალური შესწავლისას, მხოლოდ ოდნავ განსხვავდება გაუსის ნორმალური განაწილების მრუდისგან, მაშინ ეს მკვლევარს აძლევს უფლებას გამოიყენოს პარამეტრული მეთოდები სტატისტიკურ დამუშავებაში, რომელთა საწყისი დებულებები ეფუძნება გაუსის ნორმალური განაწილების მრუდს. . ნორმალურ განაწილებას პარამეტრული ეწოდება, რადგან გაუსის მრუდის ასაგებად და გასაანალიზებლად საკმარისია მხოლოდ ორი პარამეტრი: საშუალო არითმეტიკული, რომლის მნიშვნელობა უნდა შეესაბამებოდეს მრუდის ცენტრში აღდგენილი პერპენდიკულურის სიმაღლეს და ეგრეთ წოდებული ფესვის საშუალო კვადრატი, ან სტანდარტული გადახრა, მნიშვნელობა, რომელიც ახასიათებს ამ მრუდის რყევების დიაპაზონს.

თუ შეუძლებელია პარამეტრული მეთოდების გამოყენება, საჭიროა მივმართოთ არაპარამეტრულ მეთოდებს.

ნორმალურობის დაშვებაზე დაფუძნებული სტატისტიკური ტესტების გამოყენების შეზღუდვის ერთ-ერთი ფაქტორი არის შერჩევის ზომა. სანამ ნიმუში საკმარისად დიდია (მაგალითად, 100 ან მეტი დაკვირვება), ნიმუშის განაწილება შეიძლება ჩაითვალოს ნორმალურად, მაშინაც კი, თუ დარწმუნებული არ არის, რომ ცვლადის განაწილება პოპულაციაში ნორმალურია. თუმცა, თუ ნიმუში მცირეა, მაშინ პარამეტრული ტესტები უნდა იქნას გამოყენებული მხოლოდ იმ შემთხვევაში, თუ არსებობს ნდობა, რომ ცვლადი მართლაც ნორმალურად არის განაწილებული. თუმცა, ასეთი ცვლადების შემთხვევაშიც კი, არ არსებობს ამ ვარაუდის შესამოწმებლად მცირე ნიმუშზე (ნორმალობის სტატისტიკური ტესტები ეფექტურად იწყებს მუშაობას ნიმუშზე, რომელიც შეიცავს მინიმუმ 51 დაკვირვებას).

არაპარამეტრული მეთოდები ყველაზე შესაფერისია, როდესაც ნიმუშის ზომა მცირეა და მონაცემები არის რიგითი ან ნომინალური მასშტაბებით. თუ არსებობს ბევრი ემპირიული მონაცემი (მაგალითად, n>100), მაშინ ხშირად აზრი არ აქვს და არასწორადაც კი ჩანს არაპარამეტრული სტატისტიკის გამოყენება. თუ ნიმუშის ზომა ძალიან მცირეა (მაგალითად, n=10 ან ნაკლები), მაშინ p-მნიშვნელოვნების დონეები იმ არაპარამეტრული ტესტებისთვის, რომლებიც იყენებენ ნორმალურ მიახლოებას, შეიძლება ჩაითვალოს მხოლოდ უხეშ შეფასებად.



ნორმალურობის ვარაუდზე დაფუძნებული კრიტერიუმების გამოყენება ასევე შეზღუდულია იმით, რომ შესასწავლი მახასიათებლები განეკუთვნება გარკვეულ საზომ შკალას. სტატისტიკური მეთოდები, როგორიცაა, მაგალითად, სტუდენტის t-ტესტი (დამოკიდებული და დამოუკიდებელი ნიმუშებისთვის), პირსონის წრფივი კორელაცია, ასევე რეგრესია, კლასტერული და ფაქტორული ანალიზი ვარაუდობს, რომ წყაროს მონაცემები უწყვეტია (შესწავლილი ცვლადების მნიშვნელობები დაკავშირებულია ინტერვალთან ან თანაფარდობის მასშტაბთან) . თუმცა, არის შემთხვევები, როდესაც მონაცემები უბრალოდ რანჟირებულია (იზომება რიგითი მასშტაბით) და არა ზუსტად გაზომილი. შემდეგ მიზანშეწონილია ისეთი სტატისტიკური კრიტერიუმების გამოყენება, როგორიცაა, მაგალითად, Wilcoxon T-ტესტი, ნიშნების G-ტესტი, Mann-Whitney U-ტესტი, Wald-Wolfowitz Z-ტესტი, Spearman-ის რანგის კორელაცია და ა.შ. საკუთარი სტატისტიკური მეთოდები. იმუშავებს ნომინალურ მონაცემებზე, მაგალითად, თვისებრივი მახასიათებლების კორელაციაზე, ხი-კვადრატის ტესტზე, კოკრანის Q-ტესტზე და ა.შ. კონკრეტული კრიტერიუმის არჩევა ასოცირდება ჰიპოთეზასთან, რომელსაც მკვლევარი აყენებს სამეცნიერო კვლევის პროცესში. , შემდეგ კი ცდილობს დაამტკიცოს ემპირიულ დონეზე.

ასე რომ, თითოეული პარამეტრული კრიტერიუმისთვის არის მინიმუმ ერთი არაპარამეტრული ალტერნატივა. ზოგადად, ეს პროცედურები იყოფა ერთ-ერთ შემდეგ კატეგორიად: (1) ცვლადებს შორის დამოკიდებულების ხარისხის შეფასება; (2) განსხვავების კრიტერიუმები დამოუკიდებელი ნიმუშებისთვის; (3) სხვაობის კრიტერიუმები დამოკიდებული ნიმუშებისთვის.

დამოკიდებულების (ურთიერთობის) შესაფასებლად,ან შეერთების შებოჭილობის (სიმკვრივე, სიმტკიცე) ხარისხი, გამოთვალეთ პირსონის კორელაციის კოეფიციენტი (r). მკაცრად რომ ვთქვათ, მის გამოყენებას ასევე აქვს შეზღუდვები, რომლებიც დაკავშირებულია, მაგალითად, მასშტაბის ტიპთან, რომელშიც ხდება მონაცემების გაზომვა და დამოკიდებულების არაწრფივობა. ამიტომ ალტერნატივად გამოიყენება არაპარამეტრული ან ე.წ. რანგის კორელაციის კოეფიციენტები (მაგ. Spearman-ის რანგის კორელაციის კოეფიციენტი (ρ), Kendall's tau სტატისტიკა (τ), გამა (გამა)), რომლებიც გამოიყენება რიგითი (რანჟირებული) მონაცემებისთვის. თუ ორზე მეტი ცვლადია, მაშინ გამოიყენება კენდალის თანხვედრის კოეფიციენტი. იგი გამოიყენება, მაგალითად, დამოუკიდებელი ექსპერტების მოსაზრებების თანმიმდევრულობის შესაფასებლად (მაგალითად, ერთი და იგივე სუბიექტისთვის, კონკურსის მონაწილეზე მიცემული ქულები).

თუ მონაცემები იზომება ნომინალურ შკალაზე, მაშინ ბუნებრივია მათი წარდგენა შემთხვევითობის ცხრილებში, რომლებიც იყენებენ პირსონის ჩი-კვადრატის ტესტს სხვადასხვა ვარიაციებითა და კორექტირებით სიზუსტისთვის.

განსხვავებები დამოუკიდებელ ჯგუფებს შორის. თუ არსებობს ორი ნიმუში (მაგალითად, ბიჭები და გოგოები), რომლებიც უნდა შედარება გარკვეული საშუალო მნიშვნელობის მიმართ, მაგალითად, შემოქმედებითი აზროვნება, მაშინ შეგიძლიათ გამოიყენოთ t-ტესტი დამოუკიდებელი ნიმუშებისთვის (t-ტესტი დამოუკიდებელი ნიმუშებისთვის). . ამ ტესტის არაპარამეტრული ალტერნატივებია Wald-Wolfowitz runs ტესტი, Mann-Whitney U ტესტი და Kolmogorov-Smirnov-ის ორნიმუშიანი ტესტი. უნდა გვახსოვდეს, რომ კოლმოგოროვ-სმირნოვის ორი ნიმუშის ტესტი მგრძნობიარეა არა მხოლოდ ორი განაწილების პოზიციის სხვაობის, არამედ განაწილების ფორმის მიმართ. სინამდვილეში, ის მგრძნობიარეა ჰომოგენურობის ჰიპოთეზის ნებისმიერი გადახრის მიმართ, მაგრამ არ მიუთითებს, რომელ გადახრებასთან აქვს მკვლევარი საქმე.

განსხვავებები დამოკიდებულ ჯგუფებს შორის. თუ საჭიროა ერთსა და იმავე ნიმუშთან დაკავშირებული ორი ცვლადის შედარება, მაგალითად, ერთი და იგივე საგნების აგრესიულობის ინდიკატორები კორექტირებამდე და მის შემდეგ, მაშინ ჩვეულებრივ გამოიყენება t-ტესტი დამოკიდებული ნიმუშებისთვის. ალტერნატიული არაპარამეტრული ტესტებია ნიშნების ტესტი და ვილკოქსონის შესატყვისი წყვილის ტესტი. Wilcoxon ტესტი ვარაუდობს, რომ შესაძლებელია განსხვავებების რანჟირება შედარებულ დაკვირვებებს შორის. თუ ამის გაკეთება შეუძლებელია, მაშინ გამოიყენება ნიშნის კრიტერიუმი, რომელიც ითვალისწინებს მხოლოდ შედარებულ მნიშვნელობებს შორის განსხვავების ნიშნებს.

თუ განხილული ცვლადები კატეგორიულია (ნომინალური), მაშინ მაკნემარის ჩი-კვადრატი შესაბამისია. თუ არსებობს ორი კატეგორიული ცვლადი, მაშინ დამოკიდებულების ხარისხის შესაფასებლად გამოიყენება სტანდარტული სტატისტიკა და შესაბამისი კრიტერიუმები შემთხვევითი ცხრილებისთვის: Chi-square, Phi-square, Fisher exact test.

ქვემოთ მოცემულ ცხრილში წარმოდგენილია პარამეტრული ტესტები და მათი არაპარამეტრული ალტერნატივები შემდეგი კატეგორიების გათვალისწინებით: 1) ცვლადებს შორის დამოკიდებულების ხარისხის შეფასება; 2) განსხვავების კრიტერიუმები.

ცხრილი 4.1 - პარამეტრული და არაპარამეტრული კრიტერიუმები

პარამეტრული კრიტერიუმები არაპარამეტრული ტესტები
დამოკიდებულების შეფასება (ურთიერთობები)
პირსონის კორელაციის კოეფიციენტი (r) რანგის კორელაციის კოეფიციენტები (Spearman-ის რანგის კორელაციის კოეფიციენტი ρ), Kendall's tau სტატისტიკა (τ), გამა (გამა)); პირსონის ჩი-კვადრატი (ნომინალური მონაცემებისთვის)
განსხვავებები დამოუკიდებელ ჯგუფებს შორის
სტუდენტის t-ტესტი დამოუკიდებელი ნიმუშებისთვის (t-ტესტი დამოუკიდებელი ნიმუშებისთვის) უოლდ-ვოლფოვიცის ტესტირება, Mann-Whitney U ტესტი, კოლმოგოროვი-სმირნოვის ორი ნიმუშის ტესტი
განსხვავებები დამოკიდებულ ჯგუფებს შორის
სტუდენტის t-ტესტი დამოკიდებული ნიმუშებისთვის (t-ტესტი დამოკიდებული ნიმუშებისთვის) ნიშნების G-ტესტი (Sign Test), ვილკოქსონის დაწყვილებული შედარებების T-ტესტი (Wilcoxon matched pair test); McNemar Chi-square, Chi-square, Phi-Square, Fisher exact (ნომინალური მონაცემებისთვის)

თუ განიხილება ორზე მეტი ცვლადი ერთი და იმავე ნიმუშიდან (მაგალითად, წინასწარი კორექტირება, შემდგომი შესწორება-1 და შემდგომი კორექტირება-2), მაშინ ჩვეულებრივ გამოიყენება დისპერსიის განმეორებითი ზომების ანალიზი, რომელიც შეიძლება ჩაითვალოს როგორც t-ტესტის განზოგადება დამოკიდებული ნიმუშებისთვის.ანალიზის მგრძნობელობის ამაღლება. დისპერსიის ანალიზის ინგლისური აბრევიატურა არის ANOVA (Analysis of Variation). დისპერსიის ანალიზი საშუალებას გაძლევთ ერთდროულად აკონტროლოთ არა მხოლოდ დამოკიდებული ცვლადის საბაზისო დონე, არამედ სხვა ფაქტორებიც, ასევე ჩართოთ ერთზე მეტი დამოკიდებული ცვლადი ექსპერიმენტის გეგმაში. ალტერნატიული არაპარამეტრული მეთოდებია კრუსკალ-უოლისის ვარიაციის ანალიზი და მედიანური ტესტი (Kruskal-Wallis ANOVA, მედიანა ტესტი), ფრიდმანის რანგის ვარიაციის ანალიზი (Friedman ANOVA რანგის მიხედვით).

კითხვები არაპარამეტრულ კრიტერიუმებზე.

სტატისტიკური კრიტერიუმი - გადაწყვეტილების წესი, რომელიც უზრუნველყოფს ჭეშმარიტის მიღებას და მცდარი ჰიპოთეზის დიდი ალბათობით უარყოფას.ამავდროულად, სტატისტიკური კრიტერიუმი არის გარკვეული რიცხვის და თავად ამ რიცხვის გამოთვლის მეთოდი.

პარამეტრული კრიტერიუმები გამოიყენება მაშინ, როდესაც ნიმუში ნორმალურია, ხოლო ამ კრიტერიუმებში გაანგარიშება მოიცავს მახასიათებლის ალბათობის განაწილების მახასიათებლებს, ანუ საშუალებებს და დისპერსიას. ეს ვარაუდობს, რომ მონაცემები უწყვეტია. პარამეტრული ტესტები მოიცავს: სტუდენტის t-ტესტს, chi-square ტესტს. ვარგისია ინტერვალის თანაფარდობის სკალებისთვის.

არაპარამეტრული ტესტები გამოიყენება მაშინ, როდესაც შეუძლებელია ნორმალურ განაწილებაზე საუბარი, ტესტები ეფუძნება რანგებით ან სიხშირეებით მუშაობას. არაპარამეტრულები მოიცავს ნიშნის ტესტს, ვილკოქსონის ტესტს, მენ-უიტნის ტესტს და ჯონხეერს. ვარგისია ინტერვალის სასწორზე სუსტი სასწორებისთვის.

კრიტერიუმის არჩევამდე უნდა შევამოწმოთ ნიმუში ნორმალურად.

წარმოდგენა არ მაქვს რა დავწერო საშუალო და გაფანტული ზომების მიხედვით, რადგან როგორც ჩანს, არსებობს დისპერსიის და ბლა ბლა სხვა ცნებები *_*

2. სტატისტიკური ჰიპოთეზების ტესტირების მეთოდები: t-ტესტი, ვილკოქსონის ტესტი, მან-უიტნის ტესტი, კრუსკალ-უოლესის ტესტი (აპლიკაციის პირობები, ჰიპოთეზების ფორმულირება, სტატისტიკის განაწილება, გაანგარიშების იდეა)

t-test (Student) - გამოიყენება თუ ნიმუში ნორმალურია. ჰიპოთეზები ჩამოყალიბებულია შემდეგნაირად:

1. H0 ჩამოყალიბებულია

2. H1 არის ჩამოყალიბებული, ალტერნატიული H0 (ჩვეულებრივ, ეს მიუთითებს მახასიათებლების ურთიერთქმედებას).

3. სტატისტიკა არჩეულია ორ ჰიპოთეზას შორის ასარჩევად

4. თითოეული მნიშვნელოვნების დონისთვის α, დგინდება კრიტიკული რეგიონი, სადაც ა) ამ რეგიონში მოხვედრილი შედეგი მიუთითებს H1-ზე და არა H0-ზე ბ) შედეგის ალბათობა ამ რეგიონში H0 true-ზე უდრის α.

პირველი სახის მისაღები შეცდომის ალბათობა α=0,05, თუ ჩვენს ნიმუშში კრიტერიუმის მნიშვნელობა მეტია t 0,05-ზე, მაშინ ვიღებთ H0 ჰიპოთეზას, უარვყოფთ H1 ჰიპოთეზას.

ერთი ნიმუშისთვის

დამოუკიდებელი ნიმუშებისთვის.

Wilcoxon-ის ხელმოწერილი რანგის ტესტი ითვალისწინებს არა ნიმუშში მოცემული რიცხვების მნიშვნელობებს, არამედ მხოლოდ მათ ნიშნებს. კრიტერიუმი ითვალისწინებს ნიმუშის წევრების აბსოლუტურ მნიშვნელობებს. იგი გამოიყენება მაშინ, როდესაც ნიმუში შეიძლება არ იყოს ნორმალური და როდესაც საჭიროა გადაწყვიტოს აქვს თუ არა ნიმუშს მნიშვნელოვნად არანულოვანი საშუალო. განაცხადისთვის საჭიროა:

1) დააყენეთ α მნიშვნელოვნების დონე და იპოვეთ შესაბამისი ქვედა ვილკოქსონის კვანტილი.


2) დაალაგეთ ნიმუშის ყველა წევრი აბსოლუტური მნიშვნელობის ზრდადი თანმიმდევრობით, მოაწერეთ მათ ქვეშ მყოფი რიგები.

3) გამოვთვალოთ ვილკოქსონის სტატისტიკა, რისთვისაც ვიანგარიშებთ ნიმუშის უარყოფით წევრებს მინიჭებული წოდებების ჯამს.

4) მიღებული სტატისტიკა შეადარეთ ადრე აღმოჩენილ კვანტილს. თუ რიგების ეს ჯამი ქვედა კვანტილზე ნაკლებია, ჩვენ უარვყოფთ H0 ჰიპოთეზას და ვიღებთ H1 ჰიპოთეზას. ანალოგიურად, თუ ყველა დადებითი ნიმუშის წევრის რიგების ჯამი აღემატება ზედა კვანტილს, ჩვენ ვიღებთ H1-ს და უარვყოფთ H0-ს.

Mann-Whitney ტესტი (U) არის ტესტი დამოუკიდებელი ნიმუშებისთვის, სტუდენტის t-ტესტის ანალოგი. მისი ემპირიული მნიშვნელობა გვიჩვენებს, თუ როგორ ემთხვევა ატრიბუტების მნიშვნელობების ორი მწკრივი. იგი გამოიყენება მაშინ, როდესაც ნიმუში შეიძლება არ იყოს ნორმალური, შენარჩუნებულია მხოლოდ განაწილებათა მსგავსების მოთხოვნა, მაგრამ ისინი არ უნდა იყოს ნორმალური + როცა საჭიროა პრობლემის გადაჭრა, შესაძლებელია ამის მტკიცება. რომ ექსპერიმენტული ნიმუშის საშუალო მნიშვნელობა მნიშვნელოვნად აღემატება საკონტროლო ჯგუფის საშუალო მნიშვნელობას.

1) ორივე ნიმუშის წევრებს ვწერთ აღმავალი თანმიმდევრობით, გამოვყოფთ სხვადასხვა ნიმუშის წევრებს სხვადასხვა გზით.

2) პირველი (საკონტროლო) ნიმუშის თითოეული რიცხვისთვის ვიანგარიშებთ მეორე (ექსპერიმენტული) ნიმუშის რამდენი რიცხვია განთავსებული მისგან მარცხნივ. თუ პირველი ნიმუშის რაოდენობა უდრის მეორეს, დაამატეთ 0,5. ჩვენ ვიღებთ თანმიმდევრულ შედეგებს და ვამატებთ მათ.

3) ჩვენ ვუყურებთ მნიშვნელობის დონეს, რომელიც ავირჩიეთ ქვედა კვანტილისთვის მან-უიტნის მიხედვით. თუ ჩვენს მიერ მიღებული ჯამი ნაკლებია ქვედა კვანტილზე, მაშინ ჩვენ უარვყოფთ ჰიპოთეზას H0, ვიღებთ ჰიპოთეზას H1.

Mann-Whitney-ის განაწილება სიმეტრიულია (ანუ შეგიძლიათ უკუღმა დათვალოთ და გამოიყენოთ ზედა კვანტილი).

კრუსკალ-უოლესის ტესტი არის ცალმხრივი დისპერსიის ანალიზის არაპარამეტრული ანალოგი დამოუკიდებელი ნიმუშებისთვის. Mann-Whitney ტესტის მსგავსი. აფასებს შეცვლილი ატრიბუტის მნიშვნელობების რამდენიმე სერიის დამთხვევის ხარისხს. მთავარი იდეა არის შედარებული ნიმუშების ყველა მნიშვნელობის წარმოდგენა, როგორც რანჟირებული მნიშვნელობების საერთო თანმიმდევრობა, რასაც მოჰყვება საშუალო რანგის გამოთვლა თითოეული ნიმუშისთვის.

გამოითვლება რეიტინგის შემდეგ.

N არის ყველა ნიმუშის საერთო რაოდენობა.

k არის შედარებული ნიმუშების რაოდენობა.

R i არის წოდებების ჯამი კონკრეტული ნიმუშისთვის.

n i – ნიმუშის ზომა i.

რაც უფრო მეტად განსხვავდება ნიმუშები, მით მეტია H-ის გამოთვლითი მნიშვნელობა, მით უფრო დაბალია p-მნიშვნელოვნების დონე. როდესაც ნულოვანი სტატისტიკური ჰიპოთეზა უარყოფილია, ალტერნატიული ჰიპოთეზა ამ მახასიათებლის სტატისტიკურად მნიშვნელოვანი განსხვავებების შესახებ მიიღება განსხვავებების მიმართულების დაზუსტების გარეშე. (მიმართულებისთვის საჭიროა Mann-Whitney ტესტი, რადგან ეს არის ორი ნიმუშისთვის და ეს არის ორზე მეტი).