ჩი-კვადრატის განაწილების ფუნქციის ნახატი. ორი სიხშირის განაწილების შედარება

განვიხილოთ chi-კვადრატის განაწილება. MS EXCEL ფუნქციის გამოყენებითCHI2.DIST() ჩვენ ავაშენებთ განაწილების ფუნქციისა და ალბათობის სიმკვრივის გრაფიკებს, განვმარტავთ ამ განაწილების გამოყენებას მათემატიკური სტატისტიკის მიზნებისთვის.

ჩი-კვადრატის განაწილება (X 2, XI2,ინგლისურიჩი- კვადრატშიგანაწილება) გამოიყენება მათემატიკური სტატისტიკის სხვადასხვა მეთოდებში:

  • აშენებისას;
  • ზე ;
  • at (შეესაბამება თუ არა ემპირიული მონაცემები ჩვენს ვარაუდს თეორიული განაწილების ფუნქციის შესახებ თუ არა, ინგ. Goodness-of-fit)
  • at (გამოიყენება ორ კატეგორიულ ცვლადს შორის კავშირის დასადგენად, ინგ. ასოციაციის Chi-square ტესტი).

განმარტება: თუ x 1 , x 2 , …, x n არის დამოუკიდებელი შემთხვევითი ცვლადები, რომლებიც განაწილებულია N(0;1-ზე), მაშინ შემთხვევითი ცვლადის განაწილება Y=x 1 2 + x 2 2 +…+ x n 2 აქვს განაწილება X 2 თავისუფლების n ხარისხით.

დისტრიბუცია X 2 დამოკიდებულია ერთ პარამეტრზე, რომელსაც ეწოდება თავისუფლების ხარისხი (დფ, გრადუსიდანთავისუფლება). მაგალითად, მშენებლობისას თავისუფლების ხარისხების რაოდენობაუდრის df=n-1, სადაც n არის ზომა ნიმუშები.

განაწილების სიმკვრივე X 2 გამოხატული ფორმულით:

ფუნქციების გრაფიკები

დისტრიბუცია X 2 აქვს ასიმეტრიული ფორმა, n-ის ტოლი, 2n-ის ტოლი.

AT ფაილის მაგალითი ფურცელზე Graphმოცემული განაწილების სიმკვრივის ნაკვეთებიალბათობა და ინტეგრალური განაწილების ფუნქცია.

სასარგებლო ქონება chi2 განაწილება

მოდით x 1 , x 2 , ..., x n იყოს დამოუკიდებელი შემთხვევითი ცვლადები განაწილებული ნორმალური კანონიიგივე პარამეტრებით μ და σ და X იხარის საშუალო არითმეტიკულიეს მნიშვნელობები x.
შემდეგ შემთხვევითი ცვლადი თანაბარი

Მას აქვს X 2 - განაწილებათავისუფლების n-1 გრადუსით. განმარტების გამოყენებით, ზემოაღნიშნული გამოხატულება შეიძლება გადაიწეროს შემდეგნაირად:

აქედან გამომდინარე, შერჩევის განაწილებასტატისტიკა y, ერთად სინჯის აღებასაწყისი ნორმალური დისტრიბუცია, Მას აქვს X 2 - განაწილებათავისუფლების n-1 გრადუსით.

ჩვენ დაგვჭირდება ეს ქონება. იმიტომ რომ დისპერსიაშეიძლება იყოს მხოლოდ დადებითი რიცხვი და X 2 - განაწილებაგამოიყენება მის შესაფასებლად დ.ბ. >0, როგორც მითითებულია განმარტებაში.

HI2 განაწილება MS EXCEL-ში

MS EXCEL-ში, 2010 წლის ვერსიიდან დაწყებული, ამისთვის X 2 - დისტრიბუციებიარის სპეციალური ფუნქცია CHISQ.DIST() , ინგლისური სახელია CHISQ.DIST(), რომელიც საშუალებას გაძლევთ გამოთვალოთ ალბათობის სიმკვრივე(იხ. ფორმულა ზემოთ) და (ალბათობა, რომ აქვს X შემთხვევითი ცვლადი XI2-განაწილება, იღებს მნიშვნელობას ნაკლები ან ტოლი x, P(X<= x}).

შენიშვნა: იმიტომ chi2 განაწილებაარის განსაკუთრებული შემთხვევა, შემდეგ ფორმულა =GAMMA.DIST(x,n/2,2,TRUE)დადებითი მთელი რიცხვისთვის n აბრუნებს იგივე შედეგს, რასაც ფორმულა =XI2.DIST(x, n, TRUE)ან =1-XI2.DIST.X(x;n) . და ფორმულა =GAMMA.DIST(x,n/2,2,FALSE)აბრუნებს იგივე შედეგს, როგორც ფორმულა =XI2.DIST(x, n, FALSE), ე.ი. ალბათობის სიმკვრივე XI2 განაწილება.

CH2.DIST.RT() ფუნქცია ბრუნდება განაწილების ფუნქცია, უფრო ზუსტად, მემარჯვენე ალბათობა, ე.ი. P(X > x). აშკარაა, რომ თანასწორობა
=CHI2.DIST.X(x;n)+ CHI2.DIST(x;n;TRUE)=1
რადგან პირველი წევრი ითვლის ალბათობას P(X > x), ხოლო მეორე P(X<= x}.

MS EXCEL 2010-მდე EXCEL-ს ჰქონდა მხოლოდ HI2DIST() ფუნქცია, რომელიც საშუალებას გაძლევთ გამოთვალოთ მარჯვენა ხელის ალბათობა, ე.ი. P(X > x). ახალი MS EXCEL 2010 ფუნქციების CHI2.DIST() და CHI2.DIST.RT() შესაძლებლობები გადაფარავს ამ ფუნქციის შესაძლებლობებს. HI2DIST() ფუნქცია დარჩა MS EXCEL 2010-ში თავსებადობისთვის.

CHI2.DIST() არის ერთადერთი ფუნქცია, რომელიც ბრუნდება chi2 განაწილების ალბათობის სიმკვრივე(მესამე არგუმენტი უნდა იყოს FALSE). დანარჩენი ფუნქციები ბრუნდება ინტეგრალური განაწილების ფუნქცია, ე.ი. ალბათობა იმისა, რომ შემთხვევითი ცვლადი მიიღებს მნიშვნელობას მითითებული დიაპაზონიდან: P(X<= x}.

MS EXCEL-ის ზემოაღნიშნული ფუნქციები მოცემულია.

მაგალითები

იპოვეთ ალბათობა იმისა, რომ შემთხვევითი ცვლადი X მიიღებს მოცემულზე ნაკლები ან ტოლი მნიშვნელობას x: P(X<= x}. Это можно сделать несколькими функциями:

CHI2.DIST(x, n, TRUE)
=1-CHI2.DIST.RP(x; n)
=1-CHI2DIST(x; n)

ფუნქცია XI2.DIST.X() აბრუნებს ალბათობას P(X > x), ეგრეთ წოდებულ მარჯვნივ ალბათობას, რათა ვიპოვოთ P(X).<= x}, необходимо вычесть ее результат от 1.

ვიპოვოთ ალბათობა იმისა, რომ შემთხვევითი ცვლადი X მიიღებს მოცემულზე დიდ მნიშვნელობას x: P(X > x). ეს შეიძლება გაკეთდეს რამდენიმე ფუნქციით:

1-CHI2.DIST(x, n, TRUE)
=XI2.DIST.RP(x; n)
=CHI2DIST(x, n)

შებრუნებული chi2 განაწილების ფუნქცია

გამოსათვლელად გამოიყენება ინვერსიული ფუნქცია ალფა- , ე.ი. მნიშვნელობების გამოსათვლელად xმოცემული ალბათობისთვის ალფა, და Xუნდა აკმაყოფილებდეს გამოთქმას P(X<= x}=ალფა.

გამოსათვლელად გამოიყენება CH2.INV() ფუნქცია ნორმალური განაწილების დისპერსიის ნდობის ინტერვალები.

XI2.INV.RT() ფუნქცია გამოიყენება გამოსათვლელად, ე.ი. თუ ფუნქციის არგუმენტად მითითებულია მნიშვნელოვნების დონე, მაგალითად, 0.05, მაშინ ფუნქცია დააბრუნებს x შემთხვევითი ცვლადის ისეთ მნიშვნელობას, რომლისთვისაც P(X>x)=0.05. შედარებისთვის: ფუნქცია XI2.INV() დააბრუნებს x შემთხვევითი ცვლადის ისეთ მნიშვნელობას, რისთვისაც P(X<=x}=0,05.

MS EXCEL 2007-ში და უფრო ადრე, XI2.OBR.RT()-ის ნაცვლად გამოყენებული იყო XI2OBR() ფუნქცია.

ზემოაღნიშნული ფუნქციები შეიძლება შეიცვალოს, როგორც შემდეგი ფორმულები იგივე შედეგს აბრუნებს:
=CHI.OBR(ალფა,n)
=XI2.INV.RT(1-ალფა;n)
\u003d XI2OBR (1-ალფა; n)

აქ მოცემულია გაანგარიშების რამდენიმე მაგალითი ფაილის მაგალითი ფუნქციების ფურცელზე.

MS EXCEL ფუნქციონირებს chi2 განაწილების გამოყენებით

ქვემოთ მოცემულია კორესპონდენცია რუსულ და ინგლისურ ფუნქციების სახელებს შორის:
HI2.DIST.PH() - ინგ. დაასახელეთ CHISQ.DIST.RT, ე.ი. CHI-Squared DISTtribution Right Tail, მარჯვენა კუდიანი Chi-square(d) განაწილება
XI2.OBR () - ინგლისური. დაასახელეთ CHISQ.INV, ე.ი. CHI-კვადრატული განაწილება INVerse
HI2.PH.OBR() - ინგლისური. სახელი CHISQ.INV.RT, ე.ი. CHI-კვადრატული განაწილება INVerse Right Tail
HI2DIST() - ინგ. სახელი CHIDIST, ფუნქცია ექვივალენტური CHISQ.DIST.RT
HI2OBR() - ინგ. სახელი CHIINV, ე.ი. CHI-კვადრატული განაწილება INVerse

განაწილების პარამეტრების შეფასება

იმიტომ რომ ჩვეულებრივ chi2 განაწილებაგამოიყენება მათემატიკური სტატისტიკის მიზნებისათვის (გამოთვლა ნდობის ინტერვალები, ჰიპოთეზის ტესტირება და ა.შ.)და თითქმის არასოდეს რეალური მნიშვნელობების მოდელების ასაგებად, მაშინ ამ განაწილებისთვის, განაწილების პარამეტრების შეფასების განხილვა აქ არ ტარდება.

XI2 განაწილების მიახლოება ნორმალური განაწილებით

თავისუფლების ხარისხით n>30 განაწილება X 2კარგად მიახლოებული ნორმალური დისტრიბუციათანა საშუალოდμ=n და დისპერსია σ=2*n (იხ ფაილის ფურცლის მაგალითი მიახლოება).

chi-square ტესტი არის უნივერსალური მეთოდი ექსპერიმენტულ შედეგებსა და გამოყენებულ სტატისტიკურ მოდელს შორის შეთანხმების შესამოწმებლად.

პირსონის მანძილი X 2

პიატნიცკი ა.მ.

რუსეთის სახელმწიფო სამედიცინო უნივერსიტეტი

1900 წელს კარლ პირსონმა შემოგვთავაზა მარტივი, მრავალმხრივი და ეფექტური გზა მოდელის პროგნოზებსა და ექსპერიმენტულ მონაცემებს შორის შეთანხმების შესამოწმებლად. მისი "chi-square ტესტი" არის ყველაზე მნიშვნელოვანი და ყველაზე ხშირად გამოყენებული სტატისტიკური ტესტი. მოდელის უცნობი პარამეტრების შეფასებასთან და მოდელსა და ექსპერიმენტულ მონაცემებს შორის შეთანხმების შემოწმებასთან დაკავშირებული პრობლემების უმეტესი ნაწილი მისი დახმარებით შეიძლება მოგვარდეს.

მოდით არსებობდეს შესწავლილი ობიექტის ან პროცესის აპრიორი („წინასწარ ექსპერიმენტული“) მოდელი (სტატისტიკაში ისინი საუბრობენ „ნულო ჰიპოთეზაზე“ H 0) და ამ ობიექტზე ექსპერიმენტის შედეგები. აუცილებელია გადაწყვიტოს არის თუ არა მოდელი ადეკვატური (შეესაბამება თუ არა რეალობას)? ექსპერიმენტის შედეგები არ ეწინააღმდეგება ჩვენს იდეებს იმის შესახებ, თუ როგორ მუშაობს რეალობა, ან სხვა სიტყვებით რომ ვთქვათ, უნდა უარვყოთ H 0? ხშირად ეს ამოცანა შეიძლება შემცირდეს დაკვირვებული (O i = დაკვირვებული ) და მოსალოდნელი მოდელის მიხედვით (E i = მოსალოდნელი ) გარკვეული მოვლენების მოვლენის საშუალო სიხშირეების შედარებამდე. ითვლება, რომ დაკვირვებული სიხშირეები მიღებული იყო N დამოუკიდებელი (!) დაკვირვებების სერიით, რომელიც განხორციელდა მუდმივ (!) პირობებში. ყოველი დაკვირვების შედეგად რეგისტრირებულია ერთ-ერთი M მოვლენა. ეს მოვლენები ერთდროულად არ შეიძლება მოხდეს (ისინი წყვილად შეუთავსებელია) და ერთ-ერთი მათგანი აუცილებლად ხდება (მათი კომბინაცია ქმნის საიმედო მოვლენას). ყველა დაკვირვების მთლიანობა დაყვანილია სიხშირეების ცხრილამდე (ვექტორამდე) (O i )=(O 1 ,… O M ), რომელიც სრულად აღწერს ექსპერიმენტის შედეგებს. მნიშვნელობა O 2 =4 ნიშნავს, რომ მოვლენა ნომერი 2 მოხდა 4-ჯერ. O 1 +… O M =N სიხშირეების ჯამი. მნიშვნელოვანია განასხვავოთ ორი შემთხვევა: N არის ფიქსირებული, არა შემთხვევითი, N არის შემთხვევითი ცვლადი. ექსპერიმენტების ფიქსირებული საერთო რაოდენობისთვის N, სიხშირეებს აქვთ პოლინომიური განაწილება. მოდით ავხსნათ ეს ზოგადი სქემა მარტივი მაგალითით.

chi-square ტესტის გამოყენება მარტივი ჰიპოთეზების შესამოწმებლად.

მოდით მოდელი (ნულოვანი ჰიპოთეზა H 0) იყოს, რომ კამათელი რეგულარულია - ყველა სახე ერთნაირად ხშირად ამოვარდება, ალბათობით p i =1/6, i =, M=6. ჩატარდა ექსპერიმენტი, რომელიც შედგებოდა იმაში, რომ ძვალი 60-ჯერ იქნა გადაყრილი (ჩატარდა N = 60 დამოუკიდებელი ტესტი). მოდელის მიხედვით, ჩვენ ველით, რომ ყველა დაკვირვებული სიხშირე O i კლების 1,2,... 6 ქულა ახლოს უნდა იყოს მათ საშუალო მნიშვნელობებთან E i =Np i =60∙(1/6)=10. H 0-ის მიხედვით შუა სიხშირის ვექტორი (E i)=(Np i)=(10, 10, 10, 10, 10, 10). (ჰიპოთეზები, რომლებშიც საშუალო სიხშირეები სრულად არის ცნობილი ექსპერიმენტის დაწყებამდე, ეწოდება მარტივს.) თუ დაკვირვებული ვექტორი (O i) ტოლი იყო (34,0,0,0,0,26), მაშინ ის დაუყოვნებლივ გასაგებია, რომ მოდელი არასწორია - ძვალი არ შეიძლება იყოს სწორი, რადგან მხოლოდ 1 და 6 ამოვარდა 60-ჯერ. სწორი კამათელისთვის ასეთი მოვლენის ალბათობა უმნიშვნელოა: P = (2/6) 60 =2.4*10 -29 . თუმცა, ასეთი აშკარა შეუსაბამობების გამოჩენა მოდელსა და გამოცდილებას შორის გამონაკლისია. დაკვირვებული სიხშირეების ვექტორი (O i) ტოლი იყოს (5, 15, 6, 14, 4, 16). ეთანხმება ეს H 0-ს? ასე რომ, ჩვენ უნდა შევადაროთ ორი სიხშირის ვექტორი (E i) და (O i). ამავდროულად, მოსალოდნელი სიხშირეების ვექტორი (E i) არ არის შემთხვევითი, მაგრამ დაკვირვებული სიხშირეების ვექტორი (O i) არის შემთხვევითი - შემდეგ ექსპერიმენტში (60 გასროლის ახალ სერიაში) ეს იქნება განსხვავებული. სასარგებლოა პრობლემის გეომეტრიული ინტერპრეტაციის შემოღება და ვივარაუდოთ, რომ სიხშირის სივრცეში (ამ შემთხვევაში 6 განზომილებიანი) ორი წერტილი მოცემულია კოორდინატებით (5, 15, 6, 14, 4, 16) და (10, 10, 10, 10, 10, 10). არის თუ არა ისინი ერთმანეთისგან საკმარისად დაშორებული, რომ ჩაითვალოს ის შეუთავსებლად H 0-თან? სხვა სიტყვებით რომ ვთქვათ, ჩვენ გვჭირდება:

  1. ისწავლეთ როგორ გავზომოთ მანძილი სიხშირეებს შორის (წერტილები სიხშირის სივრცეში),
  2. აქვს კრიტერიუმი, თუ რა მანძილი უნდა ჩაითვალოს ძალიან ("სავარაუდოდ") დიდი, ანუ შეუსაბამოდ H 0-თან.

ჩვეულებრივი ევკლიდური მანძილის კვადრატი იქნება:

X 2 ევკლიდე = (O i -E i) 2 = (5-10) 2 + (15-10) 2 + (6-10) 2 + (14-10) 2 + (4-10) 2 + (16-10) 2

უფრო მეტიც, ზედაპირები X 2 Euclid = const ყოველთვის სფეროებია, თუ დავაფიქსირებთ E i-ს მნიშვნელობებს და შევცვლით O i-ს. კარლ პირსონმა აღნიშნა, რომ არ უნდა გამოვიყენოთ ევკლიდური მანძილი სიხშირის სივრცეში. ამრიგად, არასწორია ვივარაუდოთ, რომ წერტილები (O =1030 და E =1000) და (O =40 და E =10) ერთმანეთისგან თანაბარ მანძილზე არიან, თუმცა ორივე შემთხვევაში განსხვავება O -E =30. ყოველივე ამის შემდეგ, რაც უფრო დიდია მოსალოდნელი სიხშირე, მით მეტია მისგან გადახრები შესაძლებლად. აქედან გამომდინარე, წერტილები (O =1030 და E =1000) უნდა ჩაითვალოს „ახლო“, ხოლო წერტილები (O =40 და E =10) „შორს“ ერთმანეთისგან. შეიძლება აჩვენოს, რომ თუ ჰიპოთეზა H 0 მართალია, მაშინ O i სიხშირის რყევებს E i-სთან მიმართებაში აქვთ E i-ის კვადრატული ფესვის რიგის (!) რიგის სიდიდე. მაშასადამე, პირსონმა შესთავაზა, რომ მანძილის გამოთვლისას, მოედანზე მოეყვანა არა განსხვავებები (O i -E i ), არამედ ნორმალიზებული განსხვავებები (O i -E i )/E i 1/2. ასე რომ, აქ არის პირსონის მანძილის გამოთვლის ფორმულა (სინამდვილეში ეს არის მანძილის კვადრატი):

X 2 პირსონი = ((O i -E i )/E i 1/2) 2 = (O i -E i ) 2 /E i

ჩვენს მაგალითში:

X 2 პირსონი = (5-10) 2 /10+(15-10) 2 /10 +(6-10) 2 /10+(14-10) 2 /10+(4-10) 2 /10+( 16-10) 2 /10=15.4

ჩვეულებრივი კამათელისთვის, ყველა მოსალოდნელი სიხშირე E i ერთნაირია, მაგრამ, როგორც წესი, ისინი განსხვავდებიან, ამიტომ ზედაპირები, რომლებზეც პირსონის მანძილი მუდმივია (X 2 Pearson =const) აღმოჩნდება ელიფსოიდები და არა სფეროები.

ახლა, დისტანციების გამოთვლის ფორმულის არჩევის შემდეგ, აუცილებელია გაირკვეს, თუ რომელი მანძილი უნდა ჩაითვალოს „არც ისე დიდი“ (H 0-თან შესაბამისობაში) ასე, მაგალითად, რა შეიძლება ითქვას მანძილის შესახებ, რომელიც ჩვენ გამოვთვალეთ 15.4. ? რამდენ პროცენტში (ან რა ალბათობით) ჩვეულებრივი კამათლით ექსპერიმენტებს მივიღებდით 15,4-ზე მეტ მანძილს? თუ ეს პროცენტი მცირეა<0.05), то H 0 надо отвергнуть. Иными словами требуется найти распределение длярасстояния Пирсона. Если все ожидаемые частоты E i не слишком малы (≥5), и верна H 0 , то нормированные разности (O i - E i )/E i 1/2 приближенно эквивалентны стандартным гауссовским случайным величинам: (O i - E i )/E i 1/2 ≈N (0,1). Это, например, означает, что в 95% случаев| (O i - E i )/E i 1/2 | < 1.96 ≈ 2 (правило “двух сигм”).

ახსნა. გაზომვების რაოდენობა O i, რომელიც მოხვდება i ნომრით ცხრილის უჯრაში, აქვს ბინომიალური განაწილება პარამეტრებით: m =Np i =E i ,σ =(Np i (1-pi )) 1/2 , სადაც N არის გაზომვების რაოდენობა (N "1), p i არის ალბათობა, რომ ერთი გაზომვა მოხვდეს ამ უჯრედში (შეგახსენებთ, რომ გაზომვები დამოუკიდებელია და შესრულებულია მუდმივ პირობებში). თუ p i მცირეა, მაშინ: σ≈(Np i ) 1/2 =E i და ბინომალური განაწილება ახლოსაა პუასონთან, რომელშიც დაკვირვებების საშუალო რაოდენობა E i =λ, ხოლო სტანდარტული გადახრა σ=λ 1/2. = E i 1/2. λ≥5-ისთვის პუასონის განაწილება ახლოს არის ნორმასთან N (m =E i =λ, σ=E i 1/2 =λ 1/2) და ნორმალიზებული მნიშვნელობა (O i - E i )/E i 1. /2 ≈ N (0 ,ერთი).

პირსონმა განსაზღვრა შემთხვევითი ცვლადი χ 2 n - "chi-კვადრატი n გრადუსით თავისუფლებით", როგორც n დამოუკიდებელი სტანდარტის ნორმალური r.v. კვადრატების ჯამი:

χ 2 n = T 1 2 + T 2 2 + …+ T n 2,სად არის ყველაფერი T i = N(0,1) -ნ. შესახებ. რ. თან. in.

შევეცადოთ ვიზუალურად გავიგოთ სტატისტიკაში ამ უმნიშვნელოვანესი შემთხვევითი ცვლადის მნიშვნელობა. ამისათვის, სიბრტყეზე (n = 2-ისთვის) ან სივრცეში (n = 3-ისთვის) ჩვენ წარმოვადგენთ წერტილების ღრუბელს, რომელთა კოორდინატები დამოუკიდებელია და აქვთ სტანდარტული ნორმალური განაწილებაf T (x) ~exp (-x 2 /2 ). სიბრტყეზე, „ორი სიგმას“ წესის მიხედვით, რომელიც დამოუკიდებლად გამოიყენება ორივე კოორდინატზე, წერტილების 90% (0,95*0,95≈0,90) მოთავსებულია კვადრატში (-2).

f χ 2 2 (a) = Сexp(-a/2) = 0.5exp(-a/2).

თავისუფლების საკმარისად დიდი რაოდენობით n (n>30), ჩი-კვადრატი უახლოვდება ნორმალურს: N (m = n; σ = (2n) ½). ეს არის „ცენტრალური ლიმიტის თეორემის“ შედეგი: სასრული დისპერსიის მქონე იდენტურად განაწილებული სიდიდეების ჯამი უახლოვდება ნორმალურ კანონს ტერმინების რაოდენობის ზრდით.

პრაქტიკაში უნდა გვახსოვდეს, რომ მანძილის საშუალო კვადრატი უდრის m (χ 2 n )=n , ხოლო მისი დისპერსია σ 2 (χ 2 n )=2n . აქედან ადვილია დავასკვნათ, რომელი chi-კვადრატის მნიშვნელობები უნდა ჩაითვალოს ძალიან მცირე და ძალიან დიდი: განაწილების უმეტესი ნაწილი მდგომარეობს n -2 ∙ (2n ) ½-დან n + 2 ∙ (2n ) ½ დიაპაზონში.

ასე რომ, პირსონის მანძილი, რომელიც მნიშვნელოვნად აღემატება n +2∙ (2n ) ½ უნდა ჩაითვალოს წარმოუდგენლად დიდი (არ შეესაბამება H 0-ს). თუ შედეგი ახლოს არის n +2∙(2n) ½-თან, მაშინ უნდა გამოიყენოთ ცხრილები, რომლებშიც შეგიძლიათ გაიგოთ, თუ რა პროპორციით შეიძლება გამოჩნდეს ასეთი და დიდი chi-კვადრატის მნიშვნელობები.

მნიშვნელოვანია ვიცოდეთ, თუ როგორ უნდა აირჩიოთ სწორი მნიშვნელობა თავისუფლების გრადუსების რაოდენობისთვის (თავისუფლების გრადუსების რაოდენობა, შემოკლებით n .d .f .). ბუნებრივი ჩანდა ვიფიქროთ, რომ n უბრალოდ უდრის ბიტების რაოდენობას: n = M. პირსონმა ასე თქვა თავის სტატიაში. კამათლის მაგალითში ეს ნიშნავს, რომ n = 6. თუმცა, რამდენიმე წლის შემდეგ აღმოჩნდა, რომ პირსონი ცდებოდა. თავისუფლების ხარისხების რაოდენობა ყოველთვის ნაკლებია, ვიდრე ციფრები, თუ არის კავშირები შემთხვევით ცვლადებს შორის O i. კამათლის მაგალითისთვის O i ჯამი არის 60 და მხოლოდ 5 სიხშირის შეცვლაა შესაძლებელი დამოუკიდებლად, ამიტომ სწორი მნიშვნელობა არის n=6-1=5. n-ის ამ მნიშვნელობისთვის მივიღებთ n +2∙(2n) ½ =5+2∙(10) ½ =11.3. ვინაიდან 15.4>11.3, მაშინ ჰიპოთეზა H 0 - კამათელი სწორია, უარყოფილი უნდა იყოს.

შეცდომის გარკვევის შემდეგ, არსებული χ 2 ცხრილები უნდა დაემატოს, რადგან თავდაპირველად მათში არ იყო შემთხვევა n = 1, რადგან ციფრების უმცირესი რაოდენობა = 2. ახლა აღმოჩნდა, რომ შეიძლება იყოს შემთხვევები, როდესაც პირსონის მანძილს აქვს განაწილება χ 2 n =1.

მაგალითი. მონეტის 100 გადაყრისას გერბების რაოდენობაა O 1 = 65, ხოლო კუდები O 2 = 35. ციფრების რაოდენობა M = 2. თუ მონეტა სიმეტრიულია, მაშინ მოსალოდნელი სიხშირეებია E 1 =50, E 2 =50.

X 2 პირსონი = (O i -E i) 2 / E i \u003d (65-50) 2 / 50 + (35-50) 2 / 50 \u003d 2 * 225/50 \u003d 9.

მიღებული მნიშვნელობა უნდა შევადაროთ იმას, რისი აღებაც შემთხვევით ცვლადს χ 2 n =1 შეუძლია, განისაზღვრება, როგორც სტანდარტული ნორმალური მნიშვნელობის კვადრატი χ 2 n =1 =T 1 2 ≥ 9 ó T 1 ≥3 ან T 1 ≤-3. ასეთი მოვლენის ალბათობა ძალიან მცირეა P (χ 2 n =1 ≥9) = 0,006. აქედან გამომდინარე, მონეტა არ შეიძლება ჩაითვალოს სიმეტრიულად: H 0 უნდა იყოს უარყოფილი. ის, რომ თავისუფლების გრადუსების რაოდენობა არ შეიძლება იყოს ბიტების რაოდენობის ტოლი, ჩანს იქიდან, რომ დაკვირვებული სიხშირეების ჯამი ყოველთვის უდრის მოსალოდნელთა ჯამს, მაგალითად O 1 +O 2 =65. +35 = E 1 +E 2 =50+50=100. ამრიგად, შემთხვევითი წერტილები კოორდინატებით O 1 და O 2 განლაგებულია სწორ ხაზზე: O 1 + O 2 \u003d E 1 + E 2 \u003d 100 და მანძილი ცენტრამდე აღმოჩნდება ნაკლები, ვიდრე ეს შეზღუდვა არ ყოფილიყო იქ და ისინი მდებარეობდნენ მთელ თვითმფრინავზე. მართლაც, ორი დამოუკიდებელი შემთხვევითი ცვლადისთვის მათემატიკური მოლოდინებით E 1 =50, E 2 =50, მათი რეალიზაციის ჯამი ყოველთვის არ უნდა იყოს 100-ის ტოლი - მაგალითად, მნიშვნელობები O 1 =60, O 2 =55 იქნება. იყოს მისაღები.

ახსნა. მოდით შევადაროთ პირსონის კრიტერიუმის შედეგი M = 2-ით რასაც მოივრე-ლაპლასის ფორმულა გვაძლევს მოვლენის დადგომის სიხშირის შემთხვევითი რყევების შეფასებისას ν =K /N, რომელსაც აქვს p ალბათობა N დამოუკიდებელი ბერნულის ცდების სერიაში ( K არის წარმატებების რაოდენობა):

χ 2 n =1 = (O i -E i) 2 / E i \u003d (O 1 -E 1) 2 / E 1 + (O 2 -E 2) 2 / E 2 \u003d (Nν -Np) 2 / (Np) + ( N (1-ν)-N (1-p)) 2 /(N (1-p))=

=(Nν-Np) 2 (1/p + 1/(1-p))/N=(Nν-Np) 2 /(Np(1-p))=((K-Np)/(Npq) ½ ) 2 = T 2

მნიშვნელობა T \u003d (K -Np) / (Npq) ½ \u003d (K -m (K)) / σ (K) ≈ N (0.1) σ (K) \u003d (Npq) ½ ≥3. ჩვენ ვხედავთ, რომ ამ შემთხვევაში პირსონის შედეგი ზუსტად იგივეა, რაც მიღებული ნორმალური მიახლოების გამოყენებით ბინომალურ განაწილებაზე.

აქამდე ჩვენ განვიხილეთ მარტივი ჰიპოთეზები, რომელთა მოსალოდნელი საშუალო სიხშირეები E i წინასწარ სრულიად ცნობილია. იხილეთ ქვემოთ, თუ როგორ უნდა აირჩიოთ თავისუფლების ხარისხის სწორი რაოდენობა რთული ჰიპოთეზებისთვის.

Chi-Square ტესტის გამოყენება რთული ჰიპოთეზების შესამოწმებლად

სწორი კამათლისა და მონეტის მაგალითებში მოსალოდნელი სიხშირეების დადგენა შესაძლებელია ექსპერიმენტამდე(!). ასეთ ჰიპოთეზებს „მარტივს“ უწოდებენ. პრაქტიკაში უფრო ხშირია „კომპლექსური ჰიპოთეზები“. ამავდროულად, მოსალოდნელი E i სიხშირეების მოსაძებნად, ჯერ უნდა შეფასდეს ერთი ან რამდენიმე რაოდენობა (მოდელის პარამეტრები) და ეს შეიძლება გაკეთდეს მხოლოდ ექსპერიმენტული მონაცემების გამოყენებით. შედეგად, "რთული ჰიპოთეზებისთვის", მოსალოდნელი სიხშირეები E i აღმოჩნდება დამოკიდებული დაკვირვებულ O i სიხშირეებზე და, შესაბამისად, თავად ხდება შემთხვევითი ცვლადები, რომლებიც იცვლება ექსპერიმენტის შედეგების მიხედვით. პარამეტრების დაყენების პროცესში მცირდება პირსონის მანძილი - პარამეტრების შერჩევა ხდება ისე, რომ გაუმჯობესდეს შეთანხმება მოდელსა და ექსპერიმენტს შორის. ამიტომ, თავისუფლების ხარისხების რაოდენობა უნდა შემცირდეს.

როგორ შევაფასოთ მოდელის პარამეტრები? არსებობს შეფასების მრავალი განსხვავებული მეთოდი - „მაქსიმალური ალბათობის მეთოდი“, „მომენტების მეთოდი“, „ჩანაცვლების მეთოდი“. თუმცა, შესაძლებელია არ ჩავრთოთ დამატებითი სახსრები და მოიძიოთ პარამეტრების შეფასებები პირსონის მანძილის მინიმიზაციის გზით. კომპიუტერამდელ ეპოქაში ეს მიდგომა იშვიათად გამოიყენებოდა: ის არასასიამოვნოა ხელით გამოთვლებისთვის და, როგორც წესი, არ ექვემდებარება ანალიტიკურ გადაწყვეტას. კომპიუტერზე გაანგარიშებისას რიცხვითი მინიმიზაცია ჩვეულებრივ მარტივად ხორციელდება და ამ მეთოდის უპირატესობა მისი უნივერსალურობაა. ასე რომ, "chi-square მინიმიზაციის მეთოდის" მიხედვით, ჩვენ ვირჩევთ უცნობი პარამეტრების მნიშვნელობებს ისე, რომ Pearson მანძილი გახდეს ყველაზე პატარა. (სხვათა შორის, ამ მანძილის ცვლილებების შესწავლისას აღმოჩენილ მინიმუმთან შედარებით მცირე ცვლილებით, შეიძლება შეფასდეს შეფასების სიზუსტის საზომი: შეადგინეთ ნდობის ინტერვალები.) პარამეტრების და თავად ამ მინიმალური მანძილის აღმოჩენის შემდეგ, კვლავ აუცილებელია პასუხის გაცემა კითხვაზე, არის თუ არა ის საკმარისად მცირე.

მოქმედებების ზოგადი თანმიმდევრობა ასეთია:

  1. მოდელის არჩევანი (ჰიპოთეზები H 0).
  2. ციფრების არჩევა და დაკვირვებული სიხშირეების ვექტორის განსაზღვრა O i.
  3. მოდელის უცნობი პარამეტრების შეფასება და მათთვის ნდობის ინტერვალების აგება (მაგალითად, პირსონის მანძილის მინიმალური ძიებით).
  4. მოსალოდნელი სიხშირეების გამოთვლა E i.
  5. პირსონის მანძილის X 2 აღმოჩენილი მნიშვნელობის შედარება chi-square χ 2 კრიტის კრიტიკულ მნიშვნელობასთან - ყველაზე დიდი, რომელიც ჯერ კიდევ ითვლება დამაჯერებლად, თავსებადია H 0-თან. მნიშვნელობა, χ 2 კრიტი, ვპოულობთ ცხრილებიდან, განტოლების ამოხსნით

P (χ 2 n > χ 2 კრიტი) = 1-α,

სადაც α არის „მნიშვნელობის დონე“ ან „ტესტის ზომა“ ან „I ტიპის შეცდომის მნიშვნელობა“ (ტიპიური მნიშვნელობა α=0.05).

ჩვეულებრივ, n თავისუფლების გრადუსების რაოდენობა გამოითვლება ფორმულით

n = (ციფრთა რაოდენობა) – 1 – (შეფასებული პარამეტრების რაოდენობა)

თუ X 2 > χ 2 კრიტი, მაშინ ჰიპოთეზა H 0 უარყოფილია, წინააღმდეგ შემთხვევაში იგი მიიღება. α∙100% შემთხვევაში (ანუ საკმაოდ იშვიათად), H 0-ის შემოწმების ეს გზა გამოიწვევს „პირველი ტიპის შეცდომას“: ჰიპოთეზა H 0 უარყოფილი იქნება შეცდომით.

მაგალითი. 100 თესლისგან შემდგარი 10 სერიის შესწავლისას დაითვალა მწვანეთვალება ბუზების შემოტევების რაოდენობა. მიღებული მონაცემები: O i =(16, 18, 11, 18, 21, 10, 20, 18, 17, 21);

აქ მოსალოდნელი სიხშირეების ვექტორი წინასწარ უცნობია. თუ მონაცემები ერთგვაროვანია და მიღებულია ბინომალური განაწილებისთვის, მაშინ უცნობია ერთი პარამეტრი - ინფიცირებული თესლის პროპორცია p. გაითვალისწინეთ, რომ თავდაპირველ ცხრილში, ფაქტობრივად, არის არა 10, არამედ 20 სიხშირე, რომელიც აკმაყოფილებს 10 ბმულს: 16+84=100, ... 21+79=100.

X 2 \u003d (16-100p) 2 / 100p + (84-100 (1-p)) 2 / (100 (1-p)) + ... +

(21-100p) 2 /100p +(79-100(1-p)) 2 /(100(1-p))

ტერმინების წყვილებში გაერთიანებისას (როგორც მაგალითში მონეტასთან ერთად), ვიღებთ პირსონის კრიტერიუმის ჩაწერის ფორმას, რომელიც ჩვეულებრივ იწერება დაუყოვნებლივ:

X 2 \u003d (16-100p) 2 / (100p (1-p)) + ... + (21-100p) 2 / (100p (1-p)).

ახლა, თუ გამოვიყენებთ პირსონის მინიმალურ მანძილს, როგორც p შეფასების მეთოდს, მაშინ უნდა ვიპოვოთ p, რომლისთვისაც X 2 =min. (მოდელი ცდილობს, თუ ეს შესაძლებელია, „მოარგოს“ ექსპერიმენტულ მონაცემებს.)

პირსონის კრიტერიუმი ყველაზე უნივერსალურია სტატისტიკაში გამოყენებულ ყველა კრიტერიუმს შორის. მისი გამოყენება შესაძლებელია ერთგანზომილებიან და მრავალგანზომილებიან მონაცემებზე, რაოდენობრივ და ხარისხობრივ მახასიათებლებზე. თუმცა, სწორედ უნივერსალურობის გამო უნდა იყოს ფრთხილად, რომ შეცდომა არ დაუშვას.

მნიშვნელოვანი პუნქტები

1. წოდებების არჩევა.

  • თუ განაწილება დისკრეტულია, მაშინ, როგორც წესი, არ არის თვითნებობა ციფრების არჩევისას.
  • თუ განაწილება უწყვეტია, მაშინ თვითნებობა გარდაუვალია. შეგიძლიათ გამოიყენოთ სტატისტიკურად ექვივალენტური ბლოკები (ყველა O იგივეა, მაგალითად =10). ამ შემთხვევაში, ინტერვალების სიგრძე განსხვავებულია. ხელით გამოთვლებში ისინი ცდილობდნენ ინტერვალები ერთნაირი ყოფილიყო. ერთგანზომილებიანი მახასიათებლის განაწილების კვლევისას ინტერვალები თანაბარი უნდა იყოს? არა.
  • აუცილებელია ბიტების გაერთიანება ისე, რომ მოსალოდნელი (არ შეინიშნება!) სიხშირეები აღმოჩნდეს არც თუ ისე მცირე (≥5). შეგახსენებთ, რომ X 2-ის გამოთვლისას სწორედ ისინი არიან (E i) მნიშვნელებში! ერთგანზომილებიანი მახასიათებლების ანალიზისას დასაშვებია ამ წესის დარღვევა ორ უკიდურეს ბიტში E 1 =E max =1. თუ ბიტების რაოდენობა დიდია და მოსალოდნელი სიხშირეები ახლოსაა, მაშინ X 2 უახლოვდება χ 2-ს E i =2-ისთვისაც კი.

პარამეტრის შეფასება. „თვითნაკეთი“, არაეფექტური შეფასების მეთოდების გამოყენებამ შეიძლება გამოიწვიოს პირსონის მანძილის გადაჭარბებული მნიშვნელობები.

თავისუფლების გრადუსების სწორი რაოდენობის არჩევა. თუ პარამეტრის შეფასება ხდება არა სიხშირეებიდან, არამედ უშუალოდ მონაცემებიდან (მაგალითად, საშუალო არითმეტიკული აღებულია როგორც საშუალო შეფასება), მაშინ უცნობია n თავისუფლების გრადუსების ზუსტი რაოდენობა. ჩვენ მხოლოდ ვიცით, რომ ის აკმაყოფილებს უთანასწორობას:

(ციფრების რაოდენობა - 1 - სავარაუდო პარამეტრების რაოდენობა)< n < (число разрядов – 1)

აქედან გამომდინარე, აუცილებელია X 2 შედარება კრიტიკულ მნიშვნელობებთან χ 2 კრიტი, რომელიც გამოითვლება n-ის მთელ დიაპაზონში.

როგორ განვსაზღვროთ წარმოუდგენლად მცირე chi-კვადრატის მნიშვნელობები?უნდა ჩაითვალოს თუ არა მონეტა სიმეტრიულად, თუ 10000 გადაყრის შემდეგ მას 5000 გერბი აქვს? ადრე, ბევრი სტატისტიკოსი თვლიდა, რომ H 0 ასევე უნდა იქნას უარყოფილი ამ შემთხვევაში. ახლა სხვა მიდგომაა შემოთავაზებული: მივიღოთ H 0, მაგრამ დაექვემდებაროს მონაცემები და მათი ანალიზის მეთოდი დამატებით შემოწმებას. არსებობს ორი შესაძლებლობა: ან პირსონის ძალიან მცირე მანძილი ნიშნავს, რომ მოდელის პარამეტრების რაოდენობის ზრდას არ ახლდა თავისუფლების ხარისხების სათანადო შემცირება, ან თავად მონაცემები გაყალბდა (შესაძლოა უნებლიეთ მორგებული იყო მოსალოდნელ შედეგზე. ).

მაგალითი.ორმა მკვლევარმა A და B გამოთვალა რეცესიული ჰომოზიგოტების aa პროპორცია მეორე თაობაში AA * aa მონოჰიბრიდულ ჯვარში. მენდელის კანონების მიხედვით, ეს პროპორცია არის 0,25. თითოეულმა მკვლევარმა ჩაატარა 5 ექსპერიმენტი და თითოეულ ექსპერიმენტში შეისწავლეს 100 ორგანიზმი.

შედეგები A: 25, 24, 26, 25, 24. მკვლევარის დასკვნა: მენდელის კანონი მოქმედებს (?).

შედეგები B: 29, 21, 23, 30, 19. მკვლევარის დასკვნა: მენდელის კანონი არ არის მართებული (?).

თუმცა, მენდელის კანონი სტატისტიკური ხასიათისაა და შედეგების რაოდენობრივი ანალიზი აბრუნებს დასკვნებს! ხუთი ექსპერიმენტის ერთში შერწყმით, ჩვენ მივდივართ ჩი-კვადრატის განაწილებამდე 5 გრადუსიანი თავისუფლებით (შემოწმებულია მარტივი ჰიპოთეზა):

X 2 A = ((25-25) 2 +(24-25) 2 +(26-25) 2 +(25-25) 2 +(24-25) 2)/(100∙0.25∙0.75)=0.16

X 2 B = ((29-25) 2 +(21-25) 2 +(23-25) 2 +(30-25) 2 +(19-25) 2)/(100∙0.25∙0.75)=5.17

საშუალო მნიშვნელობა m [χ 2 n =5 ]=5, სტანდარტული გადახრა σ[χ 2 n =5 ]=(2∙5) 1/2 =3.2.

ამიტომ, ცხრილების მითითების გარეშე, ცხადია, რომ X 2 B-ის მნიშვნელობა ტიპიურია, ხოლო X 2 A-ს მნიშვნელობა წარმოუდგენლად მცირეა. P ცხრილების მიხედვით (χ 2 n =5<0.16)<0.0001.

ეს მაგალითი არის რეალური შემთხვევის ადაპტაცია, რომელიც მოხდა 1930-იან წლებში (იხ. კოლმოგოროვის ნაშრომი „მენდელის კანონების კიდევ ერთი მტკიცებულების შესახებ“). საინტერესოა, რომ მკვლევარი A იყო გენეტიკის მომხრე, ხოლო მკვლევარი B წინააღმდეგი იყო.

ნოტაციის დაბნეულობა.აუცილებელია პირსონის მანძილის გარჩევა, რომელიც საჭიროებს დამატებით შეთანხმებებს მის გამოთვლაში, შემთხვევითი ცვლადის chi-კვადრატის მათემატიკური კონცეფციისგან. პირსონის მანძილს გარკვეულ პირობებში აქვს განაწილება ახლოს chi-კვადრატთან თავისუფლების n გრადუსით. ამიტომ, სასურველია, პირსონის მანძილი არ აღვნიშნოთ χ 2 n-ით, არამედ გამოვიყენოთ მსგავსი, მაგრამ განსხვავებული აღნიშვნა X 2-ისთვის.

პირსონის კრიტერიუმი არ არის ყოვლისშემძლე.არსებობს უსასრულო რაოდენობის ალტერნატივა H 0-სთვის, რომლის გათვალისწინებაც მას არ შეუძლია. მოდით შეამოწმოთ ჰიპოთეზა, რომ მახასიათებელს ჰქონდა ერთიანი განაწილება, თქვენ გაქვთ 10 ციფრი და დაკვირვებული სიხშირეების ვექტორი არის (130,125,121,118,116,115,114,113,111,110). პირსონის კრიტერიუმი ვერ "შენიშნავს", რომ სიხშირეები მონოტონურად მცირდება და H 0 არ იქნება უარყოფილი. თუ მას დაემატა სერიების კრიტერიუმი, მაშინ დიახ!

განიხილეთ განაცხადიᲥᲐᲚᲑᲐᲢᲝᲜᲘEXCELპირსონის ჩი-კვადრატის ტესტი მარტივი ჰიპოთეზების შესამოწმებლად.

ექსპერიმენტული მონაცემების მიღების შემდეგ (ანუ როცა არის გარკვეული ნიმუში) ჩვეულებრივ არჩეულია განაწილების კანონი, რომელიც საუკეთესოდ აღწერს მოცემულით წარმოდგენილ შემთხვევით ცვლადს სინჯის აღება. იმის შემოწმება, თუ რამდენად კარგად არის აღწერილი ექსპერიმენტული მონაცემები არჩეული თეორიული განაწილების კანონით, ხორციელდება გამოყენებით თანხმობის კრიტერიუმები. ნულოვანი ჰიპოთეზა, ჩვეულებრივ, არსებობს ჰიპოთეზა, რომ შემთხვევითი ცვლადის განაწილება უდრის რაღაც თეორიულ კანონს.

ჯერ მოდით შევხედოთ აპლიკაციას პირსონის სიკეთის ტესტი X 2 (chi-კვადრატი)მარტივ ჰიპოთეზებთან მიმართებაში (თეორიული განაწილების პარამეტრები ცნობილი ვარაუდობენ). შემდეგ - , როდესაც მითითებულია მხოლოდ განაწილების ფორმა და ამ განაწილების პარამეტრები და მნიშვნელობა სტატისტიკა X 2 ფასდება/გამოითვლება იმავეს საფუძველზე ნიმუშები.

შენიშვნა: ინგლისურენოვან ლიტერატურაში განაცხადის პროცედურა პირსონის სიკეთის ტესტი X 2 აქვს სახელი მორგების ჩი-კვადრატის სიკეთის ტესტი.

გავიხსენოთ ჰიპოთეზების ტესტირების პროცედურა:

  • დაფუძნებული ნიმუშებიღირებულება გამოითვლება სტატისტიკა, რომელიც შეესაბამება შესამოწმებელი ჰიპოთეზის ტიპს. მაგალითად, გამოსაყენებლად - სტატისტიკა(თუ არ არის ცნობილი);
  • სიმართლეს ექვემდებარება ნულოვანი ჰიპოთეზა, განაწილება ამ სტატისტიკაცნობილია და შეიძლება გამოყენებულ იქნას ალბათობების გამოსათვლელად (მაგალითად, ამისთვის - სტატისტიკაეს);
  • გამოითვლება საფუძველზე ნიმუშებიმნიშვნელობა სტატისტიკამოცემული მნიშვნელობის კრიტიკულ მნიშვნელობასთან შედარებით ();
  • ნულოვანი ჰიპოთეზაუარყოფილია თუ მნიშვნელობა სტატისტიკაკრიტიკულზე მეტი (ან თუ ამ მნიშვნელობის მიღების ალბათობა სტატისტიკა() უფრო პატარა მნიშვნელობის დონე, რაც ექვივალენტური მიდგომაა).

დავხარჯოთ ჰიპოთეზის ტესტირებასხვადასხვა განაწილებისთვის.

დისკრეტული საქმე

დავუშვათ, ორი ადამიანი თამაშობს კამათელს. თითოეულ მოთამაშეს აქვს კამათლების საკუთარი ნაკრები. მოთამაშეები რიგრიგობით აგორებენ 3 კამათელს ერთდროულად. თითოეულ რაუნდს იგებს ის, ვინც ერთდროულად ათამაშებს მეტ ექვსს. შედეგები ჩაწერილია. ერთ-ერთ მოთამაშეს 100 ტურის შემდეგ გაუჩნდა ეჭვი, რომ მეტოქის ძვლები არ იყო სიმეტრიული, რადგან. ის ხშირად იგებს (ხშირად ისვრის ექვსს). მან გადაწყვიტა გაეანალიზებინა, რამდენად სავარაუდოა მოწინააღმდეგის შედეგების ასეთი რაოდენობა.

შენიშვნა: იმიტომ 3 კამათელი, შემდეგ შეგიძლიათ გააგოროთ 0 ერთდროულად; ერთი; 2 ან 3 ექვსიანი, ე.ი. შემთხვევით ცვლადს შეუძლია მიიღოს 4 მნიშვნელობა.

ალბათობის თეორიიდან ვიცით, რომ თუ კუბები სიმეტრიულია, მაშინ ემორჩილება ექვსის ამოვარდნის ალბათობა. ამიტომ, 100 რაუნდის შემდეგ, ექვსის სიხშირე შეიძლება გამოითვალოს ფორმულის გამოყენებით
=BINOM.DIST(A7,3,1/6,FALSE)*100

ფორმულა ვარაუდობს, რომ უჯრედი A7 შეიცავს ერთ რაუნდში ჩავარდნილ ექვსეულების შესაბამის რაოდენობას.

შენიშვნა: გამოთვლები მოცემულია ფაილის მაგალითი ფურცელზე დისკრეტული.

Შესადარებლად დააკვირდა(დაკვირვებული) და თეორიული სიხშირეები(მოსალოდნელი) მოსახერხებელი გამოსაყენებლად.

დაკვირვებული სიხშირეების მნიშვნელოვანი გადახრით თეორიული განაწილებიდან, ნულოვანი ჰიპოთეზაშემთხვევითი ცვლადის განაწილების შესახებ თეორიული კანონის მიხედვით, უარყოფილი უნდა იყოს. ანუ, თუ მოწინააღმდეგის კამათლები არ არის სიმეტრიული, მაშინ დაკვირვებული სიხშირეები "მნიშვნელოვნად განსხვავდება" ბინომალური განაწილება.

ჩვენს შემთხვევაში, ერთი შეხედვით, სიხშირეები საკმაოდ ახლოსაა და გათვლების გარეშე ძნელია ცალსახა დასკვნის გაკეთება. გამოიყენება პირსონის სიკეთის ტესტი X 2, ისე რომ სუბიექტური განცხადების ნაცვლად „მნიშვნელოვნად განსხვავებული“, რომელიც შეიძლება გაკეთდეს შედარების საფუძველზე ჰისტოგრამები, გამოიყენეთ მათემატიკურად სწორი დებულება.

გამოვიყენოთ ის ფაქტი, რომ დიდი რიცხვების კანონიდაკვირვებული სიხშირე (დაკვირვებული) მოცულობის მატებასთან ერთად ნიმუშები n მიდრეკილია თეორიული კანონის შესაბამისი ალბათობისკენ (ჩვენს შემთხვევაში, ბინომალური კანონი). ჩვენს შემთხვევაში, ნიმუშის ზომა n არის 100.

წარმოგიდგინოთ ტესტი სტატისტიკა, რომელსაც აღვნიშნავთ X 2-ით:

სადაც O l არის მოვლენების დაკვირვებული სიხშირე, რომლითაც შემთხვევითმა ცვლადმა მიიღო გარკვეული მისაღები მნიშვნელობები, E l არის შესაბამისი თეორიული სიხშირე (მოსალოდნელი). L არის მნიშვნელობების რაოდენობა, რომელიც შეიძლება მიიღოს შემთხვევითმა ცვლადმა (ჩვენს შემთხვევაში ის უდრის 4-ს).

როგორც ფორმულიდან ჩანს, ეს სტატისტიკაარის დაკვირვებული სიხშირეების თეორიულთან სიახლოვის საზომი, ე.ი. ის შეიძლება გამოყენებულ იქნას ამ სიხშირეებს შორის "მანძილების" შესაფასებლად. თუ ამ "მანძილების" ჯამი "ზედმეტად დიდია", მაშინ ეს სიხშირეები "არსებითად განსხვავებულია". ნათელია, რომ თუ ჩვენი კუბი სიმეტრიულია (ე.ი. გამოიყენება ბინომალური კანონი), მაშინ ალბათობა იმისა, რომ "დისტანციების" ჯამი "ძალიან დიდი" იქნება მცირე. ამ ალბათობის გამოსათვლელად, ჩვენ უნდა ვიცოდეთ განაწილება სტატისტიკა X 2 ( სტატისტიკა X 2 გამოითვლება შემთხვევითობის საფუძველზე ნიმუშებიასე რომ, ეს არის შემთხვევითი ცვლადი და, შესაბამისად, აქვს საკუთარი ალბათობის განაწილება).

მრავალგანზომილებიანი ანალოგიდან მოივრე-ლაპლასის ინტეგრალური თეორემაცნობილია, რომ n->∞-ისთვის ჩვენი შემთხვევითი ცვლადი X 2 ასიმპტომურად არის L - 1 გრადუსიანი თავისუფლებით.

ასე რომ, თუ გამოთვლილი მნიშვნელობა სტატისტიკა X 2 (სიხშირეებს შორის „მანძილების“ ჯამი) იქნება გარკვეულ ზღვრულ მნიშვნელობაზე მეტი, მაშინ გვექნება უარის მიზეზი. ნულოვანი ჰიპოთეზა. როგორც შემოწმებაში პარამეტრული ჰიპოთეზები, ზღვრული მნიშვნელობა დაყენებულია მეშვეობით მნიშვნელობის დონე. თუ ალბათობა იმისა, რომ სტატისტიკა X 2 მიიღებს გამოთვლილზე ნაკლები ან ტოლი მნიშვნელობას ( გვ- მნიშვნელობა) ნაკლები იქნება მნიშვნელობის დონე, მაშინ ნულოვანი ჰიპოთეზაშეიძლება უარი თქვას.

ჩვენს შემთხვევაში, სტატისტიკური მნიშვნელობა არის 22.757. ალბათობა იმისა, რომ X 2 სტატისტიკა მიიღებს 22,757-ზე მეტ ან ტოლ მნიშვნელობას, არის ძალიან მცირე (0,000045) და შეიძლება გამოითვალოს ფორმულების გამოყენებით
=XI2.DIST.PX(22757;4-1)ან
=XI2.TEST(დაკვირვებული; მოსალოდნელი)

შენიშვნა: CH2.TEST() ფუნქცია სპეციალურად შექმნილია ორ კატეგორიულ ცვლადს შორის კავშირის შესამოწმებლად (იხ.).

0.000045-ის ალბათობა ჩვეულებრივზე საგრძნობლად ნაკლებია მნიშვნელობის დონე 0.05. ასე რომ, მოთამაშეს აქვს ყველა მიზეზი, რომ ეჭვი შეიტანოს მის მოწინააღმდეგეს არაკეთილსინდისიერებაში ( ნულოვანი ჰიპოთეზამისი პატიოსნების შესახებ უარყოფილია).

როდესაც გამოიყენება კრიტერიუმი X 2ზრუნვა უნდა იქნას მიღებული, რათა უზრუნველყოს მოცულობა ნიმუშები n იყო საკმარისად დიდი, წინააღმდეგ შემთხვევაში განაწილების მიახლოება არასწორი იქნებოდა სტატისტიკა X 2. ჩვეულებრივ მიჩნეულია, რომ ამისათვის საკმარისია დაკვირვებული სიხშირეები (დაკვირვებული) იყოს 5-ზე მეტი. თუ ეს ასე არ არის, მაშინ დაბალი სიხშირეები გაერთიანებულია ერთში ან უერთდება სხვა სიხშირეებს და საერთო ალბათობა ენიჭება კომბინირებული მნიშვნელობა და, შესაბამისად, მცირდება თავისუფლების გრადუსების რაოდენობა X 2 -განაწილება.

განაცხადის ხარისხის გასაუმჯობესებლად კრიტერიუმი X 2(), აუცილებელია დანაყოფის ინტერვალების შემცირება (გაზრდის L და, შესაბამისად, რაოდენობის გაზრდას თავისუფლების ხარისხები), თუმცა, ამას ხელს უშლის დაკვირვების რაოდენობის შეზღუდვა, რომელიც შედის თითოეულ ინტერვალში (d.b.>5).

უწყვეტი შემთხვევა

Pearson-ის სიკეთე-of-fit ტესტი X 2 ანალოგიურად შეიძლება გამოყენებულ იქნას შემთხვევაში.

განვიხილოთ ზოგიერთი სინჯის აღება, რომელიც შედგება 200 მნიშვნელობისაგან. Ნულოვანი ჰიპოთეზააცხადებს, რომ ნიმუშიდამზადებულია.

შენიშვნა: შემთხვევითი ცვლადები in ფაილის ნიმუში ფურცელზე უწყვეტიგენერირებული ფორმულის გამოყენებით =NORM.ST.INV(RAND()). ამიტომ, ახალი ღირებულებები ნიმუშებიგენერირდება ფურცლის ხელახალი გამოთვლის დროს.

არის თუ არა ხელმისაწვდომი მონაცემთა ნაკრები ადეკვატური, შეიძლება ვიზუალურად შეფასდეს.

როგორც დიაგრამიდან ხედავთ, ნიმუშის მნიშვნელობები საკმაოდ კარგად ჯდება სწორი ხაზის გასწვრივ. თუმცა, რაც შეეხება ჰიპოთეზის ტესტირებამოქმედი პირსონის სიკეთის ტესტი X 2.

ამისათვის ჩვენ ვყოფთ შემთხვევითი ცვლადის ვარიაციის დიაპაზონს ინტერვალებად 0,5 ნაბიჯით. გამოვთვალოთ დაკვირვებული და თეორიული სიხშირეები. დაკვირვებულ სიხშირეებს ვიანგარიშებთ FREQUENCY() ფუნქციით, ხოლო თეორიულებს - NORM.ST.DIST() ფუნქციით.

შენიშვნა: რაც შეეხება დისკრეტული საქმე, აუცილებელია იმის უზრუნველყოფა ნიმუშისაკმაოდ დიდი იყო და 5-ზე მეტი მნიშვნელობა დაეცა ინტერვალში.

გამოთვალეთ სტატისტიკა X 2 და შეადარეთ მოცემულის კრიტიკულ მნიშვნელობას მნიშვნელობის დონე(0.05). იმიტომ რომ შემთხვევითი ცვლადის ცვალებადობის დიაპაზონი გავყავით 10 ინტერვალად, შემდეგ თავისუფლების ხარისხი არის 9. კრიტიკული მნიშვნელობა შეიძლება გამოითვალოს ფორმულით.
\u003d XI2.INV.RH (0.05; 9) ან
\u003d XI2.OBR (1-0.05; 9)

ზემოთ მოცემული დიაგრამა აჩვენებს, რომ სტატისტიკური მნიშვნელობა არის 8.19, რაც მნიშვნელოვნად მაღალია კრიტიკულინულოვანი ჰიპოთეზაარ არის უარყოფილი.

ქვემოთ მოცემულია რომელზე ნიმუშიაიღო ნაკლებად სავარაუდო ღირებულება და საფუძველზე კრიტერიუმები პირსონის თანხმობა X 2ნულოვანი ჰიპოთეზა უარყოფილია (მიუხედავად იმისა, რომ შემთხვევითი მნიშვნელობები წარმოიქმნება ფორმულის გამოყენებით =NORM.ST.INV(RAND())უზრუნველყოფს სინჯის აღებასაწყისი სტანდარტული ნორმალური განაწილება).

Ნულოვანი ჰიპოთეზაუარყოფილია, თუმცა ვიზუალურად მონაცემები საკმაოდ ახლოსაა სწორ ხაზთან.

მაგალითად, ავიღოთ ასევე სინჯის აღება U-დან (-3; 3). ამ შემთხვევაში, გრაფიკიდანაც კი ირკვევა, რომ ნულოვანი ჰიპოთეზაუარყოფილი უნდა იყოს.

Კრიტერიუმი პირსონის თანხმობა X 2ამასაც ადასტურებს ნულოვანი ჰიპოთეზაუარყოფილი უნდა იყოს.

რუსეთის ფედერაციის განათლებისა და მეცნიერების სამინისტრო

ქალაქ ირკუტსკის განათლების ფედერალური სააგენტო

ბაიკალის სახელმწიფო ეკონომიკისა და სამართლის უნივერსიტეტი

ინფორმატიკისა და კიბერნეტიკის დეპარტამენტი

Chi-კვადრატის განაწილება და მისი გამოყენება

კოლმიკოვა ანა ანდრეევნა

მე-2 კურსის სტუდენტი

ჯგუფი IS-09-1

მიღებული მონაცემების დასამუშავებლად ვიყენებთ chi-square ტესტს.

ამისათვის ვაშენებთ ემპირიული სიხშირეების განაწილების ცხრილს, ე.ი. სიხშირეები, რომლებსაც ჩვენ ვაკვირდებით:

თეორიულად, ჩვენ ველით, რომ სიხშირეები თანაბრად გადანაწილდება, ე.ი. სიხშირე პროპორციულად გადანაწილდება ბიჭებსა და გოგოებს შორის. მოდით ავაშენოთ თეორიული სიხშირეების ცხრილი. ამისათვის გავამრავლოთ მწკრივის ჯამი სვეტის ჯამზე და მიღებული რიცხვი გავყოთ საერთო ჯამზე (ებ).


გამოთვლების შედეგად მიღებული ცხრილი ასე გამოიყურება:

χ2 \u003d ∑ (E - T)² / T

n = (R - 1), სადაც R არის ცხრილის რიგების რაოდენობა.

ჩვენს შემთხვევაში, ჩი-კვადრატი = 4.21; n = 2.

კრიტერიუმის კრიტიკული მნიშვნელობების ცხრილის მიხედვით, ჩვენ ვპოულობთ: n = 2 და შეცდომის დონე 0.05, კრიტიკული მნიშვნელობა χ2 = 5.99.

მიღებული მნიშვნელობა ნაკლებია კრიტიკულ მნიშვნელობაზე, რაც ნიშნავს, რომ ნულოვანი ჰიპოთეზა მიღებულია.

დასკვნა: მასწავლებლები არ ანიჭებენ მნიშვნელობას ბავშვის სქესს, როდესაც წერენ მის მახასიათებლებს.

დანართი

კრიტიკული განაწილების წერტილები χ2

ცხრილი 1

დასკვნა

თითქმის ყველა სპეციალობის სტუდენტები უმაღლესი მათემატიკის კურსის ბოლოს სწავლობენ განყოფილებას "ალბათობის თეორია და მათემატიკური სტატისტიკა", რეალურად ეცნობიან მხოლოდ რამდენიმე ძირითად ცნებას და შედეგებს, რომლებიც აშკარად არ არის საკმარისი პრაქტიკული მუშაობისთვის. სტუდენტები ხვდებიან კვლევის ზოგიერთ მათემატიკურ მეთოდს სპეციალურ კურსებში (მაგალითად, როგორიცაა "პროგნოზირება და ტექნიკური და ეკონომიკური დაგეგმვა", "ტექნიკური და ეკონომიკური ანალიზი", "პროდუქტის ხარისხის კონტროლი", "მარკეტინგი", "კონტროლი", "მათემატიკური მეთოდები პროგნოზირება“, „სტატისტიკა“ და ა.შ. - ეკონომიკური სპეციალობების სტუდენტების შემთხვევაში), თუმცა პრეზენტაცია უმეტეს შემთხვევაში არის ძალიან შემოკლებული და დანიშნულებით. შედეგად, გამოყენებითი სტატისტიკოსების ცოდნა არასაკმარისია.

ამიტომ ტექნიკურ უნივერსიტეტებში კურსს "გამოყენებითი სტატისტიკა" დიდი მნიშვნელობა აქვს, ხოლო ეკონომიკურ უნივერსიტეტებში - კურსს "ეკონომეტრია", ვინაიდან ეკონომეტრია, მოგეხსენებათ, არის კონკრეტული ეკონომიკური მონაცემების სტატისტიკური ანალიზი.

ალბათობის თეორია და მათემატიკური სტატისტიკა იძლევა ფუნდამენტურ ცოდნას გამოყენებითი სტატისტიკისა და ეკონომეტრიისთვის.

ისინი აუცილებელია სპეციალისტებისთვის პრაქტიკული მუშაობისთვის.

განვიხილეთ უწყვეტი ალბათური მოდელი და შევეცადე მაგალითებით მეჩვენებინა მისი გამოყენებადობა.

ბიბლიოგრაფია

1. ორლოვი ა.ი. გამოყენებითი სტატისტიკა. მ.: გამომცემლობა „გამოცდა“, 2004 წ.

2. გმურმანი ვ.ე. ალბათობის თეორია და მათემატიკური სტატისტიკა. მ.: უმაღლესი სკოლა, 1999. - 479გვ.

3. Ayvozyan S.A. ალბათობის თეორია და გამოყენებითი სტატისტიკა, ვ.1. მ.: ერთობა, 2001. - 656წ.

4. ხამიტოვი გ.პ., ვედერნიკოვა ტ.ი. ალბათობა და სტატისტიკა. ირკუტსკი: BSUEP, 2006 - 272გვ.

5. ეჟოვა ლ.ნ. ეკონომიკა. ირკუტსკი: BSUEP, 2002. - 314გვ.

6. Mosteller F. ორმოცდაათი გასართობი ალბათური პრობლემა გადაწყვეტილებებით. მ.: ნაუკა, 1975. - 111გვ.

7. Mosteller F. ალბათობა. M.: Mir, 1969. - 428s.

8. იაგლომი ა.მ. ალბათობა და ინფორმაცია. მ.: ნაუკა, 1973. - 511გვ.

9. ჩისტიაკოვი ვ.პ. ალბათობის კურსი. მ.: ნაუკა, 1982. - 256გვ.

10. კრემერი ნ.შ. ალბათობის თეორია და მათემატიკური სტატისტიკა. M.: UNITI, 2000. - 543გვ.

11. მათემატიკური ენციკლოპედია, ტ.1. მ.: საბჭოთა ენციკლოპედია, 1976. - 655გვ.

12. http://psystat.at.ua/ - სტატისტიკა ფსიქოლოგიასა და პედაგოგიკაში. მუხლი Chi-square ტესტი.

ამ კრიტერიუმის გამოყენება ეფუძნება თეორიულ შეუსაბამობის ასეთი საზომის (სტატისტიკის) გამოყენებას. (x) და ემპირიული განაწილება * (x) , რომელიც დაახლოებით ემორჩილება განაწილების კანონს χ 2 . ჰიპოთეზა 0 განაწილების თანმიმდევრულობა მოწმდება ამ სტატისტიკის განაწილების ანალიზით. კრიტერიუმის გამოყენება მოითხოვს სტატისტიკური სერიის აგებას.

ასე რომ, მოდით ნიმუში წარმოდგენილი იყოს სტატისტიკური მწკრივით ციფრების რაოდენობით . დაფიქსირდა დარტყმის მაჩვენებელი შიგნით მე- წოდება მე. თეორიული განაწილების კანონის შესაბამისად, დარტყმების მოსალოდნელი სიხშირე მე- ეს ციფრია მე. განსხვავება დაკვირვებულ და მოსალოდნელ სიხშირეს შორის იქნება მნიშვნელობა ( მე მე). მათ შორის შეუსაბამობის საერთო ხარისხის დასადგენად (x) და * (x) აუცილებელია გამოვთვალოთ კვადრატული სხვაობების შეწონილი ჯამი სტატისტიკური სერიის ყველა ციფრისთვის

χ მნიშვნელობა 2 შეუზღუდავი გადიდებით აქვს χ 2 -განაწილება (ასიმპტომურად განაწილებული, როგორც χ 2). ეს განაწილება დამოკიდებულია თავისუფლების ხარისხების რაოდენობაზე , ე.ი. ტერმინების დამოუკიდებელი მნიშვნელობების რაოდენობა გამოხატულებაში (3.7). თავისუფლების გრადუსების რაოდენობა რიცხვის ტოლია ნიმუშზე დაწესებული ხაზოვანი ბმულების რაოდენობის გამოკლებით. ერთი კავშირი არსებობს იმის გამო, რომ ნებისმიერი სიხშირე შეიძლება გამოითვალოს დანარჩენში სიხშირეების სიმრავლიდან - 1 ციფრი. გარდა ამისა, თუ განაწილების პარამეტრები წინასწარ არ არის ცნობილი, მაშინ არსებობს კიდევ ერთი შეზღუდვა ნიმუშზე განაწილების მორგების გამო. თუ ნიმუში განსაზღვრავს განაწილების პარამეტრები, მაშინ იქნება თავისუფლების გრადუსების რაოდენობა = –1.

ჰიპოთეზის მიღების სფერო 0 განისაზღვრება პირობით χ 2 < χ 2 (; ) , სადაც ხ 2 (; ) არის χ2-განაწილების კრიტიკული წერტილი მნიშვნელოვნების დონით . პირველი ტიპის შეცდომის ალბათობაა II ტიპის შეცდომის ალბათობა არ შეიძლება მკაფიოდ განისაზღვროს, რადგან არსებობს დისტრიბუციის შეუსაბამობის უსასრულო რაოდენობა. ტესტის სიმძლავრე დამოკიდებულია ციფრების რაოდენობაზე და ნიმუშის ზომაზე. კრიტერიუმი რეკომენდებულია >200, განაცხადი დასაშვებია >40, სწორედ ასეთ პირობებშია კრიტერიუმი თანმიმდევრული (როგორც წესი, ის უარყოფს არასწორ ნულოვან ჰიპოთეზას).

კრიტერიუმების შემოწმების ალგორითმი

1. ააგეთ ჰისტოგრამა თანაბარი ალბათობით.

2. ჰისტოგრამის სახით წამოაყენეთ ჰიპოთეზა

0: (x) = 0 (x),

1: (x) ¹ 0 (x),

სადაც 0 (x) არის ჰიპოთეტური განაწილების კანონის ალბათობის სიმკვრივე (მაგალითად, ერთგვაროვანი, ექსპონენციალური, ნორმალური).

კომენტარი. ექსპონენციალური განაწილების კანონის ჰიპოთეზა შეიძლება წამოიჭრას, თუ ნიმუშის ყველა რიცხვი დადებითია.

3. გამოთვალეთ კრიტერიუმის მნიშვნელობა ფორმულის გამოყენებით

,

სადაც
დარტყმის სიხშირე მე-ე ინტერვალი;

გვ მე- შემთხვევითი ცვლადის მოხვედრის თეორიული ალბათობა მე- ე ინტერვალი იმ პირობით, რომ ჰიპოთეზა 0 სწორია.

გაანგარიშების ფორმულები გვ მეექსპონენციალური, ერთიანი და ნორმალური კანონების შემთხვევაში, შესაბამისად, თანაბარია.

ექსპონენციალური კანონი

. (3.8)

სადაც 1 = 0, = +¥.

ერთიანი კანონი

ნორმალური კანონი

. (3.10)

სადაც 1 = -¥, B M = +¥.

შენიშვნები. ყველა ალბათობის გამოთვლის შემდეგ გვ მეშეამოწმეთ დაკმაყოფილებულია თუ არა საკონტროლო კოეფიციენტი

ფუნქცია F( X) უცნაურია. Ф(+¥) = 1.

4. აპლიკაციის ცხრილიდან „ჩი-კვადრატი“ არჩეულია მნიშვნელობა
, სადაც a არის მოცემული მნიშვნელოვნების დონე (a = 0.05 ან a = 0.01), და - ფორმულით განსაზღვრული თავისუფლების ხარისხების რაოდენობა

= - 1 - .

Აქ - პარამეტრების რაოდენობა, რომელზედაც დამოკიდებულია არჩეული ჰიპოთეზა 0 განაწილების კანონი. ღირებულებები ერთიანი კანონისთვის ეს არის 2, ექსპონენციალურისთვის - 1, ნორმალურისთვის - 2.

5. თუ
, შემდეგ ჰიპოთეზა 0 უარყოფილია. წინააღმდეგ შემთხვევაში, მისი უარყოფის საფუძველი არ არსებობს: ალბათობით 1 - b ეს მართალია, ხოლო ალბათობით - b მცდარია, მაგრამ b-ის მნიშვნელობა უცნობია.

მაგალითი 3 . 1. c 2 კრიტერიუმის გამოყენებით წამოაყენეთ და შეამოწმეთ ჰიპოთეზა შემთხვევითი ცვლადის განაწილების კანონის შესახებ. X, ვარიაციების სერია, ინტერვალების ცხრილები და განაწილების ჰისტოგრამები, რომლებიც მოცემულია მაგალითში 1.2. მნიშვნელოვნების დონე a არის 0,05.

გადაწყვეტილება . ჰისტოგრამების ტიპზე დაყრდნობით, ჩვენ ვარაუდობთ, რომ შემთხვევითი ცვლადი Xგანაწილებულია ჩვეულებრივი კანონის მიხედვით:

0: (x) = (, ს);

1: (x) ¹ (, ს).

კრიტერიუმის ღირებულება გამოითვლება ფორმულით:

(3.11)

როგორც ზემოთ აღინიშნა, ჰიპოთეზის ტესტირებისას სასურველია გამოიყენოს თანაბარი ჰისტოგრამა. Ამ შემთხვევაში

თეორიული ალბათობები გვ მეჩვენ ვიანგარიშებთ ფორმულით (3.10). ამავე დროს, ჩვენ ვვარაუდობთ, რომ

გვ 1 = 0,5(F((-4,5245+1,7)/1,98)-F((-¥+1,7)/1,98)) = 0,5(F(-1,427) -Ф(-¥)) =

0,5(-0,845+1) = 0,078.

გვ 2 = 0.5(F((-3.8865+1.7)/1.98)-F((-4.5245+1.7)/1.98)) =

0.5(F(-1.104)+0.845) = 0.5(-0.729+0.845) = 0.058.

გვ 3 = 0,094; გვ 4 = 0,135; გვ 5 = 0,118; გვ 6 = 0,097; გვ 7 = 0,073; გვ 8 = 0,059; გვ 9 = 0,174;

გვ 10 \u003d 0.5 (Ф ((+ ¥ + 1.7) / 1.98) - Ф ((0.6932 + 1.7) / 1.98)) \u003d 0.114.

ამის შემდეგ ვამოწმებთ საკონტროლო ურთიერთობის შესრულებას

100 × (0,0062 + 0,0304 + 0,0004 + 0,0091 + 0,0028 + 0,0001 + 0,0100 +

0,0285 + 0,0315 + 0,0017) = 100 × 0,1207 = 12,07.

ამის შემდეგ ცხრილიდან "Chi - Square" ვირჩევთ კრიტიკულ მნიშვნელობას

.

როგორც
შემდეგ ჰიპოთეზა 0 მიიღება (არ არსებობს მიზეზი, რომ უარი თქვას).