ვარიაციის სერიის განმარტება. ვარიაციების სერია და მისი მახასიათებლები

ვარიაციების სერიაარის მახასიათებლის რიცხვითი მნიშვნელობების სერია.

ვარიაციის სერიის ძირითადი მახასიათებლები: v - ვარიანტი, p - მისი გაჩენის სიხშირე.

ვარიაციების სერიის სახეები:

    ვარიანტების გაჩენის სიხშირის მიხედვით: მარტივი - ვარიანტი ხდება ერთხელ, შეწონილი - ვარიანტი ხდება ორჯერ ან მეტჯერ;

    ოფციები მდებარეობის მიხედვით: რანჟირებული - ოფციონები დალაგებულია კლებადობით და ზრდის მიხედვით, არარეიტინგული - ოფციონები იწერება განსაკუთრებული თანმიმდევრობით;

    ოფციის ჯგუფებად დაჯგუფებით: დაჯგუფებული - ოფციები გაერთიანებულია ჯგუფებად, დაუჯგუფებელი - ოფციები არ არის დაჯგუფებული;

    მნიშვნელობის ოფციებით: უწყვეტი - ოფციები გამოიხატება როგორც მთელი და წილადი რიცხვი, დისკრეტული - ოფციები გამოიხატება მთელი რიცხვით, კომპლექსი - ოფციები წარმოდგენილია ფარდობითი ან საშუალო მნიშვნელობით.

საშუალო მნიშვნელობების გამოსათვლელად შედგენილია და შედგენილია ვარიაციული სერია.

ვარიაციის სერიის აღნიშვნის ფორმა:

8. საშუალო მნიშვნელობები, ტიპები, გამოთვლის მეთოდი, გამოყენება ჯანდაცვის სფეროში

საშუალო ღირებულებები- რაოდენობრივი მახასიათებლების საერთო განმაზოგადებელი მახასიათებელი. საშუალოების გამოყენება:

1. დაახასიათოს სამედიცინო დაწესებულებების მუშაობის ორგანიზაცია და შეაფასოს მათი საქმიანობა:

ა) პოლიკლინიკაში: ექიმების დატვირთვის მაჩვენებლები, ვიზიტების საშუალო რაოდენობა, ტერიტორიაზე მცხოვრებთა საშუალო რაოდენობა;

ბ) საავადმყოფოში: წლიური დღეების საშუალო რაოდენობა; საავადმყოფოში ყოფნის საშუალო ხანგრძლივობა;

გ) ჰიგიენის, ეპიდემიოლოგიის და საზოგადოებრივი ჯანმრთელობის ცენტრში: საშუალო ფართობი (ან კუბური ტევადობა) 1 ადამიანზე, საშუალო კვების სტანდარტები (ცილები, ცხიმები, ნახშირწყლები, ვიტამინები, მინერალური მარილები, კალორია), სანიტარული ნორმები და სტანდარტები და ა.შ.;

2. ფიზიკური განვითარების დახასიათება (მორფოლოგიური და ფუნქციური ძირითადი ანთროპომეტრიული მახასიათებლები);

3. კლინიკურ და ექსპერიმენტულ კვლევებში ნორმალურ და პათოლოგიურ პირობებში ორგანიზმის სამედიცინო და ფიზიოლოგიური პარამეტრების დადგენა.

4. სპეციალურ სამეცნიერო კვლევაში.

განსხვავება საშუალო მნიშვნელობებსა და ინდიკატორებს შორის:

1. კოეფიციენტები ახასიათებს ალტერნატიულ მახასიათებელს, რომელიც გვხვდება სტატისტიკური ჯგუფის მხოლოდ ზოგიერთ ნაწილში, რომელიც შეიძლება იყოს ან არ იყოს.

საშუალო მნიშვნელობები მოიცავს ნიშნებს, რომლებიც თან ახლავს გუნდის ყველა წევრს, მაგრამ სხვადასხვა ხარისხით (წონა, სიმაღლე, საავადმყოფოში მკურნალობის დღეები).

2. ხარისხობრივი მახასიათებლების გასაზომად გამოიყენება კოეფიციენტები. საშუალო მნიშვნელობები არის განსხვავებული რაოდენობრივი ნიშანთვისებები.

საშუალო ტიპები:

    საშუალო არითმეტიკული, მისი მახასიათებლები - სტანდარტული გადახრა და საშუალო შეცდომა

    რეჟიმი და მედიანა. მოდა (Mo)- შეესაბამება იმ თვისების მნიშვნელობას, რომელიც ყველაზე ხშირად გვხვდება ამ პოპულაციაში. მედიანა (მე)- ატრიბუტის მნიშვნელობა, რომელიც იკავებს მედიანურ მნიშვნელობას ამ პოპულაციაში. ის ყოფს სერიას 2 თანაბარ ნაწილად დაკვირვებების რაოდენობის მიხედვით. საშუალო არითმეტიკული მნიშვნელობა (M)- რეჟიმისა და მედიანისგან განსხვავებით, იგი ეყრდნობა ყველა დაკვირვებას, ამიტომ მნიშვნელოვანი მახასიათებელია მთელი განაწილებისთვის.

    სხვა ტიპის საშუალო, რომლებიც გამოიყენება სპეციალურ კვლევებში: ფესვის საშუალო კვადრატი, კუბური, ჰარმონიული, გეომეტრიული, პროგრესული.

Საშუალო არითმეტიკულიახასიათებს სტატისტიკური პოპულაციის საშუალო დონეს.

უბრალო სერიისთვის სადაც

∑v – ჯამის ვარიანტი,

n არის დაკვირვებების რაოდენობა.

შეწონილი სერიისთვის, სადაც

∑vr არის თითოეული ვარიანტის პროდუქციის ჯამი და მისი წარმოშობის სიხშირე

n არის დაკვირვებების რაოდენობა.

Სტანდარტული გადახრასაშუალო არითმეტიკული ან სიგმა (σ) ახასიათებს მახასიათებლის მრავალფეროვნებას

- მარტივი რიგისთვის

Σd 2 - არითმეტიკული საშუალოსა და თითოეულ ვარიანტს შორის სხვაობის კვადრატების ჯამი (d = │M-V│)

n არის დაკვირვებების რაოდენობა

- შეწონილი სერიებისთვის

∑d 2 p არის არითმეტიკული საშუალოსა და თითოეულ ვარიანტს შორის სხვაობის კვადრატების ნამრავლების ჯამი და მისი გაჩენის სიხშირე,

n არის დაკვირვებების რაოდენობა.

მრავალფეროვნების ხარისხი შეიძლება ვიმსჯელოთ ცვალებადობის კოეფიციენტის მნიშვნელობით
. 20%-ზე მეტი - ძლიერი მრავალფეროვნება, 10-20% - საშუალო მრავალფეროვნება, 10%-ზე ნაკლები - სუსტი მრავალფეროვნება.

თუ ერთი სიგმა (M ± 1σ) დაემატება და გამოვაკლდება საშუალო არითმეტიკას, მაშინ ნორმალური განაწილებით, ყველა ვარიანტის (დაკვირვების) მინიმუმ 68,3% იქნება ამ საზღვრებში, რაც ითვლება ნორმად შესასწავლი ფენომენისთვის. . თუ k 2 ± 2σ, მაშინ ყველა დაკვირვების 95,5% იქნება ამ საზღვრებში, ხოლო თუ k M ± 3σ, მაშინ ყველა დაკვირვების 99,7% იქნება ამ საზღვრებში. ამრიგად, სტანდარტული გადახრა არის სტანდარტული გადახრა, რომელიც საშუალებას გაძლევთ იწინასწარმეტყველოთ შესწავლილი მახასიათებლის ისეთი მნიშვნელობის გაჩენის ალბათობა, რომელიც არის მითითებულ საზღვრებში.

საშუალო არითმეტიკული ცდომილებაან წარმომადგენლობითი შეცდომა. მარტივი, შეწონილი სერიებისთვის და მომენტების წესით:

.

საშუალო მნიშვნელობების გამოსათვლელად აუცილებელია: მასალის ერთგვაროვნება, დაკვირვების საკმარისი რაოდენობა. თუ დაკვირვებების რაოდენობა 30-ზე ნაკლებია, σ და m გამოთვლის ფორმულებში გამოიყენება n-1.

საშუალო შეცდომის ზომით მიღებული შედეგის შეფასებისას გამოიყენება ნდობის კოეფიციენტი, რაც შესაძლებელს ხდის სწორი პასუხის ალბათობის განსაზღვრას, ანუ მიუთითებს, რომ შერჩევის შეცდომის მიღებული მნიშვნელობა არ იქნება მეტი უწყვეტი დაკვირვების შედეგად დაშვებული ფაქტობრივი შეცდომა. შესაბამისად, ნდობის ალბათობის მატებასთან ერთად იზრდება ნდობის ინტერვალის სიგანე, რაც, თავის მხრივ, ზრდის განსჯის ნდობას, მიღებული შედეგის მხარდაჭერას.

სტატისტიკურ ანალიზში განსაკუთრებული ადგილი უკავია შესწავლილი მახასიათებლის ან ფენომენის საშუალო დონის განსაზღვრას. მახასიათებლის საშუალო დონე იზომება საშუალო მნიშვნელობებით.

საშუალო მნიშვნელობა ახასიათებს შესწავლილი ნიშნის ზოგად რაოდენობრივ დონეს და წარმოადგენს სტატისტიკური პოპულაციის ჯგუფურ საკუთრებას. იგი ასუსტებს, ასუსტებს ინდივიდუალური დაკვირვებების შემთხვევით გადახრებს ამა თუ იმ მიმართულებით და ხაზს უსვამს შესასწავლი თვისების ძირითად, ტიპურ თვისებას.

საშუალოდ ფართოდ გამოიყენება:

1. მოსახლეობის ჯანმრთელობის მდგომარეობის შეფასება: ფიზიკური განვითარების მახასიათებლები (სიმაღლე, წონა, გულმკერდის გარშემოწერილობა და ა.შ.), სხვადასხვა დაავადების გავრცელების და ხანგრძლივობის განსაზღვრა, დემოგრაფიული მაჩვენებლების ანალიზი (მოსახლეობის ბუნებრივი მოძრაობა, სიცოცხლის საშუალო ხანგრძლივობა, მოსახლეობის რეპროდუქცია. საშუალო მოსახლეობა და ა.შ.).

2. სამედიცინო დაწესებულებების, სამედიცინო პერსონალის საქმიანობის შესწავლა და მათი მუშაობის ხარისხის შეფასება, მოსახლეობის საჭიროებების დაგეგმვა და განსაზღვრა სხვადასხვა სახის სამედიცინო მომსახურებაზე (წელიწადში მოთხოვნის ან ვიზიტების საშუალო რაოდენობა ერთ მოსახლეზე, ყოფნის საშუალო ხანგრძლივობა. საავადმყოფოში მყოფი პაციენტის, პაციენტის გამოკვლევის საშუალო ხანგრძლივობა, ექიმების საშუალო უზრუნველყოფა, საწოლები და ა.შ.).

3. სანიტარული და ეპიდემიოლოგიური მდგომარეობის დახასიათება (საამქროში ჰაერის საშუალო მტვრიანობა, საშუალო ფართობი ერთ ადამიანზე, ცილების, ცხიმებისა და ნახშირწყლების საშუალო მოხმარება და სხვ.).

4. ნორმასა და პათოლოგიაში სამედიცინო და ფიზიოლოგიური პარამეტრების დადგენა, ლაბორატორიული მონაცემების დამუშავებისას, სოციო-ჰიგიენურ, კლინიკურ, ექსპერიმენტულ კვლევებში შერჩევითი კვლევის შედეგების სანდოობის დადგენა.

საშუალო მნიშვნელობების გაანგარიშება ხორციელდება ვარიაციის სერიების საფუძველზე. ვარიაციების სერია- ეს არის თვისობრივად ერთგვაროვანი სტატისტიკური ნაკრები, რომლის ცალკეული ერთეულები ახასიათებს შესწავლილი მახასიათებლის ან ფენომენის რაოდენობრივ განსხვავებებს.

რაოდენობრივი ცვალებადობა შეიძლება იყოს ორი სახის: წყვეტილი (დისკრეტული) და უწყვეტი.

წყვეტილი (დისკრეტული) ნიშანი გამოიხატება მხოლოდ მთელი რიცხვის სახით და არ შეიძლება ჰქონდეს რაიმე შუალედური მნიშვნელობები (მაგალითად, ვიზიტების რაოდენობა, საიტის პოპულაცია, ოჯახში ბავშვების რაოდენობა, დაავადების სიმძიმე წერტილებში. და ა.შ.).

უწყვეტმა ნიშანმა შეიძლება მიიღოს ნებისმიერი მნიშვნელობა გარკვეული საზღვრებში, მათ შორის წილადი, და გამოიხატება მხოლოდ დაახლოებით (მაგალითად, წონა - მოზრდილებისთვის ის შეიძლება შემოიფარგლოს კილოგრამებით, ხოლო ახალშობილებისთვის - გრამებით; სიმაღლე, არტერიული წნევა, დრო. დაიხარჯა პაციენტის ნახვაზე და ა.შ.).



ვარიაციების სერიაში შემავალი თითოეული ინდივიდუალური მახასიათებლის ან ფენომენის ციფრულ მნიშვნელობას ეწოდება ვარიანტი და მითითებულია ასოებით . მათემატიკურ ლიტერატურაში სხვა აღნიშვნებიც არის, მაგალითად x ან წ.

ვარიაციულ სერიას, სადაც თითოეული ვარიანტი ერთხელ არის მითითებული, მარტივი ეწოდება.ასეთი სერიები გამოიყენება უმეტეს სტატისტიკურ ამოცანებში კომპიუტერული მონაცემების დამუშავების შემთხვევაში.

დაკვირვებების რაოდენობის მატებასთან ერთად, როგორც წესი, არსებობს ვარიანტის განმეორებითი მნიშვნელობები. ამ შემთხვევაში ის ქმნის დაჯგუფებული ვარიაციების სერია, სადაც მითითებულია გამეორებების რაოდენობა (სიხშირე, აღინიშნება ასო " »).

რანჟირებული ვარიაციების სერიაშედგება აღმავალი ან კლებადი თანმიმდევრობით დალაგებული ვარიანტებისგან. როგორც მარტივი, ისე დაჯგუფებული სერიების შედგენა შესაძლებელია რეიტინგით.

ინტერვალის ვარიაციის სერიაშედგენილია კომპიუტერის გამოყენების გარეშე შესრულებული შემდგომი გამოთვლების გასამარტივებლად, დაკვირვების ერთეულების ძალიან დიდი რაოდენობით (1000-ზე მეტი).

უწყვეტი ვარიაციის სერიამოიცავს ვარიანტების მნიშვნელობებს, რომლებიც შეიძლება იყოს ნებისმიერი მნიშვნელობა.

თუ ვარიაციის სერიაში ატრიბუტის (ვარიანტების) მნიშვნელობები მოცემულია ცალკეული კონკრეტული რიცხვების სახით, მაშინ ასეთ სერიას ე.წ. დისკრეტული.

ვარიაციის სერიაში ასახული ატრიბუტის მნიშვნელობების ზოგადი მახასიათებლები არის საშუალო მნიშვნელობები. მათ შორის ყველაზე მეტად გამოიყენება: საშუალო არითმეტიკული მ,მოდა მოდა მედიანა მე.თითოეული ეს მახასიათებელი უნიკალურია. ისინი ერთმანეთს ვერ შეცვლიან და მხოლოდ მთლიანობაში, საკმაოდ სრულად და ლაკონურ ფორმაშია ვარიაციის სერიების მახასიათებლები.

მოდა (მო) დაასახელეთ ყველაზე ხშირად არსებული ვარიანტების მნიშვნელობა.

მედიანური (მე) არის ვარიანტის მნიშვნელობა, რომელიც ყოფს დიაპაზონის ვარიაციულ სერიას შუაზე (მედიანას თითოეულ მხარეს არის ვარიანტის ნახევარი). იშვიათ შემთხვევებში, როდესაც არსებობს სიმეტრიული ვარიაციის სერია, რეჟიმი და მედიანა ერთმანეთის ტოლია და ემთხვევა საშუალო არითმეტიკული მნიშვნელობას.

ვარიანტის მნიშვნელობების ყველაზე ტიპიური მახასიათებელია საშუალო არითმეტიკულიღირებულება ( ). მათემატიკურ ლიტერატურაში აღინიშნება .

Საშუალო არითმეტიკული (მ, ) არის შესწავლილი ფენომენების გარკვეული მახასიათებლის ზოგადი რაოდენობრივი მახასიათებელი, რომლებიც ქმნიან თვისობრივად ერთგვაროვან სტატისტიკურ აგრეგატს. განასხვავებენ მარტივ არითმეტიკულ საშუალოსა და შეწონილ საშუალოს. მარტივი არითმეტიკული საშუალო გამოითვლება მარტივი ვარიაციული სერიებისთვის ყველა ვარიანტის შეჯამებით და ამ ჯამის გაყოფით ამ ვარიაციულ სერიაში შეტანილი ვარიანტების საერთო რაოდენობაზე. გამოთვლები ხორციელდება ფორმულის მიხედვით:

,

სადაც: - მარტივი არითმეტიკული საშუალო;

Σ - თანხის ვარიანტი;

- დაკვირვებების რაოდენობა.

დაჯგუფებული ვარიაციების სერიაში განისაზღვრება შეწონილი არითმეტიკული საშუალო. მისი გაანგარიშების ფორმულა:

,

სადაც: - საშუალო შეწონილი არითმეტიკული;

Σ vp - ვარიანტის პროდუქტების ჯამი მათ სიხშირეებზე;

- დაკვირვებების რაოდენობა.

ხელით გამოთვლების შემთხვევაში დაკვირვების დიდი რაოდენობით შეიძლება გამოყენებულ იქნას მომენტების მეთოდი.

საშუალო არითმეტიკას აქვს შემდეგი თვისებები:

ვარიანტის გადახრების ჯამი საშუალოდან ( Σ ) უდრის ნულს (იხ. ცხრილი 15);

ყველა ვარიანტის ერთ ფაქტორზე (გამყოფზე) გამრავლების (გაყოფისას) საშუალო არითმეტიკული მრავლდება (იყოფა) იმავე კოეფიციენტზე (გამყოფზე);

თუ ყველა ვარიანტს ერთსა და იმავე რიცხვს დაამატებთ (აკლებთ), საშუალო არითმეტიკული იგივე რიცხვით იზრდება (მცირდება).

არითმეტიკული საშუალო, თავისთავად მიღებული, სერიების ცვალებადობის გათვალისწინების გარეშე, საიდანაც ისინი გამოითვლება, შეიძლება სრულად არ ასახავდეს ვარიაციული სერიის თვისებებს, განსაკუთრებით მაშინ, როდესაც საჭიროა სხვა საშუალო მაჩვენებლებთან შედარება. საშუალო მნიშვნელობებით მიახლოებული მნიშვნელობების მიღება შესაძლებელია სერიებიდან სხვადასხვა ხარისხის გაფანტვით. რაც უფრო ახლოსაა ცალკეული ვარიანტები ერთმანეთთან მათი რაოდენობრივი მახასიათებლებით, მით ნაკლებია გაფანტვა (რყევა, ცვალებადობა)სერია, მით უფრო ტიპიურია მისი საშუალო.

ძირითადი პარამეტრები, რომლებიც საშუალებას გაძლევთ შეაფასოთ ნიშან-თვისების ცვალებადობა, არის:

· ფარგლები;

Დიაპაზონი;

· Სტანდარტული გადახრა;

· ვარიაციის კოეფიციენტი.

დაახლოებით, ნიშან-თვისების მერყეობა შეიძლება შეფასდეს ვარიაციის სერიის მასშტაბით და ამპლიტუდით. დიაპაზონი მიუთითებს სერიის მაქსიმალურ (V max) და მინიმალურ (V min) ვარიანტებს. ამპლიტუდა (A m) არის განსხვავება ამ ვარიანტებს შორის: A m = V max - V min .

ვარიაციული სერიების რყევების ძირითადი, ზოგადად მიღებული საზომია დისპერსიას ( ). მაგრამ ყველაზე მოსახერხებელი პარამეტრი ყველაზე ხშირად გამოიყენება, გამოითვლება დისპერსიის საფუძველზე - სტანდარტული გადახრა ( σ ). იგი ითვალისწინებს გადახრის მნიშვნელობას ( ) ვარიაციის სერიის თითოეული ვარიანტის არითმეტიკული საშუალოდან ( d=V - M ).

ვინაიდან ვარიანტის გადახრები საშუალოდან შეიძლება იყოს დადებითი და უარყოფითი, შეჯამებისას ისინი აძლევენ მნიშვნელობას "0" (S d=0). ამის თავიდან ასაცილებლად, გადახრის მნიშვნელობები ( ) ამაღლებულია მეორე ხარისხზე და საშუალოდ. ამრიგად, ვარიაციული სერიის ვარიაცია არის ვარიანტის გადახრების საშუალო კვადრატი არითმეტიკული საშუალოდან და გამოითვლება ფორმულით:

.

ეს არის ცვალებადობის ყველაზე მნიშვნელოვანი მახასიათებელი და გამოიყენება მრავალი სტატისტიკური ტესტის გამოსათვლელად.

იმის გამო, რომ განსხვავება გამოიხატება როგორც გადახრების კვადრატი, მისი მნიშვნელობა არ შეიძლება გამოყენებულ იქნას საშუალო არითმეტიკასთან შედარებით. ამ მიზნებისათვის იგი გამოიყენება სტანდარტული გადახრა, რომელიც აღინიშნება ნიშნით "სიგმა" ( σ ). იგი ახასიათებს ვარიაციის სერიის ყველა ვარიანტის საშუალო გადახრას არითმეტიკული საშუალოდან იმავე ერთეულებში, როგორც თავად საშუალო, ასე რომ მათი გამოყენება შესაძლებელია ერთად.

სტანდარტული გადახრა განისაზღვრება ფორმულით:

ეს ფორმულა გამოიყენება დაკვირვებების რაოდენობისთვის ( ) მეტია 30. უფრო მცირე რიცხვით სტანდარტული გადახრის მნიშვნელობას ექნება შეცდომა, რომელიც დაკავშირებულია მათემატიკურ მიკერძოებასთან ( - ერთი). ამასთან დაკავშირებით, უფრო ზუსტი შედეგის მიღება შესაძლებელია სტანდარტული გადახრის გამოთვლის ფორმულაში ასეთი მიკერძოების გათვალისწინებით:

სტანდარტული გადახრა ( ) არის შემთხვევითი ცვლადის სტანდარტული გადახრის შეფასება Xმის მათემატიკურ მოლოდინთან შედარებით, მისი დისპერსიის მიუკერძოებელი შეფასებით.

ღირებულებებისთვის > 30 სტანდარტული გადახრა ( σ ) და სტანდარტული გადახრა ( ) იგივე იქნება ( σ=ს ). ამიტომ, უმეტეს პრაქტიკულ სახელმძღვანელოებში ეს კრიტერიუმები განიხილება, როგორც განსხვავებული მნიშვნელობის მქონე. Excel-ში სტანდარტული გადახრის გამოთვლა შესაძლებელია ფუნქციით =STDEV(დიაპაზონი). და სტანდარტული გადახრის გამოსათვლელად, თქვენ უნდა შექმნათ შესაბამისი ფორმულა.

ფესვის საშუალო კვადრატი ან სტანდარტული გადახრა საშუალებას გაძლევთ განსაზღვროთ რამდენად შეიძლება განსხვავდებოდეს მახასიათებლის მნიშვნელობები საშუალო მნიშვნელობიდან. დავუშვათ, რომ არსებობს ორი ქალაქი ზაფხულში ერთი და იგივე საშუალო დღიური ტემპერატურის მქონე. ამ ქალაქებიდან ერთი მდებარეობს სანაპიროზე, მეორე კი კონტინენტზე. ცნობილია, რომ სანაპიროზე მდებარე ქალაქებში დღისით ტემპერატურის სხვაობა ნაკლებია, ვიდრე შიდა ქალაქებში. აქედან გამომდინარე, დღის ტემპერატურის სტანდარტული გადახრა ზღვისპირა ქალაქთან შედარებით ნაკლები იქნება, ვიდრე მეორე ქალაქში. პრაქტიკაში, ეს ნიშნავს, რომ კონტინენტზე მდებარე ქალაქში ყოველი კონკრეტული დღის ჰაერის საშუალო ტემპერატურა უფრო მეტად განსხვავდება საშუალო მნიშვნელობიდან, ვიდრე სანაპიროზე მდებარე ქალაქში. გარდა ამისა, სტანდარტული გადახრა შესაძლებელს ხდის შეფასდეს შესაძლო ტემპერატურის გადახრები საშუალოდან ალბათობის საჭირო დონით.

ალბათობის თეორიის მიხედვით, ფენომენებში, რომლებიც ემორჩილებიან ნორმალურ განაწილების კანონს, არსებობს მკაცრი კავშირი საშუალო არითმეტიკული მნიშვნელობების, სტანდარტული გადახრასა და ვარიანტებს შორის ( სამი სიგმის წესი). მაგალითად, ცვლადი ატრიბუტის მნიშვნელობების 68.3% არის M ± 1 ფარგლებში σ , 95.5% - M ± 2-ის ფარგლებში σ ხოლო 99,7% - M ± 3 ფარგლებში σ .

სტანდარტული გადახრის მნიშვნელობა შესაძლებელს ხდის ვიმსჯელოთ ვარიაციების სერიის და შესწავლილი ჯგუფის ჰომოგენურობის ბუნებაზე. თუ სტანდარტული გადახრის მნიშვნელობა მცირეა, მაშინ ეს მიუთითებს შესასწავლი ფენომენის საკმარისად მაღალ ჰომოგენურობაზე. საშუალო არითმეტიკული ამ შემთხვევაში უნდა იყოს აღიარებული, როგორც საკმაოდ დამახასიათებელი ამ ვარიაციული სერიის. თუმცა, ძალიან მცირე სიგმა ადამიანს აიძულებს იფიქროს დაკვირვებების ხელოვნურ შერჩევაზე. ძალიან დიდი სიგმით, საშუალო არითმეტიკული ახასიათებს ვარიაციის სერიას ნაკლებად, რაც მიუთითებს შესწავლილი ნიშან-თვისების ან ფენომენის მნიშვნელოვან ცვალებადობაზე ან საკვლევი ჯგუფის ჰეტეროგენულობაზე. თუმცა, სტანდარტული გადახრის მნიშვნელობის შედარება შესაძლებელია მხოლოდ იმავე განზომილების ნიშნებისთვის. მართლაც, თუ შევადარებთ ახალშობილთა და მოზრდილთა წონის მრავალფეროვნებას, ჩვენ ყოველთვის მივიღებთ უფრო მაღალ სიგმას მოზარდებში.

სხვადასხვა განზომილების მახასიათებლების ცვალებადობის შედარება შეიძლება განხორციელდეს გამოყენებით ვარიაციის კოეფიციენტი. იგი გამოხატავს მრავალფეროვნებას საშუალოს პროცენტულად, რაც იძლევა სხვადასხვა ნიშან-თვისებების შედარების საშუალებას. სამედიცინო ლიტერატურაში ცვალებადობის კოეფიციენტი მითითებულია ნიშნით " FROM "და მათემატიკაში" » და გამოითვლება ფორმულით:

.

ვარიაციის კოეფიციენტის მნიშვნელობები 10% -ზე ნაკლები მიუთითებს მცირე გაფანტვაზე, 10-დან 20% -მდე - საშუალოდ, 20% -ზე მეტი - არითმეტიკული საშუალოს გარშემო ძლიერი გაფანტვის შესახებ.

საშუალო არითმეტიკული ჩვეულებრივ გამოითვლება ნიმუშის მონაცემების საფუძველზე. შემთხვევითი ფენომენების გავლენის ქვეშ განმეორებითი კვლევებით, საშუალო არითმეტიკული შეიძლება შეიცვალოს. ეს გამოწვეულია იმით, რომ, როგორც წესი, დაკვირვების შესაძლო ერთეულების მხოლოდ ნაწილი, ანუ შერჩევის პოპულაცია, გამოკვლეულია. შესწავლილი ფენომენის გამომსახველი ყველა შესაძლო ერთეულის შესახებ ინფორმაციის მიღება შესაძლებელია მთლიანი პოპულაციის შესწავლით, რაც ყოველთვის არ არის შესაძლებელი. ამავდროულად, ექსპერიმენტული მონაცემების განზოგადებისთვის საინტერესოა საშუალო სიდიდე ზოგად პოპულაციაში. ამიტომ, შესასწავლი ფენომენის შესახებ ზოგადი დასკვნის ჩამოსაყალიბებლად, შერჩევის პოპულაციის საფუძველზე მიღებული შედეგები სტატისტიკური მეთოდებით უნდა გადავიდეს საერთო პოპულაციაზე.

იმისათვის, რომ დადგინდეს დამთხვევის ხარისხი სანიმუშო კვლევასა და ზოგად პოპულაციას შორის, საჭიროა შეფასდეს შეცდომის რაოდენობა, რომელიც აუცილებლად წარმოიქმნება ნიმუშის დაკვირვებისას. ასეთ შეცდომას უწოდებენ წარმომადგენლობითი შეცდომა” ან ”საშუალო არითმეტიკული ცდომილება”. ეს არის, ფაქტობრივად, განსხვავება შერჩევითი სტატისტიკური დაკვირვებით მიღებულ საშუალოებსა და მსგავს მნიშვნელობებს შორის, რომლებიც მიიღება ერთი და იგივე ობიექტის უწყვეტი შესწავლით, ე.ი. ზოგადი მოსახლეობის შესწავლისას. ვინაიდან შერჩევის საშუალო არის შემთხვევითი ცვლადი, ასეთი პროგნოზი კეთდება მკვლევარისთვის ალბათობის მისაღები დონით. სამედიცინო კვლევებში ეს არის მინიმუმ 95%.

წარმომადგენლობითობის შეცდომა არ უნდა აგვერიოს სარეგისტრაციო შეცდომებთან ან ყურადღების შეცდომებთან (არასწორი ბეჭდვა, არასწორი გამოთვლები, არასწორი ბეჭდვა და ა.შ.), რაც მინიმუმამდე უნდა იქნას დაყვანილი ექსპერიმენტში გამოყენებული ადეკვატური მეთოდოლოგიითა და ხელსაწყოებით.

წარმომადგენლობითობის შეცდომის სიდიდე დამოკიდებულია როგორც ნიმუშის ზომაზე, ასევე მახასიათებლის ცვალებადობაზე. რაც უფრო დიდია დაკვირვებების რაოდენობა, მით უფრო ახლოსაა ნიმუში საერთო პოპულაციასთან და მით უფრო მცირეა შეცდომა. რაც უფრო ცვალებადია ფუნქცია, მით მეტია სტატისტიკური შეცდომა.

პრაქტიკაში, შემდეგი ფორმულა გამოიყენება ვარიაციულ სერიებში წარმომადგენლობითი შეცდომის დასადგენად:

,

სადაც: – წარმომადგენლობითობის შეცდომა;

σ - სტანდარტული გადახრა;

არის ნიმუშში დაკვირვებების რაოდენობა.

ფორმულიდან ჩანს, რომ საშუალო შეცდომის ზომა პირდაპირპროპორციულია სტანდარტული გადახრის, ანუ შესასწავლი ნიშან-თვისების ცვალებადობისა და უკუპროპორციულია დაკვირვებების რაოდენობის კვადრატულ ფესვთან.

ფარდობითი მნიშვნელობების გაანგარიშების საფუძველზე სტატისტიკური ანალიზის ჩატარებისას, ვარიაციის სერიის აგება სავალდებულო არ არის. ამ შემთხვევაში, შედარებითი ინდიკატორების საშუალო შეცდომის დადგენა შეიძლება განხორციელდეს გამარტივებული ფორმულის გამოყენებით:

,

სადაც: - ფარდობითი ინდიკატორის მნიშვნელობა, გამოხატული პროცენტულად, ppm და ა.შ.;

- P-ის საპასუხო და გამოხატული როგორც (1-P), (100-P), (1000-P) და ა.შ., იმის მიხედვით, თუ რა საფუძველზე გამოითვლება მაჩვენებელი;

არის ნიმუშში დაკვირვებების რაოდენობა.

ამასთან, ფარდობითი მნიშვნელობებისთვის წარმომადგენლობითი შეცდომის გამოსათვლელად მითითებული ფორმულა შეიძლება გამოყენებულ იქნას მხოლოდ მაშინ, როდესაც ინდიკატორის მნიშვნელობა მის ბაზაზე ნაკლებია. ინტენსიური ინდიკატორების გამოთვლის რიგ შემთხვევებში ეს პირობა არ სრულდება და ინდიკატორი შეიძლება გამოიხატოს 100% ან 1000%o-ზე მეტი რიცხვით. ასეთ სიტუაციაში აგებულია ვარიაციის სერია და წარმომადგენლობითი შეცდომა გამოითვლება საშუალო მნიშვნელობების ფორმულის გამოყენებით, სტანდარტული გადახრის საფუძველზე.

საერთო პოპულაციაში საშუალო არითმეტიკული მნიშვნელობის პროგნოზირება ხორციელდება ორი მნიშვნელობის მითითებით - მინიმალური და მაქსიმალური. შესაძლო გადახრების ამ უკიდურეს მნიშვნელობებს, რომლის ფარგლებშიც შეიძლება მერყეობდეს საერთო პოპულაციის სასურველი საშუალო მნიშვნელობა, ეწოდება " ნდობის საზღვრები».

ალბათობის თეორიის პოსტულატებმა დაამტკიცეს, რომ მახასიათებლის ნორმალური განაწილებით 99,7% ალბათობით, საშუალოს გადახრების უკიდურესი მნიშვნელობები არ აღემატება წარმომადგენლობითობის სამმაგი შეცდომის მნიშვნელობას ( ± 3 ); 95.5% -ში - არაუმეტეს საშუალო მნიშვნელობის გაორმაგებული საშუალო ცდომილების მნიშვნელობა ( ±2 ); 68.3%-ში - არაუმეტეს ერთი საშუალო შეცდომის მნიშვნელობა ( ± 1 ) (სურ. 9).

P%

ბრინჯი. 9. ნორმალური განაწილების ალბათობის სიმკვრივე.

გაითვალისწინეთ, რომ ზემოაღნიშნული განცხადება მართალია მხოლოდ იმ მახასიათებლისთვის, რომელიც ემორჩილება გაუსის განაწილების ნორმალურ კანონს.

ექსპერიმენტული კვლევების უმეტესობა, მათ შორის მედიცინის სფეროში, დაკავშირებულია გაზომვებთან, რომელთა შედეგებს შეუძლია მიიღოს თითქმის ნებისმიერი მნიშვნელობა მოცემულ ინტერვალში, ამიტომ, როგორც წესი, ისინი აღწერილია უწყვეტი შემთხვევითი ცვლადების მოდელით. ამასთან დაკავშირებით, სტატისტიკური მეთოდების უმეტესობა ითვალისწინებს უწყვეტ განაწილებას. ერთ-ერთი ასეთი განაწილება, რომელიც ფუნდამენტურ როლს თამაშობს მათემატიკური სტატისტიკაში, არის ნორმალური, ან გაუსიანი განაწილება.

ეს გამოწვეულია მთელი რიგი მიზეზების გამო.

1. უპირველეს ყოვლისა, მრავალი ექსპერიმენტული დაკვირვება შეიძლება წარმატებით აღიწეროს ნორმალური განაწილების გამოყენებით. დაუყოვნებლივ უნდა აღინიშნოს, რომ არ არსებობს ემპირიული მონაცემების განაწილება, რომელიც იქნება ზუსტად ნორმალური, რადგან ნორმალურად განაწილებული შემთხვევითი ცვლადი არის დიაპაზონში დან მდე, რაც არასდროს ხდება პრაქტიკაში. თუმცა, ნორმალური განაწილება ძალიან ხშირად კარგი მიახლოებაა.

ტარდება თუ არა ადამიანის სხეულის წონის, სიმაღლის და სხვა ფიზიოლოგიური პარამეტრების გაზომვები - ყველგან შემთხვევითი ფაქტორების ძალიან დიდი რაოდენობა (ბუნებრივი მიზეზები და გაზომვის შეცდომები) გავლენას ახდენს შედეგებზე. და, როგორც წესი, თითოეული ამ ფაქტორის გავლენა უმნიშვნელოა. გამოცდილება გვიჩვენებს, რომ ასეთ შემთხვევებში შედეგები დაახლოებით ნორმალურად გადანაწილდება.

2. შემთხვევით ნიმუშთან დაკავშირებული მრავალი განაწილება, ამ უკანასკნელის მოცულობის მატებასთან ერთად, ხდება ნორმალური.

3. ნორმალურ განაწილებას კარგად ერგება სხვა უწყვეტი განაწილების (მაგალითად, ასიმეტრიული) მიახლოებითი აღწერა.

4. ნორმალურ განაწილებას აქვს მთელი რიგი ხელსაყრელი მათემატიკური თვისებები, რამაც დიდწილად უზრუნველყო მისი ფართო გამოყენება სტატისტიკაში.

ამავდროულად, უნდა აღინიშნოს, რომ სამედიცინო მონაცემებში არის მრავალი ექსპერიმენტული განაწილება, რომელთა აღწერა შეუძლებელია ნორმალური განაწილების მოდელით. ამისათვის სტატისტიკამ შეიმუშავა მეთოდები, რომლებსაც ჩვეულებრივ უწოდებენ "არაპარამეტრულ".

სტატისტიკური მეთოდის არჩევა, რომელიც შესაფერისია კონკრეტული ექსპერიმენტის მონაცემების დასამუშავებლად, უნდა მოხდეს იმის მიხედვით, მიეკუთვნება თუ არა მიღებული მონაცემები ნორმალურ განაწილების კანონს. ნიშნის ნორმალურ განაწილების კანონისადმი დაქვემდებარების ჰიპოთეზის ტესტირება ტარდება სიხშირის განაწილების ჰისტოგრამის (გრაფიკის), ასევე მთელი რიგი სტატისტიკური კრიტერიუმების გამოყენებით. Მათ შორის:

ასიმეტრიის კრიტერიუმი ( );

ქურტოზის შემოწმების კრიტერიუმები ( );

შაპირო-ვილქსის კრიტერიუმი ( ) .

თითოეული პარამეტრისთვის ტარდება მონაცემთა განაწილების ბუნების ანალიზი (მას ასევე უწოდებენ განაწილების ნორმალურობის ტესტს). იმისათვის, რომ დამაჯერებლად ვიმსჯელოთ პარამეტრის განაწილების შესაბამისობაზე ნორმალურ კანონთან, საჭიროა საკმარისად დიდი რაოდენობის დაკვირვების ერთეულები (მინიმუმ 30 მნიშვნელობა).

ნორმალური განაწილებისთვის, დახრილობისა და ქურტოზის კრიტერიუმები იღებენ მნიშვნელობას 0. თუ განაწილება გადატანილია მარჯვნივ. > 0 (პოზიტიური ასიმეტრია), თან < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона =0. ზე > 0 განაწილების მრუდი უფრო მკვეთრია, თუ < 0 пик более сглаженный, чем функция нормального распределения.

ნორმალურობის შესამოწმებლად Shapiro-Wilks ტესტის გამოყენებით, საჭიროა ამ კრიტერიუმის მნიშვნელობის პოვნა სტატისტიკური ცხრილების გამოყენებით მნიშვნელოვნების საჭირო დონეზე და დაკვირვების ერთეულების რაოდენობის მიხედვით (თავისუფლების ხარისხი). დანართი 1. ნორმალურობის ჰიპოთეზა უარყოფილია ამ კრიტერიუმის მცირე მნიშვნელობებისთვის, როგორც წესი, <0,8.

ვარიაციის სერიის კონცეფცია.სტატისტიკური დაკვირვების მასალების სისტემატიზაციის პირველი ნაბიჯი არის იმ ერთეულების რაოდენობის დათვლა, რომლებსაც აქვთ ამა თუ იმ თვისება. ერთეულები მათი რაოდენობრივი ატრიბუტის აღმავალი ან კლებადობით დალაგებით და კონკრეტული ატრიბუტის მნიშვნელობის მქონე ერთეულების რაოდენობის დათვლით, ვიღებთ ვარიაციის სერიას. ვარიაციების სერია ახასიათებს გარკვეული სტატისტიკური პოპულაციის ერთეულების განაწილებას ზოგიერთი რაოდენობრივი ატრიბუტის მიხედვით.

ვარიაციების სერია შედგება ორი სვეტისაგან, მარცხენა სვეტი შეიცავს ცვლადის ატრიბუტის მნიშვნელობებს, რომელსაც ეწოდება ვარიანტები და აღინიშნება (x), ხოლო მარჯვენა სვეტი შეიცავს აბსოლუტურ რიცხვებს, რომლებიც აჩვენებს რამდენჯერ ხდება თითოეული ვარიანტი. ამ სვეტის მნიშვნელობებს ეწოდება სიხშირეები და აღინიშნება (f).

სქემატურად, ვარიაციების სერია შეიძლება წარმოდგენილი იყოს ცხრილის 5.1 სახით:

ცხრილი 5.1

ვარიაციის სერიის ტიპი

ვარიანტები (x)

სიხშირეები (f)

მარჯვენა სვეტში ასევე შეიძლება გამოყენებულ იქნას ფარდობითი ინდიკატორები, რომლებიც ახასიათებენ ცალკეული ვარიანტების სიხშირის პროპორციას სიხშირეების მთლიან რაოდენობაში. ამ ფარდობით მაჩვენებლებს სიხშირეებს უწოდებენ და პირობითად აღინიშნება, ე.ი. . ყველა სიხშირის ჯამი ერთის ტოლია. სიხშირეები ასევე შეიძლება გამოისახოს პროცენტულად და მაშინ მათი ჯამი 100%-ის ტოლი იქნება.

ცვლადი ნიშნები შეიძლება იყოს განსხვავებული ხასიათისა. ზოგიერთი ნიშნის ვარიანტები გამოიხატება მთელი რიცხვებით, მაგალითად, ბინაში ოთახების რაოდენობა, გამოქვეყნებული წიგნების რაოდენობა და ა.შ. ამ ნიშნებს უწოდებენ წყვეტილს, ან დისკრეტულს. სხვა მახასიათებლების ვარიანტებს შეუძლიათ მიიღონ ნებისმიერი მნიშვნელობა გარკვეული საზღვრებში, როგორიცაა დაგეგმილი მიზნების შესრულება, ხელფასი და ა.შ. ამ მახასიათებლებს უწყვეტი ეწოდება.

დისკრეტული ვარიაციის სერია.თუ ვარიაციული სერიის ვარიანტები გამოიხატება როგორც დისკრეტული მნიშვნელობები, მაშინ ასეთ ვარიაციულ სერიას ეწოდება დისკრეტული, მისი გარეგნობა წარმოდგენილია ცხრილში. 5.2:

ცხრილი 5.2

სტუდენტების განაწილება გამოცდაზე მიღებული ქულების მიხედვით

რეიტინგი (x)

სტუდენტების რაოდენობა (ვ)

საერთოს პროცენტში ()

დისკრეტულ სერიებში განაწილების ბუნება გრაფიკულად არის გამოსახული, როგორც განაწილების პოლიგონი, სურ.5.1.

ბრინჯი. 5.1. სტუდენტების განაწილება გამოცდაზე მიღებული ქულების მიხედვით.

ინტერვალის ვარიაციის სერია.უწყვეტი მახასიათებლებისთვის, ვარიაციის სერიები აგებულია ინტერვალის სერიებად, ე.ი. მათში ფუნქციების მნიშვნელობები გამოიხატება ინტერვალებით "დან დამდე". ამ შემთხვევაში, მახასიათებლის მინიმალურ მნიშვნელობას ასეთ ინტერვალში ეწოდება ინტერვალის ქვედა ზღვარი, ხოლო მაქსიმალურ მნიშვნელობას - ინტერვალის ზედა ზღვარი.

ინტერვალური ვარიაციული სერიები აგებულია როგორც უწყვეტი ფუნქციებისთვის (დისკრეტული) და მათთვის, ვინც განსხვავდება დიდი დიაპაზონში. ინტერვალის რიგები შეიძლება იყოს თანაბარი და არათანაბარი ინტერვალებით. ეკონომიკურ პრაქტიკაში, უმეტესწილად, გამოიყენება არათანაბარი ინტერვალები, რომლებიც თანდათან იზრდება ან მცირდება. ასეთი საჭიროება ჩნდება განსაკუთრებით იმ შემთხვევებში, როდესაც ნიშნის რყევა ხორციელდება არათანაბრად და დიდ ფარგლებში.

განვიხილოთ ინტერვალის სერიის ტიპი თანაბარი ინტერვალებით, ცხრილი. 5.3:

ცხრილი 5.3

მუშაკთა განაწილება პროდუქციის მიხედვით

გამომავალი, tr. (X)

მუშაკთა რაოდენობა (f)

კუმულაციური სიხშირე (f´)

ინტერვალის განაწილების სერია გრაფიკულად არის გამოსახული ჰისტოგრამის სახით, სურ.5.2.

სურ.5.2. მუშაკთა განაწილება პროდუქციის მიხედვით

დაგროვილი (კუმულაციური) სიხშირე.პრაქტიკაში საჭიროა დისტრიბუციის სერიის გარდაქმნა კუმულაციური რიგები,აგებულია დაგროვილ სიხშირეებზე. ისინი შეიძლება გამოყენებულ იქნას სტრუქტურული საშუალოების დასადგენად, რაც ხელს უწყობს განაწილების სერიის მონაცემების ანალიზს.

კუმულაციური სიხშირეები განისაზღვრება განაწილების სერიის შემდგომი ჯგუფების ამ ინდიკატორების პირველი ჯგუფის სიხშირეებზე (ან სიხშირეებზე) თანმიმდევრული დამატებით. კუმულაციები და ოგივები გამოიყენება განაწილების სერიების საილუსტრაციოდ. მათი ასაშენებლად, აბსცისის ღერძზე აღინიშნება დისკრეტული მახასიათებლის მნიშვნელობები (ან ინტერვალების ბოლოები), ხოლო სიხშირეების მზარდი ჯამები (კუმულაცია) აღინიშნება ორდინატთა ღერძზე, ნახ.5.3.

ბრინჯი. 5.3. მუშაკთა კუმულაციური განაწილება განვითარების მიხედვით

თუ სიხშირეების და ვარიანტების სასწორები ერთმანეთს ენაცვლება, ე.ი. ასახავს დაგროვილ სიხშირეებს აბსცისის ღერძზე და ოფციონების მნიშვნელობებს ორდინატთა ღერძზე, შემდეგ მრუდს, რომელიც ახასიათებს სიხშირეების ცვლილებას ჯგუფიდან ჯგუფში, დაერქმევა განაწილების გამოსახულებას, ნახ. 5.4.

ბრინჯი. 5.4. Ogiva მუშების განაწილება წარმოებისთვის

ცვალებადობის სერიები თანაბარი ინტერვალებით უზრუნველყოფს სტატისტიკური განაწილების სერიების ერთ-ერთ ყველაზე მნიშვნელოვან მოთხოვნას, რაც უზრუნველყოფს მათ შედარებას დროსა და სივრცეში.

განაწილების სიმკვრივე.თუმცა, ამ სერიებში ინდივიდუალური არათანაბარი ინტერვალების სიხშირე პირდაპირ შედარებადი არ არის. ასეთ შემთხვევებში, აუცილებელი შედარების უზრუნველსაყოფად, გამოითვლება განაწილების სიმკვრივე, ე.ი. დაადგინეთ რამდენი ერთეულია თითოეულ ჯგუფში ინტერვალის მნიშვნელობის ერთეულზე.

არათანაბარი ინტერვალებით ვარიაციული სერიის განაწილების გრაფიკის აგებისას, მართკუთხედების სიმაღლე განისაზღვრება არა სიხშირეების, არამედ შესწავლილი ნიშან-თვისების მნიშვნელობების განაწილების სიმკვრივის მაჩვენებლების პროპორციულად შესაბამის ინტერვალებში. .

ვარიაციული სერიის შედგენა და მისი გრაფიკული წარმოდგენა არის პირველი ნაბიჯი საწყისი მონაცემების დამუშავებისა და პირველი საფეხური შესასწავლი პოპულაციის ანალიზისას. ვარიაციური სერიების ანალიზის შემდეგი ნაბიჯი არის ძირითადი განზოგადებული ინდიკატორების განსაზღვრა, რომელსაც უწოდებენ სერიების მახასიათებლებს. ამ მახასიათებლებმა უნდა მისცეს წარმოდგენა ატრიბუტის საშუალო მნიშვნელობის შესახებ მოსახლეობის ერთეულებში.

საშუალო ღირებულება. საშუალო მნიშვნელობა არის შესწავლილი ნიშან-თვისების განზოგადებული მახასიათებელი შესწავლილ პოპულაციაში, რომელიც ასახავს მის ტიპურ დონეს პოპულაციის ერთეულზე კონკრეტული ადგილისა და დროის პირობებში.

საშუალო მნიშვნელობა ყოველთვის არის დასახელებული, აქვს იგივე განზომილება, როგორც მოსახლეობის ცალკეული ერთეულების ატრიბუტი.

საშუალო მნიშვნელობების გამოთვლამდე აუცილებელია შესწავლილი პოპულაციის ერთეულების დაჯგუფება, ხარისხობრივად ერთგვაროვანი ჯგუფების გამოყოფით.

მთლიანი მოსახლეობისთვის გამოთვლილ საშუალოს ზოგადი საშუალო ეწოდება, ხოლო თითოეული ჯგუფისთვის - ჯგუფის საშუალო.

არსებობს ორი სახის საშუალო: სიმძლავრე (საშუალო არითმეტიკული, ჰარმონიული საშუალო, გეომეტრიული საშუალო, ფესვი საშუალო კვადრატული); სტრუქტურული (რეჟიმი, მედიანა, კვარტილები, დეცილები).

გაანგარიშებისთვის საშუალო არჩევანი დამოკიდებულია მიზანზე.

სიმძლავრის საშუალო ტიპები და მათი გაანგარიშების მეთოდები.შეგროვებული მასალის სტატისტიკური დამუშავების პრაქტიკაში ჩნდება სხვადასხვა პრობლემა, რომელთა გადაწყვეტისთვის საჭიროა სხვადასხვა საშუალო მაჩვენებელი.

მათემატიკური სტატისტიკა იღებს სხვადასხვა საშუალებებს სიმძლავრის საშუალო ფორმულებიდან:

სად არის საშუალო მნიშვნელობა; x - ინდივიდუალური პარამეტრები (ფუნქციური მნიშვნელობები); z - ექსპონენტი (z = 1 - საშუალო არითმეტიკული, z = 0 გეომეტრიული საშუალო, z = - 1 - ჰარმონიული საშუალო, z = 2 - საშუალო კვადრატული).

თუმცა, კითხვა, თუ რა ტიპის საშუალო უნდა იყოს გამოყენებული თითოეულ ცალკეულ შემთხვევაში, წყდება შესწავლილი მოსახლეობის კონკრეტული ანალიზით.

სტატისტიკაში ყველაზე გავრცელებული საშუალო ტიპია საშუალო არითმეტიკული. იგი გამოითვლება იმ შემთხვევებში, როდესაც საშუალო ატრიბუტის მოცულობა ყალიბდება, როგორც მისი მნიშვნელობების ჯამი შესწავლილი სტატისტიკური პოპულაციის ცალკეული ერთეულებისთვის.

საწყისი მონაცემების ბუნებიდან გამომდინარე, საშუალო არითმეტიკული განისაზღვრება სხვადასხვა გზით:

თუ მონაცემები არ არის დაჯგუფებული, მაშინ გაანგარიშება ხორციელდება მარტივი საშუალო მნიშვნელობის ფორმულის მიხედვით

არითმეტიკული საშუალოს გამოთვლა დისკრეტულ სერიაშიხდება ფორმულის მიხედვით 3.4.

არითმეტიკული საშუალოს გამოთვლა ინტერვალის სერიაში.ინტერვალის ვარიაციების სერიაში, სადაც ინტერვალის შუა პირობითად აღებულია, როგორც მახასიათებლის მნიშვნელობა თითოეულ ჯგუფში, საშუალო არითმეტიკული შეიძლება განსხვავდებოდეს არაჯგუფური მონაცემებისგან გამოთვლილი საშუალოსგან. უფრო მეტიც, რაც უფრო დიდია ინტერვალი ჯგუფებში, მით მეტია დაჯგუფებული მონაცემებიდან გამოთვლილი საშუალოს შესაძლო გადახრები დაუჯგუფებელი მონაცემებიდან გამოთვლილი საშუალოდან.

ინტერვალის ვარიაციის სერიის საშუალო გაანგარიშებისას, საჭირო გამოთვლების შესასრულებლად, ინტერვალებიდან მათ შუა წერტილებზე გადადის. და შემდეგ გამოთვალეთ საშუალო მნიშვნელობა საშუალო შეწონილი არითმეტიკული ფორმულით.

საშუალო არითმეტიკული თვისებები.საშუალო არითმეტიკას აქვს გარკვეული თვისებები, რაც საშუალებას გვაძლევს გავამარტივოთ გამოთვლები, განვიხილოთ ისინი.

1. მუდმივი რიცხვების საშუალო არითმეტიკული ტოლია ამ მუდმივი რიცხვის.

თუ x = a. მერე .

2. თუ პროპორციულად შეიცვალა ყველა ვარიანტის წონა, ე.ი. გაიზარდოს ან შემცირდეს იმავე რაოდენობის ჯერ, მაშინ ახალი სერიის საშუალო არითმეტიკული არ შეიცვლება აქედან.

თუ ყველა წონა f მცირდება k-ჯერ, მაშინ .

3. ცალკეული ვარიანტების საშუალოდან დადებითი და უარყოფითი გადახრების ჯამი, გამრავლებული წონებზე, უდრის ნულს, ე.ი.

თუ , მაშინ . აქედან.

თუ ყველა ვარიანტი შემცირდება ან გაზრდილია გარკვეული რიცხვით, მაშინ ახალი სერიის საშუალო არითმეტიკული იგივე ოდენობით შემცირდება ან გაიზრდება.

შეამცირეთ ყველა ვარიანტი xზე , ე.ი. x´ = xა.

მერე

საწყისი სერიის არითმეტიკული საშუალო შეიძლება მივიღოთ შემცირებულ საშუალოზე ვარიანტებს ადრე გამოკლებული რიცხვის დამატებით. , ე.ი. .

5. თუ ყველა ვარიანტი შემცირდა ან გაიზარდა ჯერ, მაშინ ახალი სერიის საშუალო არითმეტიკული შემცირდება ან გაიზრდება იმავე ოდენობით, ე.ი. in ერთხელ.

დაე მერე .

აქედან გამომდინარე, ე.ი. ორიგინალური სერიის საშუალოს მისაღებად, ახალი სერიის საშუალო არითმეტიკული (შემცირებული ვარიანტებით) უნდა გაიზარდოს ერთხელ.

საშუალო ჰარმონიული.ჰარმონიული საშუალო არის არითმეტიკული საშუალოს ორმხრივი. იგი გამოიყენება, როდესაც სტატისტიკური ინფორმაცია არ შეიცავს სიხშირეებს პოპულაციის ცალკეული ვარიანტებისთვის, მაგრამ წარმოდგენილია როგორც მათი პროდუქტი (M = xf). ჰარმონიული საშუალო გამოითვლება ფორმულით 3.5

ჰარმონიული საშუალოს პრაქტიკული გამოყენება არის ზოგიერთი ინდექსის, კერძოდ, ფასების ინდექსის გამოთვლა.

გეომეტრიული საშუალო.გეომეტრიული საშუალოს გამოყენებისას, ატრიბუტის ინდივიდუალური მნიშვნელობები, როგორც წესი, არის დინამიკის ფარდობითი მნიშვნელობები, რომლებიც აგებულია ჯაჭვის მნიშვნელობების სახით, როგორც თანაფარდობა დინამიკის სერიაში თითოეული დონის წინა დონესთან. . საშუალო ამგვარად ახასიათებს საშუალო ზრდის ტემპს.

გეომეტრიული საშუალო ასევე გამოიყენება ატრიბუტის მაქსიმალური და მინიმალური მნიშვნელობებიდან თანაბარი მანძილის დასადგენად. მაგალითად, სადაზღვევო კომპანია დებს ხელშეკრულებებს ავტოდაზღვევის მომსახურების გაწევაზე. კონკრეტული სადაზღვევო შემთხვევიდან გამომდინარე, სადაზღვევო გადახდა შეიძლება განსხვავდებოდეს 10,000-დან 100,000 დოლარამდე წელიწადში. დაზღვევის საშუალო ანაზღაურება არის აშშ დოლარი.

გეომეტრიული საშუალო არის მნიშვნელობა, რომელიც გამოიყენება თანაფარდობების საშუალოდ ან განაწილების სერიებში, წარმოდგენილი გეომეტრიული პროგრესიის სახით, როდესაც z = 0. ეს საშუალო მოსახერხებელია გამოსაყენებლად, როდესაც ყურადღება ექცევა არა აბსოლუტურ განსხვავებებს, არამედ თანაფარდობებს. ორი ნომერი.

გაანგარიშების ფორმულები შემდეგია

სად არის საშუალო მახასიათებლის ვარიანტები; - ოფციონის პროდუქტი; - ვარიანტების სიხშირე.

გეომეტრიული საშუალო გამოიყენება საშუალო წლიური ზრდის ტემპების გამოსათვლელად.

საშუალო კვადრატი.ფესვის საშუალო კვადრატის ფორმულა გამოიყენება განაწილების სერიაში ნიშან-თვისების ინდივიდუალური მნიშვნელობების რყევის ხარისხის გასაზომად საშუალო არითმეტიკულის გარშემო. ასე რომ, ვარიაციის ინდიკატორების გაანგარიშებისას, საშუალო გამოითვლება არითმეტიკული საშუალოდან თვისების ინდივიდუალური მნიშვნელობების გადახრების კვადრატებიდან.

საშუალო კვადრატული მნიშვნელობა გამოითვლება ფორმულით

ეკონომიკურ კვლევაში, ფესვის საშუალო კვადრატის შეცვლილი ფორმა ფართოდ გამოიყენება ნიშან-თვისების ვარიაციის ინდიკატორების გამოთვლაში, როგორიცაა ვარიაცია, სტანდარტული გადახრა.

უმრავლესობის წესი.ძალაუფლების კანონის საშუალო მაჩვენებლებს შორის არსებობს შემდეგი კავშირი - რაც უფრო დიდია მაჩვენებელი, მით მეტია საშუალო მნიშვნელობა, ცხრილი 5.4:

ცხრილი 5.4

კავშირი საშუალოებს შორის

z მნიშვნელობა

თანაფარდობა საშუალოებს შორის

ამ კავშირს მაჟორის წესს უწოდებენ.

სტრუქტურული საშუალო.მოსახლეობის სტრუქტურის დასახასიათებლად გამოიყენება სპეციალური ინდიკატორები, რომლებსაც შეიძლება ეწოდოს სტრუქტურული საშუალო. ეს ზომები მოიცავს მოდს, მედიანას, კვარტილებს და დეცილებს.

მოდა.რეჟიმი (Mo) არის მახასიათებლის ყველაზე ხშირად წარმოქმნილი მნიშვნელობა პოპულაციის ერთეულებში. რეჟიმი არის მახასიათებლის მნიშვნელობა, რომელიც შეესაბამება თეორიული განაწილების მრუდის მაქსიმალურ წერტილს.

მოდა ფართოდ გამოიყენება კომერციულ პრაქტიკაში მომხმარებელთა მოთხოვნის შესწავლისას (დიდი მოთხოვნადი ტანსაცმლისა და ფეხსაცმლის ზომის განსაზღვრისას), ფასების რეგისტრაციაში. სულ რამდენიმე მოდიფიკაცია შეიძლება იყოს.

რეჟიმის გაანგარიშება დისკრეტულ სერიაში.დისკრეტულ სერიაში რეჟიმი არის ყველაზე მაღალი სიხშირის ვარიანტი. განვიხილოთ რეჟიმის პოვნა დისკრეტულ სერიაში.

მოდის გაანგარიშება ინტერვალის სერიაში.ინტერვალის ვარიაციის სერიაში მოდალური ინტერვალის ცენტრალურ ვარიანტად მიჩნეულია დაახლოებით რეჟიმი, ე.ი. ინტერვალი, რომელსაც აქვს ყველაზე მაღალი სიხშირე (სიხშირე). ინტერვალის ფარგლებში აუცილებელია ვიპოვოთ ატრიბუტის მნიშვნელობა, რომელიც არის რეჟიმი. ინტერვალის სერიებისთვის რეჟიმი განისაზღვრება ფორმულით

სად არის მოდალური ინტერვალის ქვედა ზღვარი; არის მოდალური ინტერვალის მნიშვნელობა; არის მოდალური ინტერვალის შესაბამისი სიხშირე; არის სიხშირე, რომელიც წინ უსწრებს მოდალურ ინტერვალს; არის მოდალის შემდგომი ინტერვალის სიხშირე.

მედიანური.მედიანა () არის მახასიათებლის მნიშვნელობა რანჟირებული სერიის შუა ერთეულში. რანჟირებული სერია არის სერია, რომელშიც დამახასიათებელი მნიშვნელობები იწერება აღმავალი ან კლებადობით. ან მედიანა არის მნიშვნელობა, რომელიც ყოფს მოწესრიგებული ვარიაციული სერიის რაოდენობას ორ თანაბარ ნაწილად: ერთ ნაწილს აქვს ცვლადი მახასიათებლის მნიშვნელობა, რომელიც საშუალო ვარიანტზე ნაკლებია, ხოლო მეორეს დიდი.

მედიანას საპოვნელად ჯერ მისი სერიული ნომერი განისაზღვრება. ამისათვის, კენტი რაოდენობის ერთეულებით, ერთი ემატება ყველა სიხშირის ჯამს და ყველაფერი იყოფა ორზე. ერთეულების ლუწი რაოდენობის შემთხვევაში, მედიანა გვხვდება, როგორც ერთეულის ატრიბუტის მნიშვნელობა, რომლის სერიული ნომერი განისაზღვრება სიხშირეების ჯამით გაყოფილი ორზე. მედიანის რიგითი რიცხვის ცოდნა, დაგროვილი სიხშირეებიდან ადვილია მისი მნიშვნელობის პოვნა.

მედიანის გაანგარიშება დისკრეტულ სერიაში.შერჩევის კვლევის მიხედვით, მიღებული იქნა მონაცემები ოჯახების განაწილების შესახებ ბავშვების რაოდენობის მიხედვით, ცხრილი. 5.5. მედიანას დასადგენად ჯერ დაადგინეთ მისი რიგითი რიცხვი

ამ ოჯახებში ბავშვების რაოდენობა არის 2, შესაბამისად, = 2. ამრიგად, ოჯახების 50%-ში ბავშვების რაოდენობა არ აღემატება 2-ს.

- დაგროვილი სიხშირე, რომელიც წინ უსწრებს მედიანურ ინტერვალს;

ერთის მხრივ, ეს ძალიან დადებითი თვისებაა. ამ შემთხვევაში მხედველობაში მიიღება ყველა მიზეზის ეფექტი, რომელიც გავლენას ახდენს შესწავლილი მოსახლეობის ყველა ერთეულზე. მეორეს მხრივ, ერთმა დაკვირვებამაც კი, რომელიც შემთხვევით იყო ჩართული საწყის მონაცემებში, შეიძლება მნიშვნელოვნად დაამახინჯოს განსახილველ პოპულაციაში შესწავლილი თვისების განვითარების დონის იდეა (განსაკუთრებით მოკლე სერიებში).

მეოთხედები და დეცილები.ვარიაციულ სერიებში მედიანის პოვნის ანალოგიით, შეგიძლიათ იპოვოთ მახასიათებლის მნიშვნელობა ნებისმიერ რანჟირებულ სერიის ერთეულში თანმიმდევრობით. ასე რომ, კერძოდ, შეგიძლიათ იპოვოთ მახასიათებლის მნიშვნელობა ერთეულებისთვის, რომლებიც ყოფენ სერიას 4 თანაბარ ნაწილად, 10-ად და ა.შ.

კვარტლები.ვარიანტებს, რომლებიც რიგებს ოთხ თანაბარ ნაწილად ყოფს, ეწოდება კვარტილები.

ამავდროულად, განასხვავებენ შემდეგს: ქვედა (ან პირველი) მეოთხედი (Q1) - რანჟირებული სერიის ერთეულის მახასიათებლის მნიშვნელობა, რომელიც ყოფს პოპულაციას ¼-დან ¾-მდე და ზედა (ან მესამე) თანაფარდობით. ) მეოთხედი (Q3) - რანჟირებული სერიის ერთეულის მახასიათებლის მნიშვნელობა, რომელიც ყოფს პოპულაციას ¾-დან ¼-მდე თანაფარდობით.

- მეოთხედის ინტერვალების სიხშირე (ქვედა და ზედა)

Q1 და Q3 შემცველი ინტერვალები განისაზღვრება დაგროვილი სიხშირეებიდან (ან სიხშირეებიდან).

დეცილები.კვარტილების გარდა, გამოითვლება დეცილები - ვარიანტები, რომლებიც რიგებს ყოფს 10 თანაბარ ნაწილად.

ისინი აღინიშნება D-ით, პირველი დეცილი D1 ყოფს სერიებს 1/10 და 9/10 თანაფარდობით, მეორე D2 - 2/10 და 8/10 და ა.შ. ისინი გამოითვლება ისე, როგორც მედიანა და კვარტილები.

როგორც მედიანა, ასევე კვარტილები და დეცილები მიეკუთვნება ეგრეთ წოდებულ რიგით სტატისტიკას, რომელიც გაგებულია, როგორც ვარიანტი, რომელიც იკავებს გარკვეულ რიგით ადგილს რანჟირებულ სერიაში.

ვარიაციების სერია - სერია, რომელშიც ისინი შედარებულია (აღმავალი ან კლებადი მიმდევრობით) პარამეტრებიდა მათი შესაბამისი სიხშირეები

ვარიანტები მახასიათებლის ცალკეული რაოდენობრივი გამოხატულებაა. დანიშნულია ლათინური ასოებით . ტერმინი „ვარიანტის“ კლასიკური გაგება ვარაუდობს, რომ მახასიათებლის თითოეულ უნიკალურ მნიშვნელობას ეწოდება ვარიანტი, განმეორების რაოდენობის მიუხედავად.

მაგალითად, ათ პაციენტში გაზომილი სისტოლური არტერიული წნევის ინდიკატორების ვარიაციულ სერიაში:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

მხოლოდ 6 მნიშვნელობა არის ვარიანტი:

110, 120, 130, 140, 160, 170.

სიხშირე არის რიცხვი, რომელიც მიუთითებს რამდენჯერ მეორდება ვარიანტი. აღინიშნება ლათინური ასოებით . ყველა სიხშირის ჯამი (რაც, რა თქმა უნდა, უდრის ყველა შესწავლილის რაოდენობას) აღინიშნება როგორც .

    ჩვენს მაგალითში, სიხშირეები მიიღებენ შემდეგ მნიშვნელობებს:
  • 110 ვარიანტისთვის სიხშირე P = 1 (მნიშვნელობა 110 გვხვდება ერთ პაციენტში),
  • 120 ვარიანტისთვის, სიხშირე P = 2 (მნიშვნელობა 120 გვხვდება ორ პაციენტში),
  • 130 ვარიანტისთვის სიხშირე P = 3 (მნიშვნელობა 130 გვხვდება სამ პაციენტში),
  • 140 ვარიანტისთვის, სიხშირე P = 2 (მნიშვნელობა 140 გვხვდება ორ პაციენტში),
  • 160 ვარიანტისთვის სიხშირე P = 1 (მნიშვნელობა 160 გვხვდება ერთ პაციენტში),
  • 170 ვარიანტისთვის სიხშირე P = 1 (მნიშვნელობა 170 გვხვდება ერთ პაციენტში),

ვარიაციების სერიის სახეები:

  1. მარტივი- ეს არის სერია, რომელშიც თითოეული ვარიანტი ხდება მხოლოდ ერთხელ (ყველა სიხშირე უდრის 1-ს);
  2. შეჩერებული- სერია, რომელშიც ერთი ან მეტი ვარიანტი განმეორებით ხდება.

ვარიაციების სერია გამოიყენება რიცხვების დიდი მასივების აღსაწერად; სწორედ ამ ფორმით არის პირველად წარმოდგენილი სამედიცინო კვლევების უმეტესობის შეგროვებული მონაცემები. ვარიაციების სერიის დასახასიათებლად გამოითვლება სპეციალური ინდიკატორები, მათ შორის საშუალო მნიშვნელობები, ცვალებადობის მაჩვენებლები (ე.წ. დისპერსია), ნიმუშის მონაცემების წარმომადგენლობითობის ინდიკატორები.

ვარიაციის სერიის ინდიკატორები

1) საშუალო არითმეტიკული არის განზოგადებული მაჩვენებელი, რომელიც ახასიათებს შესწავლილი ნიშან-თვისების ზომას. საშუალო არითმეტიკული აღინიშნება როგორც , არის საშუალო ყველაზე გავრცელებული ტიპი. საშუალო არითმეტიკული გამოითვლება, როგორც დაკვირვების ყველა ერთეულის ინდიკატორის მნიშვნელობების ჯამის თანაფარდობა ყველა გამოკვლეულის რაოდენობასთან. არითმეტიკული საშუალოს გამოთვლის მეთოდი განსხვავდება მარტივი და შეწონილი ვარიაციის სერიებისთვის.

გაანგარიშების ფორმულა მარტივი არითმეტიკული საშუალო:

გაანგარიშების ფორმულა შეწონილი არითმეტიკული საშუალო:

M = Σ(V * P)/ n

​2) რეჟიმი - ვარიაციის სერიის კიდევ ერთი საშუალო მნიშვნელობა, რომელიც შეესაბამება ყველაზე ხშირად განმეორებით ვარიანტს. ან, სხვაგვარად რომ ვთქვათ, ეს არის ის ვარიანტი, რომელიც შეესაბამება უმაღლეს სიხშირეს. დანიშნული როგორც მო . რეჟიმი გამოითვლება მხოლოდ შეწონილი სერიებისთვის, რადგან მარტივ სერიებში არცერთი ვარიანტი არ მეორდება და ყველა სიხშირე ერთის ტოლია.

მაგალითად, გულისცემის მნიშვნელობების ვარიაციის სერიაში:

80, 84, 84, 86, 86, 86, 90, 94;

რეჟიმის მნიშვნელობა არის 86, რადგან ეს ვარიანტი 3-ჯერ ხდება, ამიტომ მისი სიხშირე ყველაზე მაღალია.

3) მედიანა - ოფციონის მნიშვნელობა, ვარიაციის სერიის შუაზე გაყოფა: მის ორივე მხარეს არის თანაბარი რაოდენობის ვარიანტები. მედიანა, ისევე როგორც არითმეტიკული საშუალო და რეჟიმი, ეხება საშუალო მნიშვნელობებს. დანიშნული როგორც მე

4) სტანდარტული გადახრა (სინონიმები: სტანდარტული გადახრა, სიგმას გადახრა, სიგმა) - ვარიაციის სერიის ცვალებადობის საზომი. ეს არის განუყოფელი მაჩვენებელი, რომელიც აერთიანებს ვარიანტის საშუალოდან გადახრის ყველა შემთხვევას. ფაქტობრივად, ის პასუხობს კითხვას: რამდენად და რამდენად ხშირად ვრცელდება ვარიანტები არითმეტიკული საშუალოდან. აღინიშნება ბერძნული ასოთი σ ("სიგმა").

როდესაც მოსახლეობის რაოდენობა 30 ერთეულზე მეტია, სტანდარტული გადახრა გამოითვლება შემდეგი ფორმულის გამოყენებით:

მცირე პოპულაციისთვის - 30 დაკვირვების ერთეული ან ნაკლები - სტანდარტული გადახრა გამოითვლება განსხვავებული ფორმულით:

(ვარიაციური სერიის განმარტება; ვარიაციული სერიის კომპონენტები; ვარიაციული სერიის სამი ფორმა; ინტერვალის სერიის აგების მიზანშეწონილობა; დასკვნები, რომლებიც შეიძლება გაკეთდეს აგებული სერიიდან)

ვარიაციული სერია არის ნიმუშის ყველა ელემენტის თანმიმდევრობა, რომლებიც განლაგებულია შეუმცირებელი თანმიმდევრობით. იგივე ელემენტები მეორდება

ვარიაციული - ეს არის რაოდენობრივ საფუძველზე აგებული სერიები.

ვარიაციული განაწილების სერია შედგება ორი ელემენტისგან: ვარიანტები და სიხშირეები:

ვარიანტები არის რაოდენობრივი ნიშნის რიცხვითი მნიშვნელობები განაწილების ვარიაციის სერიაში. ისინი შეიძლება იყოს დადებითი ან უარყოფითი, აბსოლუტური ან ფარდობითი. ასე რომ, ეკონომიკური საქმიანობის შედეგების მიხედვით საწარმოების დაჯგუფებისას, ვარიანტები დადებითია - ეს არის მოგება, ხოლო უარყოფითი რიცხვები - ეს არის ზარალი.

სიხშირეები არის ცალკეული ვარიანტების რიცხვი ან ვარიაციის სერიის თითოეული ჯგუფი, ე.ი. ეს არის რიცხვები, რომლებიც გვიჩვენებს, რამდენად ხშირად ხდება გარკვეული ვარიანტები განაწილების სერიაში. ყველა სიხშირის ჯამს უწოდებენ პოპულაციის მოცულობას და განისაზღვრება მთელი პოპულაციის ელემენტების რაოდენობით.

სიხშირეები არის სიხშირეები, რომლებიც გამოხატულია ფარდობითი მნიშვნელობებით (ერთეულების ფრაქციები ან პროცენტები). სიხშირეების ჯამი უდრის ერთს ან 100%-ს. სიხშირეების ჩანაცვლება სიხშირეებით შესაძლებელს ხდის ვარიაციის სერიების შედარებას დაკვირვებების სხვადასხვა რაოდენობასთან.

ვარიაციის სერიის სამი ფორმა არსებობს:რანჟირებული სერიები, დისკრეტული სერიები და ინტერვალური სერიები.

რანჟირებული სერია არის პოპულაციის ცალკეული ერთეულების განაწილება შესასწავლი მახასიათებლის აღმავალი ან კლებადობით. რანჟირება აადვილებს რაოდენობრივი მონაცემების ჯგუფებად დაყოფას, მახასიათებლის უმცირესი და უდიდესი მნიშვნელობების დაუყოვნებლივ გამოვლენას და მნიშვნელობების ხაზგასმას, რომლებიც ყველაზე ხშირად მეორდება.

ვარიაციების სერიის სხვა ფორმებია ჯგუფური ცხრილები, რომლებიც შედგენილია შესასწავლი თვისების მნიშვნელობებში ვარიაციის ბუნების მიხედვით. ვარიაციის ბუნებით გამოირჩევა დისკრეტული (შეწყვეტილი) და უწყვეტი ნიშნები.

დისკრეტული სერია არის ისეთი ვარიაციული სერია, რომლის აგება ემყარება უწყვეტი ცვლილების მქონე ნიშნებს (დისკრეტული ნიშნები). ეს უკანასკნელი მოიცავს სატარიფო კატეგორიას, ოჯახში შვილების რაოდენობას, საწარმოში დასაქმებულთა რაოდენობას და ა.შ. ამ ნიშნებს შეუძლიათ მიიღონ გარკვეული მნიშვნელობების მხოლოდ სასრული რაოდენობა.

დისკრეტული ვარიაციული სერია არის ცხრილი, რომელიც შედგება ორი სვეტისგან. პირველ სვეტში მითითებულია ატრიბუტის სპეციფიკური მნიშვნელობა, ხოლო მეორე - პოპულაციის ერთეულების რაოდენობა ატრიბუტის კონკრეტული მნიშვნელობით.

თუ ნიშანს აქვს მუდმივი ცვლილება (შემოსავლის ოდენობა, სამუშაო გამოცდილება, საწარმოს ძირითადი საშუალებების ღირებულება და ა.შ., რომელსაც შეუძლია მიიღოს ნებისმიერი მნიშვნელობა გარკვეულ ფარგლებში), მაშინ ამ ნიშნისთვის უნდა აშენდეს ინტერვალის ვარიაციის სერია.



ჯგუფურ ცხრილს აქ ასევე აქვს ორი სვეტი. პირველი მიუთითებს მახასიათებლის მნიშვნელობას ინტერვალში "-დან -მდე" (ოფციები), მეორე - ინტერვალში შემავალი ერთეულების რაოდენობას (სიხშირე).

სიხშირე (განმეორების სიხშირე) - ატრიბუტის მნიშვნელობების კონკრეტული ვარიანტის გამეორებების რაოდენობა, რომელიც აღინიშნება fi , და სიხშირეების ჯამი, რომელიც ტოლია შესწავლილი პოპულაციის მოცულობის, აღინიშნა.

სადაც k არის ატრიბუტების მნიშვნელობის ვარიანტების რაოდენობა

ძალიან ხშირად, ცხრილს ავსებს სვეტი, რომელშიც გამოითვლება დაგროვილი S სიხშირეები, რომლებიც გვიჩვენებს მოსახლეობის რამდენ ერთეულს აქვს ამ მნიშვნელობაზე არაუმეტეს მახასიათებლის მნიშვნელობა.

დისკრეტული ვარიაციული განაწილების სერია არის სერია, რომელშიც ჯგუფები შედგენილია მახასიათებლის მიხედვით, რომელიც განსხვავდება დისკრეტულად და იღებს მხოლოდ მთელ რიცხვებს.

განაწილების ინტერვალის ვარიაციის სერია არის სერია, რომელშიც დაჯგუფების ატრიბუტს, რომელიც ქმნის დაჯგუფების საფუძველს, შეუძლია მიიღოს ნებისმიერი მნიშვნელობა გარკვეულ ინტერვალში, მათ შორის წილადის ჩათვლით.

ინტერვალის ვარიაციული სერია არის შემთხვევითი ცვლადის მნიშვნელობების ცვალებადობის ინტერვალების მოწესრიგებული ნაკრები თითოეულ მათგანში მოხვედრილი რაოდენობის მნიშვნელობების შესაბამისი სიხშირეებით ან სიხშირით.

მიზანშეწონილია აშენდეს ინტერვალური განაწილების სერია, უპირველეს ყოვლისა, ნიშან-თვისების უწყვეტი ვარიაციით და ასევე, თუ დისკრეტული ვარიაცია იჩენს თავს ფართო დიაპაზონში, ე.ი. დისკრეტული ფუნქციის ვარიანტების რაოდენობა საკმაოდ დიდია.

ამ სერიიდან უკვე შეიძლება რამდენიმე დასკვნის გაკეთება. მაგალითად, ვარიაციული სერიის საშუალო ელემენტი (მედიანა) შეიძლება იყოს გაზომვის ყველაზე სავარაუდო შედეგის შეფასება. ვარიაციის სერიის პირველი და ბოლო ელემენტი (ანუ ნიმუშის მინიმალური და მაქსიმალური ელემენტი) აჩვენებს ნიმუშის ელემენტების გავრცელებას. ზოგჯერ, თუ პირველი ან ბოლო ელემენტი ძალიან განსხვავდება დანარჩენი ნიმუშისგან, მაშინ ისინი გამოირიცხება გაზომვის შედეგებიდან, იმის გათვალისწინებით, რომ ეს მნიშვნელობები მიღებულია რაიმე სახის უხეში წარუმატებლობის შედეგად, მაგალითად, ტექნოლოგია.