ვარიაციის სერიას ე.წ. განსაზღვრეთ ვარიაციული სერია

ვარიაციული სერიები, მათი ელემენტები.

მექანიკოსების სატარიფო კატეგორიით დაინტერესებული მკვლევარი
მაღაზიამ ჩაატარა გამოკითხვა 100 მუშაზე. იპოვნეთ დაკვირვებული მნიშვნელობები
პრიზი-ნაკა ზრდადი თანმიმდევრობით. ამ ოპერაციას რანჟირება ეწოდება
სტატისტიკური მონაცემები. შედეგად, ჩვენ ვიღებთ შემდეგ სერიას, რომელიც ე.წ.
Xia რეიტინგი:

1,1,..1, 2,2..2, 3,3,..3, 4,4,..4, 5,5,..5, 6,6,..6.

რეიტინგული სერიიდან გამომდინარეობს, რომ შესწავლილი თვისება (ტარიფი
ციფრმა) მიიღო ექვსი განსხვავებული მნიშვნელობა: 1, 2, 3, 4, 5 და 6.

Უფრო სხვადასხვა მნიშვნელობაპრიზ-ნაკა დაერქმევა ვარიანტი -
mi,
და ქვეშ ვარიაცია -გააცნობიეროს ატრიბუტის მნიშვნელობების ცვლილება.

ნიშნის მიერ აღებული მნიშვნელობებიდან გამომდინარე, ნიშნები იყოფა
ზე დისკრეტულად ცვალებადი და მუდმივად ცვალებადი.

ტარიფის კატეგორია არის დისკრეტულად განსხვავებული ფუნქცია. ნომერი, შთაბეჭდილებები -
რამდენჯერ ჩნდება x ვარიანტი დაკვირვებების სერიაში საათი -
ტოტოი
ვარიანტი მ x .

x ვარიანტის სიხშირის ნაცვლად, შეიძლება განვიხილოთ მისი მიმართება გენერალთან
დაკვირვებების რაოდენობა n,რომელსაც ქვია ხშირადვარიანტი და მისი ურთიერთობის აღნიშვნა- იწყება ვ x .

w x =m x /n=m x /åm x

ცხრილი, რომელიც საშუალებას გაძლევთ განსაჯოთ სიხშირეების (ან სიხშირეების) განაწილება ვარიანტებს შორის, ეწოდება დისკრეტული ვარიაციის სერია.

სიხშირის კონცეფციასთან ერთად გამოიყენება კონცეფცია დაგროვილი სიხშირე,
რომელიც აღინიშნება t x აკ.დაგროვილი საათი აჩვენებს რამდენი
დაკვირვებით, ნიშანმა მიიღო მოცემული x-ზე ნაკლები მნიშვნელობები. ნათესავი
დაგროვილი სიხშირე საერთო რაოდენობა n დაკვირვება ეწოდება დაგროვილი -
სიხშირე
და აღვნიშნავთ w x nak. აშკარაა რომ



w x nac =m x nac /n=m x nac /åm x.

დაგროვილი სიხშირეები (სიხშირეები_ დისკრეტული ვარიაციული სერიებისთვის, გამოითვლება შემდეგ ცხრილში:

X მ x მ x ნაკ w x nak
0+4=4 0,04
4+6=10 0,10
10+12=22 0,22
22+16=38 0,38
38+44=82 0,82
82+18=100 1,00
6-ის ზემოთ

დაე, საჭირო იყოს საანგარიშო წელს გამომავალი ერთ მუშაკზე - მექანიკური მაღაზიის მანქანათმწარმოებელზე გამოკვლეული იყოს პროცენტულად. წინა წელს. აქ შესწავლილი მახასიათებელი x არის გამომავალი საანგარიშო წელს წინა წლის პროცენტულად. ეს არის მუდმივად ცვალებადი ნიშანი. Იდენტიფიცირება დამახასიათებელი ნიშნებიატრიბუტის მნიშვნელობების ვარიაციები გაერთიანდება მუშაკთა ჯგუფებად, რომელთა გამომუშავება მერყეობს 10% ფარგლებში. ჩვენ წარმოგიდგენთ დაჯგუფებულ მონაცემებს ცხრილში:

Კვლევა თვისება x მუშათა რაოდენობა მ მუშათა წილი w დაგროვილი სიხშირე m x აკ w x nak
80-90 8/117 8/117
90-100 15/117 8+15=23 23/117
100-110 46/117 23+46=69 69/117
110-120 29/117 69+29=98 98/117
120-130 13/117 98+13=111 111/117
130-140 3/117 111+3=114 114/117
140-150 3/117 114+3=117 117/117
å

სიხშირის ცხრილში m გვიჩვენებს რამდენ დაკვირვებას აიღო მახასიათებლის მნიშვნელობა, ამის კუთვნილებაან სხვა ინტერვალით. ამ სიხშირეს ე.წ ინტერვალი,და მისი შეფარდება დაკვირვებების საერთო რაოდენობასთან არის ინტერვალის სიხშირე w.ცხრილი, რომელიც საშუალებას გაძლევთ განსაჯოთ სიხშირეების განაწილება მახასიათებლის მნიშვნელობების ცვალებადობის ინტერვალებს შორის, ე.წ. ინტერვალის ვარიაციის სერია.

ინტერვალის ვარიაციების სერია აგებულია დაკვირვების მონაცემების მიხედვით
შეუწყვეტლად ცვალებადი მახასიათებელი, ისევე როგორც დისკრეტული ცვალებადობა, თუ
დაკვირვებული ვარიანტების დიდი რაოდენობა. აგებულია დისკრეტული ვარიაციული სერია
მხოლოდ დისკრეტული ცვლადი მახასიათებლისთვის

ზოგჯერ ინტერვალის ვარიაციის სერია პირობითად იცვლება დისკრეტულით.
შემდეგ ინტერვალის შუა მნიშვნელობა მიიღება როგორც x ვარიანტი და, შესაბამისად,
ინტერვალის სიხშირე - ამისთვის t x.

ოპტიმალური მუდმივი ინტერვალის დასადგენად ხშირად გამოიყენება h Sturges-ის ფორმულა:

=(x max – x min)/(1+3.322*lg ).

int.var.series-ის მშენებლობა

სიხშირეები m აჩვენებს რამდენ დაკვირვებას ასრულებდა ნიშან-თვისებამ, რომელიც მიეკუთვნება კონკრეტულ ინტერვალს. ასეთ სიხშირეს ეწოდება ინტერვალის სიხშირე და მისი თანაფარდობა დაკვირვებების მთლიან რაოდენობასთან არის w ინტერვალის სიხშირე. ცხრილს, რომელიც შესაძლებელს ხდის ვიმსჯელოთ სიხშირეების (ან სიხშირეების) განაწილებაზე მახასიათებლის მნიშვნელობების ცვალებადობის ინტერვალებს შორის, ეწოდება ინტერვალის ვარიაციის სერია.

ინტერვალის ვარიაციული სერია აგებულია დაკვირვების მონაცემების მიხედვით მუდმივად ცვალებადი მახასიათებლისთვის, ისევე როგორც დისკრეტულად ცვალებადი, თუ დაკვირვებული ვარიანტების რაოდენობა დიდია. დისკრეტული ვარიაციული სერია აგებულია მხოლოდ დისკრეტულად განსხვავებული მახასიათებლისთვის.

ზოგჯერ ინტერვალის ვარიაციის სერია პირობითად იცვლება დისკრეტულით. შემდეგ ინტერვალის შუა მნიშვნელობა მიიღება როგორც x ვარიანტი, ხოლო შესაბამისი ინტერვალის სიხშირე მიიღება როგორც mx.

ინტერვალის ვარიაციული სერიის ასაგებად, საჭიროა განისაზღვროს ინტერვალის მნიშვნელობა, კომპლექტი სრული მასშტაბითინტერვალებს და მის შესაბამისად აჯგუფებს დაკვირვების შედეგებს.

h ოპტიმალური მუდმივი ინტერვალის დასადგენად, Sturgess-ის ფორმულა ხშირად გამოიყენება:

h = (xmax - xmin) /(1+ 3.322 log n) .

სადაც xmax xmin არის მაქსიმალური და მინიმალური ვარიანტები, შესაბამისად. თუ გამოთვლების შედეგად h აღმოჩნდება წილადი რიცხვი, მაშინ ინტერვალის მნიშვნელობად უნდა მივიღოთ ან უახლოესი მთელი რიცხვი ან უახლოესი მარტივი წილადი.

რეკომენდებულია პირველი ინტერვალის დასაწყისად აიღოთ მნიშვნელობა a1=xmin-h/2; მეორე ინტერვალის დასაწყისი ემთხვევა პირველის დასასრულს და უდრის a2=a1 +h; მესამე ინტერვალის დასაწყისი ემთხვევა მეორის დასასრულს და უდრის a3=a2 + h. ინტერვალების აგება გრძელდება შემდეგი ინტერვალის დასაწყისამდე, რათა არ იყოს xmax-ზე მეტი. ინტერვალების მასშტაბის დადგენის შემდეგ დაკვირვების შედეგები უნდა დაჯგუფდეს.

5) ცნება, გამოხატვის ფორმები და სტატისტიკური მაჩვენებლების სახეები.

სტატისტიკაარის სოციალურ-ეკონომიკური ფენომენებისა და პროცესების რაოდენობრივი მახასიათებელი თვისებრივი სიზუსტის თვალსაზრისით. ინდიკატორის ხარისხობრივი სიზუსტე მდგომარეობს იმაში, რომ იგი პირდაპირ კავშირშია შიდა შინაარსიშესწავლილი ფენომენი ან პროცესი, მისი არსი.

სტატისტიკური მაჩვენებლების სისტემაარის ურთიერთდაკავშირებული ინდიკატორების ერთობლიობა, რომელსაც აქვს ერთდონიანი ან მრავალდონიანი სტრუქტურა და მიმართულია კონკრეტული სტატისტიკური პრობლემის გადაჭრაზე.

ნიშნისგან განსხვავებით, სტატისტიკური მაჩვენებელი მიიღება გაანგარიშებით. ეს შეიძლება იყოს მოსახლეობის ერთეულების მარტივი დათვლა, მათი ატრიბუტების მნიშვნელობების ჯამი, 2 ან მეტი მნიშვნელობის შედარება ან უფრო რთული გამოთვლები.

განასხვავებენ კონკრეტულ სტატისტიკურ ინდიკატორსა და ინდიკატორ-კატეგორიას.

კონკრეტული სტატისტიკაახასიათებს ფენომენის ან პროცესის ზომას, სიდიდეს შესწავლილი მოცემულ ადგილას და შიგნით მოცემული დრო. თუმცა, in თეორიული სამუშაოებიხოლო სტატისტიკური დაკვირვების საპროექტო ეტაპზე ასევე მოქმედებენ აბსოლუტური მაჩვენებლებით ან ინდიკატორ-კატეგორიებით.

კატეგორიის ინდიკატორებიასახავს არსს, ზოგად გამორჩეული თვისებებიერთი და იგივე ტიპის კონკრეტული სტატისტიკური მაჩვენებლები ადგილის, დროისა და რიცხვითი მნიშვნელობის მითითების გარეშე. ყველა სტატისტიკური მაჩვენებელი მოსახლეობის ერთეულების დაფარვის მიხედვით იყოფა ინდივიდუალურად და თავისუფლად, ხოლო ფორმის მიხედვით - აბსოლუტურ, ფარდობით და საშუალოდ.

ინდივიდუალური ინდიკატორებიახასიათებს ცალკეულ ობიექტს ან მოსახლეობის ცალკეულ ერთეულს - საწარმოს, ფირმას, ბანკს და ა.შ. მაგალითად არის საწარმოს სამრეწველო და საწარმოო პერსონალის რაოდენობა. ერთი და იგივე ობიექტის ან ერთეულის დამახასიათებელი ორი ინდივიდუალური აბსოლუტური ინდიკატორის კორელაციის საფუძველზე მიიღება ინდივიდუალური ფარდობითი მაჩვენებელი.

შემაჯამებელი ინდიკატორებიცალკეულისგან განსხვავებით, ისინი ახასიათებენ ერთეულთა ჯგუფს, რომელიც წარმოადგენს სტატისტიკური პოპულაციის ნაწილს ან მთლიან პოპულაციას. ეს მაჩვენებლები იყოფა მოცულობით და გაანგარიშებულებად.

მოცულობის ინდიკატორებიმიიღება მოსახლეობის ცალკეული ერთეულების ატრიბუტის მნიშვნელობების დამატებით. შედეგად მიღებული მნიშვნელობა, რომელსაც ეწოდება ატრიბუტის მოცულობა, შეუძლია იმოქმედოს მოცულობის აბსოლუტური ინდიკატორის სახით და შეიძლება შევადაროთ სხვა მოცულობის აბსოლუტურ მნიშვნელობას ან პოპულაციის მოცულობას. ბოლო 2 შემთხვევაში მიიღება მოცულობითი ფარდობითი და მოცულობითი საშუალოები.

სავარაუდო მაჩვენებლებისხვადასხვა ფორმულებით გამოთვლილი ემსახურება ინდივიდუალური ამოხსნას სტატისტიკური ამოცანებიანალიზი - ვარიაციის გაზომვა, სტრუქტურული ცვლილებების მახასიათებლები, ურთიერთობის შეფასება და ა.შ. ისინი ასევე იყოფა აბსოლუტურ, ფარდობით ან საშუალოდ.

ეს ჯგუფი მოიცავს ინდექსებს, სიახლოვის კოეფიციენტებს, შერჩევის შეცდომებს და სხვა ინდიკატორებს.

მოსახლეობის ერთეულების გაშუქება და გამოხატვის ფორმა არის სტატისტიკური მაჩვენებლების ძირითადი, მაგრამ არა ერთადერთი კლასიფიკაციის ნიშნები. მნიშვნელოვანი კლასიფიკაციის თვისებაასევე დროის ფაქტორია. სოციალურ-ეკონომიკური პროცესები და მოვლენები აისახება სტატისტიკურ მაჩვენებლებში ან გარკვეული მომენტიდრო, ჩვეულებრივ გარკვეული თარიღი, თვის, წლის ან დასასრულის დასაწყისი ან დასასრული გარკვეული პერიოდი- დღე, კვირა, თვე, კვარტალი, წელი. პირველ შემთხვევაში, ინდიკატორები არის წამიერი,მეორეში - ინტერვალი.

ერთი ან ორი სასწავლო ობიექტის კუთვნილების მიხედვით, არსებობს ერთი ობიექტიდა ობიექტთაშორისი ინდიკატორები. თუ პირველი ახასიათებს მხოლოდ ერთ ობიექტს, მაშინ ეს უკანასკნელი მიიღება სხვადასხვა ობიექტთან დაკავშირებული ორი სიდიდის შედარებით.

სივრცითი სიზუსტის თვალსაზრისით სტატისტიკური მაჩვენებლები იყოფა ტერიტორიულიახასიათებს შესწავლილი ობიექტი ან ფენომენი მთელ ქვეყანაში, რეგიონალური და ადგილობრივიტერიტორიის რომელიმე ნაწილს ან ცალკეულ ობიექტს ეხება.

6) ფარდობითი ინდიკატორების სახეები და ურთიერთობა.

შედარებითი მაჩვენებელი არის ერთი აბსოლუტური მაჩვენებლის მეორეზე გაყოფის შედეგი და გამოხატავს თანაფარდობას შორის რაოდენობრივი მახასიათებლებისოციალურ-ეკონომიკური პროცესები და ფენომენები. აქედან გამომდინარე, დაკავშირებით აბსოლუტური მაჩვენებლებიშედარებითი ინდიკატორები ან ინდიკატორები ფორმაში შედარებითი ღირებულებებიწარმოებულებია.

ფარდობითი ინდიკატორის გაანგარიშებისას აბსოლუტური მაჩვენებელი, რომელიც არის მიღებული თანაფარდობის მრიცხველში ე.წ. მიმდინარეან შესადარებელი. ინდიკატორს, რომლითაც ხდება შედარება და რომელიც არის მნიშვნელში, ეწოდება შედარების საფუძველი ან საფუძველი. ფარდობითი ინდიკატორები შეიძლება გამოისახოს პროცენტებში, ppm-ში, კოეფიციენტებში, ან შეიძლება დასახელდეს რიცხვები.

პრაქტიკაში გამოყენებული ყველა შედარებითი ინდიკატორი იყოფა:

დინამიკა; გეგმა; გეგმის განხორციელება; სტრუქტურები; კოორდინაცია; ეკო-გოს განვითარების ინტენსივობა და დონე; შედარებები.

დინამიკის შედარებითი მაჩვენებელიწინასწარ არის შესწავლილი პროცესის ან ფენომენის დონის თანაფარდობა მოცემული პერიოდის განმავლობაში იმავე პროცესის ან ფენომენის დონესთან წარსულში.

OPD = მიმდინარე მაჩვენებელი / წინა. ან საბაზისო.

ამ გზით გამოთვლილი მნიშვნელობა გვიჩვენებს რამდენჯერ მიმდინარე დონეაღემატება წინას ან რა პროპორციაა ბოლო. თუ ეს მაჩვენებელი გამოიხატება მრავალჯერადი თანაფარდობით, მას უწოდებენ ზრდის ფაქტორი, როდესაც ეს კოეფიციენტი გამრავლდება 100%-ზე, მივიღებთ ზრდის ტემპი.

ფარდობითი სტრუქტურის ინდექსიწარმოადგენს შესასწავლი ობიექტის სტრუქტურული ნაწილების თანაფარდობას და მათ მთლიანობას. სტრუქტურის ფარდობითი მაჩვენებელი გამოიხატება ერთეულის ფრაქციებში ან პროცენტულად. გამოთვლილი მნიშვნელობები (d i), შესაბამისად, სახელწოდებით აქციები ან სპეციფიკური სიმძიმე, აჩვენებს, თუ რომელ წილს აქვს ან რომელი სპეციფიკური სიმძიმეაქვს i-ე ნაწილი ჯამში.

კოორდინაციის შედარებითი მაჩვენებლებიახასიათებს მთლიანის ცალკეული ნაწილების შეფარდებას ერთმანეთთან. ამ შემთხვევაში შედარების საფუძვლად შეირჩევა ის ნაწილი, რომელსაც ყველაზე დიდი წილი აქვს ან პრიორიტეტულია ეკონომიკური, სოციალური თუ სხვა თვალსაზრისით. შედეგი არის თითოეული სტრუქტურული ნაწილის რამდენი ერთეული შეადგენს ძირითადი სტრუქტურული ნაწილის 1 ერთეულს.

შედარებითი ინტენსივობის მაჩვენებელიახასიათებს შესასწავლი პროცესის ან ფენომენის განაწილების ხარისხს მის თანდაყოლილ გარემოში. ეს მაჩვენებელი გამოითვლება, როდესაც აბსოლუტური მნიშვნელობაარასაკმარისია ფენომენის მასშტაბის, მისი ზომის, გაჯერების და განაწილების სიმკვრივის შესახებ გონივრული დასკვნების ჩამოსაყალიბებლად. ის შეიძლება იყოს გამოხატული პროცენტულად, ppm ან იყოს დასახელებული მნიშვნელობა. ინტენსივობის სხვადასხვა ფარდობითი ინდიკატორია ეკო განვითარების დონის შედარებითი მაჩვენებლები,ახასიათებს წარმოებას ერთ სულ მოსახლეზე და სათამაშოდ მნიშვნელოვანი როლისახელმწიფო ეკონომიკის განვითარების შეფასებისას. გამოხატვის ფორმის მხრივ ეს მაჩვენებლები ახლოსაა საშუალო მაჩვენებლებთან, რაც ხშირად იწვევს მათ დაბნეულობას ან იდენტიფიკაციას. მათ შორის განსხვავება მხოლოდ იმაში მდგომარეობს, რომ საშუალოს გამოთვლისას საქმე გვაქვს ერთეულების ერთობლიობასთან, რომელთაგან თითოეული საშუალო მახასიათებლის მატარებელია.

შედარებითი შედარების ინდექსიარის ამავე სახელწოდების დამახასიათებელი აბსოლუტური მაჩვენებლების თანაფარდობა სხვადასხვა ობიექტები(საწარმოები, ფირმები, რეგიონები, რაიონები და ა.შ.)

ვარიაციის ინდიკატორები

ვარიაციის (პოპულაციის შიგნით თვისების მნიშვნელობების ცვლილება) შესწავლას აქვს დიდი მნიშვნელობასტატისტიკასა და ზოგადად სოციალურ და ეკონომიკურ კვლევებში. ცვალებადობის აბსოლუტური და ფარდობითი ინდიკატორები, რომლებიც ახასიათებენ ცვალებადი ატრიბუტის მნიშვნელობების რყევას, შესაძლებელს ხდის, კერძოდ, გაზომოს კავშირისა და ურთიერთობის ხარისხი, შეაფასოს მოსახლეობის ჰომოგენურობის ხარისხი, ტიპიურობა და სტაბილურობა. საშუალოს და სინჯის დაკვირვების შესაძლო შეცდომის სიდიდის დასადგენად.

ვარიაციის აბსოლუტური მაჩვენებლები მოიცავს ვარიაციის დიაპაზონს, საშუალოს წრფივი გადახრა, განსხვავება, საშუალო სტანდარტული გადახრადა კვარტალური გადახრა.

ვარიაციის დიაპაზონი გვიჩვენებს, რამდენად იცვლება რაოდენობრივად ცვალებადი ატრიბუტის მნიშვნელობა

R=xmax-xmin, სადაც xmax(xmin) არის ატრიბუტის მაქსიმალური (მინიმალური) მნიშვნელობა აგრეგატში (განაწილების სერიაში).

საშუალო წრფივი გადახრა d განისაზღვრება როგორც საშუალო ღირებულებანიშან-თვისებების ვარიანტების გადახრებიდან საშუალოდან პირველ ხარისხში, აღებული მოდულით:

საშუალო წრფივი გადახრა შედარებით იშვიათად გამოიყენება ნიშან-თვისების ვარიაციის შესაფასებლად. როგორც წესი, დისპერსია და სტანდარტული გადახრა გამოითვლება.

თუ საჭიროა რამდენიმე მახასიათებლის რყევების შედარება ერთ კომპლექტში ან იგივე მახასიათებლის რამდენიმე კომპლექტში სხვადასხვა მაჩვენებლებისადისტრიბუციო ცენტრი, შემდეგ გამოიყენეთ ვარიაციის ფარდობითი ინდიკატორები.

ეს მოიცავს შემდეგ ინდიკატორებს:

1. რხევის კოეფიციენტი:

2. ფარდობითი წრფივი გადახრა:

3. ვარიაციის კოეფიციენტი:

4. კვარტლის ვარიაციის შედარებითი მაჩვენებელი:

ფარდობითი ცვალებადობის ყველაზე ხშირად გამოყენებული საზომია ვარიაციის კოეფიციენტი. ეს მაჩვენებელი გამოიყენება არა მხოლოდ ვარიაციის შედარებითი შეფასებისთვის, არამედ როგორც მოსახლეობის ჰომოგენურობის მახასიათებელი. ნაკრები ითვლება ერთგვაროვანად თუ<0,33.

ფორმები.

1. სტატისტიკა. ანგარიშგება არის ისეთი ორგანიზაციული ფორმა, რომელშიც დაკვირვების ერთეულები აწვდიან ინფორმაციას თავიანთი საქმიანობის შესახებ ფორმების, მარეგულირებელი აპარატის სახით.

ანგარიშგების თავისებურება ის არის, რომ იგი სავალდებულოდ დასაბუთებულია, სავალდებულოა შესრულებისას და იურიდიულად დადასტურებულია ხელმძღვანელის ან პასუხისმგებელი პირის ხელმოწერით.

2. სპეციალურად ორგანიზებული დაკვირვება დაკვირვების ამ ფორმის ყველაზე ნათელი და მარტივი მაგალითია. აღწერა. აღწერა ჩვეულებრივ ტარდება რეგულარული ინტერვალებით, ერთდროულად მთელ საკვლევ ტერიტორიაზე.

რუსეთის სტატისტიკური ორგანოები ატარებენ მოსახლეობის აღწერას გარკვეული ტიპის დასახლებებისა და ორგანიზაციების, მატერიალური რესურსების, მრავალწლიანი პლანტაციების, NZ სამშენებლო ობიექტების და ა.შ.

4. დაკვირვების რეესტრის ფორმა - სტატისტიკური რეესტრის წარმოების საფუძველზე. რეესტრში ყოველი ერთეული obl-I har-Xia ინდიკატორების რაოდენობა. შიდა სტატისტიკურ პრაქტიკაში ყველაზე ფართოდ გამოიყენება რეგისტრები us-I და p/p რეგისტრები.

მოსახლეობის აღრიცხვა - ატარებს რეესტრის ოფისს

რეგისტრაცია p/p - USREO lead.org. სტატისტიკა.

სახეები.

შეიძლება დაიყოს ჯგუფებად შემდეგი მიხედვით. გამორჩეული:

ა) რეგისტრაციის დროს

ბ) კოსტ-თის ერთეულების დაფარვის თვალსაზრისით

დროის რეგ. ისინი არიან:

მიმდინარე (უწყვეტი)

უწყვეტი (პერიოდული და ერთჯერადი)

მიმდინარეობისას ობს. ფენომენებსა და პროცესებში ცვლილებები აღირიცხება მიღებისას (დაბადების რეგისტრაცია, გარდაცვალება, ქორწინება, განქორწინება და ა.შ.)

პერიოდული ობს. განხორციელდა მეშვეობით ინტერვალები (N აღწერა ყოველ 10 წელიწადში)

Ერთხელ ობს. ჩატარდა არარეგულარულად ან მხოლოდ ერთხელ (რეფერენდუმი)

ფარგლების მიხედვით cos.stat.obl. არიან, იმყოფებიან:

მყარი

უწყვეტი

უწყვეტი დაკვირვება. არის გამოკითხვა ყველა ერთეულის cos

უწყვეტი დაკვირვება ვარაუდობს, რომ კვლევის მხოლოდ ნაწილი ექვემდებარება შენარჩუნებას.

არსებობს რამდენიმე სახის უწყვეტი დაკვირვება:

მთავარი მეთოდი მასივი

შერჩევითი (თვითონ)

მონოგრაფიული

ეს მეთოდი არის x-Xia იმით, რომ, როგორც წესი, ყველაზე მეტი არსება ირჩევა, როგორც წესი, ყველაზე დიდი ერთეული. ბუები კატაში. შუა ნიშნავს. ყველა დაკვირვებადი ნიშნის ნაწილი.

მონოგრაფიული დაკვირვებით, ფრთხილად ა. ექვემდებარებიან ერთეულები ისწავლე ოჰ ბუები ან მ.ბ. ან ტიპიური ამ cov-ti ერთეულებისთვის. ან წარმოადგენენ ფენომენების ახალ სახეობებს.

ობს. განხორციელდა განვითარების ან განვითარებადი ტენდენციების იდენტიფიცირების მიზნით ამ ფენომენს.

გზები

პირდაპირი დაკვირვება

დოკუმენტური დაკვირვება.

პირდაპირ დაურეკეს. ასეთი დაკვირვებადი კატასთან ერთად თავად რეგისტრატორები პირდაპირი გაზომვის, გამოთვლის, შეკავების გზით ადგენენ რეგისტრაციას დაქვემდებარებულ ფაქტს და ამის საფუძველზე აკეთებენ ჩანაწერს ფორმაში.

დოკუმენტური მეთოდი obl. ინფორმაციის წყაროდ სხვადასხვა დოკუმენტის გამოყენებაზე დაყრდნობით, როგორც ბუღალტრული აღრიცხვის x-ra (ე.ი. სტატისტიკური ანგარიშგების) წესი.

გამოკითხვა კატასთან დარწმუნების მეთოდია. საჭირო ინფორმაცია მიიღება რესპონდენტის (ანუ რესპონდენტის) სიტყვებიდან (ზეპირი, კორესპონდენტი, კითხვარი, პირადი და ა.შ.)

შერჩევის შეცდომების დადგენა.

შერჩევის დაკვირვების პროცესში გამოიყოფა შეცდომების ორი ტიპი: რეგისტრაცია და წარმომადგენლობა.

რეგისტრაციის შეცდომები - გადახრები სტატისტიკური დაკვირვების დროს მიღებული ინდიკატორისა და მის რეალურ მნიშვნელობას შორის. ეს შეცდომები შეიძლება გამოჩნდეს როგორც უწყვეტი, ასევე არაუწყვეტი დაკვირვების დროს. რეგისტრაციის შეცდომები წარმოიქმნება არასწორი ან არაზუსტი ინფორმაციის გამო. ამ ტიპის შეცდომის წყარო შეიძლება იყოს საკითხის არსის გაუგებრობა, რეგისტრატორის უყურადღებობა, დაკვირვების ცალკეული ერთეულების გამოტოვება ან განმეორებითი დათვლა. რეგისტრაციის შეცდომები იყოფა სისტემატურიერთი მიმართულებით მოქმედი მიზეზების გამო და გამოკვლევის შედეგების გამარტივება (რიცხვების დამრგვალება) და შემთხვევითი, რომლებიც სხვადასხვა შემთხვევითი ფაქტორების მოქმედების შედეგია (მიმდებარე ციფრების გადაწყობა). შემთხვევით შეცდომებს განსხვავებული მიმართულებები აქვთ და გამოკითხული მოსახლეობის საკმარისად დიდი მოცულობით, ერთმანეთს ანადგურებენ.

წარმომადგენლობითობის შეცდომები - გამოკითხული მოსახლეობის ინდიკატორის მნიშვნელობების გადახრები საწყის პოპულაციაში მისი მნიშვნელობიდან. ეს შეცდომები ასევე იყოფა სისტემატურიჩნდება საწყისი პოპულაციისგან დასაკვირვებელი ერთეულების შერჩევის პრინციპების დარღვევის შედეგად და შემთხვევითირომ წარმოიქმნება, თუ შერჩეული პოპულაცია არასრულად ამრავლებს მთელ პოპულაციას მთლიანობაში. შემთხვევითი შეცდომის ოდენობა შეიძლება შეფასდეს.

შერჩევის შეცდომა- განსხვავება საერთო პოპულაციაში ატრიბუტის მნიშვნელობასა და შერჩევითი დაკვირვების შედეგებიდან გამოთვლილ მის მნიშვნელობას შორის. სანიმუშო გამოკითხვის პრაქტიკაში ყველაზე ხშირად დგინდება შერჩევის საშუალო და ზღვრული შეცდომები.

შერჩევის სხვადასხვა მეთოდისთვის შერჩევის საშუალო შეცდომა განსხვავებულად გამოითვლება. თუ შემთხვევითი ან მექანიკური შერჩევა, მაშინ

საშუალოდ: m \u003d s 2 / (n) 1/2

წილადისთვის: m = (w(1-w)/n) 1/ 2, სადაც

m - შერჩევის საშუალო შეცდომა

s 2 - ზოგადი დისპერსია

n - მოცულობა ნიმუშის ჩარჩო

თუ შერჩევის ნაკრები ყალიბდება ტიპიური ნიმუშის საფუძველზე და ერთეულების შერჩევა ხდება ტიპიური ჯგუფების მოცულობის პროპორციულად, მაშინ საშუალო შეცდომა უდრის:

შუასთვის: m = (s i 2 / n) 1/2

გასაზიარებლად: m = (w i (1-w i) / n) 1/2 , სად

s i 2 - ჯგუფშიდა ვარიაციების საშუალო

w i არის ერთეულების პროპორცია მთელ ჯგუფში, რომლებსაც აქვთ შესასწავლი თვისება.

s i 2 = ås 2 n i / ån i

სერიული შერჩევის საშუალო შეცდომა უდრის:

შუასთვის: m = (d x 2 / r) 1/2

გასაზიარებლად: m = (d 2 w / r) 1/2

d 2 w -წილის ჯგუფთაშორისი განსხვავება

d x 2 -რაოდენობრივი ნიშნის ჯგუფთაშორისი დისპერსია.

r არის შერჩეული სერიების რაოდენობა/

d 2 x \u003d å (x i -x) 2 / r

d 2 w \u003d å (w i - w) 2 / r

თუ საერთო პოპულაციის ერთეულების შერჩევა განხორციელდება არაგანმეორებადი გზით, მაშინ შესწორება ხდება შეცდომის საშუალო ფორმულებში: (1-n/N) 1/2

შერჩევის ზღვრული შეცდომა D გამოითვლება ნდობის ფაქტორის t და საშუალო შერჩევის შეცდომის ნამრავლის სახით: D = t*m. D დაკავშირებულია ალბათობის დონესთან, რომელიც იძლევა გარანტიას. ეს დონე განსაზღვრავს ნდობის ფაქტორს t და პირიქით. t-ის მნიშვნელობები მოცემულია სპეციალურ მათემატიკურ ცხრილებში.

ნიმუშის ზომის განსაზღვრა.

შერჩევის ზომა გამოითვლება, როგორც წესი, შერჩევის კვლევის შემუშავების ეტაპზე. ნიმუშის ზომის განსაზღვრის ფორმულები გამომდინარეობს ზღვრული შერჩევის შეცდომების ფორმულებიდან.

შემთხვევითი და მექანიკური განმეორებითი ნიმუშების მოცულობა განისაზღვრება ფორმულებით:

საშუალოდ n \u003d t 2 s 2 / D 2

გასაზიარებლად n \u003d t 2 w (1-w) / D 2

განმეორებითი შერჩევის შემთხვევაში:

საშუალოდ n \u003d t 2 s 2 N / ND 2 + t 2 s 2

გასაზიარებლად n = t 2 w(1-w)N / ND 2 +t 2 w(1-w).

მნიშვნელობები არის 2 და შემთხვევითი დაკვირვებამდე უცნობია. ისინი დაახლოებით ასე გვხვდება:

1. აღებული წინა კვლევებიდან;

2. თუ ცნობილია ატრიბუტის მაქსიმალური და მინიმალური მნიშვნელობები, მაშინ სტანდარტული გადახრა განისაზღვრება "სამი სიგმის" წესის მიხედვით:

s= xmax – xmin / 6

3. ალტერნატიული ნიშნის შესწავლისას, თუ არ არის ინფორმაცია მისი წილის შესახებ საერთო პოპულაციაში, აღებულია მაქსიმალური შესაძლო მნიშვნელობა w = 0,5.

ტიპიური შერჩევით, ტიპიური ჯგუფების ზომის პროპორციულად, თითოეული ჯგუფის ნიმუშის ზომა განისაზღვრება ფორმულით : n i = n*N i / N, სად

n მე -ნიმუშის ზომა i-ე ჯგუფიდან

N i- i -th ჯგუფის მოცულობა გენში-th cos-ti.

ნიშან-თვისების ცვალებადობის პროპორციული ნიმუშით, თითოეული ჯგუფიდან შერჩევის ზომა შემდეგია: n i = nN i s i /åN i s i.

ტიპური ხელახალი შერჩევისას, რომელიც პროპორციულია ჯგუფების ზომისა, ნიმუშის მთლიანი ზომა შემდეგნაირად არის ნაპოვნი:

საშუალოდ n \u003d t 2 s 2 i / D 2

გასაზიარებლად n \u003d t 2 w (1-w) / D 2

განმეორებითი ტიპიური შერჩევის შემთხვევაში:

საშუალოდ n = t 2 s 2 i N / D 2 N + t 2 s 2 i

გასაზიარებლად n = t 2 w(1-w)N / D 2 N+t 2 w(1-w)

კორელაციური და რეგრესიული ანალიზის გამოყენების ძირითადი ცნებები და წინაპირობები.

კორელაციაარის სტატისტიკური დამოკიდებულება შემთხვევით ცვლადებს შორის, რომლებსაც არ აქვთ მკაცრად ფუნქციონალური ხასიათი, რომელშიც ხდება ცვლილება ერთ-ერთში შემთხვევითი ცვლადებიიწვევს სხვისი მათემატიკური მოლოდინის ცვლილებას.

კორელაციური ანალიზი- მისი ამოცანაა ორ ნიშანს შორის კავშირის სიახლოვის რაოდენობრივი განსაზღვრა და ეფექტურ და მრავალფაქტორიან ნიშანს შორის. კავშირის სიმჭიდროვე რაოდენობრივად გამოიხატება კორელაციის კოეფიციენტების მნიშვნელობით.

კორელაცია-რეგრესიაანალიზი, როგორც ზოგადი კონცეფცია, მოიცავს შებოჭილობის გაზომვას, კომუნიკაციის მიმართულებას და კომუნიკაციის ანალიტიკური გამოხატვის (ფორმის) დადგენას (რეგრესიული ანალიზი).

Რეგრესიული ანალიზიმოიცავს ურთიერთობის ანალიტიკური გამოხატვის განსაზღვრას, რომელშიც ერთი მნიშვნელობის ცვლილება (ე.წ. დამოკიდებულ ან ეფექტურ მახასიათებელს) განპირობებულია ერთი ან მეტი დამოუკიდებელი ცვლადის (ფაქტორების) გავლენით და ყველა სხვა ფაქტორების სიმრავლით, რომლებიც ასევე გავლენას ახდენენ. დამოკიდებული მნიშვნელობა, იღებს - შრომობს მუდმივი და საშუალო მნიშვნელობებისთვის. რეგრესია შეიძლება იყოს ერთფაქტორიანი (წყვილი) და მრავალფაქტორიანი (მრავალჯერადი).

რეგრესიული ანალიზის მიზანიარის ეფექტური ატრიბუტის (Y) პირობითი საშუალო მნიშვნელობის ფუნქციური დამოკიდებულების შეფასება ფაქტორულ (x 1, x 2, ... x k) ნიშნებზე.

რეგრესიული ანალიზის მთავარი წინაპირობაარის ის, რომ მხოლოდ შედეგიანი ნიშანი (Y) ემორჩილება ნორმალურ განაწილების კანონს, ხოლო ფაქტორების ნიშნებს x 1, x 2, ..., x k შეიძლება ჰქონდეს თვითნებური განაწილების კანონი. დროის სერიების ანალიზისას დრო t მოქმედებს როგორც ფაქტორის ნიშანი. ამავდროულად, რეგრესიის ანალიზში წინასწარ იგულისხმება მიზეზობრივი კავშირის არსებობა ეფექტურ (Y) ფაქტორულ (x 1, x 2, ..., x k) ნიშნებს შორის. რეგრესიის განტოლება, ან სოციალურ-ეკონომიკური ფენომენების ურთიერთკავშირის სტატისტიკური მოდელი, გამოხატული ფუნქციით Y x \u003d f (x 1, x 2, ..., x k), საკმაოდ ადეკვატურია რეალური სიმულირებული ფენომენის ან პროცესისთვის. თუ დაცულია შემდეგი მოთხოვნები მათი მშენებლობისთვის.

1. შესასწავლი საწყისი მონაცემების მთლიანობა ერთგვაროვანია და მათემატიკურად აღწერილია უწყვეტი ფუნქციებით.

2. სიმულირებული ფენომენის აღწერის შესაძლებლობა მიზეზ-შედეგობრივი ურთიერთობის ერთი ან მეტი განტოლებით.

3. ყველა ფაქტორის ნიშანს უნდა ჰქონდეს რაოდენობრივი (რიცხობრივი) გამოხატულება.

4. შესასწავლი ნიმუშის საკმარისად დიდი მოცულობის არსებობა.

5. მიზეზ-შედეგობრივი კავშირი მოვლენებსა და პროცესებს შორის უნდა იყოს აღწერილი დამოკიდებულების წრფივი ან წრფივი ფორმით.

6. საკომუნიკაციო მოდელის პარამეტრებზე რაოდენობრივი შეზღუდვების არარსებობა.

7. შესწავლილი მოსახლეობის ტერიტორიული და დროითი სტრუქტურის მუდმივობა.

კორელაციისა და რეგრესიის ანალიზის საფუძველზე აგებული ურთიერთობის მოდელების თეორიული ვალიდობა უზრუნველყოფილია შემდეგზე დაკვირვებით. ძირითადი პირობები.

1. ყველა ნიშანი და მათი ერთობლივი განაწილება უნდა ემორჩილებოდეს ნორმალურ განაწილების კანონს;

2. მოდელირებული ნიშან-თვისების (Y) ვარიაცია ყოველთვის უნდა დარჩეს მუდმივი მნიშვნელობის (Y) და ფაქტორების ნიშან-თვისებების მნიშვნელობების შეცვლისას.

3. ცალკეული დაკვირვებები უნდა იყოს დამოუკიდებელი, ანუ მე-ე დაკვირვების შედეგად მიღებული შედეგები არ უნდა იყოს დაკავშირებული წინასთან და შეიცავდეს ინფორმაციას შემდგომი დაკვირვებების შესახებ, ასევე გავლენას მოახდენს მათზე.

შემაჯამებელი მიზნები და შინაარსი

დაკვირვება გვაწვდის ინფორმაციას შესწავლილი ობიექტის თითოეულ ერთეულზე. მიღებული მონაცემები არ არის ზოგადი მაჩვენებლები. მათი დახმარებით შეუძლებელია დასკვნის გაკეთება მთლიან ობიექტზე მონაცემთა წინასწარი დამუშავების გარეშე.

მაშასადამე, სტატისტიკური კვლევის შემდეგი ეტაპის მიზანია პირველადი მონაცემების სისტემატიზაცია და, ამის საფუძველზე, მთლიანი ობიექტის შემაჯამებელი მახასიათებლის მიღება განზოგადებული სტატისტიკური მონაცემების გამოყენებით.

შეჯამება - თანმიმდევრული ოპერაციების ერთობლიობა კონკრეტული ცალკეული ფაქტების განზოგადებისთვის, რომლებიც ქმნიან კომპლექტს, რათა გამოავლინოს ტიპიური მახასიათებლები და შაბლონები, რომლებიც თან ახლავს შესასწავლ ფენომენს მთლიანობაში.

თუ სტატისტიკური დაკვირვების დროს გროვდება მონაცემები ობიექტის თითოეული ერთეულის შესახებ, მაშინ შეჯამების შედეგი არის დეტალური მონაცემები, რომელიც ასახავს მთლიან პოპულაციას.

სტატისტიკური შეჯამება უნდა ჩატარდეს ფენომენებისა და პროცესების წინასწარი თეორიული ანალიზის საფუძველზე, რათა შეჯამების დროს არ დაიკარგოს ინფორმაცია შესასწავლი ფენომენის შესახებ და ყველა სტატისტიკური შედეგი ასახავდეს ობიექტის ყველაზე მნიშვნელოვან მახასიათებელ მახასიათებლებს.

მასალის დამუშავების სიღრმის მიხედვით, შეჯამება შეიძლება იყოს მარტივი და რთული.

მარტივი შეჯამება არის დაკვირვების ერთი და იგივე ერთეულებისთვის ჯამების გამოთვლის ოპერაცია.

რთული შეჯამება არის ოპერაციების ერთობლიობა, რომელიც მოიცავს დაკვირვების ერთეულების დაჯგუფებას, ჯამების დათვლას თითოეული ჯგუფისთვის და მთელი ობიექტისთვის და დაჯგუფებისა და შემაჯამებელი შედეგების სტატისტიკური ცხრილების სახით წარმოდგენას.

შეჯამებას წინ უძღვის მისი პროგრამის შემუშავება, რომელიც შედგება შემდეგი ეტაპებისაგან: დაჯგუფების მახასიათებლების შერჩევა; ჯგუფების ფორმირების რიგითობის განსაზღვრა; სტატისტიკური პოკ-ლეის სისტემის შემუშავება ჯგუფებისა და მთლიანად ობიექტის დასახასიათებლად; სტატისტიკური ცხრილების განლაგების სისტემის შემუშავება, რომელშიც უნდა იყოს წარმოდგენილი შეჯამების შედეგები.

მასალის დამუშავების ფორმის მიხედვით შეჯამება: დეცენტრალიზებული და ცენტრალიზებული.

დეცენტრალიზებული შეჯამებით (იგი გამოიყენება, როგორც წესი, სტატისტიკური ანგარიშგების დამუშავებისას) მასალის შემუშავება ხდება თანმიმდევრული ეტაპებით. ამრიგად, საწარმოების ანგარიშები შეჯამებულია რუსეთის ფედერაციის შემადგენელი სუბიექტების სტატისტიკური ორგანოების მიერ, ხოლო რეგიონის შედეგები უკვე იგზავნება რუსეთის სტატისტიკის სახელმწიფო კომიტეტში და იქ ისინი განისაზღვრება მთელი ეროვნული ეკონომიკისთვის. ქვეყანა.

ცენტრალიზებული შეჯამებით, ყველა პირველადი მასალა შედის ერთ ორგანიზაციაში, სადაც მუშავდება თავიდან ბოლომდე. ცენტრალიზებული რეზიუმე ჩვეულებრივ გამოიყენება ერთჯერადი სტატისტიკური კვლევების მასალების დასამუშავებლად.

შესრულების ტექნიკის მიხედვით, სტატისტიკური რეზიუმე იყოფა მექანიზებულ და სახელმძღვანელოდ.

მექანიზებული რეზიუმე - რომელშიც ყველა ოპერაცია ხორციელდება ელექტრონული კომპიუტერების გამოყენებით. ხელით შეჯამებით, ყველა ძირითადი ოპერაცია (ჯგუფური და ჯამური ჯამების გამოთვლა) ხორციელდება ხელით.

შეჯამების განსახორციელებლად შედგენილია გეგმა, რომელიც ადგენს ორგანიზაციულ საკითხებს: ვის მიერ და როდის განხორციელდება ყველა ოპერაცია, ჩატარების წესი, პერიოდულ პრესაში გამოსაქვეყნებელი ინფორმაციის შემადგენლობა.

დინ-კი რიგების დახურვა

დინ-კი რიგების გაანალიზებისას საჭირო ხდება მათი დახურვა - ორი ან მეტი რიგის ერთ რიგში გაერთიანება. დახურვა აუცილებელია იმ შემთხვევებში, როდესაც სერიის დონეები შეუდარებელია ტერიტორიული ცვლილებების გამო, ფასების ცვლილების გამო და სერიის დონეების გამოთვლის მეთოდოლოგიის ცვლილების გამო. აუცილებელია ზემოთ მოყვანილი ორი მწკრივის ერთში დახურვა (გაერთება). ეს შეიძლება გაკეთდეს შედარების ფაქტორის გამოყენებით. წლის მონაცემების მიღებულ კოეფიციენტზე გამრავლებით, მივიღებთ აბსოლუტური სიდიდეების დინამიკის დახურულ (შედარებად) სერიას, ხოლო ცვლილების შემდეგ იღებენ 100% -ს, ხოლო დანარჩენი ხელახლა გამოითვლება პროცენტულად, შესაბამისად, ამ დონეებთან შედარებით.

30. M-dy გასწორების რიგები დინ-კი

დინ-კი-ს ნებისმიერი სერია თეორიულად შეიძლება წარმოდგენილი იყოს სამი კომპონენტის სახით:

ტრენდი (დინამიური სერიის ძირითადი ტენდენცია და განვითარება);

ციკლური (პერიოდული) რყევები, სეზონური ჩათვლით;

შემთხვევითი რყევები.

ერთ-ერთი ამოცანა, რომელიც წარმოიქმნება დინამიური სერიების ანალიზისას, არის შესწავლილი ფენომენის დონეებში ცვლილებების დადგენა. ზოგიერთ შემთხვევაში, დინ-კი სერიების დონის ცვლილებების ნიმუში საკმაოდ მკაფიოა, მაგალითად, სერიის დონის სისტემატური შემცირება, ან მათი ზრდა. ზოგჯერ სერიის დონეები განიცდის მრავალფეროვან ცვლილებას (ზოგჯერ იზრდება, ხან კლებულობს). ამ შემთხვევაში, ჩვენ შეგვიძლია ვისაუბროთ მხოლოდ ზოგად ტენდენციაზე და განვითარებაზე: ან ზრდაზე ან კლებაზე.

ძირითადი ტენდენციის და განვითარების (ტენდენციის) იდენტიფიკაციას ეწოდება დროის სერიების გასწორება, ხოლო m-dy ძირითადი ტენდენციის m-dy ნიველირება.

ტენდენციის პირდაპირი შერჩევა შესაძლებელია სამი მე-მიით.

* Md უხეში ინტერვალები. ეს md ეფუძნება დროის ხაზების გაფართოებას, რომელიც მოიცავს სერიის დონეებს. მაგალითად, რიგი დინ-კი

ყოველდღიური გამომუშავება იცვლება ყოველთვიური გამომავალი პროგნოზების სერიით და ა.შ.

* Md მოძრავი საშუალო. ამ m-de-ში სერიის საწყისი დონეები ჩანაცვლებულია საშუალო მნიშვნელობებით, რომლებიც მიიღება მოცემული დონიდან და რამდენიმე სიმეტრიულად მიმდებარე დონიდან. დონეების მთელ რიცხვს, რომლებზედაც გამოითვლება საშუალო მნიშვნელობა, ეწოდება დამარბილებელი ინტერვალი. დამარბილების ინტერვალი შეიძლება იყოს კენტი (3, 5, 7 და ა.შ. ქულა) ან ლუწი (2, 4, 6 და ა.შ. ქულა). საშუალოების გამოთვლა ხორციელდება სრიალის მეთოდით, ანუ პირველი დონის თანდათანობით გამორიცხვით მიღებული სრიალის პერიოდიდან და მომდევნოს ჩათვლით. უცნაური გამარტივებით, მიღებული საშუალო არითმეტიკული მნიშვნელობა ენიჭება გამოთვლილი ინტერვალის შუას.

მოძრავი საშუალოებით გამარტივების "-" მ-დიკა შედგება სერიის დასაწყისში და ბოლოს წერტილებისთვის გათლილი დონის განსაზღვრაში.

* ანალიტიკური გასწორება - არის ყველაზე ეფექტური გზა ძირითადი ტენდენციისა და განვითარების გამოსავლენად. ამ შემთხვევაში დინამიკის სერიის დონეები გამოიხატება დროის ფუნქციით: Yt=f(t)

din-th სერიის ანალიტიკურ განლაგების დანიშნულება არის f(t) ანალიტის ქარხნის განსაზღვრა. პრაქტიკაში, არსებული დროის სერიების მიხედვით, დგინდება ფორმა და მოიძებნება f(t) ფუნქციის პარამეტრები, შემდეგ კი გაანალიზებულია ტენდენციიდან გადახრების ქცევა.

ეკონომიკაში ხშირად გამოიყენება ფორმის ფუნქცია: Уi = а0 +∑ ai +ti

ფორმის (3.12) ფუნქციებიდან ყველაზე ხშირად ნიველირებისას გამოიყენება ხაზოვანი სისტემა / (*) \u003d ao + a1 * t ან პარაბოლური f (t) \u003d a0 + att + a2 t2.

კოეფიციენტები ao,a,a2,...,ap გვხვდება ფორმულაში უმცირესი კვადრატებით.

ამ მეთოდის მიხედვით, p-th ხარისხის მრავალწევრის პარამეტრების საპოვნელად საჭიროა ეგრეთ წოდებული ნორმალური განტოლებების სისტემის ამოხსნა:

nao+a1∑t=∑Y

ao∑t+ a1∑t*t= ∑Y*t.

ტენდენცია გვიჩვენებს, თუ როგორ მოქმედებს სისტემატური ფაქტორები დინ-კის დონეებზე. ტენდენციის ირგვლივ დონეების რყევა ემსახურება ნარჩენი (შემთხვევითი) ფაქტორების გავლენის საზომს. ეს გავლენა შეიძლება შეფასდეს

სტანდარტული გადახრის ფორმულის მიხედვით.

კორელაცია-რეგრესიული ანალიზის ძირითადი ცნებები.

პარამეტრის სახელი მნიშვნელობა
სტატიის თემა: ვარიაციების სერია
რუბრიკა (თემატური კატეგორია) წარმოება

შემთხვევითი ცვლადის დაკვირვებული მნიშვნელობები X 1 , X 2 , …, x kდაურეკა პარამეტრები.

სიხშირეპარამეტრები Xმე მქვია ნომერი n i (მე=1,…,) აჩვენებს რამდენჯერ არის ეს ვარიანტი ნიმუშში.

სიხშირე(შეფარდებითი სიხშირე, აქციები) ოფციები x i (მე=1,…,) ჩვეულებრივ უწოდებენ მისი სიხშირის თანაფარდობას n iნიმუშის ზომამდე .

სიხშირეები და სიხშირეები ე.წ სასწორები.

დაგროვილი სიხშირეჩვეულებრივად არის გამოძახებული ვარიანტების რაოდენობა, რომელთა მნიშვნელობები მოცემულზე ნაკლებია X:

დაგროვილი სიხშირეჩვეულებრივ, დაგროვილი სიხშირის თანაფარდობა ნიმუშის ზომასთან არის დაძახება:

ვარიაციის სერია(სტატისტიკური სერია) - ჩვეულებრივად არის გამოძახებული აღმავალი თანმიმდევრობით დაწერილი ვარიანტების თანმიმდევრობა და მათი შესაბამისი წონა.

ვარიაციის სერია უნდა იყოს დისკრეტული(დისკრეტული შემთხვევითი ცვლადის მნიშვნელობების ნიმუში) და უწყვეტი (ინტერვალი)(უწყვეტი შემთხვევითი ცვლადის მნიშვნელობების შერჩევა).

დისკრეტულ ვარიაციულ სერიას აქვს ფორმა:

როდესაც ვარიანტების რაოდენობა დიდია ან ფუნქცია უწყვეტია (შემთხვევითი ცვლადი შეიძლება მიიღოს ნებისმიერი მნიშვნელობა გარკვეულ ინტერვალში), ისინი ინტერვალივარიაციის სერია.

ინტერვალის ვარიაციის სერიის შესაქმნელად, განახორციელეთ დაჯგუფებავარიანტი - ისინი იყოფა ცალკეულ ინტერვალებად:

ინტერვალების რაოდენობა ზოგჯერ განისაზღვრება გამოყენებით Sturges ფორმულები:

შემდეგ გამოითვლება ვარიანტების რაოდენობა, რომლებიც ხვდება თითოეულ ინტერვალში - სიხშირეები n i(ან სიხშირე n i/). თუ ვარიანტი არის ინტერვალის საზღვარზე, მაშინ ის მიმაგრებულია სწორ ინტერვალზე.

ინტერვალის ვარიაციულ სერიას აქვს ფორმა:

Პარამეტრები
სიხშირეები

ემპირიული (სტატისტიკური) განაწილების ფუნქციაჩვეულებრივია გამოიძახოთ ფუნქცია, რომლის მნიშვნელობაც წერტილშია Xუდრის ფარდობითი სიხშირის, რომელზედაც ვარიანტი მიიღებს ნაკლებ მნიშვნელობას X(კუმულაციური სიხშირე ამისთვის X):

სიხშირის პოლიგონიეწოდება პოლიხაზი, რომლის სეგმენტები აკავშირებს წერტილებს კოორდინატებთან ( X 1 ; 1), (X 2 ; 2), …, (x k; ნკ). The სიხშირის პოლიგონი, რომელიც არის განაწილებათა მრავალკუთხედის სტატისტიკური ანალოგი.

უნდა ითქვას, რომ უწყვეტი ვარიაციული სერიებისთვის შეიძლება აშენდეს მრავალკუთხედი, თუ მნიშვნელობებია X 1 , X 2 , …, x kაიღეთ ინტერვალების შუა წერტილები.

ინტერვალის ვარიაციების სერია ჩვეულებრივ გრაფიკულად არის გამოსახული გამოყენებით ჰისტოგრამები.

ზოლიანი დიაგრამა- საფეხურიანი ფიგურა, რომელიც შედგება მართკუთხედებისგან, რომელთა ფუძეები არის ნაწილობრივი სიგრძის ინტერვალები = x i +1 – x i, მე= 0,…,-1 და სიმაღლეები ტოლია ინტერვალების სიხშირეების (ან სიხშირეების) n i (w i).

კუმულაცია(კუმულაციური მრუდი) - დაგროვილი სიხშირეების (სიხშირეების) მრუდი. ამისთვის დისკრეტული სერიაკუმულატი არის გატეხილი ხაზი, რომელიც აკავშირებს წერტილებს ან , . ამისთვის ინტერვალის სერიაკუმულაცია იწყება წერტილიდან, რომლის აბსციზა უდრის პირველი ინტერვალის დასაწყისს, ხოლო ორდინატი არის დაგროვილი სიხშირე (სიხშირე) ნულის ტოლი. ამ გატეხილი ხაზის სხვა წერტილები შეესაბამება ინტერვალების ბოლოებს.

ვარიაციების სერია - კონცეფცია და ტიპები. კატეგორიის კლასიფიკაცია და მახასიათებლები "ვარიაციის სერია" 2017, 2018.

  • - განაწილების ვარიაციების სერია

    საცალო ვაჭრობის ბრუნვის განაწილება რუსეთის ფედერაციაში 1995 წელს საკუთრების ტიპის მიხედვით, მილიონი რუბლი განაწილების სერიის სახეები ლექცია VIII. სადისტრიბუციო სერიები პირველადი სტატისტიკური მონაცემების დამუშავებისა და სისტემატიზაციის შედეგად იღებენ ....


  • - ვარიაციების სერია

    სტატისტიკური მონაცემების უმარტივესი ტრანსფორმაცია არის მათი დალაგება სიდიდის მიხედვით. ნიმუშის ზომა ზოგადი პოპულაციიდან, დალაგებულია ელემენტების შეუმცირებელი თანმიმდევრობით, ე.ი. , ეწოდება ვარიაციის სერია: . იმ შემთხვევაში, როდესაც დაკვირვების მოცულობა ... .


  • - დავალება 2. ინტერვალის ვარიაციის სერია

    1. დავალების ვარიანტის შესაბამისი მოცემული ნიმუშის საფუძველზე შექმენით ინტერვალის ვარიაციის სერია; ჰისტოგრამის აგება და კუმულაცია (გამოიყენეთ ორი მეთოდი: Excel-ის დიაგრამის ჩასმა და "მონაცემთა ანალიზის" პაკეტის "ჰისტოგრამის" რეჟიმი). 2. გაანალიზეთ მიღებული ჰისტოგრამა. ....


  • - შეადგინეთ იმავე ასაკის ნებისმიერი მცენარის ლობიოს თესლის ან ფოთლების ნიშან-თვისების ცვალებადობის ვარიაციული სერია. გამოავლინეთ თვისებების ცვალებადობის ნიმუშები.

    პოპულაცია არის სახეობის სტრუქტურული ერთეული. მოსახლეობის რაოდენობა. მოსახლეობის რყევების მიზეზები. ინდივიდების ურთიერთობა პოპულაციებში და ერთი და იგივე სახეობის სხვადასხვა პოპულაციას შორის. 1. სახეობის მნიშვნელოვანი მახასიათებელია მისი განაწილება ჯგუფებად, პოპულაციები ...

  • ვარიაციების სერია: განმარტება, ტიპები, ძირითადი მახასიათებლები. გაანგარიშების მეთოდი
    მოდა, მედიანა, საშუალო არითმეტიკული სამედიცინო და სტატისტიკურ კვლევებში
    (აჩვენე პირობით მაგალითზე).

    ვარიაციული სერია არის შესასწავლი ნიშან-თვისების რიცხვითი მნიშვნელობების სერია, რომლებიც განსხვავდებიან ერთმანეთისგან თავიანთი სიდიდით და განლაგებულია გარკვეული თანმიმდევრობა(აღმავალი ან კლებადი მიმდევრობით). სერიის თითოეულ რიცხობრივ მნიშვნელობას ეწოდება ვარიანტი (V), ხოლო რიცხვებს, რომლებიც გვიჩვენებს, თუ რამდენად ხშირად ხდება ესა თუ ის ვარიანტი ამ სერიის შემადგენლობაში, სიხშირე (p).

    დაკვირვების შემთხვევების საერთო რაოდენობა, რომელთაგან შედგება ვარიაციის სერია, აღინიშნება ასო n-ით. შესწავლილი მახასიათებლების მნიშვნელობის განსხვავებას ვარიაცია ეწოდება. თუ ცვლადის ნიშანს არ აქვს რაოდენობრივი საზომი, ვარიაციას ეწოდება ხარისხობრივი, ხოლო განაწილების სერიას - ატრიბუტი (მაგალითად, განაწილება დაავადების შედეგის მიხედვით, ჯანმრთელობის მდგომარეობა და ა.შ.).

    თუ ცვლადის ნიშანს აქვს რაოდენობრივი გამოხატულება, ასეთ ცვალებადობას რაოდენობრივი ეწოდება, ხოლო განაწილების სერიებს ცვალებადობა.

    ვარიაციული სერიები იყოფა უწყვეტად და უწყვეტად - რაოდენობრივი ნიშან-თვისების ბუნების მიხედვით, მარტივი და შეწონილი - ვარიანტის გაჩენის სიხშირის მიხედვით.

    მარტივ ვარიაციულ სერიაში ყოველი ვარიანტი ხდება მხოლოდ ერთხელ (p=1), შეწონილში ერთი და იგივე ვარიანტი ხდება რამდენჯერმე (p>1). ასეთი სერიის მაგალითები მოგვიანებით იქნება განხილული ტექსტში. Თუ რაოდენობრივი ნიშანიარის უწყვეტი, ე.ი. მთელ რიცხვებს შორის არის შუალედური წილადი რაოდენობები, ვარიაციულ სერიას უწყვეტი ეწოდება.

    მაგალითად: 10.0 - 11.9

    14.0 - 15.9 და ა.შ.

    თუ რაოდენობრივი ნიშანი შეწყვეტილია, ე.ი. მისი ინდივიდუალური მნიშვნელობები (ვარიანტები) განსხვავდება ერთმანეთისგან მთელი რიცხვით და არ აქვთ შუალედური წილადური მნიშვნელობები, ვარიაციულ სერიას ეწოდება წყვეტილი ან დისკრეტული.

    წინა მაგალითის მონაცემების გამოყენება გულისცემის შესახებ

    21 მოსწავლისთვის ავაშენებთ ვარიაციების სერიას (ცხრილი 1).

    ცხრილი 1

    სამედიცინო სტუდენტების განაწილება პულსის სიხშირით (bpm)

    ამრიგად, ვარიაციული სერიის აშენება ნიშნავს ხელმისაწვდომს რიცხვითი მნიშვნელობები(ოფციები) სისტემატიზაცია, გამარტივება, ე.ი. დაალაგეთ გარკვეული თანმიმდევრობით (აღმავალი ან კლებადი მიმდევრობით) მათი შესაბამისი სიხშირეებით. განსახილველ მაგალითში ოფციონები განლაგებულია ზრდის მიხედვით და გამოიხატება როგორც წყვეტილი (დისკრეტული) მთელი რიცხვები, თითოეული ვარიანტი ხდება რამდენჯერმე, ე.ი. საქმე გვაქვს შეწონილ, წყვეტილ ან დისკრეტულ ვარიაციულ სერიასთან.

    როგორც წესი, თუ სტატისტიკურ პოპულაციაში დაკვირვებების რაოდენობა, რომელსაც ჩვენ ვსწავლობთ, არ აღემატება 30-ს, მაშინ საკმარისია შესასწავლი ნიშან-თვისების ყველა მნიშვნელობა განვასხვავოთ ცვალებად სერიაში, როგორც ცხრილში. 1, ან კლებადობით.

    ზე დიდი რაოდენობითდაკვირვებები (n>30), არსებული ვარიანტების რაოდენობა შეიძლება იყოს ძალიან დიდი, ამ შემთხვევაში შედგენილია ინტერვალი ან დაჯგუფებული ვარიაციული სერია, რომელშიც შემდგომი დამუშავების გასამარტივებლად და განაწილების ბუნების გასარკვევად, ვარიანტები გაერთიანებულია ჯგუფებად. .

    ჩვეულებრივ ნომერი ჯგუფის ვარიანტიმერყეობს 8-დან 15-მდე.

    უნდა იყოს მინიმუმ 5 მათგანი, რადგან. წინააღმდეგ შემთხვევაში, ეს იქნება ძალიან უხეში, გადაჭარბებული გაფართოება, რაც ამახინჯებს ვარიაციის საერთო სურათს და დიდ გავლენას ახდენს საშუალო მნიშვნელობების სიზუსტეზე. როდესაც ჯგუფის ვარიანტების რაოდენობა 20-25-ზე მეტია, საშუალო მნიშვნელობების გამოთვლის სიზუსტე იზრდება, მაგრამ მახასიათებლების ცვალებადობის მახასიათებლები მნიშვნელოვნად დამახინჯებულია და მათემატიკური დამუშავება უფრო რთული ხდება.

    დაჯგუფებული სერიის შედგენისას აუცილებელია გათვალისწინება

    − ვარიანტული ჯგუფები განლაგებული უნდა იყოს კონკრეტული თანმიმდევრობით (აღმავალი ან დაღმავალი);

    - ინტერვალები ვარიანტულ ჯგუფებში უნდა იყოს იგივე;

    - ინტერვალების საზღვრების მნიშვნელობები არ უნდა ემთხვეოდეს, რადგან გაურკვეველი იქნება, რომელ ჯგუფში უნდა მიეწეროს ინდივიდუალური ვარიანტები;

    - ინტერვალების საზღვრების დადგენისას აუცილებელია შეგროვებული მასალის ხარისხობრივი მახასიათებლების გათვალისწინება (მაგალითად, მოზრდილების წონის შესწავლისას მისაღებია 3-4 კგ ინტერვალი, ხოლო ბავშვებისთვის პირველ თვეებში სიცოცხლის განმავლობაში არ უნდა აღემატებოდეს 100 გ.)

    მოდით ავაშენოთ დაჯგუფებული (ინტერვალის) სერია, რომელიც ახასიათებს პულსის სიხშირის მონაცემებს (წუთში დარტყმების რაოდენობა) 55 სამედიცინო სტუდენტისთვის გამოცდამდე: 64, 66, 60, 62,

    64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

    64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

    79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

    დაჯგუფებული სერიის შესაქმნელად დაგჭირდებათ:

    1. განსაზღვრეთ ინტერვალის მნიშვნელობა;

    2. განვსაზღვროთ ვარიაციის სერიის ვარიანტის ჯგუფების შუა, დასაწყისი და დასასრული.

    ● (i) ინტერვალის მნიშვნელობა განისაზღვრება მოსალოდნელი ჯგუფების რაოდენობით (r), რომელთა რაოდენობა დგინდება დაკვირვებების რაოდენობის მიხედვით (n) სპეციალური ცხრილის მიხედვით.

    ჯგუფების რაოდენობა დამოკიდებულია დაკვირვების რაოდენობაზე:

    ჩვენს შემთხვევაში 55 მოსწავლისთვის შესაძლებელია 8-დან 10-მდე ჯგუფის შედგენა.

    (i) ინტერვალის მნიშვნელობა განისაზღვრება შემდეგი ფორმულით -

    i = Vmax-Vmin/r

    ჩვენს მაგალითში ინტერვალის მნიშვნელობა არის 82-58/8=3.

    თუ ინტერვალის მნიშვნელობა არის წილადი რიცხვი, შედეგი უნდა დამრგვალდეს მთელ რიცხვამდე.

    არსებობს რამდენიმე ტიპის საშუალო:

    საშუალო არითმეტიკული,

    გეომეტრიული საშუალო,

    ● ჰარმონიული საშუალო,

    ფესვი საშუალო კვადრატი,

    ● საშუალო პროგრესული,

    ● მედიანა

    სამედიცინო სტატისტიკაში ყველაზე ხშირად გამოიყენება საშუალო არითმეტიკული მაჩვენებლები.

    საშუალო არითმეტიკული მნიშვნელობა(M) არის განზოგადებული მნიშვნელობა, რომელიც განსაზღვრავს ტიპიურს, რომელიც დამახასიათებელია მთელი პოპულაციისთვის. M-ის გამოთვლის ძირითადი მეთოდებია: საშუალო არითმეტიკული მეთოდი და მომენტების მეთოდი (პირობითი გადახრები).

    საშუალო არითმეტიკული მეთოდი გამოიყენება მარტივი არითმეტიკული საშუალო და შეწონილი არითმეტიკული საშუალოს გამოსათვლელად. საშუალო არითმეტიკული მნიშვნელობის გამოთვლის მეთოდის არჩევანი დამოკიდებულია ვარიაციის სერიის ტიპზე. მარტივი ვარიაციული სერიის შემთხვევაში, რომელშიც თითოეული ვარიანტი მხოლოდ ერთხელ ხდება, მარტივი არითმეტიკული საშუალო განისაზღვრება ფორმულით:

    სადაც: М – საშუალო არითმეტიკული მნიშვნელობა;

    V არის ცვლადი მახასიათებლის მნიშვნელობა (ოფციები);

    Σ - მიუთითებს მოქმედება - შეჯამება;

    n არის დაკვირვებების საერთო რაოდენობა.

    საშუალო არითმეტიკული გამოთვლის მაგალითი მარტივია. სუნთქვის სიხშირე (სუნთქვის რაოდენობა წუთში) 35 წლის 9 მამაკაცში: 20, 22, 19, 15, 16, 21, 17, 23, 18.

    35 წლის მამაკაცებში სუნთქვის სიხშირის საშუალო დონის დასადგენად აუცილებელია:

    1. შექმენით ვარიაციული სერიები, განათავსეთ ყველა ვარიანტი აღმავალი ან დაღმავალი თანმიმდევრობით. ჩვენ მივიღეთ მარტივი ვარიაციული სერია, რადგან ვარიანტის მნიშვნელობები მხოლოდ ერთხელ ხდება.

    M = ∑V/n = 171/9 = 19 ჩასუნთქვა წუთში

    დასკვნა. 35 წლის მამაკაცებში სუნთქვის სიხშირე საშუალოდ 19-ია რესპირატორული მოძრაობებიერთ წუთში.

    თუ ვარიანტის ინდივიდუალური მნიშვნელობები მეორდება, არ არის საჭირო თითოეული ვარიანტის სტრიქონში ჩაწერა, საკმარისია ჩამოვთვალოთ ვარიანტის ზომები, რომლებიც ხდება (V) და შემდეგ მიუთითოთ მათი გამეორებების რაოდენობა ( გვ). ასეთ ვარიაციულ სერიას, რომელშიც ვარიანტები, როგორც იქნა, შეწონილია მათ შესაბამისი სიხშირეების რაოდენობის მიხედვით, ეწოდება შეწონილი ვარიაციული სერია, ხოლო გამოთვლილი საშუალო მნიშვნელობა არის არითმეტიკული შეწონილი საშუალო.

    არითმეტიკული შეწონილი საშუალო განისაზღვრება ფორმულით: M= ∑Vp/n

    სადაც n არის დაკვირვებების რაოდენობა, ჯამის ტოლისიხშირეები - Σr.

    არითმეტიკული შეწონილი საშუალოს გამოთვლის მაგალითი.

    ინვალიდობის ხანგრძლივობა (დღეებში) მწვავე რესპირატორული დაავადებებით (ARI) 35 პაციენტში, რომლებიც მკურნალობდნენ ადგილობრივი ექიმის მიერ პირველი კვარტლის განმავლობაში მიმდინარე წელსიყო: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 დღე.

    მწვავე რესპირატორული ინფექციების მქონე პაციენტებში ინვალიდობის საშუალო ხანგრძლივობის განსაზღვრის მეთოდოლოგია შემდეგია:

    1. ავაშენოთ შეწონილი ვარიაციული სერია, რადგან ინდივიდუალური ვარიანტების მნიშვნელობები რამდენჯერმე მეორდება. ამისათვის თქვენ შეგიძლიათ დაალაგოთ ყველა ვარიანტი აღმავალი ან კლებადობით მათი შესაბამისი სიხშირეებით.

    ჩვენს შემთხვევაში, ვარიანტები აღმავალი თანმიმდევრობითაა.

    2. გამოთვალეთ საშუალო შეწონილი არითმეტიკული ფორმულის გამოყენებით: M = ∑Vp/n = 233/35 = 6,7 დღე

    მწვავე რესპირატორული ინფექციების მქონე პაციენტების განაწილება ინვალიდობის ხანგრძლივობის მიხედვით:

    შრომისუუნარობის ხანგრძლივობა (V) პაციენტების რაოდენობა (p) vp
    ∑p = n = 35 ∑Vp = 233

    დასკვნა. ინვალიდობის ხანგრძლივობა მწვავე რესპირატორული დაავადებების მქონე პაციენტებში საშუალოდ 6,7 დღე იყო.

    რეჟიმი (Mo) არის ყველაზე გავრცელებული ვარიანტი ვარიაციების სერიაში. ცხრილში წარმოდგენილი განაწილებისთვის რეჟიმი შეესაბამება 10-ის ტოლ ვარიანტს, ის უფრო ხშირად ხდება ვიდრე სხვები - 6-ჯერ.

    პაციენტების განაწილება ყოფნის ხანგრძლივობის მიხედვით საავადმყოფოს საწოლი(დღეებში)

    გვ

    ზოგჯერ ძნელია რეჟიმის ზუსტი მნიშვნელობის დადგენა, რადგან შესწავლილ მონაცემებში შეიძლება იყოს რამდენიმე დაკვირვება, რომელიც ხდება "ყველაზე ხშირად".

    მედიანა (Me) არის არაპარამეტრული ინდიკატორი, რომელიც ყოფს ვარიაციის სერიას ორ თანაბარ ნაწილად: მედიანის ორივე მხარეს არის იგივე ნომერივარიანტი.

    მაგალითად, ცხრილში ნაჩვენები განაწილებისთვის, მედიანა არის 10, რადგან ამ მნიშვნელობის ორივე მხარეს მდებარეობს მე-14 ვარიანტზე, ე.ი. ნომერი 10 იღებს ცენტრალური პოზიციაამ სერიაში არის მისი მედიანა.

    იმის გათვალისწინებით, რომ ამ მაგალითში დაკვირვებების რაოდენობა ლუწია (n=34), მედიანა შეიძლება განისაზღვროს შემდეგნაირად:

    მე = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

    ეს ნიშნავს, რომ სერიის შუა რიცხვები მოდის მეჩვიდმეტე ვარიანტზე, რომელიც შეესაბამება 10-ის მედიანას. ცხრილში წარმოდგენილი განაწილებისთვის საშუალო არითმეტიკული არის:

    M = ∑Vp/n = 334/34 = 10.1

    ასე რომ, ცხრილიდან 34 დაკვირვებისთვის. 8, მივიღეთ: Mo=10, Me=10, საშუალო არითმეტიკული (M) არის 10,1. ჩვენს მაგალითში სამივე ინდიკატორი ტოლი ან ერთმანეთთან ახლოს აღმოჩნდა, თუმცა სრულიად განსხვავებულია.

    საშუალო არითმეტიკული არის ყველა გავლენის შედეგიანი ჯამი; ყველა ვარიანტი, გამონაკლისის გარეშე, მონაწილეობს მის ფორმირებაში, მათ შორის უკიდურესი, ხშირად ატიპიური მოცემული ფენომენისთვის ან ნაკრებისთვის.

    რეჟიმი და მედიანა, საშუალო არითმეტიკისგან განსხვავებით, არ არის დამოკიდებული ყველას მნიშვნელობაზე ინდივიდუალური ღირებულებებიცვლადი ნიშანი (ექსტრემალური ვარიანტის მნიშვნელობები და სერიის გაფანტვის ხარისხი). საშუალო არითმეტიკული ახასიათებს დაკვირვების მთელ მასას, რეჟიმი და მედიანა ახასიათებს ნაყარს

    ვარიაციების სერია - სერია, რომელშიც ისინი ადარებენ (აღმავალი ან კლებადი მიმდევრობით) პარამეტრებიდა მათი შესაბამისი სიხშირეები

    ვარიანტები ნიშან-თვისების ცალკეული რაოდენობრივი გამოხატულებაა. დანიშნულია ლათინური ასო . კლასიკური გაგებატერმინი „ვარიანტი“ გულისხმობს, რომ თითოეული უნიკალური ღირებულებაფუნქცია, განმეორების რაოდენობის მიუხედავად.

    მაგალითად, სისტოლური ინდიკატორების ვარიაციის სერიაში სისხლის წნევაიზომება ათ პაციენტში:

    110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

    მხოლოდ 6 მნიშვნელობა არის ვარიანტი:

    110, 120, 130, 140, 160, 170.

    სიხშირე არის რიცხვი, რომელიც მიუთითებს რამდენჯერ მეორდება ვარიანტი. აღინიშნება ლათინური ასოებით . ყველა სიხშირის ჯამი (რაც, რა თქმა უნდა, უდრის ყველა შესწავლილის რაოდენობას) აღინიშნება როგორც .

      ჩვენს მაგალითში, სიხშირეები მიიღებენ შემდეგ მნიშვნელობებს:
    • 110 ვარიანტისთვის სიხშირე P = 1 (მნიშვნელობა 110 გვხვდება ერთ პაციენტში),
    • 120 ვარიანტისთვის, სიხშირე P = 2 (მნიშვნელობა 120 გვხვდება ორ პაციენტში),
    • 130 ვარიანტისთვის სიხშირე P = 3 (მნიშვნელობა 130 გვხვდება სამ პაციენტში),
    • 140 ვარიანტისთვის სიხშირე P = 2 (მნიშვნელობა 140 გვხვდება ორ პაციენტში),
    • 160 ვარიანტისთვის სიხშირე P = 1 (მნიშვნელობა 160 გვხვდება ერთ პაციენტში),
    • 170 ვარიანტისთვის სიხშირე P = 1 (მნიშვნელობა 170 გვხვდება ერთ პაციენტში),

    ვარიაციების სერიის სახეები:

    1. მარტივი- ეს არის სერია, რომელშიც თითოეული ვარიანტი ხდება მხოლოდ ერთხელ (ყველა სიხშირე უდრის 1-ს);
    2. შეჩერებულია- სერია, რომელშიც ერთი ან მეტი ვარიანტი განმეორებით ხდება.

    ვარიაციების სერია გამოიყენება რიცხვების დიდი მასივების აღსაწერად; სწორედ ამ ფორმით არის თავდაპირველად წარმოდგენილი უმრავლესობის შეგროვებული მონაცემები. სამედიცინო გამოკვლევა. ვარიაციების სერიის დასახასიათებლად გამოითვლება სპეციალური ინდიკატორები, მათ შორის საშუალო მნიშვნელობები, ცვალებადობის მაჩვენებლები (ე.წ. დისპერსია), ნიმუშის მონაცემების წარმომადგენლობითობის ინდიკატორები.

    ვარიაციის სერიის ინდიკატორები

    1) საშუალო არითმეტიკული არის განზოგადებული მაჩვენებელი, რომელიც ახასიათებს შესწავლილი ნიშან-თვისების ზომას. საშუალო არითმეტიკული აღინიშნება როგორც , არის საშუალო ყველაზე გავრცელებული ტიპი. საშუალო არითმეტიკული გამოითვლება, როგორც დაკვირვების ყველა ერთეულის ინდიკატორის მნიშვნელობების ჯამის თანაფარდობა ყველა გამოკვლეულის რაოდენობასთან. არითმეტიკული საშუალოს გამოთვლის მეთოდი განსხვავდება მარტივი და შეწონილი ვარიაციის სერიებისთვის.

    გაანგარიშების ფორმულა მარტივი არითმეტიკული საშუალო:

    გაანგარიშების ფორმულა შეწონილი არითმეტიკული საშუალო:

    M = Σ(V * P)/ n

    ​2) რეჟიმი - ვარიაციის სერიის კიდევ ერთი საშუალო მნიშვნელობა, რომელიც შეესაბამება ყველაზე ხშირად განმეორებით ვარიანტს. ან, სხვაგვარად რომ ვთქვათ, ეს არის ის ვარიანტი, რომელიც შეესაბამება უმაღლეს სიხშირეს. დანიშნული როგორც მო . რეჟიმი გამოითვლება მხოლოდ შეწონილი სერიებისთვის, ვინაიდან ქ მარტივი რიგებიარცერთი ვარიანტი არ მეორდება და ყველა სიხშირე ერთის ტოლია.

    მაგალითად, გულისცემის მნიშვნელობების ვარიაციის სერიაში:

    80, 84, 84, 86, 86, 86, 90, 94;

    რეჟიმის მნიშვნელობა არის 86, რადგან ეს ვარიანტი 3-ჯერ ხდება, ამიტომ მისი სიხშირე ყველაზე მაღალია.

    3) მედიანა - ოფციონის მნიშვნელობა, რომელიც ყოფს ვარიაციის სერიებს შუაზე: მისი ორივე მხარეს არის თანაბარი რაოდენობავარიანტი. მედიანა, ისევე როგორც არითმეტიკული საშუალო და რეჟიმი, ეხება საშუალო მნიშვნელობებს. დანიშნული როგორც მე

    4) სტანდარტული გადახრა (სინონიმები: სტანდარტული გადახრასიგმას გადახრა, სიგმა) - ვარიაციის სერიის ცვალებადობის საზომი. ეს არის განუყოფელი მაჩვენებელი, რომელიც აერთიანებს ვარიანტის საშუალოდან გადახრის ყველა შემთხვევას. ფაქტობრივად, ის პასუხობს კითხვას: რამდენად და რამდენად ხშირად ვრცელდება ვარიანტები არითმეტიკული საშუალოდან. აღინიშნება ბერძნული ასო σ ("სიგმა").

    როდესაც მოსახლეობის რაოდენობა 30 ერთეულზე მეტია, სტანდარტული გადახრა გამოითვლება შემდეგი ფორმულის გამოყენებით:

    მცირე პოპულაციებისთვის - 30 დაკვირვების ერთეული ან ნაკლები - სტანდარტული გადახრა გამოითვლება განსხვავებული ფორმულით:

    მოდით ვუწოდოთ სხვადასხვა ნიმუშის მნიშვნელობები პარამეტრებიმნიშვნელობების სერია და აღნიშნავს: X 1 , X 2,…. უპირველეს ყოვლისა, მოდით გავაკეთოთ დიაპაზონივარიანტები, ე.ი. დაალაგეთ ისინი აღმავალი ან კლებადობით. თითოეული ვარიანტისთვის მითითებულია საკუთარი წონა, ე.ი. რიცხვი, რომელიც ახასიათებს ამ ვარიანტის წვლილს მთლიანი მოსახლეობა. სიხშირეები ან სიხშირეები მოქმედებს როგორც წონა.

    სიხშირე n i ვარიანტი x iე.წ. რიცხვი, რომელიც გვიჩვენებს რამდენჯერ ჩნდება ეს ვარიანტი განხილულ ნიმუშ პოპულაციაში.

    სიხშირე ან ფარდობითი სიხშირე w i ვარიანტი x iნომერს ეძახიან თანაფარდობის ტოლივარიანტის სიხშირე ყველა ვარიანტის სიხშირეების ჯამს. სიხშირე გვიჩვენებს შერჩევის პოპულაციის ერთეულების რომელ ნაწილს აქვს მოცემული ვარიანტი.

    ოპციების თანმიმდევრობას მათი შესაბამისი წონებით (სიხშირეები ან სიხშირეები), რომლებიც დაწერილია აღმავალი (ან კლებადი) თანმიმდევრობით, ე.წ. ვარიაციული სერია.

    ვარიაციული სერიები არის დისკრეტული და ინტერვალური.

    დისკრეტული ვარიაციული სერიებისთვის მითითებულია ატრიბუტის წერტილის მნიშვნელობები, ინტერვალის სერიებისთვის ატრიბუტების მნიშვნელობები მითითებულია ინტერვალების სახით. ვარიაციის სერიას შეუძლია აჩვენოს სიხშირეების განაწილება ან შედარებითი სიხშირეები(სიხშირეები), იმის მიხედვით, თუ რომელი მნიშვნელობაა მითითებული თითოეული ვარიანტისთვის - სიხშირე ან სიხშირე.

    სიხშირის განაწილების დისკრეტული ვარიაციის სერიაროგორც ჩანს:

    სიხშირეები გვხვდება ფორმულით, i = 1, 2, ..., .

    1 + 2 + … + მ = 1.

    მაგალითი 4.1. მოცემული რიცხვების ნაკრებისთვის

    4, 6, 6, 3, 4, 9, 6, 4, 6, 6

    დისკრეტული აშენება ვარიაციის სერიასიხშირეების და სიხშირეების განაწილება.

    გადაწყვეტილება . მოსახლეობის მოცულობა არის = 10. დისკრეტული სიხშირის განაწილების სერიას აქვს ფორმა

    ინტერვალის სერიებს აქვთ ჩაწერის მსგავსი ფორმა.

    სიხშირის განაწილების ინტერვალის ვარიაციების სერიაიწერება როგორც:

    ყველა სიხშირის ჯამი უდრის დაკვირვების საერთო რაოდენობას, ე.ი. მთლიანი მოცულობა: = 1 + 2 + … + მ .

    ფარდობითი სიხშირეების (სიხშირეების) განაწილების ინტერვალის ვარიაციების სერიაროგორც ჩანს:

    სიხშირე გვხვდება ფორმულით, i = 1, 2, ..., .

    ყველა სიხშირის ჯამი ერთის ტოლია: 1 + 2 + … + მ = 1.

    პრაქტიკაში ყველაზე ხშირად გამოიყენება ინტერვალის სერიები. თუ არსებობს ბევრი სტატისტიკური ნიმუშის მონაცემები და მათი მნიშვნელობები ერთმანეთისგან თვითნებურად განსხვავდება მცირე რაოდენობით, მაშინ ამ მონაცემების დისკრეტული სერია საკმაოდ რთული და მოუხერხებელი იქნება შემდგომი კვლევა. ამ შემთხვევაში გამოიყენება მონაცემთა დაჯგუფება, ე.ი. ატრიბუტის ყველა მნიშვნელობის შემცველი ინტერვალი დაყოფილია რამდენიმე ნაწილობრივ ინტერვალად და, თითოეული ინტერვალისთვის სიხშირის გამოთვლის შემდეგ, მიიღება ინტერვალის სერია. მოდით უფრო დეტალურად ჩამოვწეროთ ინტერვალის სერიის აგების სქემა, თუ ვივარაუდებთ, რომ ნაწილობრივი ინტერვალების სიგრძე იგივე იქნება.

    2.2 ინტერვალის სერიის აგება

    ინტერვალის სერიის შესაქმნელად დაგჭირდებათ:

    ინტერვალების რაოდენობის განსაზღვრა;

    ინტერვალების სიგრძის განსაზღვრა;

    განსაზღვრეთ ინტერვალების მდებარეობა ღერძზე.

    დადგენისთვის ინტერვალების რაოდენობა არსებობს სტურგესის ფორმულა, რომლის მიხედვითაც

    ,

    სადაც - მთლიანობის მოცულობა.

    მაგალითად, თუ არსებობს 100 მახასიათებლის (ვარიანტის) მნიშვნელობა, მაშინ რეკომენდებულია ინტერვალების ტოლი ინტერვალების აღება ინტერვალის სერიის ასაგებად.

    თუმცა, პრაქტიკაში ძალიან ხშირად, ინტერვალების რაოდენობას თავად მკვლევარი ირჩევს, იმის გათვალისწინებით, რომ ეს რიცხვი არ უნდა იყოს ძალიან დიდი, რათა სერია არ იყოს შრომატევადი, მაგრამ ასევე არც ისე მცირე, რომ არ დაკარგოს ზოგიერთი თვისება. განაწილება.

    ინტერვალის სიგრძე განისაზღვრება შემდეგი ფორმულით:

    ,

    სადაც xმაქს და xწთ არის ყველაზე დიდი და ყველაზე მცირე ღირებულებაპარამეტრები.

    ღირებულება დაურეკა დიდი მასშტაბითრიგი.

    თავად ინტერვალების ასაგებად, ისინი სხვადასხვა გზით მოქმედებენ. Ერთ - ერთი ყველაზე მარტივი გზებიარის შემდეგი. მნიშვნელობა მიიღება როგორც პირველი ინტერვალის დასაწყისი
    . შემდეგ შუალედების დანარჩენი საზღვრები იპოვება ფორმულით. ცხადია, ბოლო ინტერვალის დასასრული m+1 უნდა აკმაყოფილებდეს პირობას

    ინტერვალების ყველა საზღვრის აღმოჩენის შემდეგ, განისაზღვრება ამ ინტერვალების სიხშირეები (ან სიხშირეები). ამ პრობლემის გადასაჭრელად, ისინი ათვალიერებენ ყველა ვარიანტს და განსაზღვრავენ იმ ვარიანტების რაოდენობას, რომლებიც ხვდება კონკრეტულ ინტერვალში. სრული აშენებამოდით შევხედოთ ინტერვალის სერიას მაგალითის გამოყენებით.

    მაგალითი 4.2. შემდეგი სტატისტიკისთვის, დაწერილი აღმავალი თანმიმდევრობით, შექმენით ინტერვალის სერია ინტერვალების რაოდენობით 5-ის ტოლი:

    11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

    გადაწყვეტილება. სულ =50 ვარიანტის მნიშვნელობა.

    პრობლემურ მდგომარეობაში მითითებულია ინტერვალების რაოდენობა, ე.ი. =5.

    ინტერვალების სიგრძე არის
    .

    მოდით განვსაზღვროთ ინტერვალების საზღვრები:

    1 = 11 − 8,5 = 2,5; 2 = 2,5 + 17 = 19,5; 3 = 19,5 + 17 = 36,5;

    4 = 36,5 + 17 = 53,5; 5 = 53,5 + 17 = 70,5; 6 = 70,5 + 17 = 87,5;

    7 = 87,5 +17 = 104,5.

    ინტერვალების სიხშირის დასადგენად, ჩვენ ვითვლით იმ ვარიანტების რაოდენობას, რომლებიც შედის ამ ინტერვალში. მაგალითად, ვარიანტები 11, 12, 12, 14, 14, 15 პირველ ინტერვალში ხვდება 2,5-დან 19,5-მდე.მათი რიცხვია 6, შესაბამისად, პირველი ინტერვალის სიხშირეა. 1=6. პირველი ინტერვალის სიხშირე არის . ვარიაციები 21, 21, 22, 23, 25, რომელთა რიცხვი 5-ია, მეორე ინტერვალში ხვდება 19,5-დან 36,5-მდე, ამიტომ მეორე ინტერვალის სიხშირე არის 2 =5 და სიხშირე . ყველა ინტერვალისთვის მსგავსი სიხშირეების და სიხშირის აღმოჩენის შემდეგ, ჩვენ ვიღებთ შემდეგ ინტერვალურ სერიებს.

    სიხშირის განაწილების ინტერვალის სერიას აქვს ფორმა:

    სიხშირეების ჯამია 6+5+9+11+8+11=50.

    სიხშირის განაწილების ინტერვალის სერიას აქვს ფორმა:

    სიხშირეების ჯამია 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

    ინტერვალური სერიების აგებისას, განსახილველი პრობლემის სპეციფიკური პირობებიდან გამომდინარე, შეიძლება გამოყენებულ იქნას სხვა წესები, კერძოდ,

    1. ინტერვალის ვარიაციის სერია შეიძლება შედგებოდეს ნაწილობრივი ინტერვალებისგან სხვადასხვა სიგრძე. ინტერვალების არათანაბარი სიგრძე შესაძლებელს ხდის გამოვყოთ სტატისტიკური პოპულაციის თვისებები მახასიათებლის არათანაბარი განაწილებით. მაგალითად, თუ ინტერვალების საზღვრები განსაზღვრავს ქალაქებში მცხოვრებთა რაოდენობას, მაშინ ამ პრობლემაში მიზანშეწონილია გამოიყენოთ სიგრძით არათანაბარი ინტერვალები. აშკარაა, რომ ამისთვის დიდი ქალაქებისაკითხებს და დიდი განსხვავება არ არისმოსახლეობის რაოდენობაში, ხოლო დიდი ქალაქებისთვის ათეულობით და ასეულობით მცხოვრებთა სხვაობა არ არის მნიშვნელოვანი. ინტერვალის სერიანაწილობრივი ინტერვალების არათანაბარი სიგრძით შესწავლილია ძირითადად ქ ზოგადი თეორიასტატისტიკა და მათი განხილვა სცილდება ამ სახელმძღვანელოს ფარგლებს.

    2. In მათემატიკური სტატისტიკაზოგჯერ განიხილება ინტერვალის სერიები, რომლებისთვისაც პირველი ინტერვალის მარცხენა საზღვარი არის –∞, ხოლო ბოლო ინტერვალის მარჯვენა საზღვარი არის +∞. ეს კეთდება იმისათვის, რომ მოიტანოს სტატისტიკური განაწილებათეორიულამდე.

    3. ინტერვალური სერიების აგებისას შეიძლება აღმოჩნდეს, რომ ზოგიერთი ვარიანტის მნიშვნელობა ზუსტად ემთხვევა ინტერვალის ზღვარს. ამ შემთხვევაში საუკეთესო რამ არის შემდეგი. თუ არსებობს მხოლოდ ერთი ასეთი დამთხვევა, მაშინ ჩათვალეთ, რომ განხილული ვარიანტი თავისი სიხშირით მოხვდა ინტერვალის სერიის შუათან უფრო ახლოს ინტერვალში, თუ რამდენიმე ასეთი ვარიანტია, მაშინ ან ყველა მათგანი მიეკუთვნება ინტერვალებს. ამ ვარიანტის მარჯვნივ, ან ყველა მარცხნივ.

    4. ინტერვალების რაოდენობის და მათი სიგრძის დადგენის შემდეგ, ინტერვალების განლაგება შეიძლება სხვა გზითაც. იპოვეთ ოფციონის ყველა განხილული მნიშვნელობის არითმეტიკული საშუალო Xშდრ. და შექმენით პირველი ინტერვალი ისე, რომ ეს ნიმუშის საშუალო იყოს გარკვეული ინტერვალის შიგნით. ამრიგად, ჩვენ ვიღებთ ინტერვალს Xშდრ. - 0,5 ადრე Xსაშუალო + 0,5 . შემდეგ მარცხნივ და მარჯვნივ, ვამატებთ ინტერვალის სიგრძეს, ვაშენებთ დარჩენილ ინტერვალებს xწთ და x max არ მოხვდება პირველ და ბოლო ინტერვალებში, შესაბამისად.

    5. ინტერვალის სერია ამისთვის დიდი რაოდენობითმოსახერხებელია ინტერვალების ვერტიკალურად ჩაწერა, ე.ი. ჩაწერეთ ინტერვალები არა პირველ სტრიქონში, არამედ პირველ სვეტში და სიხშირეები (ან სიხშირეები) მეორე სვეტში.

    ნიმუშის მონაცემები შეიძლება ჩაითვალოს ზოგიერთი შემთხვევითი ცვლადის მნიშვნელობებად X. შემთხვევით ცვლადს აქვს თავისი განაწილების კანონი. ალბათობის თეორიიდან ცნობილია, რომ დისკრეტული შემთხვევითი ცვლადის განაწილების კანონი შეიძლება განისაზღვროს როგორც განაწილების სერია, ხოლო უწყვეტისთვის, განაწილების სიმკვრივის ფუნქციის გამოყენებით. თუმცა, არსებობს უნივერსალური განაწილების კანონი, რომელიც მოქმედებს როგორც დისკრეტულ, ასევე უწყვეტ შემთხვევით ცვლადებზე. ეს განაწილების კანონი მოცემულია როგორც განაწილების ფუნქცია (x) = (X<x). ნიმუშის მონაცემებისთვის შეგიძლიათ მიუთითოთ განაწილების ფუნქციის ანალოგი - ემპირიული განაწილების ფუნქცია.


    მსგავსი ინფორმაცია.