სახეობების ვარიაციული და სტატისტიკური სერიების განსაზღვრა. ვარიაციული სერიების ანალიზი

ვარიაციების სერია: განმარტება, ტიპები, ძირითადი მახასიათებლები. გაანგარიშების მეთოდი
მოდა, მედიანა, საშუალო არითმეტიკული სამედიცინო და სტატისტიკურ კვლევებში
(აჩვენე პირობით მაგალითზე).

ვარიაციული სერია არის შესასწავლი ნიშან-თვისების რიცხვითი მნიშვნელობების სერია, რომლებიც განსხვავდებიან ერთმანეთისაგან მათი სიდიდით და განლაგებულია გარკვეული თანმიმდევრობით (აღმავალი ან კლებადი თანმიმდევრობით). სერიის თითოეულ ციფრულ მნიშვნელობას ეწოდება ვარიანტი (V), ხოლო რიცხვებს, რომლებიც გვიჩვენებს, თუ რამდენად ხშირად ხდება ესა თუ ის ვარიანტი ამ სერიის შემადგენლობაში - სიხშირე (p).

დაკვირვების შემთხვევების საერთო რაოდენობა, რომელთაგან შედგება ვარიაციის სერია, აღინიშნება ასო n-ით. შესწავლილი მახასიათებლების მნიშვნელობის განსხვავებას ვარიაცია ეწოდება. თუ ცვლადის ნიშანს არ აქვს რაოდენობრივი საზომი, ვარიაციას ეწოდება ხარისხობრივი, ხოლო განაწილების სერიას - ატრიბუტი (მაგალითად, განაწილება დაავადების შედეგის მიხედვით, ჯანმრთელობის მდგომარეობა და ა.შ.).

თუ ცვლადის ნიშანს აქვს რაოდენობრივი გამოხატულება, ასეთ ცვალებადობას რაოდენობრივი ეწოდება, ხოლო განაწილების სერიებს ცვალებადობა.

ვარიაციული სერიები იყოფა უწყვეტად და უწყვეტად - რაოდენობრივი ნიშან-თვისების ბუნების მიხედვით, მარტივი და შეწონილი - ვარიანტის გაჩენის სიხშირის მიხედვით.

მარტივ ვარიაციულ სერიაში ყოველი ვარიანტი ხდება მხოლოდ ერთხელ (p=1), შეწონილში ერთი და იგივე ვარიანტი ხდება რამდენჯერმე (p>1). ასეთი სერიის მაგალითები მოგვიანებით იქნება განხილული ტექსტში. თუ რაოდენობრივი ატრიბუტი უწყვეტია, ე.ი. მთელ მნიშვნელობებს შორის არის შუალედური წილადი მნიშვნელობები, ვარიაციულ სერიას ეწოდება უწყვეტი.

მაგალითად: 10.0 - 11.9

14.0 - 15.9 და ა.შ.

თუ რაოდენობრივი ნიშანი შეწყვეტილია, ე.ი. მისი ინდივიდუალური მნიშვნელობები (ოფციები) განსხვავდება ერთმანეთისგან მთელი რიცხვით და არ გააჩნიათ შუალედური წილადი მნიშვნელობები, ვარიაციის სერიას ეწოდება წყვეტილი ან დისკრეტული.

წინა მაგალითის მონაცემების გამოყენება გულისცემის შესახებ

21 მოსწავლისთვის ავაშენებთ ვარიაციების სერიას (ცხრილი 1).

ცხრილი 1

სამედიცინო სტუდენტების განაწილება პულსის სიხშირით (bpm)

ამრიგად, ვარიაციული სერიის აგება ნიშნავს არსებული რიცხვითი მნიშვნელობების (ვარიანტების) სისტემატიზაციას, გამარტივებას, ე.ი. დაალაგეთ გარკვეული თანმიმდევრობით (აღმავალი ან კლებადი მიმდევრობით) მათი შესაბამისი სიხშირეებით. განსახილველ მაგალითში ოფციონები განლაგებულია ზრდის მიხედვით და გამოიხატება როგორც წყვეტილი (დისკრეტული) მთელი რიცხვები, თითოეული ვარიანტი ხდება რამდენჯერმე, ე.ი. საქმე გვაქვს შეწონილ, წყვეტილ ან დისკრეტულ ვარიაციულ სერიასთან.

როგორც წესი, თუ სტატისტიკურ პოპულაციაში დაკვირვებების რაოდენობა, რომელსაც ჩვენ ვსწავლობთ, არ აღემატება 30-ს, მაშინ საკმარისია შესასწავლი ნიშან-თვისების ყველა მნიშვნელობა განვასხვავოთ ცვალებად სერიაში, როგორც ცხრილში. 1, ან კლებადობით.

დაკვირვებების დიდი რაოდენობით (n>30), არსებული ვარიანტების რაოდენობა შეიძლება იყოს ძალიან დიდი, ამ შემთხვევაში შედგენილია ინტერვალი ან დაჯგუფებული ვარიაციული სერია, რომელშიც შემდგომი დამუშავების გასამარტივებლად და განაწილების ბუნების გასარკვევად, ვარიანტები გაერთიანებულია ჯგუფებად.

ჩვეულებრივ, ჯგუფის ვარიანტების რაოდენობა მერყეობს 8-დან 15-მდე.

უნდა იყოს მინიმუმ 5 მათგანი, რადგან. წინააღმდეგ შემთხვევაში, ეს იქნება ძალიან უხეში, გადაჭარბებული გაფართოება, რაც ამახინჯებს ვარიაციის საერთო სურათს და დიდ გავლენას ახდენს საშუალო მნიშვნელობების სიზუსტეზე. როდესაც ჯგუფის ვარიანტების რაოდენობა 20-25-ზე მეტია, საშუალო მნიშვნელობების გამოთვლის სიზუსტე იზრდება, მაგრამ ატრიბუტის ვარიაციის მახასიათებლები მნიშვნელოვნად დამახინჯებულია და მათემატიკური დამუშავება უფრო რთული ხდება.

დაჯგუფებული სერიის შედგენისას აუცილებელია გათვალისწინება

− ვარიანტული ჯგუფები განლაგებული უნდა იყოს კონკრეტული თანმიმდევრობით (აღმავალი ან დაღმავალი);

- ინტერვალები ვარიანტულ ჯგუფებში უნდა იყოს იგივე;

- ინტერვალების საზღვრების მნიშვნელობები არ უნდა ემთხვეოდეს, რადგან გაურკვეველი იქნება, რომელ ჯგუფში უნდა მიეწეროს ინდივიდუალური ვარიანტები;

- ინტერვალების საზღვრების დადგენისას აუცილებელია შეგროვებული მასალის ხარისხობრივი მახასიათებლების გათვალისწინება (მაგალითად, მოზრდილების წონის შესწავლისას მისაღებია 3-4 კგ ინტერვალი, ხოლო ბავშვებისთვის პირველ თვეებში სიცოცხლის განმავლობაში არ უნდა აღემატებოდეს 100 გ.)

მოდით ავაშენოთ დაჯგუფებული (ინტერვალის) სერია, რომელიც ახასიათებს პულსის სიხშირის მონაცემებს (წუთში დარტყმების რაოდენობა) 55 სამედიცინო სტუდენტისთვის გამოცდამდე: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

დაჯგუფებული სერიის შესაქმნელად დაგჭირდებათ:

1. განსაზღვრეთ ინტერვალის მნიშვნელობა;

2. განვსაზღვროთ ვარიაციის სერიის ვარიანტის ჯგუფების შუა, დასაწყისი და დასასრული.

● (i) ინტერვალის მნიშვნელობა განისაზღვრება მოსალოდნელი ჯგუფების რაოდენობით (r), რომელთა რაოდენობა დგინდება დაკვირვებების რაოდენობის მიხედვით (n) სპეციალური ცხრილის მიხედვით.

ჯგუფების რაოდენობა დამოკიდებულია დაკვირვების რაოდენობაზე:

ჩვენს შემთხვევაში 55 მოსწავლისთვის შესაძლებელია 8-დან 10-მდე ჯგუფის შედგენა.

(i) ინტერვალის მნიშვნელობა განისაზღვრება შემდეგი ფორმულით -

i = Vmax-Vmin/r

ჩვენს მაგალითში ინტერვალის მნიშვნელობა არის 82-58/8=3.

თუ ინტერვალის მნიშვნელობა არის წილადი რიცხვი, შედეგი უნდა დამრგვალდეს მთელ რიცხვამდე.

არსებობს რამდენიმე ტიპის საშუალო:

● საშუალო არითმეტიკული,

● გეომეტრიული საშუალო,

● ჰარმონიული საშუალო,

● ფესვი საშუალო კვადრატი,

● საშუალო პროგრესული,

● მედიანა

სამედიცინო სტატისტიკაში ყველაზე ხშირად გამოიყენება საშუალო არითმეტიკული მაჩვენებლები.

საშუალო არითმეტიკული (M) არის განზოგადებული მნიშვნელობა, რომელიც განსაზღვრავს ტიპიურ მნიშვნელობას, რომელიც დამახასიათებელია მთელი პოპულაციისთვის. M-ის გამოთვლის ძირითადი მეთოდებია: საშუალო არითმეტიკული მეთოდი და მომენტების მეთოდი (პირობითი გადახრები).

საშუალო არითმეტიკული მეთოდი გამოიყენება მარტივი არითმეტიკული საშუალო და შეწონილი არითმეტიკული საშუალოს გამოსათვლელად. საშუალო არითმეტიკული მნიშვნელობის გამოთვლის მეთოდის არჩევანი დამოკიდებულია ვარიაციის სერიის ტიპზე. მარტივი ვარიაციული სერიის შემთხვევაში, რომელშიც თითოეული ვარიანტი მხოლოდ ერთხელ ხდება, მარტივი არითმეტიკული საშუალო განისაზღვრება ფორმულით:

სადაც: М – საშუალო არითმეტიკული მნიშვნელობა;

V არის ცვლადი მახასიათებლის მნიშვნელობა (ოფციები);

Σ - მიუთითებს მოქმედება - შეჯამება;

n არის დაკვირვებების საერთო რაოდენობა.

საშუალო არითმეტიკული გამოთვლის მაგალითი მარტივია. სუნთქვის სიხშირე (სუნთქვის რაოდენობა წუთში) 35 წლის 9 მამაკაცში: 20, 22, 19, 15, 16, 21, 17, 23, 18.

35 წლის მამაკაცებში სუნთქვის სიხშირის საშუალო დონის დასადგენად აუცილებელია:

1. შექმენით ვარიაციული სერიები, განათავსეთ ყველა ვარიანტი აღმავალი ან დაღმავალი თანმიმდევრობით. ჩვენ მივიღეთ მარტივი ვარიაციული სერია, რადგან ვარიანტის მნიშვნელობები მხოლოდ ერთხელ ხდება.

M = ∑V/n = 171/9 = 19 ჩასუნთქვა წუთში

დასკვნა. 35 წლის მამაკაცებში სუნთქვის სიხშირე საშუალოდ არის 19 სუნთქვა წუთში.

თუ ვარიანტის ინდივიდუალური მნიშვნელობები მეორდება, არ არის საჭირო თითოეული ვარიანტის სტრიქონში ჩაწერა, საკმარისია ჩამოვთვალოთ ვარიანტის ზომები (V) და შემდეგ მიუთითოთ მათი გამეორებების რაოდენობა ( გვ). ასეთ ვარიაციულ სერიას, რომელშიც ვარიანტები, როგორც იქნა, შეწონილია მათ შესაბამისი სიხშირეების რაოდენობის მიხედვით, ეწოდება შეწონილი ვარიაციული სერია, ხოლო გამოთვლილი საშუალო მნიშვნელობა არის არითმეტიკული შეწონილი საშუალო.

არითმეტიკული შეწონილი საშუალო განისაზღვრება ფორმულით: M= ∑Vp/n

სადაც n არის სიხშირეების ჯამის ტოლი დაკვირვებების რაოდენობა - Σr.

არითმეტიკული შეწონილი საშუალოს გამოთვლის მაგალითი.

ადგილობრივი ექიმის მიერ ჩატარებული მწვავე რესპირატორული დაავადებების (ARI) მქონე 35 პაციენტში ინვალიდობის ხანგრძლივობა (დღეებში) მიმდინარე წლის პირველ კვარტალში იყო: 6, 7, 5, 3, 9, 8, 7, 5, 6. , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 დღე.

მწვავე რესპირატორული ინფექციების მქონე პაციენტებში ინვალიდობის საშუალო ხანგრძლივობის განსაზღვრის მეთოდოლოგია შემდეგია:

1. ავაშენოთ შეწონილი ვარიაციული სერია, რადგან ინდივიდუალური ვარიანტების მნიშვნელობები რამდენჯერმე მეორდება. ამისათვის თქვენ შეგიძლიათ დაალაგოთ ყველა ვარიანტი აღმავალი ან კლებადობით მათი შესაბამისი სიხშირეებით.

ჩვენს შემთხვევაში, ვარიანტები აღმავალი თანმიმდევრობითაა.

2. გამოთვალეთ საშუალო შეწონილი არითმეტიკული ფორმულის გამოყენებით: M = ∑Vp/n = 233/35 = 6,7 დღე

მწვავე რესპირატორული ინფექციების მქონე პაციენტების განაწილება ინვალიდობის ხანგრძლივობის მიხედვით:

შრომისუუნარობის ხანგრძლივობა (V) პაციენტების რაოდენობა (p) vp
∑p = n = 35 ∑Vp = 233

დასკვნა. ინვალიდობის ხანგრძლივობა მწვავე რესპირატორული დაავადებების მქონე პაციენტებში საშუალოდ 6,7 დღე იყო.

რეჟიმი (Mo) არის ყველაზე გავრცელებული ვარიანტი ვარიაციების სერიაში. ცხრილში წარმოდგენილი განაწილებისთვის რეჟიმი შეესაბამება 10-ის ტოლ ვარიანტს, ის უფრო ხშირად ხდება ვიდრე სხვები - 6-ჯერ.

პაციენტების განაწილება საავადმყოფოს საწოლში ყოფნის ხანგრძლივობის მიხედვით (დღეებში)

გვ

ზოგჯერ ძნელია რეჟიმის ზუსტი მნიშვნელობის დადგენა, რადგან შესწავლილ მონაცემებში შეიძლება იყოს რამდენიმე დაკვირვება, რომელიც ხდება "ყველაზე ხშირად".

მედიანა (Me) არის არაპარამეტრული ინდიკატორი, რომელიც ყოფს ვარიაციის სერიებს ორ თანაბარ ნაწილად: ერთნაირი რაოდენობის ვარიანტები მდებარეობს მედიანის ორივე მხარეს.

მაგალითად, ცხრილში ნაჩვენები განაწილებისთვის, მედიანა არის 10, რადგან ამ მნიშვნელობის ორივე მხარეს მდებარეობს მე-14 ვარიანტზე, ე.ი. რიცხვი 10 ამ სერიაში ცენტრალურ ადგილს იკავებს და არის მისი მედიანა.

იმის გათვალისწინებით, რომ ამ მაგალითში დაკვირვებების რაოდენობა ლუწია (n=34), მედიანა შეიძლება განისაზღვროს შემდეგნაირად:

მე = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

ეს ნიშნავს, რომ სერიის შუა რიცხვები მოდის მეჩვიდმეტე ვარიანტზე, რომელიც შეესაბამება 10-ის მედიანას. ცხრილში წარმოდგენილი განაწილებისთვის საშუალო არითმეტიკული არის:

M = ∑Vp/n = 334/34 = 10.1

ასე რომ, ცხრილიდან 34 დაკვირვებისთვის. 8, მივიღეთ: Mo=10, Me=10, საშუალო არითმეტიკული (M) არის 10,1. ჩვენს მაგალითში სამივე ინდიკატორი ტოლი ან ერთმანეთთან ახლოს აღმოჩნდა, თუმცა სრულიად განსხვავებულია.

საშუალო არითმეტიკული არის ყველა გავლენის შედეგიანი ჯამი; ყველა ვარიანტი, გამონაკლისის გარეშე, მონაწილეობს მის ფორმირებაში, მათ შორის უკიდურესი, ხშირად ატიპიური მოცემული ფენომენისთვის ან ნაკრებისთვის.

რეჟიმი და მედიანა, არითმეტიკული საშუალოსგან განსხვავებით, არ არის დამოკიდებული ცვლადის ატრიბუტის ყველა ინდივიდუალური მნიშვნელობის მნიშვნელობაზე (ექსტრემალური ვარიანტების მნიშვნელობები და სერიის გაფანტვის ხარისხი). საშუალო არითმეტიკული ახასიათებს დაკვირვების მთელ მასას, რეჟიმი და მედიანა ახასიათებს ნაყარს

ამ თავის დაუფლების შედეგად სტუდენტმა უნდა: ვიცი

  • ვარიაციული ინდიკატორები და მათი ურთიერთობა;
  • მახასიათებლების განაწილების ძირითადი კანონები;
  • თანხმობის კრიტერიუმების არსი; შეძლებს
  • ცვალებადობისა და მორგების მაჩვენებლების გამოთვლა;
  • განაწილების მახასიათებლების განსაზღვრა;
  • სტატისტიკური განაწილების სერიების ძირითადი რიცხვითი მახასიათებლების შეფასება;

საკუთარი

  • განაწილების სერიების სტატისტიკური ანალიზის მეთოდები;
  • დისპერსიული ანალიზის საფუძვლები;
  • სტატისტიკური განაწილების სერიების შემოწმების მეთოდები განაწილების ძირითად კანონებთან შესაბამისობაში.

ვარიაციის ინდიკატორები

სხვადასხვა სტატისტიკური პოპულაციის თავისებურებების სტატისტიკური შესწავლისას დიდი ინტერესია პოპულაციის ცალკეული სტატისტიკური ერთეულების მახასიათებლის ცვალებადობის, ასევე ამ მახასიათებლის მიხედვით ერთეულების განაწილების ხასიათის შესწავლა. Ვარიაცია -ეს არის განსხვავებები თვისების ინდივიდუალურ მნიშვნელობებში შესწავლილი პოპულაციის ერთეულებს შორის. ვარიაციის შესწავლას დიდი პრაქტიკული მნიშვნელობა აქვს. ცვალებადობის ხარისხით შეიძლება ვიმსჯელოთ ნიშან-თვისების ცვალებადობის საზღვრებზე, ამ მახასიათებლის პოპულაციის ჰომოგენურობაზე, საშუალოს ტიპურობაზე, ვარიაციის განმსაზღვრელ ფაქტორთა ურთიერთობაზე. ვარიაციის ინდიკატორები გამოიყენება სტატისტიკური პოპულაციების დასახასიათებლად და დასალაგებლად.

სტატისტიკური განაწილების სერიების სახით შედგენილი სტატისტიკური დაკვირვების მასალების შეჯამებისა და დაჯგუფების შედეგები წარმოადგენს შესწავლილი პოპულაციის ერთეულების მოწესრიგებულ განაწილებას ჯგუფებად დაჯგუფების (ცვლადი) ატრიბუტის მიხედვით. თუ დაჯგუფების საფუძვლად ხარისხობრივი მახასიათებელია მიღებული, მაშინ ასეთი განაწილების სერია ეწოდება ატრიბუტული(განაწილება პროფესიის, სქესის, ფერის და ა.შ.). თუ განაწილების სერია აგებულია რაოდენობრივ საფუძველზე, მაშინ ასეთ სერიას უწოდებენ ვარიაციული(განაწილება სიმაღლის, წონის, ხელფასის და ა.შ.). ვარიაციული სერიის აგება ნიშნავს მოსახლეობის ერთეულების რაოდენობრივი განაწილების დალაგებას ატრიბუტის მნიშვნელობების მიხედვით, ამ მნიშვნელობებით მოსახლეობის ერთეულების რაოდენობის დათვლას (სიხშირე), შედეგების დალაგებას ცხრილში.

ვარიანტის სიხშირის ნაცვლად, შესაძლებელია გამოვიყენოთ მისი თანაფარდობა დაკვირვებების მთლიან მოცულობასთან, რომელსაც სიხშირე (ფარდობითი სიხშირე) ეწოდება.

არსებობს ვარიაციის სერიების ორი ტიპი: დისკრეტული და ინტერვალი. დისკრეტული სერია- ეს არის ისეთი ვარიაციული სერია, რომლის აგება ემყარება უწყვეტი ცვლილების მქონე ნიშნებს (დისკრეტული ნიშნები). ეს უკანასკნელი მოიცავს საწარმოში დასაქმებულთა რაოდენობას, სახელფასო კატეგორიას, ოჯახში ბავშვების რაოდენობას და ა.შ. დისკრეტული ვარიაციული სერია არის ცხრილი, რომელიც შედგება ორი სვეტისგან. პირველ სვეტში მითითებულია ატრიბუტის სპეციფიკური მნიშვნელობა, ხოლო მეორე - პოპულაციის ერთეულების რაოდენობა ატრიბუტის კონკრეტული მნიშვნელობით. თუ ნიშანს აქვს მუდმივი ცვლილება (შემოსავლის ოდენობა, მომსახურების ხანგრძლივობა, საწარმოს ძირითადი საშუალებების ღირებულება და ა.შ., რომელიც გარკვეულ ფარგლებში შეუძლია მიიღოს ნებისმიერი მნიშვნელობა), მაშინ ამ ნიშნისთვის შესაძლებელია აშენდეს. ინტერვალის ვარიაციის სერია.ინტერვალის ვარიაციის სერიის აგებისას ცხრილს ასევე აქვს ორი სვეტი. პირველი მიუთითებს მახასიათებლის მნიშვნელობას ინტერვალში "-დან -მდე" (ოფციები), მეორე - ინტერვალში შემავალი ერთეულების რაოდენობას (სიხშირე). სიხშირე (განმეორების სიხშირე) - ატრიბუტის მნიშვნელობების კონკრეტული ვარიანტის გამეორებების რაოდენობა. ინტერვალები შეიძლება იყოს დახურული და ღია. დახურული ინტერვალები შეზღუდულია ორივე მხრიდან, ე.ი. აქვს საზღვარი ქვედა ("დან") და ზედა ("დან"). ღია ინტერვალებს აქვს ერთი საზღვარი: ზედა ან ქვედა. თუ ოფციები განლაგებულია აღმავალი ან კლებადი თანმიმდევრობით, მაშინ რიგები გამოიძახება რეიტინგული.

ვარიაციული სერიებისთვის, არსებობს ორი ტიპის სიხშირეზე რეაგირების ვარიანტი: კუმულაციური სიხშირე და კუმულაციური სიხშირე. კუმულაციური სიხშირე გვიჩვენებს რამდენ დაკვირვებას აიღო მახასიათებლის მნიშვნელობა მითითებულ მნიშვნელობაზე ნაკლები მნიშვნელობებით. კუმულაციური სიხშირე განისაზღვრება მოცემული ჯგუფისთვის დამახასიათებელი სიხშირის მნიშვნელობების შეჯამებით წინა ჯგუფის ყველა სიხშირეზე. დაგროვილი სიხშირე ახასიათებს დაკვირვების ერთეულების პროპორციას, რომლებშიც მახასიათებლის მნიშვნელობები არ აღემატება დღის ჯგუფის ზედა ზღვარს. ამრიგად, დაგროვილი სიხშირე აჩვენებს ვარიანტის სპეციფიკურ წონას აგრეგატში, რომლის მნიშვნელობა არ აღემატება მოცემულს. სიხშირე, სიხშირე, აბსოლუტური და ფარდობითი სიმკვრივეები, კუმულაციური სიხშირე და სიხშირე არის ვარიანტის სიდიდის მახასიათებლები.

პოპულაციის სტატისტიკური ერთეულების ნიშნის ცვალებადობა, ისევე როგორც განაწილების ბუნება, შესწავლილია ვარიაციის სერიის ინდიკატორებისა და მახასიათებლების გამოყენებით, რომელიც მოიცავს სერიის საშუალო დონეს, საშუალო ხაზოვან გადახრას, სტანდარტულ გადახრას, დისპერსიას. , რხევის კოეფიციენტები, ვარიაცია, ასიმეტრია, ქურთოზი და ა.შ.

სადისტრიბუციო ცენტრის დასახასიათებლად გამოიყენება საშუალო მნიშვნელობები. საშუალო არის განზოგადებული სტატისტიკური მახასიათებელი, რომელშიც რაოდენობრივად არის განსაზღვრული ნიშან-თვისების ტიპიური დონე, რომელსაც ფლობენ შესწავლილი პოპულაციის წევრები. თუმცა, შეიძლება იყოს შემთხვევები, როდესაც არითმეტიკული საშუალებები ემთხვევა განაწილების განსხვავებულ ბუნებას, ამიტომ, როგორც ვარიაციული სერიის სტატისტიკური მახასიათებლები, გამოითვლება ეგრეთ წოდებული სტრუქტურული საშუალოები - რეჟიმი, მედიანა, აგრეთვე კვანტილები, რომლებიც ყოფენ განაწილებას. სერიები თანაბარ ნაწილებად (კვარტილები, დეცილები, პროცენტები და ა.შ.).

მოდა -ეს არის ფუნქციის მნიშვნელობა, რომელიც უფრო ხშირად გვხვდება განაწილების სერიაში, ვიდრე მისი სხვა მნიშვნელობები. დისკრეტული სერიებისთვის, ეს არის ყველაზე მაღალი სიხშირის ვარიანტი. ინტერვალის ვარიაციულ სერიებში, რეჟიმის დასადგენად, პირველ რიგში საჭიროა განისაზღვროს ის ინტერვალი, რომელშიც ის მდებარეობს, ე.წ. მოდალური ინტერვალი. ცვალებად სერიაში თანაბარი ინტერვალებით, მოდალური ინტერვალი განისაზღვრება უმაღლესი სიხშირით, სერიებში არათანაბარი ინტერვალებით - მაგრამ უმაღლესი განაწილების სიმკვრივით. შემდეგ, თანაბარი ინტერვალებით რიგებში რეჟიმის დასადგენად, გამოიყენეთ ფორმულა

სადაც Mo არის მოდის ღირებულება; x Mo - მოდალური ინტერვალის ქვედა ზღვარი; თ-მოდალური ინტერვალის სიგანე; / Mo - მოდალური ინტერვალის სიხშირე; / Mo j - პრემოდალური ინტერვალის სიხშირე; / Mo+1 არის პოსტმოდალური ინტერვალის სიხშირე და ამ გამოთვლის ფორმულაში არათანაბარი ინტერვალების მქონე სერიებისთვის, სიხშირეების ნაცვლად / Mo, / Mo, / Mo გამოყენებული უნდა იყოს განაწილების სიმკვრივეები. გონება 0 _| , გონება 0> UMO+"

თუ არსებობს ერთი რეჟიმი, მაშინ შემთხვევითი ცვლადის ალბათობის განაწილებას ეწოდება უნიმოდალური; თუ არსებობს ერთზე მეტი რეჟიმი, მას ეწოდება მულტიმოდალური (პოლიმოდალური, მულტიმოდალური), ორი რეჟიმის შემთხვევაში - ბიმოდალური. როგორც წესი, მულტიმოდალობა მიუთითებს იმაზე, რომ შესასწავლი განაწილება არ შეესაბამება ნორმალურ განაწილების კანონს. ერთგვაროვანი პოპულაციები, როგორც წესი, ხასიათდება უნიმოდალური განაწილებით. Multivertex ასევე მიუთითებს შესწავლილი პოპულაციის ჰეტეროგენულობაზე. ორი ან მეტი წვერის გამოჩენა აუცილებელს ხდის მონაცემების გადაჯგუფებას უფრო ჰომოგენური ჯგუფების იზოლირებისთვის.

ინტერვალის ვარიაციის სერიაში, რეჟიმი შეიძლება განისაზღვროს გრაფიკულად ჰისტოგრამის გამოყენებით. ამისათვის, ორი გადამკვეთი ხაზი იხაზება ჰისტოგრამის უმაღლესი სვეტის ზედა წერტილებიდან ორი მიმდებარე სვეტის ზედა წერტილებამდე. შემდეგ, მათი გადაკვეთის ადგილიდან, პერპენდიკულარი ქვეითდება აბსცისის ღერძზე. პერპენდიკულარულის შესაბამისი აბსცისაზე ფუნქციის მნიშვნელობა არის რეჟიმი. ხშირ შემთხვევაში, პოპულაციის განზოგადებულ ინდიკატორად დახასიათებისას უპირატესობა ენიჭება რეჟიმს და არა საშუალო არითმეტიკულს.

მედიანა -ეს არის მახასიათებლის ცენტრალური მნიშვნელობა; მას ფლობს რანჟირებული განაწილების სერიის ცენტრალური წევრი. დისკრეტულ სერიებში, მედიანის მნიშვნელობის საპოვნელად, ჯერ დგინდება მისი სერიული ნომერი. ამისათვის, კენტი რაოდენობის ერთეულებით, ერთი ემატება ყველა სიხშირის ჯამს, რიცხვი იყოფა ორზე. თუ არის 1-ების ლუწი რიცხვი, სერიაში იქნება 2 მედიანა 1, ასე რომ, ამ შემთხვევაში მედიანა განისაზღვრება, როგორც 2 მედიანური 1-ის მნიშვნელობების საშუალო. ამრიგად, დისკრეტული ვარიაციის სერიის მედიანა არის მნიშვნელობა, რომელიც ყოფს სერიას ორ ნაწილად, რომლებიც შეიცავს იგივე რაოდენობის ვარიანტებს.

ინტერვალის სერიაში, მედიანის რიგითი რიცხვის დადგენის შემდეგ, მედიანური ინტერვალი იპოვება დაგროვილი სიხშირეებით (სიხშირეებით), შემდეგ კი მედიანის გამოთვლის ფორმულის გამოყენებით განისაზღვრება თავად მედიანის მნიშვნელობა:

სადაც მე არის მედიანის მნიშვნელობა; x მე -მედიანური ინტერვალის ქვედა ზღვარი; თ-შუალედური ინტერვალის სიგანე; - განაწილების სერიის სიხშირეების ჯამი; /D - პრემედიანი ინტერვალის დაგროვილი სიხშირე; / მე - მედიანური ინტერვალის სიხშირე.

მედიანა შეგიძლიათ იხილოთ გრაფიკულად კუმულაციის გამოყენებით. ამისათვის, კუმულაციის დაგროვილი სიხშირეების (სიხშირეების) შკალაზე, მედიანის რიგითი რიცხვის შესაბამისი წერტილიდან, აბსცისის ღერძის პარალელურად იხაზება სწორი ხაზი, სანამ ის არ გადაიკვეთება კუმულაციასთან. გარდა ამისა, მითითებული სწორი ხაზის კუმულატთან გადაკვეთის ადგილიდან, პერპენდიკულარი ეშვება აბსცისის ღერძზე. ნიშან-თვისების მნიშვნელობა x ღერძზე, რომელიც შეესაბამება შედგენილ ორდინატს (პერპენდიკულარულს) არის მედიანა.

მედიანა ხასიათდება შემდეგი თვისებებით.

  • 1. ეს არ არის დამოკიდებული იმ ატრიბუტების მნიშვნელობებზე, რომლებიც მდებარეობს მის ორივე მხარეს.
  • 2. მას აქვს მინიმალისტური თვისება, რაც ნიშნავს, რომ ატრიბუტის მნიშვნელობების აბსოლუტური გადახრების ჯამი მედიანადან არის მინიმალური მნიშვნელობა ატრიბუტის მნიშვნელობების სხვა მნიშვნელობიდან გადახრასთან შედარებით.
  • 3. ორი განაწილების ცნობილ მედიანასთან გაერთიანებისას შეუძლებელია ახალი განაწილების მედიანური მნიშვნელობის წინასწარ წინასწარ განსაზღვრა.

მედიანის ეს თვისებები ფართოდ გამოიყენება მასობრივი მომსახურების პუნქტების ადგილმდებარეობის დიზაინში - სკოლები, კლინიკები, ბენზინგასამართი სადგურები, წყლის ტუმბოები და ა.შ. მაგალითად, თუ ქალაქის გარკვეულ კვარტალში იგეგმება პოლიკლინიკის აშენება, მაშინ უფრო მიზანშეწონილია მისი განთავსება კვარტალის ისეთ წერტილში, რომელიც ორად ყოფს არა კვარტალის სიგრძეს, არამედ მცხოვრებთა რაოდენობას.

რეჟიმის, მედიანისა და საშუალო არითმეტიკული თანაფარდობა მიუთითებს მახასიათებლის აგრეგატში განაწილების ბუნებაზე, საშუალებას გაძლევთ შეაფასოთ განაწილების სიმეტრია. Თუ x მე მაშინ არის სერიის მარჯვენა ასიმეტრია. ნორმალური განაწილებით X -მე - მო.

კ. პირსონმა, სხვადასხვა ტიპის მრუდების გასწორების საფუძველზე, დაადგინა, რომ ზომიერად ასიმეტრიული განაწილებისთვის, არითმეტიკული საშუალოს, მედიანასა და რეჟიმს შორის მოქმედებს შემდეგი სავარაუდო მიმართებები:

სადაც მე არის მედიანის მნიშვნელობა; Mo - მოდის ღირებულება; x არითმი - საშუალო არითმეტიკული მნიშვნელობა.

თუ საჭიროა ვარიაციის სერიის სტრუქტურის უფრო დეტალურად შესწავლა, მაშინ გამოითვლება დამახასიათებელი მნიშვნელობები, მედიანის მსგავსი. ასეთი მახასიათებლების მნიშვნელობები ყოფს ყველა განაწილების ერთეულს თანაბარ რიცხვებად, მათ უწოდებენ კვანტილებს ან გრადიენტებს. კვანტილები იყოფა კვარტლებად, დეცილებად, პროცენტულებად და ა.შ.

მეოთხედი მოსახლეობას ყოფს ოთხ თანაბარ ნაწილად. პირველი მეოთხედი გამოითვლება მედიანას მსგავსად, პირველი კვარტლის გამოთვლის ფორმულის გამოყენებით, წინასწარ განსაზღვრული პირველი კვარტალური ინტერვალით:

სადაც Qi არის პირველი მეოთხედის მნიშვნელობა; xQ ^ -პირველი მეოთხედის ინტერვალის ქვედა ზღვარი; - პირველი კვარტალური ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები;

დაგროვილი სიხშირე პირველი მეოთხედის ინტერვალის წინა ინტერვალში; Jq ( - პირველი მეოთხედის ინტერვალის სიხშირე.

პირველი მეოთხედი აჩვენებს, რომ მოსახლეობის ერთეულების 25% ნაკლებია მის ღირებულებაზე, ხოლო 75% მეტია. მეორე მეოთხედი უდრის მედიანას, ე.ი. Q2 =მე.

ანალოგიით, მესამე კვარტალი გამოითვლება, მანამდე იპოვა მესამე კვარტალური ინტერვალი:

სად არის მესამე მეოთხედის ინტერვალის ქვედა ზღვარი; - მესამე მეოთხედის ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები; /X"-დაგროვილი სიხშირე წინა ინტერვალში

მესამე მეოთხედი ინტერვალი; Jq - მესამე მეოთხედის ინტერვალის სიხშირე.

მესამე მეოთხედი აჩვენებს, რომ მოსახლეობის 75% მის ღირებულებაზე ნაკლებია, ხოლო 25% მეტია.

განსხვავება მესამე და პირველ კვარტალებს შორის არის კვარტლთაშორისი ინტერვალი:

სადაც Aq არის ინტერკვატური ინტერვალის მნიშვნელობა; Q 3 -მესამე მეოთხედის ღირებულება; Q, - პირველი მეოთხედის მნიშვნელობა.

დეცილები მოსახლეობას ყოფენ 10 თანაბარ ნაწილად. დეცილი არის მახასიათებლის მნიშვნელობა განაწილების სერიაში, რომელიც შეესაბამება მოსახლეობის მეათედს. კვარტილების ანალოგიით, პირველი დეცილი აჩვენებს, რომ მოსახლეობის ერთეულების 10% მის ღირებულებაზე ნაკლებია, ხოლო 90% მეტია, ხოლო მეცხრე დეცილი ცხადყოფს, რომ მოსახლეობის ერთეულების 90% მის ღირებულებაზე ნაკლებია, ხოლო 10% არის. მეტი. მეცხრე და პირველი დეცილების შეფარდება, ე.ი. დეცილური კოეფიციენტი, რომელიც ფართოდ გამოიყენება შემოსავლების დიფერენციაციის შესწავლისას ყველაზე მდიდარი მოსახლეობის 10% და ყველაზე ნაკლებად მდიდარი მოსახლეობის 10% შემოსავლის დონის თანაფარდობის გასაზომად. პროცენტული მაჩვენებელი ყოფს რეიტინგულ მოსახლეობას 100 თანაბარ ნაწილად. პროცენტების გამოთვლა, მნიშვნელობა და გამოყენება დეცილების მსგავსია.

კვარტილები, დეცილები და სხვა სტრუქტურული მახასიათებლები შეიძლება განისაზღვროს გრაფიკულად მედიანასთან ანალოგიით კუმულაციის გამოყენებით.

ვარიაციის ზომის გასაზომად გამოიყენება შემდეგი ინდიკატორები: ვარიაციის დიაპაზონი, საშუალო წრფივი გადახრა, სტანდარტული გადახრა და ვარიაცია. ვარიაციის დიაპაზონის სიდიდე მთლიანად დამოკიდებულია სერიის უკიდურესი წევრების განაწილების შემთხვევითობაზე. ეს მაჩვენებელი საინტერესოა იმ შემთხვევებში, როდესაც მნიშვნელოვანია იცოდეთ რა არის ატრიბუტის მნიშვნელობებში რყევების ამპლიტუდა:

სადაც R-ვარიაციის დიაპაზონის მნიშვნელობა; x max - ატრიბუტის მაქსიმალური მნიშვნელობა; x tt -ფუნქციის მინიმალური მნიშვნელობა.

ვარიაციის დიაპაზონის გამოთვლისას სერიების წევრების დიდი უმრავლესობის მნიშვნელობა არ არის გათვალისწინებული, ხოლო ვარიაცია ასოცირდება სერიის წევრის თითოეულ მნიშვნელობასთან. ეს ნაკლოვანება მოკლებულია ინდიკატორებს, რომლებიც მიიღება ინდივიდუალური ნიშან-თვისებების მნიშვნელობების გადახრებიდან მათი საშუალო მნიშვნელობიდან: საშუალო წრფივი გადახრა და სტანდარტული გადახრა. არსებობს პირდაპირი კავშირი საშუალოდან ცალკეულ გადახრებსა და კონკრეტული მახასიათებლის რყევებს შორის. რაც უფრო ძლიერია არასტაბილურობა, მით მეტია გადახრების აბსოლუტური ზომა საშუალოდან.

საშუალო წრფივი გადახრა არის ინდივიდუალური ვარიანტების გადახრების აბსოლუტური მნიშვნელობების საშუალო არითმეტიკული საშუალო მნიშვნელობიდან.

საშუალო ხაზოვანი გადახრა დაუჯგუფებელი მონაცემებისთვის

სადაც / pr - საშუალო წრფივი გადახრის მნიშვნელობა; x, - - მახასიათებლის მნიშვნელობა; X - P -მოსახლეობის ერთეულების რაოდენობა.

დაჯგუფებული სერიების საშუალო წრფივი გადახრა

სადაც / vz - საშუალო წრფივი გადახრის მნიშვნელობა; x, - მახასიათებლის მნიშვნელობა; X -თვისების საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; / - მოსახლეობის ერთეულების რაოდენობა ცალკეულ ჯგუფში.

გადახრის ნიშნები ამ შემთხვევაში იგნორირებულია, წინააღმდეგ შემთხვევაში ყველა გადახრის ჯამი იქნება ნულის ტოლი. საშუალო წრფივი გადახრა, რომელიც დამოკიდებულია გაანალიზებული მონაცემების დაჯგუფებაზე, გამოითვლება სხვადასხვა ფორმულების გამოყენებით: დაჯგუფებული და არაჯგუფური მონაცემებისთვის. საშუალო წრფივი გადახრა, თავისი პირობითობის გამო, ცვალებადობის სხვა მაჩვენებლებისგან დამოუკიდებლად, პრაქტიკაში შედარებით იშვიათად გამოიყენება (კერძოდ, სახელშეკრულებო ვალდებულებების შესრულების დასახასიათებლად მიწოდების ერთგვაროვნების თვალსაზრისით; საგარეო სავაჭრო ბრუნვის ანალიზში, თანამშრომლების შემადგენლობა, წარმოების რიტმი, პროდუქციის ხარისხი, წარმოების ტექნოლოგიური მახასიათებლების გათვალისწინებით და ა.შ.).

სტანდარტული გადახრა ახასიათებს, თუ რამდენად განსხვავდება შესწავლილი ნიშან-თვისების ინდივიდუალური მნიშვნელობები საშუალოდ პოპულაციის საშუალო მნიშვნელობიდან და გამოიხატება შესწავლილი მახასიათებლის ერთეულებში. სტანდარტული გადახრა, როგორც ვარიაციის ერთ-ერთი მთავარი საზომი, ფართოდ გამოიყენება ერთგვაროვან პოპულაციაში ნიშან-თვისების ცვალებადობის საზღვრების შესაფასებლად, ნორმალური განაწილების მრუდის ორდინატების მნიშვნელობების განსაზღვრისას, აგრეთვე. გამოთვლები, რომლებიც დაკავშირებულია ნიმუშზე დაკვირვების ორგანიზებასთან და ნიმუშის მახასიათებლების სიზუსტის დადგენასთან. დაუჯგუფებელი მონაცემების სტანდარტული გადახრა გამოითვლება შემდეგი ალგორითმის მიხედვით: საშუალოდან ყოველი გადახრა იკვრება, ყველა კვადრატი ჯამდება, რის შემდეგაც კვადრატების ჯამი იყოფა სერიების წევრთა რაოდენობაზე და კვადრატული ფესვი აღებულია. კოეფიციენტი:

სადაც Iip - სტანდარტული გადახრის მნიშვნელობა; Xj-ფუნქციის ღირებულება; X- ატრიბუტის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; P -მოსახლეობის ერთეულების რაოდენობა.

დაჯგუფებული გაანალიზებული მონაცემებისთვის, მონაცემთა სტანდარტული გადახრა გამოითვლება შეწონილი ფორმულის გამოყენებით

სადაც - სტანდარტული გადახრის მნიშვნელობა; Xj-ფუნქციის ღირებულება; X -თვისების საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; fx-მოსახლეობის ერთეულების რაოდენობა კონკრეტულ ჯგუფში.

ფესვის ქვეშ გამოსახულებას ორივე შემთხვევაში დისპერსიას უწოდებენ. ამრიგად, ვარიაცია გამოითვლება, როგორც ნიშან-თვისებების მნიშვნელობების გადახრების საშუალო კვადრატი მათი საშუალო მნიშვნელობიდან. შეუწონავი (მარტივი) მახასიათებლის მნიშვნელობებისთვის, განსხვავება განისაზღვრება შემდეგნაირად:

შეწონილი დამახასიათებელი მნიშვნელობებისთვის

ასევე არსებობს დისპერსიის გამოთვლის სპეციალური გამარტივებული გზა: ზოგადი თვალსაზრისით

შეუწონავი (მარტივი) მახასიათებლების მნიშვნელობებისთვის შეწონილი დამახასიათებელი მნიშვნელობებისთვის
პირობითი ნულიდან დათვლის მეთოდის გამოყენებით

სადაც a 2 - დისპერსიის მნიშვნელობა; x, - - მახასიათებლის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა, თ-ჯგუფის ინტერვალის მნიშვნელობა, t 1 -წონა (A =

დისპერსიას აქვს დამოუკიდებელი გამოხატულება სტატისტიკაში და ვარიაციის ერთ-ერთი ყველაზე მნიშვნელოვანი მაჩვენებელია. იგი იზომება შესასწავლი ნიშან-თვისების საზომი ერთეულების კვადრატის შესაბამისი ერთეულებით.

დისპერსიას აქვს შემდეგი თვისებები.

  • 1. მუდმივი მნიშვნელობის დისპერსია არის ნული.
  • 2. ფუნქციის ყველა მნიშვნელობის შემცირება A-ს იგივე მნიშვნელობით არ ცვლის დისპერსიის მნიშვნელობას. ეს ნიშნავს, რომ გადახრების საშუალო კვადრატი შეიძლება გამოითვალოს არა ატრიბუტის მოცემული მნიშვნელობებით, არამედ მათი გადახრებიდან გარკვეული მუდმივი რიცხვიდან.
  • 3. ფუნქციის ყველა მნიშვნელობის შემცირება ჯერ ამცირებს დისპერსიას შიგნით 2-ჯერ, ხოლო სტანდარტული გადახრა - in ჯერ, ე.ი. ყველა მახასიათებლის მნიშვნელობა შეიძლება დაიყოს რაიმე მუდმივ რიცხვზე (ვთქვათ, სერიის ინტერვალის მნიშვნელობით), გამოვთვალოთ სტანდარტული გადახრა და შემდეგ გავამრავლოთ იგი მუდმივ რიცხვზე.
  • 4. თუ გამოვთვლით გადახრების საშუალო კვადრატს რომელიმე მნიშვნელობიდან და ზეგარკვეულწილად განსხვავდება საშუალო არითმეტიკისგან, მაშინ ის ყოველთვის იქნება მეტი არითმეტიკული საშუალოდან გამოთვლილი გადახრების საშუალო კვადრატზე. ამ შემთხვევაში, გადახრების საშუალო კვადრატი უფრო დიდი იქნება კარგად განსაზღვრული მნიშვნელობით - საშუალო და ამ პირობით აღებულ მნიშვნელობას შორის სხვაობის კვადრატით.

ალტერნატიული მახასიათებლის ვარიაცია არის შესწავლილი ქონების არსებობა ან არარსებობა მოსახლეობის ერთეულებში. რაოდენობრივად ალტერნატიული ატრიბუტის ცვალებადობა გამოიხატება ორი მნიშვნელობით: შესწავლილი თვისების არსებობა ერთეულში აღინიშნება ერთით (1), მისი არარსებობა კი ნულით (0). ერთეულების პროპორცია, რომლებსაც აქვთ შესასწავლი თვისება, აღინიშნება P-ით, ხოლო ერთეულების პროპორცია, რომლებსაც არ გააჩნიათ ეს თვისება, აღინიშნება გ.ამრიგად, ალტერნატიული ატრიბუტის ვარიაცია უდრის იმ ერთეულების პროპორციის ნამრავლს, რომლებსაც აქვთ მოცემული თვისება (P) იმ ერთეულების პროპორციით, რომლებსაც არ გააჩნიათ ეს თვისება. (G).პოპულაციის ყველაზე დიდი ცვალებადობა მიიღწევა იმ შემთხვევებში, როდესაც მოსახლეობის ნაწილს, რომელიც შეადგენს მოსახლეობის მთლიანი მოცულობის 50%-ს, აქვს თვისება, ხოლო მოსახლეობის მეორე ნაწილს, ასევე 50%-ის ტოლი, არ აქვს ეს. ფუნქცია, ხოლო დისპერსიას აღწევს მაქსიმალურ მნიშვნელობას 0,25, მ .ე. P = 0.5, G= 1 - P \u003d 1 - 0.5 \u003d 0.5 და o 2 \u003d 0.5 0.5 \u003d 0.25. ამ ინდიკატორის ქვედა ზღვარი ნულის ტოლია, რაც შეესაბამება სიტუაციას, რომელშიც არ არის ვარიაცია აგრეგატში. ალტერნატიული მახასიათებლის დისპერსიის პრაქტიკული გამოყენება არის ნდობის ინტერვალების აშენება ნიმუშის დაკვირვების ჩატარებისას.

რაც უფრო მცირეა განსხვავება და სტანდარტული გადახრა, მით უფრო ერთგვაროვანი იქნება პოპულაცია და მით უფრო ტიპიური იქნება საშუალო. სტატისტიკის პრაქტიკაში ხშირად ხდება საჭირო სხვადასხვა მახასიათებლების ვარიაციების შედარება. მაგალითად, საინტერესოა მუშების ასაკისა და მათი კვალიფიკაციის ვარიაციების, სამსახურის ხანგრძლივობისა და ხელფასის, ხარჯებისა და მოგების, სამსახურის ხანგრძლივობისა და შრომის პროდუქტიულობის და ა.შ. ასეთი შედარებისთვის, მახასიათებლების აბსოლუტური ცვალებადობის ინდიკატორები შეუსაბამოა: შეუძლებელია სამუშაო გამოცდილების ცვალებადობის შედარება, გამოხატული წლების განმავლობაში, ხელფასის ცვალებადობასთან, გამოხატული რუბლით. ასეთი შედარებების განსახორციელებლად, ისევე როგორც რამდენიმე პოპულაციაში ერთი და იმავე ატრიბუტის რყევების შედარებისთვის, სხვადასხვა არითმეტიკული საშუალებებით, გამოიყენება ვარიაციის ინდიკატორები - რხევის კოეფიციენტი, ვარიაციის ხაზოვანი კოეფიციენტი და ცვალებადობის კოეფიციენტი, რომელიც აჩვენებს ზომას. უკიდურესი მნიშვნელობების რყევები საშუალოზე.

რხევის ფაქტორი:

სადაც V R -რხევის კოეფიციენტის მნიშვნელობა; - ვარიაციის დიაპაზონის მნიშვნელობა; X -

ცვალებადობის ხაზოვანი კოეფიციენტი“.

სადაც vj-ცვალებადობის წრფივი კოეფიციენტის მნიშვნელობა; ᲛᲔ-საშუალო წრფივი გადახრის მნიშვნელობა; X -ნიშნის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

ცვალებადობის კოეფიციენტი:

სადაც ვა-ცვალებადობის კოეფიციენტის მნიშვნელობა; a - სტანდარტული გადახრის მნიშვნელობა; X -ნიშნის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

რხევის კოეფიციენტი არის ცვალებადობის დიაპაზონის პროცენტი შესასწავლი ნიშან-თვისების საშუალო მნიშვნელობამდე, ხოლო ცვალებადობის წრფივი კოეფიციენტი არის საშუალო წრფივი გადახრის თანაფარდობა შესასწავლი თვისების საშუალო მნიშვნელობასთან, გამოხატული პროცენტულად. ვარიაციის კოეფიციენტი არის სტანდარტული გადახრის პროცენტი შესასწავლი თვისების საშუალო მნიშვნელობამდე. ფარდობითი მნიშვნელობის სახით, გამოხატული პროცენტულად, ვარიაციის კოეფიციენტი გამოიყენება სხვადასხვა ნიშან-თვისებების ცვალებადობის ხარისხის შესადარებლად. ვარიაციის კოეფიციენტის გამოყენებით ფასდება სტატისტიკური პოპულაციის ჰომოგენურობა. თუ ვარიაციის კოეფიციენტი 33%-ზე ნაკლებია, მაშინ შესწავლილი პოპულაცია ერთგვაროვანია, ვარიაცია კი სუსტი. თუ ვარიაციის კოეფიციენტი 33%-ზე მეტია, მაშინ შესწავლილი პოპულაცია ჰეტეროგენულია, ვარიაცია ძლიერია და საშუალო მნიშვნელობა ატიპიურია და არ შეიძლება გამოყენებულ იქნას ამ პოპულაციის განზოგადების ინდიკატორად. გარდა ამისა, ვარიაციის კოეფიციენტები გამოიყენება სხვადასხვა პოპულაციაში ერთი მახასიათებლის რყევის შესადარებლად. მაგალითად, ორ საწარმოში მუშაკთა სტაჟის ცვალებადობის შესაფასებლად. რაც უფრო მაღალია კოეფიციენტის მნიშვნელობა, მით უფრო მნიშვნელოვანია მახასიათებლის ცვალებადობა.

გამოთვლილი კვარტლების საფუძველზე, ასევე შესაძლებელია კვარტალური ვარიაციის ფარდობითი ინდიკატორის გამოთვლა ფორმულის გამოყენებით

სადაც ქ 2 და

კვარტლთაშორისი დიაპაზონი განისაზღვრება ფორმულით

მეოთხედი გადახრა გამოიყენება ვარიაციის დიაპაზონის ნაცვლად, რათა თავიდან იქნას აცილებული უკიდურესი მნიშვნელობების გამოყენებასთან დაკავშირებული უარყოფითი მხარეები:

არათანაბარი ინტერვალის ვარიაციული სერიებისთვის ასევე გამოითვლება განაწილების სიმკვრივე. იგი განისაზღვრება, როგორც შესაბამისი სიხშირის ან სიხშირის კოეფიციენტი გაყოფილი ინტერვალის მნიშვნელობაზე. არათანაბარი ინტერვალის სერიებში გამოიყენება აბსოლუტური და ფარდობითი განაწილების სიმკვრივეები. აბსოლუტური განაწილების სიმკვრივე არის სიხშირე ინტერვალის სიგრძის ერთეულზე. ფარდობითი განაწილების სიმკვრივე - სიხშირე ინტერვალის სიგრძის ერთეულზე.

ყოველივე ზემოთქმული მართალია განაწილების სერიებისთვის, რომელთა განაწილების კანონი კარგად არის აღწერილი ნორმალური განაწილების კანონით ან ახლოსაა მასთან.

ტესტის ამოხსნის მაგალითი მათემატიკური სტატისტიკაში

დავალება 1

საწყისი მონაცემები : 30 კაცისგან შემდგარმა გარკვეული ჯგუფის სტუდენტებმა ჩააბარეს გამოცდა კურსში „ინფორმატიკა“. სტუდენტების მიერ მიღებული შეფასებები ქმნიან რიცხვების შემდეგ სერიას:

I. ვარიაციული სერიების შედგენა

x

x

x ნაკ

x ნაკ

სულ:

II. სტატისტიკური ინფორმაციის გრაფიკული წარმოდგენა.

III. ნიმუშის რიცხვითი მახასიათებლები.

1. საშუალო არითმეტიკული

2. გეომეტრიული საშუალო

3. მოდა

4. მედიანა

222222333333333 | 3 34444444445555

5. ნიმუშის ვარიაცია

7. ვარიაციის კოეფიციენტი

8. ასიმეტრია

9. ასიმეტრიის კოეფიციენტი

10. კურტოზი

11. კურტოზის კოეფიციენტი

დავალება 2

საწყისი მონაცემები : გარკვეული ჯგუფის მოსწავლეებმა დაწერეს დასკვნითი ტესტი. ჯგუფი შედგება 30 ადამიანისგან. სტუდენტების მიერ მიღებული ქულები ქმნიან რიცხვების შემდეგ სერიას

გადაწყვეტილება

I. ვინაიდან ნიშანი იღებს მრავალ განსხვავებულ მნიშვნელობას, ჩვენ ავაშენებთ მას ინტერვალის ვარიაციის სერიას. ამისათვის ჩვენ ჯერ დავაყენეთ ინტერვალის მნიშვნელობა . მოდით გამოვიყენოთ სტურგერის ფორმულა

მოდით გავაკეთოთ ინტერვალების მასშტაბი. ამ შემთხვევაში, პირველი ინტერვალის ზედა საზღვრისთვის ჩვენ ავიღებთ ფორმულით განსაზღვრულ მნიშვნელობას:

შემდგომი ინტერვალების ზედა საზღვრები განისაზღვრება შემდეგი რეკურსიული ფორმულით:

, მაშინ

ჩვენ ვასრულებთ ინტერვალების შკალის აგებას, ვინაიდან მომდევნო ინტერვალის ზედა ზღვარი გახდა ნიმუშის მაქსიმალურ მნიშვნელობაზე მეტი ან ტოლი.
.

II. ინტერვალის ვარიაციის სერიის გრაფიკული ჩვენება

III. ნიმუშის რიცხვითი მახასიათებლები

ნიმუშის რიცხობრივი მახასიათებლების დასადგენად შევადგენთ დამხმარე ცხრილს

ჯამი:

1. საშუალო არითმეტიკული

2. გეომეტრიული საშუალო

3. მოდა

4. მედიანა

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. ნიმუშის ვარიაცია

6. ნიმუშის სტანდარტული გადახრა

7. ვარიაციის კოეფიციენტი

8. ასიმეტრია

9. ასიმეტრიის კოეფიციენტი

10. კურტოზი

11. კურტოზის კოეფიციენტი

დავალება 3

მდგომარეობა : ამმეტრის სკალის გაყოფის მნიშვნელობა არის 0,1 ა. ჩვენებები მრგვალდება უახლოეს მთელ განყოფილებამდე. იპოვეთ ალბათობა იმისა, რომ წაკითხვისას დაშვებული იქნება 0,02 A-ზე მეტი შეცდომა.

გადაწყვეტილება.

დამრგვალების შეცდომა შეიძლება ჩაითვალოს შემთხვევით ცვლადად X, რომელიც თანაბრად ნაწილდება ორ მიმდებარე მთელ რიცხვს შორის ინტერვალში. ერთგვაროვანი განაწილების სიმკვრივე

,

სადაც
- ინტერვალის სიგრძე, რომელიც შეიცავს შესაძლო მნიშვნელობებს X; ამ ინტერვალის გარეთ
ამ პრობლემაში შესაძლო მნიშვნელობების შემცველი ინტერვალის სიგრძე X, უდრის 0.1-ს, ასე

წაკითხვის შეცდომა გადააჭარბებს 0.02-ს, თუ იგი ჩართულია ინტერვალში (0.02; 0.08). მერე

პასუხი: =0,6

დავალება 4

საწყისი მონაცემები: მათემატიკური მოლოდინი და ნორმალურად განაწილებული მახასიათებლის სტანდარტული გადახრა Xარის შესაბამისად 10 და 2. იპოვეთ ალბათობა, რომ ტესტის შედეგად Xმიიღებს მნიშვნელობას, რომელიც შეიცავს ინტერვალში (12, 14).

გადაწყვეტილება.

მოდით გამოვიყენოთ ფორმულა

და თეორიული სიხშირეები

გადაწყვეტილება

X-სთვის, მისი მათემატიკური მოლოდინი M(X) და ვარიაცია D(X). გადაწყვეტილება. იპოვეთ შემთხვევითი ცვლადის განაწილების ფუნქცია F(x)... შერჩევის შეცდომა). შევადგინოთ ვარიაციული რიგიინტერვალის სიგანე იქნება: თითოეული მნიშვნელობისთვის რიგიმოდით გამოვთვალოთ რამდენი...

  • ამოხსნა: გამყოფი განტოლება

    გადაწყვეტილება

    ფორმაში, რათა იპოვოთ პირადი გადაწყვეტილებებიარაერთგვაროვანი განტოლება შედგენასისტემა მოვაგვაროთ მიღებული სისტემა... ; +47; +61; +10; -რვა. აშენების ინტერვალი ვარიაციული რიგი. მიეცით საშუალო სტატისტიკური შეფასებები...

  • გამოსავალი: გამოვთვალოთ ჯაჭვის და ძირითადი აბსოლუტური ზრდის ტემპები, ზრდის ტემპები, ზრდის ტემპები. მიღებული მნიშვნელობები შეჯამებულია ცხრილში 1

    გადაწყვეტილება

    წარმოების მოცულობა. გადაწყვეტილება: ინტერვალის საშუალო არითმეტიკული ვარიაციული რიგიგამოითვლება შემდეგნაირად: თითო... შერჩევის ზღვრული შეცდომა 0,954 ალბათობით (t=2) იქნება: Δ w = t*μ = 2*0.0146 = 0.02927 განვსაზღვროთ საზღვრები...

  • გადაწყვეტილება. ნიშანი

    გადაწყვეტილება

    ვისი სამუშაო გამოცდილების შესახებ და შეადგინანიმუში. ამ თანამშრომლების სამუშაო დღის ნიმუშის საშუალო სტაჟი და შეადგინანიმუში. ნიმუშის საშუალო ხანგრძლივობა... 1.16, მნიშვნელოვნების დონე α = 0.05. გადაწყვეტილება. ვარიაციული რიგიამ ნიმუშს აქვს ფორმა: 0.71 ...

  • სამუშაო სასწავლო გეგმა ბიოლოგიაში 10-11 კლასებისთვის შედგენილი პოლიკარპოვა ს.ვ.

    სამუშაო სასწავლო გეგმა

    შეჯვარების უმარტივესი სქემები» 5 ლ.რ. " გადაწყვეტილებაელემენტარული გენეტიკური პრობლემები“ 6 ლ.რ. " გადაწყვეტილებაელემენტარული გენეტიკური პრობლემები“ 7 ლ.რ. „..., 110, 115, 112, 110. შედგენა ვარიაციული რიგი, დახატე ვარიაციულიმრუდი, იპოვნეთ მახასიათებლის საშუალო მნიშვნელობა ...

  • რუსეთის ეროვნული ეკონომიკის აკადემია და საჯარო სამსახური რუსეთის ფედერაციის პრეზიდენტის ქვეშ

    OREL ფილიალი

    მათემატიკისა და მათემატიკური მეთოდების განყოფილება მენეჯმენტში

    დამოუკიდებელი მუშაობა

    მათემატიკა

    თემაზე "ვარიაციური სერია და მისი მახასიათებლები"

    ეკონომიკისა და მენეჯმენტის ფაკულტეტის სრულ განაკვეთზე სტუდენტებისთვის

    ტრენინგის სფეროები "პერსონალის მართვა"


    მიზანი:მათემატიკური სტატისტიკის ცნებებისა და პირველადი მონაცემთა დამუშავების მეთოდების დაუფლება.

    ტიპიური პრობლემების გადაჭრის მაგალითი.

    დავალება 1.

    შემდეგი მონაცემები იქნა მიღებული გამოკითხვის შედეგად ():

    1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6

    3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

    3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5

    აუცილებელი:

    1) ვარიაციური სერიების შედგენა (ნიმუშის სტატისტიკური განაწილება), მანამდე ჩაწერილი პარამეტრების დისკრეტული სერიის რანჟირება.

    2) ააგეთ სიხშირეების მრავალკუთხედი და კუმულაცია.

    3) შეადგინეთ ფარდობითი სიხშირეების (სიხშირეების) განაწილების სერია.

    4) იპოვეთ ვარიაციის სერიის ძირითადი რიცხვითი მახასიათებლები (გამოიყენეთ გამარტივებული ფორმულები მათ მოსაძებნად): ა) საშუალო არითმეტიკული, ბ) მედიანა მედა მოდა მო, გ) დისპერსიას s2, დ) სტანდარტული გადახრა , ე) ვარიაციის კოეფიციენტი .

    5) განმარტეთ მიღებული შედეგების მნიშვნელობა.

    გადაწყვეტილება.

    1) შედგენისთვის რეიტინგული ვარიანტების დისკრეტული სერია დაალაგეთ გამოკითხვის მონაცემები ზომის მიხედვით და დაალაგეთ ისინი ზრდადი თანმიმდევრობით

    0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2

    3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

    5 5 5 5 6 6 6 7 7.

    მოდით შევქმნათ ვარიაციის სერია ცხრილის პირველ რიგში დაკვირვებული მნიშვნელობების (ვარიანტების) ჩაწერით, ხოლო მეორე რიგში მათ შესაბამისი სიხშირეების ჩაწერით (ცხრილი 1)

    ცხრილი 1.

    2) სიხშირის პოლიგონი არის გატეხილი ხაზი, რომელიც აკავშირებს წერტილებს ( x i; n i), მე=1, 2,…, , სად X.

    გამოვსახოთ ვარიაციული სერიის სიხშირეების დიაპაზონი (ნახ. 1).

    ნახ.1. სიხშირის პოლიგონი

    კუმულაციური მრუდი (კუმულაცია) დისკრეტული ვარიაციული სერიებისთვის არის გატეხილი ხაზი, რომელიც აკავშირებს წერტილებს ( x i; ნ და ნაკ), მე=1, 2,…, .

    მოდი ვიპოვოთ დაგროვილი სიხშირეები ნ და ნაკ(კუმულაციური სიხშირე გვიჩვენებს, რამდენი ვარიანტი დაფიქსირდა ნიშან-თვისების მნიშვნელობით ნაკლები X). ნაპოვნი მნიშვნელობები შეყვანილია ცხრილის მესამე რიგში 1.



    ავაშენოთ კუმულატი (ნახ. 2).

    ნახ.2. კუმულაცია

    3) იპოვეთ ფარდობითი სიხშირეები (სიხშირეები), სად, სად - სხვადასხვა მახასიათებლების მნიშვნელობების რაოდენობა X, რომელიც გამოითვლება იგივე სიზუსტით.

    მოდით დავწეროთ ფარდობითი სიხშირეების (სიხშირეების) განაწილების სერია ცხრილის 2 სახით.

    ცხრილი 2

    4) მოდით ვიპოვოთ ვარიაციული სერიის ძირითადი რიცხვითი მახასიათებლები:

    ა) ჩვენ ვპოულობთ საშუალო არითმეტიკას გამარტივებული ფორმულის გამოყენებით:

    ,

    სადაც - პირობითი ვარიანტები

    დავსვათ თან= 3 (ერთ-ერთი საშუალო დაკვირვებული მნიშვნელობა), = 1 (განსხვავება ორ მიმდებარე ვარიანტს შორის) და შეადგინეთ საანგარიშო ცხრილი (ცხრილი 3).

    ცხრილი 3

    x i მე u i u i n i u i 2 n i
    -3 -12
    -2 -26
    -1 -14
    ჯამი -11

    შემდეგ არითმეტიკული საშუალო

    ბ) მედიანა მევარიაციის სერია არის მახასიათებლის მნიშვნელობა, რომელიც ხვდება დაკვირვებების დიაპაზონის სერიის შუაში. ეს დისკრეტული ვარიაციული სერია შეიცავს ლუწი რაოდენობის ტერმინებს ( =80), ასე რომ, მედიანა უდრის ორი მედიანის ვარიანტის ჯამის ნახევარს.

    მოდა მოვარიაციის სერიას უწოდებენ ვარიანტს, რომელიც შეესაბამება უმაღლეს სიხშირეს. მოცემული ვარიაციული სერიისთვის, უმაღლესი სიხშირე max = 24 შეესაბამება ვარიანტს X= 3 ნიშნავს მოდას მო=3.

    გ) დისპერსიას s2, რომელიც არის ინდიკატორის შესაძლო მნიშვნელობების დისპერსიის საზომი Xმისი საშუალო მნიშვნელობის გარშემო, ჩვენ ვპოულობთ გამარტივებული ფორმულის გამოყენებით:

    , სად u i- პირობითი ვარიანტები

    ჩვენ ასევე შევიყვანთ შუალედურ გამოთვლებს ცხრილში 3.

    შემდეგ განსხვავება

    დ) სტანდარტული გადახრა იპოვეთ ფორმულით:

    .

    ე) ვარიაციის კოეფიციენტი : (),

    ცვალებადობის კოეფიციენტი არის განზომილებიანი სიდიდე, ამიტომ იგი ვარგისია ვარიაციული სერიების გაფანტვის შესადარებლად, რომელთა ვარიანტებს განსხვავებული ზომები აქვთ.

    ცვალებადობის კოეფიციენტი

    .

    5) მიღებული შედეგების მნიშვნელობა არის ის, რომ მნიშვნელობა ახასიათებს მახასიათებლის საშუალო მნიშვნელობას Xგანხილული ნიმუშის ფარგლებში, ანუ საშუალო მნიშვნელობა იყო 2,86. Სტანდარტული გადახრა აღწერს ინდიკატორის მნიშვნელობების აბსოლუტურ დისპერსიას Xდა ამ შემთხვევაში არის ≈ 1.55. ცვალებადობის კოეფიციენტი ახასიათებს ინდიკატორის შედარებით ცვალებადობას X, ანუ ფარდობითი გავრცელება მისი საშუალო მნიშვნელობის ირგვლივ და ამ შემთხვევაში არის .

    პასუხი: ; ; ; .

    დავალება 2.

    ჩვენ გვაქვს შემდეგი მონაცემები ცენტრალური რუსეთის 40 უმსხვილესი ბანკის სააქციო კაპიტალის შესახებ:

    12,0 49,4 22,4 39,3 90,5 15,2 75,0 73,0 62,3 25,2
    70,4 50,3 72,0 71,6 43,7 68,3 28,3 44,9 86,6 61,0
    41,0 70,9 27,3 22,9 88,6 42,5 41,9 55,0 56,9 68,1
    120,8 52,4 42,0 119,3 49,6 110,6 54,5 99,3 111,5 26,1

    აუცილებელი:

    1) შექმენით ინტერვალის ვარიაციის სერია.

    2) გამოთვალეთ ნიმუშის საშუალო და ნიმუშის განსხვავება

    3) იპოვეთ სტანდარტული გადახრა და ვარიაციის კოეფიციენტი.

    4) განაწილების სიხშირეების ჰისტოგრამის აგება.

    გადაწყვეტილება.

    1) მოდით ავირჩიოთ ინტერვალების თვითნებური რაოდენობა, მაგალითად, 8. შემდეგ ინტერვალის სიგანე:

    .

    მოდით გავაკეთოთ გაანგარიშების ცხრილი:

    ინტერვალის ვარიანტი, x k – x k +1 სიხშირე, n i ინტერვალის შუა წერტილი x i პირობითი ვარიანტი, და მე და მე ნ ი და მე 2 n i (და მე + 1) 2 n i
    10 – 25 17,5 – 3 – 12
    25 – 40 32,5 – 2 – 10
    40 – 55 47,5 – 1 – 11
    55 – 70 62,5
    70 – 85 77,5
    85 – 100 92,5
    100 – 115 107,5
    115 – 130 122,5
    ჯამი – 5

    მნიშვნელობა არჩეულია, როგორც ყალბი ნული c= 62.5 (ეს ვარიანტი მდებარეობს დაახლოებით ვარიაციის სერიის შუაში) .

    პირობითი ვარიანტები განისაზღვრება ფორმულით

    მოდით ვუწოდოთ სხვადასხვა ნიმუშის მნიშვნელობები პარამეტრებიმნიშვნელობების სერია და აღნიშნავს: X 1 , X 2,…. უპირველეს ყოვლისა, მოდით გავაკეთოთ დიაპაზონივარიანტები, ე.ი. დაალაგეთ ისინი აღმავალი ან კლებადობით. თითოეული ვარიანტისთვის მითითებულია საკუთარი წონა, ე.ი. რიცხვი, რომელიც ახასიათებს ამ ვარიანტის წვლილს მთლიან მოსახლეობაში. სიხშირეები ან სიხშირეები მოქმედებს როგორც წონა.

    სიხშირე n i ვარიანტი x iე.წ. რიცხვი, რომელიც გვიჩვენებს რამდენჯერ ჩნდება ეს ვარიანტი განხილულ ნიმუშ პოპულაციაში.

    სიხშირე ან ფარდობითი სიხშირე w i ვარიანტი x iეწოდება რიცხვს, რომელიც ტოლია ვარიანტის სიხშირის თანაფარდობას ყველა ვარიანტის სიხშირეების ჯამს. სიხშირე გვიჩვენებს შერჩევის პოპულაციის ერთეულების რომელ ნაწილს აქვს მოცემული ვარიანტი.

    ოპციების თანმიმდევრობას მათი შესაბამისი წონებით (სიხშირეები ან სიხშირეები), რომლებიც დაწერილია აღმავალი (ან კლებადი) თანმიმდევრობით, ე.წ. ვარიაციული სერია.

    ვარიაციული სერიები არის დისკრეტული და ინტერვალური.

    დისკრეტული ვარიაციული სერიებისთვის მითითებულია ატრიბუტის წერტილის მნიშვნელობები, ინტერვალის სერიებისთვის ატრიბუტების მნიშვნელობები მითითებულია ინტერვალების სახით. ვარიაციის სერიას შეუძლია აჩვენოს სიხშირეების ან ფარდობითი სიხშირეების (სიხშირეების) განაწილება, იმისდა მიხედვით, თუ რა მნიშვნელობაა მითითებული თითოეული ვარიანტისთვის - სიხშირე ან სიხშირე.

    სიხშირის განაწილების დისკრეტული ვარიაციის სერიაროგორც ჩანს:

    სიხშირეები გვხვდება ფორმულით, i = 1, 2, ..., .

    1 + 2 + … + მ = 1.

    მაგალითი 4.1. მოცემული რიცხვების ნაკრებისთვის

    4, 6, 6, 3, 4, 9, 6, 4, 6, 6

    სიხშირისა და სიხშირის განაწილების დისკრეტული ვარიაციული სერიის შექმნა.

    გადაწყვეტილება . მოსახლეობის მოცულობა არის = 10. დისკრეტული სიხშირის განაწილების სერიას აქვს ფორმა

    ინტერვალის სერიებს აქვთ ჩაწერის მსგავსი ფორმა.

    სიხშირის განაწილების ინტერვალის ვარიაციების სერიაიწერება როგორც:

    ყველა სიხშირის ჯამი უდრის დაკვირვების საერთო რაოდენობას, ე.ი. მთლიანი მოცულობა: = 1 + 2 + … + მ .

    ფარდობითი სიხშირეების (სიხშირეების) განაწილების ინტერვალის ვარიაციების სერიაროგორც ჩანს:

    სიხშირე გვხვდება ფორმულით, i = 1, 2, ..., .

    ყველა სიხშირის ჯამი ერთის ტოლია: 1 + 2 + … + მ = 1.

    პრაქტიკაში ყველაზე ხშირად გამოიყენება ინტერვალის სერიები. თუ არსებობს უამრავი სტატისტიკური ნიმუშის მონაცემები და მათი მნიშვნელობები განსხვავდება ერთმანეთისგან თვითნებურად მცირე რაოდენობით, მაშინ ამ მონაცემების დისკრეტული სერია იქნება საკმაოდ შრომატევადი და მოუხერხებელი შემდგომი კვლევისთვის. ამ შემთხვევაში გამოიყენება მონაცემთა დაჯგუფება, ე.ი. ატრიბუტის ყველა მნიშვნელობის შემცველი ინტერვალი დაყოფილია რამდენიმე ნაწილობრივ ინტერვალად და, თითოეული ინტერვალისთვის სიხშირის გამოთვლის შემდეგ, მიიღება ინტერვალის სერია. მოდით უფრო დეტალურად ჩამოვწეროთ ინტერვალის სერიის აგების სქემა, თუ ვივარაუდებთ, რომ ნაწილობრივი ინტერვალების სიგრძე იგივე იქნება.

    2.2 ინტერვალის სერიის აგება

    ინტერვალის სერიის შესაქმნელად დაგჭირდებათ:

    ინტერვალების რაოდენობის განსაზღვრა;

    ინტერვალების სიგრძის განსაზღვრა;

    განსაზღვრეთ ინტერვალების მდებარეობა ღერძზე.

    დადგენისთვის ინტერვალების რაოდენობა არსებობს სტურგესის ფორმულა, რომლის მიხედვითაც

    ,

    სადაც - მთლიანობის მოცულობა.

    მაგალითად, თუ არსებობს 100 დამახასიათებელი მნიშვნელობა (ვარიანტი), მაშინ რეკომენდებულია ინტერვალების ტოლი ინტერვალების აყვანა ინტერვალის სერიის ასაგებად.

    თუმცა, პრაქტიკაში ძალიან ხშირად, ინტერვალების რაოდენობას თავად მკვლევარი ირჩევს, იმის გათვალისწინებით, რომ ეს რიცხვი არ უნდა იყოს ძალიან დიდი, რათა სერია არ იყოს შრომატევადი, მაგრამ ასევე არც ისე მცირე, რომ არ დაკარგოს ზოგიერთი თვისება. განაწილება.

    ინტერვალის სიგრძე განისაზღვრება შემდეგი ფორმულით:

    ,

    სადაც xმაქს და x min არის პარამეტრების ყველაზე დიდი და უმცირესი მნიშვნელობები, შესაბამისად.

    ღირებულება დაურეკა დიდი მასშტაბითრიგი.

    ინტერვალების თავად ასაგებად, ისინი სხვადასხვა გზით მოქმედებენ. ერთ-ერთი ყველაზე მარტივი გზა შემდეგია. მნიშვნელობა მიიღება როგორც პირველი ინტერვალის დასაწყისი
    . შემდეგ შუალედების დანარჩენი საზღვრები იპოვება ფორმულით. ცხადია, ბოლო ინტერვალის დასასრული m+1 უნდა აკმაყოფილებდეს პირობას

    ინტერვალების ყველა საზღვრის აღმოჩენის შემდეგ, განისაზღვრება ამ ინტერვალების სიხშირეები (ან სიხშირეები). ამ პრობლემის გადასაჭრელად, ისინი ათვალიერებენ ყველა ვარიანტს და განსაზღვრავენ იმ ვარიანტების რაოდენობას, რომლებიც ხვდება კონკრეტულ ინტერვალში. ჩვენ განვიხილავთ ინტერვალის სერიის სრულ კონსტრუქციას მაგალითის გამოყენებით.

    მაგალითი 4.2. შემდეგი სტატისტიკისთვის, დაწერილი აღმავალი თანმიმდევრობით, შექმენით ინტერვალის სერია ინტერვალების რაოდენობით 5-ის ტოლი:

    11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

    გადაწყვეტილება. სულ =50 ვარიანტის მნიშვნელობა.

    პრობლემურ მდგომარეობაში მითითებულია ინტერვალების რაოდენობა, ე.ი. =5.

    ინტერვალების სიგრძე არის
    .

    მოდით განვსაზღვროთ ინტერვალების საზღვრები:

    1 = 11 − 8,5 = 2,5; 2 = 2,5 + 17 = 19,5; 3 = 19,5 + 17 = 36,5;

    4 = 36,5 + 17 = 53,5; 5 = 53,5 + 17 = 70,5; 6 = 70,5 + 17 = 87,5;

    7 = 87,5 +17 = 104,5.

    ინტერვალების სიხშირის დასადგენად, ჩვენ ვითვლით იმ ვარიანტების რაოდენობას, რომლებიც შედის ამ ინტერვალში. მაგალითად, ვარიანტები 11, 12, 12, 14, 14, 15 პირველ ინტერვალში ხვდება 2,5-დან 19,5-მდე.მათი რიცხვია 6, შესაბამისად, პირველი ინტერვალის სიხშირეა. 1=6. პირველი ინტერვალის სიხშირე არის . ვარიანტები 21, 21, 22, 23, 25, რომელთა რიცხვი 5-ია, მეორე ინტერვალში ხვდება 19,5-დან 36,5-მდე, ამიტომ მეორე ინტერვალის სიხშირე არის 2 =5 და სიხშირე . ყველა ინტერვალისთვის მსგავსი სიხშირეების და სიხშირის აღმოჩენის შემდეგ, ჩვენ ვიღებთ შემდეგ ინტერვალურ სერიებს.

    სიხშირის განაწილების ინტერვალის სერიას აქვს ფორმა:

    სიხშირეების ჯამია 6+5+9+11+8+11=50.

    სიხშირის განაწილების ინტერვალის სერიას აქვს ფორმა:

    სიხშირეების ჯამია 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

    ინტერვალური სერიების აგებისას, განსახილველი პრობლემის სპეციფიკური პირობებიდან გამომდინარე, შეიძლება გამოყენებულ იქნას სხვა წესები, კერძოდ:

    1. ინტერვალის ვარიაციის სერია შეიძლება შედგებოდეს სხვადასხვა სიგრძის ნაწილობრივი ინტერვალებისგან. ინტერვალების არათანაბარი სიგრძე შესაძლებელს ხდის გამოვყოთ სტატისტიკური პოპულაციის თვისებები მახასიათებლის არათანაბარი განაწილებით. მაგალითად, თუ ინტერვალების საზღვრები განსაზღვრავს ქალაქებში მცხოვრებთა რაოდენობას, მაშინ ამ პრობლემაში მიზანშეწონილია გამოიყენოთ სიგრძით არათანაბარი ინტერვალები. ცხადია, პატარა ქალაქებისთვის ასევე მნიშვნელოვანია მოსახლეობის რაოდენობის მცირე განსხვავება, დიდი ქალაქებისთვის კი ათეულობით და ასეულობით მცხოვრებთა სხვაობა არ არის მნიშვნელოვანი. ნაწილობრივი ინტერვალების არათანაბარი სიგრძის ინტერვალური სერიები შესწავლილია ძირითადად სტატისტიკის ზოგად თეორიაში და მათი განხილვა სცილდება წინამდებარე სახელმძღვანელოს ფარგლებს.

    2. მათემატიკურ სტატისტიკაში ზოგჯერ განიხილება ინტერვალური სერიები, რომლებისთვისაც პირველი ინტერვალის მარცხენა საზღვარი არის –∞, ხოლო ბოლო ინტერვალის მარჯვენა საზღვარი +∞. ეს კეთდება იმისთვის, რომ სტატისტიკური განაწილება უფრო ახლოს იყოს თეორიულთან.

    3. ინტერვალური სერიების აგებისას შეიძლება აღმოჩნდეს, რომ ზოგიერთი ვარიანტის მნიშვნელობა ზუსტად ემთხვევა ინტერვალის ზღვარს. ამ შემთხვევაში საუკეთესო რამ არის შემდეგი. თუ არსებობს მხოლოდ ერთი ასეთი დამთხვევა, მაშინ ჩათვალეთ, რომ განხილული ვარიანტი თავისი სიხშირით მოხვდა ინტერვალის სერიის შუათან უფრო ახლოს ინტერვალში, თუ რამდენიმე ასეთი ვარიანტია, მაშინ ან ყველა მათგანი მიეკუთვნება ინტერვალებს. ამ ვარიანტის მარჯვნივ, ან ყველა მარცხნივ.

    4. ინტერვალების რაოდენობის და მათი სიგრძის დადგენის შემდეგ, ინტერვალების განლაგება შეიძლება სხვა გზითაც. იპოვეთ ოფციონის ყველა განხილული მნიშვნელობის არითმეტიკული საშუალო Xშდრ. და შექმენით პირველი ინტერვალი ისე, რომ ეს ნიმუშის საშუალო იყოს გარკვეული ინტერვალის შიგნით. ამრიგად, ჩვენ ვიღებთ ინტერვალს Xშდრ. - 0,5 ადრე Xსაშუალო + 0,5 . შემდეგ მარცხნივ და მარჯვნივ, ვამატებთ ინტერვალის სიგრძეს, ვაშენებთ დარჩენილ ინტერვალებს xწთ და x max არ მოხვდება პირველ და ბოლო ინტერვალებში, შესაბამისად.

    5. ინტერვალური სერიები დიდი რაოდენობით ინტერვალებით მოხერხებულად იწერება ვერტიკალურად, ე.ი. ჩაწერეთ ინტერვალები არა პირველ სტრიქონში, არამედ პირველ სვეტში და სიხშირეები (ან სიხშირეები) მეორე სვეტში.

    ნიმუშის მონაცემები შეიძლება ჩაითვალოს ზოგიერთი შემთხვევითი ცვლადის მნიშვნელობებად X. შემთხვევით ცვლადს აქვს თავისი განაწილების კანონი. ალბათობის თეორიიდან ცნობილია, რომ დისკრეტული შემთხვევითი ცვლადის განაწილების კანონი შეიძლება განისაზღვროს როგორც განაწილების სერია, ხოლო უწყვეტისთვის, განაწილების სიმკვრივის ფუნქციის გამოყენებით. თუმცა, არსებობს უნივერსალური განაწილების კანონი, რომელიც მოქმედებს როგორც დისკრეტულ, ასევე უწყვეტ შემთხვევით ცვლადებზე. ეს განაწილების კანონი მოცემულია როგორც განაწილების ფუნქცია (x) = (X<x). ნიმუშის მონაცემებისთვის შეგიძლიათ მიუთითოთ განაწილების ფუნქციის ანალოგი - ემპირიული განაწილების ფუნქცია.