ვარიაციის სერიის რიცხვითი მნიშვნელობა ეწოდება. ვარიაციების სერია

ვარიაციულირაოდენობრივ საფუძველზე აგებული განაწილების სერიები. მოსახლეობის ცალკეულ ერთეულებში რაოდენობრივი მახასიათებლების მნიშვნელობები არ არის მუდმივი, მეტ-ნაკლებად განსხვავდება ერთმანეთისგან.

Ვარიაცია- მერყეობა, ატრიბუტის მნიშვნელობის ცვალებადობა პოპულაციის ერთეულებში. გამოკვლეულ პოპულაციაში წარმოქმნილი ნიშან-თვისების ცალკეული რიცხვითი მნიშვნელობები ეწოდება პარამეტრებიღირებულებები. საშუალო მნიშვნელობის არასაკმარისი რაოდენობა მოსახლეობის სრული დახასიათებისთვის საჭიროებს საშუალო მნიშვნელობების შევსებას ინდიკატორებით, რაც შესაძლებელს გახდის ამ საშუალოების ტიპურობის შეფასებას შესასწავლი თვისების რყევების (ვარიაციის) გაზომვით.

ვარიაციის არსებობა განპირობებულია მრავალი ფაქტორის გავლენით ნიშან-თვისებების დონის ფორმირებაზე. ეს ფაქტორები მოქმედებს არათანაბარი ძალით და სხვადასხვა მიმართულებით. ვარიაციის ინდიკატორები გამოიყენება ნიშან-თვისებების ცვალებადობის საზომის აღსაწერად.

ვარიაციის სტატისტიკური შესწავლის ამოცანები:

  • 1) მოსახლეობის ცალკეულ ერთეულებში ნიშნების ცვალებადობის ხასიათისა და ხარისხის შესწავლა;
  • 2) ცალკეული ფაქტორების ან მათი ჯგუფების როლის განსაზღვრა პოპულაციის გარკვეული მახასიათებლების ცვალებადობაში.

სტატისტიკაში გამოიყენება ვარიაციის შესწავლის სპეციალური მეთოდები, რომლებიც დაფუძნებულია ინდიკატორების სისტემის გამოყენებაზე. თანრომლითაც ვარიაცია იზომება.

ვარიაციის შესწავლა აუცილებელია. ვარიაციების გაზომვა აუცილებელია ნიმუშის დაკვირვების, კორელაციისა და დისპერსიული ანალიზის ჩატარებისას და ა.შ. ერმოლაევი O.Yu. მათემატიკური სტატისტიკა ფსიქოლოგებისთვის: სახელმძღვანელო [ტექსტი] / O.Yu. ერმოლაევი. - მ.: მოსკოვის ფსიქოლოგიური და სოციალური ინსტიტუტის ფლინტის გამომცემლობა, 2012. - 335გვ.

ცვალებადობის ხარისხის მიხედვით, შეიძლება ვიმსჯელოთ მოსახლეობის ჰომოგენურობაზე, მახასიათებლების ინდივიდუალური მნიშვნელობების სტაბილურობაზე და საშუალო ტიპურობაზე. მათ საფუძველზე შემუშავებულია ნიშანთა ურთიერთობის სიახლოვის ინდიკატორები, შერჩევითი დაკვირვების სიზუსტის შეფასების ინდიკატორები.

არის ცვალებადობა სივრცეში და ცვალებადობა დროში.

სივრცეში ცვალებადობა გაგებულია, როგორც მახასიათებლის მნიშვნელობების რყევა ცალკეულ ტერიტორიებზე წარმოდგენილ პოპულაციის ერთეულებში. დროის ცვალებადობაში იგულისხმება ატრიბუტის მნიშვნელობების ცვლილება დროის სხვადასხვა პერიოდში.

განაწილების სერიის ცვალებადობის შესასწავლად, ატრიბუტების მნიშვნელობების ყველა ვარიანტი განლაგებულია აღმავალი ან კლებადობით. ამ პროცესს სერიების რანჟირება ეწოდება.

ვარიაციის უმარტივესი ნიშნებია მინიმალური და მაქსიმალური- ატრიბუტის უმცირესი და უდიდესი მნიშვნელობა აგრეგატში. მახასიათებლის მნიშვნელობების ცალკეული ვარიანტების გამეორებების რაოდენობას ეწოდება გამეორების სიხშირე (fi). მოსახერხებელია სიხშირეების ჩანაცვლება სიხშირეებით - wi. სიხშირე - სიხშირის ფარდობითი მაჩვენებელი, რომელიც შეიძლება გამოისახოს ერთეულის ფრაქციებში ან პროცენტებში და საშუალებას გაძლევთ შეადაროთ ვარიაციების სერიები დაკვირვებების სხვადასხვა რაოდენობას. გამოხატულია ფორმულით:

სადაც Xmax, Xmin - ატრიბუტის მაქსიმალური და მინიმალური მნიშვნელობები აგრეგატში; n არის ჯგუფების რაოდენობა.

ნიშან-თვისების ცვალებადობის გასაზომად გამოიყენება სხვადასხვა აბსოლუტური და ფარდობითი ინდიკატორი. ვარიაციის აბსოლუტური მაჩვენებლები მოიცავს ვარიაციის დიაპაზონს, საშუალო წრფივ გადახრას, დისპერსიას, სტანდარტულ გადახრას. რყევის ფარდობითი მაჩვენებლები მოიცავს რხევის კოეფიციენტს, ფარდობით ხაზოვან გადახრას, ვარიაციულ კოეფიციენტს.

ვარიაციის სერიის პოვნის მაგალითი

ვარჯიში.ამ ნიმუშისთვის:

  • ა) იპოვეთ ვარიაციის სერიები;
  • ბ) განაწილების ფუნქციის აგება;

No=42. ნიმუშები:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

გადაწყვეტილება.

  • ა) რანჟირებული ვარიაციული სერიის აგება:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • ბ) დისკრეტული ვარიაციული სერიის აგება.

მოდით გამოვთვალოთ ჯგუფების რაოდენობა ვარიაციების სერიაში Sturgess-ის ფორმულის გამოყენებით:

ავიღოთ ჯგუფების რაოდენობა 7-ის ტოლი.

ჯგუფების რაოდენობის ცოდნა, ჩვენ ვიანგარიშებთ ინტერვალის მნიშვნელობას:

ცხრილის აგების მოხერხებულობისთვის ავიღებთ 8-ის ტოლი ჯგუფების რაოდენობას, ინტერვალი იქნება 1.

ბრინჯი. ერთი მაღაზიის მიერ საქონლის გაყიდვების მოცულობა გარკვეული პერიოდის განმავლობაში

დაჯგუფების მეთოდი ასევე საშუალებას გაძლევთ გაზომოთ ვარიაცია(ცვალებადობა, რყევა) ნიშნები. პოპულაციის ერთეულების შედარებით მცირე რაოდენობით, ვარიაცია იზომება ერთეულების რანჟირებული სერიის საფუძველზე, რომლებიც ქმნიან მოსახლეობას. რიგს ეძახიან რეიტინგულითუ ერთეულები განლაგებულია აღმავალ (დაღმავალ) ნიშანში.

თუმცა, რანჟირებული სერიები საკმაოდ საჩვენებელია, როდესაც საჭიროა ვარიაციის შედარებითი მახასიათებელი. გარდა ამისა, ხშირ შემთხვევაში საქმე გვაქვს სტატისტიკურ აგრეგატებთან, რომლებიც შედგება დიდი რაოდენობის ერთეულებისგან, რომელთა წარმოდგენა პრაქტიკულად რთულია კონკრეტული სერიის სახით. ამასთან დაკავშირებით, სტატისტიკური მონაცემების პირველადი ზოგადი გაცნობისთვის და განსაკუთრებით ნიშნების ცვალებადობის შესწავლის გასაადვილებლად, შესწავლილი ფენომენები და პროცესები ჩვეულებრივ გაერთიანებულია ჯგუფებად, ხოლო დაჯგუფების შედეგები შედგენილია ჯგუფური ცხრილების სახით. .

თუ ჯგუფურ ცხრილში მხოლოდ ორი სვეტია - ჯგუფები არჩეული მახასიათებლის (ოფციების) და ჯგუფების რაოდენობის მიხედვით (სიხშირეები ან სიხშირეები), მას ე.წ. განაწილების მახლობლად.

განაწილების დიაპაზონი -სტრუქტურული დაჯგუფების უმარტივესი ტიპი ერთი ატრიბუტის მიხედვით, რომელიც ნაჩვენებია ჯგუფურ ცხრილში ორი სვეტით, რომლებიც შეიცავს ატრიბუტის ვარიანტებს და სიხშირეს. ხშირ შემთხვევაში, ასეთი სტრუქტურული დაჯგუფებით, ე.ი. განაწილების სერიების შედგენით იწყება საწყისი სტატისტიკური მასალის შესწავლა.

სტრუქტურული დაჯგუფება განაწილების სერიის სახით შეიძლება გადაიქცეს ნამდვილ სტრუქტურულ დაჯგუფებად, თუ შერჩეული ჯგუფები ხასიათდება არა მხოლოდ სიხშირეებით, არამედ სხვა სტატისტიკური მაჩვენებლებითაც. სადისტრიბუციო სერიების მთავარი მიზანია ფუნქციების ცვალებადობის შესწავლა. განაწილების სერიების თეორია დეტალურად არის შემუშავებული მათემატიკური სტატისტიკით.

განაწილების სერიები იყოფა ატრიბუტული(ატრიბუტული მახასიათებლების მიხედვით დაჯგუფება, მაგალითად, მოსახლეობის დაყოფა სქესის, ეროვნების, ოჯახური მდგომარეობის და ა.შ.) და ვარიაციული(რაოდენობრივი მახასიათებლების მიხედვით დაჯგუფება).

ვარიაციების სერიაარის ჯგუფის ცხრილი, რომელიც შეიცავს ორ სვეტს: ერთეულების დაჯგუფებას ერთი რაოდენობრივი ატრიბუტის მიხედვით და ერთეულების რაოდენობა თითოეულ ჯგუფში. ვარიაციების სერიაში ინტერვალები, როგორც წესი, თანაბარი და დახურულია. ვარიაციების სერია არის რუსეთის მოსახლეობის შემდეგი დაჯგუფება ერთ სულ მოსახლეზე ნაღდი ფულის საშუალო შემოსავლის მიხედვით (ცხრილი 3.10).

ცხრილი 3.10

რუსეთის მოსახლეობის განაწილება ერთ სულ მოსახლეზე საშუალო შემოსავლით 2004-2009 წლებში

მოსახლეობის ჯგუფები საშუალოდ ერთ სულ მოსახლეზე ფულადი შემოსავლის მიხედვით, რუბლი/თვეში

მოსახლეობა ჯგუფში, მთლიანი პროცენტით

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25000.0-ზე მეტი

მთელი მოსახლეობა

ვარიაციური სერიები, თავის მხრივ, იყოფა დისკრეტებად და ინტერვალებად. დისკრეტულივარიაციების სერიები აერთიანებს დისკრეტული მახასიათებლების ვარიანტებს, რომლებიც განსხვავდება ვიწრო საზღვრებში. დისკრეტული ვარიაციული სერიის მაგალითია რუსული ოჯახების განაწილება მათი შვილების რაოდენობის მიხედვით.

ინტერვალივარიაციული სერიები აერთიანებს უწყვეტი მახასიათებლების ან დისკრეტული მახასიათებლების ვარიანტებს, რომლებიც იცვლება ფართო დიაპაზონში. ინტერვალის სერია არის რუსეთის მოსახლეობის განაწილების ვარიაციული სერია ერთ სულ მოსახლეზე ფულადი საშუალო შემოსავლის მიხედვით.

დისკრეტული ვარიაციული სერიები პრაქტიკაში არც თუ ისე ხშირად გამოიყენება. იმავდროულად, მათი შედგენა არ არის რთული, რადგან ჯგუფების შემადგენლობა განისაზღვრება კონკრეტული ვარიანტებით, რომლებსაც რეალურად ფლობენ შესწავლილი დაჯგუფების მახასიათებლები.

ინტერვალური ვარიაციული სერიები უფრო გავრცელებულია. მათი შედგენისას ჩნდება რთული კითხვა როგორც ჯგუფების რაოდენობაზე, ასევე იმ ინტერვალების სიდიდის შესახებ, რომელიც უნდა დადგინდეს.

ამ საკითხის გადაწყვეტის პრინციპები ჩამოყალიბებულია სტატისტიკური დაჯგუფებების აგების მეთოდოლოგიის შესახებ (იხ. პუნქტი 3.3).

ვარიაციების სერიები არის მრავალფეროვანი ინფორმაციის დაშლის ან კომპაქტურ ფორმაში შეკუმშვის საშუალება; ისინი შეიძლება გამოყენებულ იქნას ცვალებადობის ბუნების შესახებ საკმაოდ მკაფიო განსჯის გასაკეთებლად, შესასწავლად ნაკრებში შემავალი ფენომენების ნიშნების განსხვავებების შესასწავლად. მაგრამ ვარიაციული სერიის ყველაზე მნიშვნელოვანი მნიშვნელობა არის ის, რომ მათ საფუძველზე გამოითვლება ვარიაციის სპეციალური განზოგადების მახასიათებლები (იხ. თავი 7).

ვარიაციის სერიის კონცეფცია.სტატისტიკური დაკვირვების მასალების სისტემატიზაციის პირველი ნაბიჯი არის იმ ერთეულების რაოდენობის დათვლა, რომლებსაც აქვთ ამა თუ იმ თვისება. ერთეულების დალაგებით მათი რაოდენობრივი ატრიბუტის აღმავალი ან კლებადი თანმიმდევრობით და ატრიბუტის კონკრეტული მნიშვნელობის მქონე ერთეულების რაოდენობის დათვლით, ვიღებთ ვარიაციის სერიას. ვარიაციების სერია ახასიათებს გარკვეული სტატისტიკური პოპულაციის ერთეულების განაწილებას ზოგიერთი რაოდენობრივი ატრიბუტის მიხედვით.

ვარიაციების სერია შედგება ორი სვეტისგან, მარცხენა სვეტი შეიცავს ცვლადის ატრიბუტის მნიშვნელობებს, რომელსაც ეწოდება ვარიანტები და აღინიშნება (x), ხოლო მარჯვენა სვეტი შეიცავს აბსოლუტურ რიცხვებს, რომლებიც გვიჩვენებს რამდენჯერ ხდება თითოეული ვარიანტი. ამ სვეტის მნიშვნელობებს ეწოდება სიხშირეები და აღინიშნება (f).

სქემატურად, ვარიაციების სერია შეიძლება წარმოდგენილი იყოს ცხრილის 5.1 სახით:

ცხრილი 5.1

ვარიაციის სერიის ტიპი

ვარიანტები (x)

სიხშირეები (f)

მარჯვენა სვეტში ასევე შეიძლება გამოყენებულ იქნას ფარდობითი ინდიკატორები, რომლებიც ახასიათებენ ცალკეული ვარიანტების სიხშირის პროპორციას სიხშირეების მთლიან რაოდენობაში. ამ ფარდობით მაჩვენებლებს სიხშირეებს უწოდებენ და პირობითად აღინიშნება, ე.ი. . ყველა სიხშირის ჯამი ერთის ტოლია. სიხშირეები ასევე შეიძლება გამოხატული იყოს პროცენტულად და მაშინ მათი ჯამი იქნება 100%-ის ტოლი.

ცვლადი ნიშნები შეიძლება იყოს განსხვავებული ხასიათისა. ზოგიერთი ნიშნის ვარიანტები გამოიხატება მთელი რიცხვებით, მაგალითად, ბინაში ოთახების რაოდენობა, გამოქვეყნებული წიგნების რაოდენობა და ა.შ. ამ ნიშნებს უწოდებენ წყვეტილს, ან დისკრეტულს. სხვა მახასიათებლების ვარიანტებს შეუძლიათ მიიღონ ნებისმიერი მნიშვნელობა გარკვეული საზღვრებში, როგორიცაა დაგეგმილი მიზნების შესრულება, ხელფასი და ა.შ. ამ მახასიათებლებს უწოდებენ უწყვეტი.

დისკრეტული ვარიაციის სერია.თუ ვარიაციული სერიის ვარიანტები გამოიხატება როგორც დისკრეტული მნიშვნელობები, მაშინ ასეთ ვარიაციულ სერიას ეწოდება დისკრეტული, მისი გარეგნობა წარმოდგენილია ცხრილში. 5.2:

ცხრილი 5.2

სტუდენტების განაწილება გამოცდაზე მიღებული ქულების მიხედვით

რეიტინგი (x)

სტუდენტების რაოდენობა (ვ)

მთლიანი პროცენტით ()

დისკრეტულ სერიებში განაწილების ბუნება გრაფიკულად არის გამოსახული, როგორც განაწილების პოლიგონი, ნახ.5.1.

ბრინჯი. 5.1. სტუდენტების განაწილება გამოცდაზე მიღებული ქულების მიხედვით.

ინტერვალის ვარიაციის სერია.უწყვეტი მახასიათებლებისთვის, ვარიაციის სერიები აგებულია ინტერვალის სერიებად, ე.ი. მათში ფუნქციების მნიშვნელობები გამოიხატება ინტერვალებით "დან დამდე". ამ შემთხვევაში, მახასიათებლის მინიმალურ მნიშვნელობას ასეთ ინტერვალში ეწოდება ინტერვალის ქვედა ზღვარი, ხოლო მაქსიმალურ მნიშვნელობას - ინტერვალის ზედა ზღვარი.

ინტერვალის ვარიაციული სერიები აგებულია როგორც უწყვეტი ფუნქციებისთვის (დისკრეტული) და მათთვის, ვინც განსხვავდება დიდი დიაპაზონში. ინტერვალის რიგები შეიძლება იყოს თანაბარი და არათანაბარი ინტერვალებით. ეკონომიკურ პრაქტიკაში, უმეტესწილად, გამოიყენება არათანაბარი ინტერვალები, თანდათან იზრდება ან მცირდება. ასეთი საჭიროება ჩნდება განსაკუთრებით იმ შემთხვევებში, როდესაც ნიშნის რყევა ხორციელდება არათანაბრად და დიდ საზღვრებში.

განვიხილოთ ინტერვალის სერიის ტიპი თანაბარი ინტერვალებით, ცხრილი. 5.3:

ცხრილი 5.3

მუშაკთა განაწილება პროდუქციის მიხედვით

გამომავალი, tr. (X)

მუშაკთა რაოდენობა (f)

კუმულაციური სიხშირე (f´)

ინტერვალის განაწილების სერია გრაფიკულად არის გამოსახული ჰისტოგრამის სახით, სურ.5.2.

სურ.5.2. მუშაკთა განაწილება პროდუქციის მიხედვით

დაგროვილი (კუმულაციური) სიხშირე.პრაქტიკაში საჭიროა დისტრიბუციის სერიის გარდაქმნა კუმულაციური რიგები,აგებულია დაგროვილ სიხშირეებზე. ისინი შეიძლება გამოყენებულ იქნას სტრუქტურული საშუალოების დასადგენად, რაც ხელს უწყობს განაწილების სერიის მონაცემების ანალიზს.

კუმულაციური სიხშირეები განისაზღვრება განაწილების სერიის შემდგომი ჯგუფების ამ მაჩვენებლების პირველი ჯგუფის სიხშირეებზე (ან სიხშირეებზე) თანმიმდევრულად დამატებით. კუმულაციები და ოგივები გამოიყენება განაწილების სერიების საილუსტრაციოდ. მათი ასაშენებლად, აბსცისის ღერძზე აღინიშნება დისკრეტული მახასიათებლის მნიშვნელობები (ან ინტერვალების ბოლოები), ხოლო სიხშირეების მზარდი ჯამები (კუმულაცია) აღინიშნება ორდინატთა ღერძზე, ნახ.5.3.

ბრინჯი. 5.3. მუშაკთა კუმულაციური განაწილება განვითარების მიხედვით

თუ სიხშირეების და ვარიანტების სასწორები ერთმანეთს ენაცვლება, ე.ი. ასახავს დაგროვილ სიხშირეებს აბსცისის ღერძზე და ოფციონების მნიშვნელობებს ორდინატთა ღერძზე, შემდეგ მრუდს, რომელიც ახასიათებს სიხშირეების ცვლილებას ჯგუფიდან ჯგუფში, დაერქმევა განაწილების გამოსახულებას, ნახ. 5.4.

ბრინჯი. 5.4. Ogiva მუშათა განაწილება წარმოებისთვის

თანაბარი ინტერვალებით ვარიაციების სერიები წარმოადგენს სტატისტიკური განაწილების სერიების ერთ-ერთ ყველაზე მნიშვნელოვან მოთხოვნას, რაც უზრუნველყოფს მათ შედარებას დროსა და სივრცეში.

განაწილების სიმკვრივე.თუმცა, ამ სერიებში ინდივიდუალური არათანაბარი ინტერვალების სიხშირე პირდაპირ შედარებადი არ არის. ასეთ შემთხვევებში, აუცილებელი შედარებაობის უზრუნველსაყოფად, გამოითვლება განაწილების სიმკვრივე, ე.ი. დაადგინეთ რამდენი ერთეულია თითოეულ ჯგუფში ინტერვალის მნიშვნელობის ერთეულზე.

არათანაბარი ინტერვალებით ვარიაციული სერიის განაწილების გრაფიკის აგებისას, მართკუთხედების სიმაღლე განისაზღვრება არა სიხშირეების, არამედ შესწავლილი ნიშან-თვისების მნიშვნელობების განაწილების სიმკვრივის მაჩვენებლების პროპორციულად შესაბამის ინტერვალებში. .

ვარიაციული სერიის შედგენა და მისი გრაფიკული წარმოდგენა არის პირველი ნაბიჯი საწყისი მონაცემების დამუშავებაში და პირველი ნაბიჯი შესწავლილი პოპულაციის ანალიზისას. ვარიაციის სერიების ანალიზის შემდეგი ნაბიჯი არის ძირითადი განზოგადებული ინდიკატორების განსაზღვრა, რომელსაც უწოდებენ სერიების მახასიათებლებს. ამ მახასიათებლებმა უნდა მისცეს წარმოდგენა ატრიბუტის საშუალო მნიშვნელობის შესახებ მოსახლეობის ერთეულებში.

საშუალო ღირებულება. საშუალო მნიშვნელობა არის შესწავლილი ნიშან-თვისების განზოგადებული მახასიათებელი შესწავლილ პოპულაციაში, რომელიც ასახავს მის ტიპურ დონეს პოპულაციის ერთეულზე კონკრეტული ადგილისა და დროის პირობებში.

საშუალო მნიშვნელობა ყოველთვის დასახელებულია, აქვს იგივე განზომილება, როგორც მოსახლეობის ცალკეული ერთეულების ატრიბუტი.

საშუალო მნიშვნელობების გამოთვლამდე აუცილებელია შესწავლილი პოპულაციის ერთეულების დაჯგუფება, ხარისხობრივად ერთგვაროვანი ჯგუფების გამოყოფით.

მთლიანი მოსახლეობისთვის გამოთვლილ საშუალოს ზოგადი საშუალო ეწოდება, ხოლო თითოეული ჯგუფისთვის - ჯგუფის საშუალო.

არსებობს ორი სახის საშუალო: სიმძლავრე (საშუალო არითმეტიკული, ჰარმონიული საშუალო, გეომეტრიული საშუალო, ფესვი საშუალო კვადრატული); სტრუქტურული (რეჟიმი, მედიანა, კვარტილები, დეცილები).

გაანგარიშებისთვის საშუალო არჩევანი დამოკიდებულია მიზანზე.

სიმძლავრის საშუალო ტიპები და მათი გაანგარიშების მეთოდები.შეგროვებული მასალის სტატისტიკური დამუშავების პრაქტიკაში ჩნდება სხვადასხვა პრობლემები, რომელთა გადაწყვეტისთვის საჭიროა სხვადასხვა საშუალო მაჩვენებელი.

მათემატიკური სტატისტიკა იღებს სხვადასხვა საშუალებებს სიმძლავრის საშუალო ფორმულებიდან:

სად არის საშუალო მნიშვნელობა; x - ინდივიდუალური ოფციები (ფუნქციური მნიშვნელობები); z - ექსპონენტი (z = 1 - საშუალო არითმეტიკული, z = 0 გეომეტრიული საშუალო, z = - 1 - ჰარმონიული საშუალო, z = 2 - საშუალო კვადრატული).

თუმცა, საკითხი, თუ რა ტიპის საშუალო უნდა იყოს გამოყენებული თითოეულ ცალკეულ შემთხვევაში, წყდება შესწავლილი მოსახლეობის კონკრეტული ანალიზით.

სტატისტიკაში ყველაზე გავრცელებული საშუალო ტიპია საშუალო არითმეტიკული. იგი გამოითვლება იმ შემთხვევებში, როდესაც საშუალო ატრიბუტის მოცულობა ყალიბდება, როგორც მისი მნიშვნელობების ჯამი შესწავლილი სტატისტიკური პოპულაციის ცალკეული ერთეულებისთვის.

საწყისი მონაცემების ბუნებიდან გამომდინარე, საშუალო არითმეტიკული განისაზღვრება სხვადასხვა გზით:

თუ მონაცემები არ არის დაჯგუფებული, მაშინ გაანგარიშება ხორციელდება მარტივი საშუალო მნიშვნელობის ფორმულის მიხედვით

საშუალო არითმეტიკულის გამოთვლა დისკრეტულ სერიაშიხდება ფორმულის მიხედვით 3.4.

საშუალო არითმეტიკულის გამოთვლა ინტერვალის სერიაში.ინტერვალის ვარიაციის სერიაში, სადაც ინტერვალის შუა პირობითად აღებულია, როგორც მახასიათებლის მნიშვნელობა თითოეულ ჯგუფში, საშუალო არითმეტიკული შეიძლება განსხვავდებოდეს დაუჯგუფებელი მონაცემებიდან გამოთვლილი საშუალოსგან. უფრო მეტიც, რაც უფრო დიდია ინტერვალი ჯგუფებში, მით უფრო დიდია დაჯგუფებული მონაცემებიდან გამოთვლილი საშუალოს შესაძლო გადახრები დაუჯგუფებელი მონაცემებიდან გამოთვლილი საშუალოდან.

ინტერვალის ვარიაციული სერიის საშუალო გაანგარიშებისას, საჭირო გამოთვლების შესასრულებლად, ინტერვალებიდან მათ შუა წერტილებზე გადადის. და შემდეგ გამოთვალეთ საშუალო მნიშვნელობა საშუალო შეწონილი არითმეტიკული ფორმულით.

საშუალო არითმეტიკული თვისებები.საშუალო არითმეტიკას აქვს გარკვეული თვისებები, რაც საშუალებას გვაძლევს გავამარტივოთ გამოთვლები, განვიხილოთ ისინი.

1. მუდმივი რიცხვების საშუალო არითმეტიკული ტოლია ამ მუდმივი რიცხვის.

თუ x = a. მერე .

2. თუ ყველა ვარიანტის წონა პროპორციულად შეიცვალა, ე.ი. გაიზარდოს ან შემცირდეს იმავე რაოდენობის ჯერ, მაშინ ახალი სერიის საშუალო არითმეტიკული არ შეიცვლება აქედან.

თუ ყველა წონა f მცირდება k-ჯერ, მაშინ .

3. ცალკეული ვარიანტების საშუალოდან დადებითი და უარყოფითი გადახრების ჯამი, გამრავლებული წონებზე, უდრის ნულს, ე.ი.

თუ , მაშინ . აქედან.

თუ ყველა ვარიანტი მცირდება ან გაზრდილია გარკვეული რიცხვით, მაშინ ახალი სერიის საშუალო არითმეტიკული იგივე ოდენობით შემცირდება ან გაიზრდება.

შეამცირეთ ყველა ვარიანტი xზე , ე.ი. x´ = xა.

მერე

საწყისი სერიის არითმეტიკული საშუალო შეიძლება მივიღოთ შემცირებულ საშუალოზე ადრე გამოკლებული ვარიანტების რიცხვის დამატებით. , ე.ი. .

5. თუ ყველა ვარიანტი შემცირებულია ან გაიზარდა ჯერ, მაშინ ახალი სერიის საშუალო არითმეტიკული შემცირდება ან გაიზრდება იგივე ოდენობით, ე.ი. in ერთხელ.

დაე მერე .

აქედან გამომდინარე, ე.ი. ორიგინალური სერიის საშუალოს მისაღებად, ახალი სერიის საშუალო არითმეტიკული (შემცირებული ვარიანტებით) უნდა გაიზარდოს ერთხელ.

საშუალო ჰარმონიული.ჰარმონიული საშუალო არის არითმეტიკული საშუალოს ორმხრივი. იგი გამოიყენება, როდესაც სტატისტიკური ინფორმაცია არ შეიცავს სიხშირეებს პოპულაციის ცალკეული ვარიანტებისთვის, მაგრამ წარმოდგენილია როგორც მათი პროდუქტი (M = xf). ჰარმონიული საშუალო გამოითვლება ფორმულით 3.5

ჰარმონიული საშუალოს პრაქტიკული გამოყენება არის ზოგიერთი ინდექსის, კერძოდ, ფასების ინდექსის გამოთვლა.

გეომეტრიული საშუალო.გეომეტრიული საშუალო გამოყენებისას, ატრიბუტის ინდივიდუალური მნიშვნელობები, როგორც წესი, არის დინამიკის ფარდობითი მნიშვნელობები, რომლებიც აგებულია ჯაჭვის მნიშვნელობების სახით, როგორც თანაფარდობა დინამიკის სერიაში თითოეული დონის წინა დონესთან. . საშუალო ამგვარად ახასიათებს საშუალო ზრდის ტემპს.

გეომეტრიული საშუალო ასევე გამოიყენება ატრიბუტის მაქსიმალური და მინიმალური მნიშვნელობებიდან თანაბარი მანძილის დასადგენად. მაგალითად, სადაზღვევო კომპანია დებს ხელშეკრულებებს ავტოდაზღვევის მომსახურების გაწევაზე. კონკრეტული სადაზღვევო შემთხვევიდან გამომდინარე, სადაზღვევო გადახდა შეიძლება განსხვავდებოდეს 10,000-დან 100,000 დოლარამდე წელიწადში. დაზღვევის საშუალო ანაზღაურება არის აშშ დოლარი.

გეომეტრიული საშუალო არის მნიშვნელობა, რომელიც გამოიყენება თანაფარდობების საშუალოდ ან განაწილების სერიებში, წარმოდგენილი გეომეტრიული პროგრესიის სახით, როდესაც z = 0. ეს საშუალო მოსახერხებელია გამოსაყენებლად, როდესაც ყურადღება ექცევა არა აბსოლუტურ განსხვავებებს, არამედ თანაფარდობებს. ორი ნომერი.

გაანგარიშების ფორმულები შემდეგია

სად არის საშუალო მახასიათებლის ვარიანტები; - ოფციონის პროდუქტი; - ვარიანტების სიხშირე.

გეომეტრიული საშუალო გამოიყენება საშუალო წლიური ზრდის ტემპების გამოსათვლელად.

საშუალო კვადრატი.ფესვის საშუალო კვადრატის ფორმულა გამოიყენება განაწილების სერიაში ნიშან-თვისების ინდივიდუალური მნიშვნელობების რყევის ხარისხის გასაზომად საშუალო არითმეტიკულის გარშემო. ასე რომ, ვარიაციის ინდიკატორების გაანგარიშებისას, საშუალო გამოითვლება არითმეტიკული საშუალოდან თვისების ინდივიდუალური მნიშვნელობების გადახრების კვადრატებიდან.

საშუალო კვადრატული მნიშვნელობა გამოითვლება ფორმულით

ეკონომიკურ კვლევაში, ფესვის საშუალო კვადრატის შეცვლილი ფორმა ფართოდ გამოიყენება ნიშან-თვისების ვარიაციის ინდიკატორების გამოსათვლელად, როგორიცაა ვარიაცია, სტანდარტული გადახრა.

უმრავლესობის წესი.ძალაუფლების კანონის საშუალო მაჩვენებლებს შორის არსებობს შემდეგი კავშირი - რაც უფრო დიდია მაჩვენებელი, მით მეტია საშუალო მნიშვნელობა, ცხრილი 5.4:

ცხრილი 5.4

ურთიერთობა საშუალოებს შორის

z მნიშვნელობა

თანაფარდობა საშუალოებს შორის

ამ კავშირს მაჟორის წესს უწოდებენ.

სტრუქტურული საშუალო.მოსახლეობის სტრუქტურის დასახასიათებლად გამოიყენება სპეციალური ინდიკატორები, რომლებსაც შეიძლება ეწოდოს სტრუქტურული საშუალო. ეს ზომები მოიცავს მოდს, მედიანას, კვარტილებს და დეცილებს.

მოდა.რეჟიმი (Mo) არის მახასიათებლის ყველაზე ხშირად წარმოქმნილი მნიშვნელობა პოპულაციის ერთეულებში. რეჟიმი არის მახასიათებლის მნიშვნელობა, რომელიც შეესაბამება თეორიული განაწილების მრუდის მაქსიმალურ წერტილს.

მოდა ფართოდ გამოიყენება კომერციულ პრაქტიკაში მომხმარებელთა მოთხოვნის შესწავლისას (დიდი მოთხოვნადი ტანსაცმლისა და ფეხსაცმლის ზომის განსაზღვრისას), ფასების რეგისტრაციაში. სულ რამდენიმე მოდიფიკაცია შეიძლება იყოს.

რეჟიმის გაანგარიშება დისკრეტულ სერიაში.დისკრეტულ სერიაში რეჟიმი არის ყველაზე მაღალი სიხშირის ვარიანტი. განვიხილოთ რეჟიმის პოვნა დისკრეტულ სერიაში.

მოდის გაანგარიშება ინტერვალის სერიაში.ინტერვალის ვარიაციის სერიაში მოდალური ინტერვალის ცენტრალურ ვარიანტად მიჩნეულია დაახლოებით რეჟიმი, ე.ი. ინტერვალი, რომელსაც აქვს ყველაზე მაღალი სიხშირე (სიხშირე). ინტერვალის ფარგლებში აუცილებელია ვიპოვოთ ატრიბუტის მნიშვნელობა, რომელიც არის რეჟიმი. ინტერვალის სერიებისთვის რეჟიმი განისაზღვრება ფორმულით

სად არის მოდალური ინტერვალის ქვედა ზღვარი; არის მოდალური ინტერვალის მნიშვნელობა; არის მოდალური ინტერვალის შესაბამისი სიხშირე; არის სიხშირე, რომელიც წინ უსწრებს მოდალურ ინტერვალს; არის მოდალის შემდგომი ინტერვალის სიხშირე.

მედიანური.მედიანა () არის მახასიათებლის მნიშვნელობა რანჟირებული სერიის შუა ერთეულში. რანჟირებული სერია არის სერია, რომელშიც დამახასიათებელი მნიშვნელობები იწერება აღმავალი ან კლებადობით. ან მედიანა არის მნიშვნელობა, რომელიც ყოფს მოწესრიგებული ვარიაციული სერიის რაოდენობას ორ თანაბარ ნაწილად: ერთ ნაწილს აქვს ცვლადი მახასიათებლის მნიშვნელობა, რომელიც საშუალო ვარიანტზე ნაკლებია, ხოლო მეორეს დიდი.

მედიანას საპოვნელად ჯერ მისი სერიული ნომერი განისაზღვრება. ამისათვის, კენტი რაოდენობის ერთეულებით, ერთი ემატება ყველა სიხშირის ჯამს და ყველაფერი იყოფა ორზე. ერთეულების ლუწი რაოდენობით, მედიანა გვხვდება, როგორც ერთეულის ატრიბუტის მნიშვნელობა, რომლის სერიული ნომერი განისაზღვრება სიხშირეების ჯამით გაყოფილი ორზე. მედიანის რიგითი რიცხვის ცოდნა, დაგროვილი სიხშირეებიდან ადვილია მისი მნიშვნელობის პოვნა.

მედიანის გაანგარიშება დისკრეტულ სერიაში.შერჩევის კვლევის მიხედვით მიღებული იქნა მონაცემები ოჯახების განაწილების შესახებ ბავშვების რაოდენობის მიხედვით, ცხრილი. 5.5. მედიანას დასადგენად ჯერ დაადგინეთ მისი რიგითი რიცხვი

ამ ოჯახებში ბავშვების რაოდენობა არის 2, შესაბამისად, = 2. ამრიგად, ოჯახების 50%-ში ბავშვების რაოდენობა არ აღემატება 2-ს.

არის კუმულაციური სიხშირე, რომელიც წინ უსწრებს მედიანურ ინტერვალს;

ერთის მხრივ, ეს ძალიან დადებითი თვისებაა. ამ შემთხვევაში მხედველობაში მიიღება ყველა მიზეზის ეფექტი, რომელიც გავლენას ახდენს შესწავლილი მოსახლეობის ყველა ერთეულზე. მეორეს მხრივ, თუნდაც ერთმა დაკვირვებამ, რომელიც შემთხვევით იქნა შეტანილი საწყის მონაცემებში, შეიძლება მნიშვნელოვნად დაამახინჯოს განსახილველ პოპულაციაში შესწავლილი ნიშან-თვისების განვითარების დონის იდეა (განსაკუთრებით მოკლე სერიებში).

მეოთხედები და დეცილები.ვარიაციულ სერიებში მედიანის პოვნის ანალოგიით, შეგიძლიათ იპოვოთ მახასიათებლის მნიშვნელობა ნებისმიერ რანჟირებულ სერიის ერთეულში თანმიმდევრობით. ასე რომ, კერძოდ, შეგიძლიათ იპოვოთ მახასიათებლის მნიშვნელობა ერთეულებისთვის, რომლებიც ყოფენ სერიას 4 თანაბარ ნაწილად, 10-ად და ა.შ.

მეოთხედი.ვარიანტებს, რომლებიც რიგებს ყოფს ოთხ თანაბარ ნაწილად, ეწოდება კვარტილები.

ამავდროულად, განასხვავებენ შემდეგს: ქვედა (ან პირველი) მეოთხედი (Q1) - რანჟირებული სერიის ერთეულის მახასიათებლის მნიშვნელობა, რომელიც ყოფს პოპულაციას ¼-დან ¾-მდე და ზედა (ან მესამე) თანაფარდობით. ) მეოთხედი (Q3) - რანჟირებული სერიის ერთეულის მახასიათებლის მნიშვნელობა, რომელიც ყოფს პოპულაციას ¾-დან ¼-მდე თანაფარდობით.

- მეოთხედის ინტერვალების სიხშირე (ქვედა და ზედა)

Q1 და Q3 შემცველი ინტერვალები განისაზღვრება დაგროვილი სიხშირეებიდან (ან სიხშირეებიდან).

დეცილები.კვარტილების გარდა, გამოითვლება დეცილები - ვარიანტები, რომლებიც ყოფს რანჟირებულ სერიას 10 თანაბარ ნაწილად.

ისინი აღინიშნება D-ით, პირველი დეცილი D1 ყოფს სერიებს 1/10 და 9/10 თანაფარდობით, მეორე D2 - 2/10 და 8/10 და ა.შ. ისინი გამოითვლება ისე, როგორც მედიანა და კვარტილები.

როგორც მედიანა, ასევე მეოთხედები და დეცილები მიეკუთვნება ეგრეთ წოდებულ რიგით სტატისტიკას, რომელიც გაგებულია, როგორც ვარიანტი, რომელიც იკავებს გარკვეულ რიგით ადგილს რანჟირებულ სერიაში.

აშენდა რიგები რაოდენობით, უწოდებენ ვარიაციული.

სადისტრიბუციო სერია შედგება პარამეტრები(მახასიათებელი ღირებულებები) და სიხშირეები(ჯგუფების რაოდენობა). ფარდობითი მნიშვნელობებით გამოხატული სიხშირეები (წილები, პროცენტები) ეწოდება სიხშირეები. ყველა სიხშირის ჯამს უწოდებენ განაწილების სერიის მოცულობას.

ტიპის მიხედვით, განაწილების სერიები იყოფა დისკრეტული(აშენებულია ფუნქციის უწყვეტ მნიშვნელობებზე) და ინტერვალი(აშენებულია უწყვეტი მახასიათებლების მნიშვნელობებზე).

ვარიაციების სერიაწარმოადგენს ორ სვეტს (ან მწკრივს); რომელთაგან ერთ-ერთი იძლევა ცვლადის ატრიბუტის ინდივიდუალურ მნიშვნელობებს, რომელსაც ეწოდება ვარიანტები და აღინიშნება X-ით; ხოლო მეორეში - აბსოლუტური რიცხვები, რომლებიც გვიჩვენებს რამდენჯერ (რამდენჯერ) ხდება თითოეული ვარიანტი. მეორე სვეტის ინდიკატორებს სიხშირეებს უწოდებენ და პირობითად აღინიშნება f-ით. კიდევ ერთხელ აღვნიშნავთ, რომ მეორე სვეტში ასევე შეიძლება გამოყენებულ იქნას ფარდობითი ინდიკატორები, რომლებიც ახასიათებენ ცალკეული ვარიანტების სიხშირის წილს სიხშირეების მთლიან რაოდენობაში. ამ ფარდობით მაჩვენებლებს სიხშირეებს უწოდებენ და პირობითად აღინიშნება ω-ით ყველა სიხშირის ჯამი ამ შემთხვევაში ერთის ტოლია. თუმცა, სიხშირეები ასევე შეიძლება გამოხატული იყოს პროცენტულად და შემდეგ ყველა სიხშირის ჯამი იძლევა 100%.

თუ ვარიაციული სერიების ვარიანტები გამოიხატება დისკრეტული მნიშვნელობებით, მაშინ ასეთ ვარიაციის სერიას უწოდებენ დისკრეტული.

უწყვეტი მახასიათებლებისთვის, ვარიაციის სერიები აგებულია როგორც ინტერვალი, ანუ მათში ატრიბუტის მნიშვნელობები გამოიხატება "...-დან ...". ამ შემთხვევაში, ასეთ ინტერვალში ატრიბუტის მინიმალურ მნიშვნელობებს უწოდებენ ინტერვალის ქვედა ზღვარს, ხოლო მაქსიმუმს - ზედა ზღვარს.

ინტერვალის ვარიაციული სერიები ასევე აგებულია დისკრეტული მახასიათებლებისთვის, რომლებიც განსხვავდება ფართო დიაპაზონში. ინტერვალის სერია შეიძლება იყოს თანაბარიდა არათანაბარიინტერვალებით.

განვიხილოთ, როგორ განისაზღვრება თანაბარი ინტერვალების მნიშვნელობა. მოდით შემოგთავაზოთ შემდეგი აღნიშვნა:

მე- ინტერვალის მნიშვნელობა;

- ატრიბუტის მაქსიმალური მნიშვნელობა მოსახლეობის ერთეულებისთვის;

- ატრიბუტის მინიმალური მნიშვნელობა მოსახლეობის ერთეულებისთვის;

n-გამოყოფილი ჯგუფების რაოდენობა.

თუ n ცნობილია.

თუ გამოყოფილი ჯგუფების რაოდენობის წინასწარ განსაზღვრა რთულია, მაშინ 1926 წელს სტერჯესის მიერ შემოთავაზებული ფორმულა შეიძლება იყოს რეკომენდაცია, რომ გამოვთვალოთ ინტერვალის ოპტიმალური ზომა პოპულაციის საკმარისი რაოდენობით:

n = 1+ 3.322 log N, სადაც N არის ერთეულების რაოდენობა პოპულაციაში.

არათანაბარი ინტერვალების მნიშვნელობა განისაზღვრება თითოეულ ინდივიდუალურ შემთხვევაში, კვლევის ობიექტის მახასიათებლების გათვალისწინებით.

ნიმუშის სტატისტიკური განაწილებაგამოიძახეთ ოფციების სია და მათი შესაბამისი სიხშირეები (ან შედარებითი სიხშირეები).

ნიმუშის სტატისტიკური განაწილება შეიძლება განისაზღვროს ცხრილის სახით, რომლის პირველ სვეტში არის ვარიანტები, ხოლო მეორეში - ამ ვარიანტების შესაბამისი სიხშირეები. ნი, ან შედარებითი სიხშირეები პი .

ნიმუშის სტატისტიკური განაწილება

ინტერვალის სერიებს უწოდებენ ვარიაციულ სერიებს, რომლებშიც მათი ფორმირების ძირითადი მახასიათებლების მნიშვნელობები გამოხატულია გარკვეულ საზღვრებში (ინტერვალებში). სიხშირეები ამ შემთხვევაში არ ეხება ატრიბუტის ცალკეულ მნიშვნელობებს, არამედ მთელ ინტერვალს.

ინტერვალური განაწილების სერიები აგებულია უწყვეტი რაოდენობრივი მახასიათებლების მიხედვით, ასევე დისკრეტული მახასიათებლების მიხედვით, რომლებიც იცვლება მნიშვნელოვანი დიაპაზონში.

ინტერვალის სერია შეიძლება წარმოდგენილი იყოს ნიმუშის სტატისტიკური განაწილებით, ინტერვალებისა და მათი შესაბამისი სიხშირეების მითითებით. ამ შემთხვევაში, ამ ინტერვალში მოხვედრილი ვარიანტის სიხშირეების ჯამი მიიღება როგორც ინტერვალის სიხშირე.

რაოდენობრივი უწყვეტი მახასიათებლების მიხედვით დაჯგუფებისას მნიშვნელოვანია ინტერვალის ზომის განსაზღვრა.

სინჯის საშუალო და ნიმუშის დისპერსიის გარდა, ასევე გამოიყენება ვარიაციის სერიის სხვა მახასიათებლები.

მოდადაასახელეთ ვარიანტი, რომელსაც აქვს ყველაზე მაღალი სიხშირე.

ამ თავის დაუფლების შედეგად სტუდენტმა უნდა: ვიცი

  • ვარიაციული ინდიკატორები და მათი ურთიერთობა;
  • მახასიათებლების განაწილების ძირითადი კანონები;
  • თანხმობის კრიტერიუმების არსი; შეძლებს
  • ცვალებადობისა და მორგების მაჩვენებლების გამოთვლა;
  • განაწილების მახასიათებლების განსაზღვრა;
  • სტატისტიკური განაწილების სერიების ძირითადი რიცხვითი მახასიათებლების შეფასება;

საკუთარი

  • განაწილების სერიების სტატისტიკური ანალიზის მეთოდები;
  • დისპერსიული ანალიზის საფუძვლები;
  • სტატისტიკური განაწილების სერიების შემოწმების მეთოდები განაწილების ძირითად კანონებთან შესაბამისობაში.

ვარიაციის ინდიკატორები

სხვადასხვა სტატისტიკური პოპულაციის თავისებურებების სტატისტიკური შესწავლისას დიდი ინტერესია პოპულაციის ცალკეული სტატისტიკური ერთეულების მახასიათებლის ცვალებადობის, ასევე ამ მახასიათებლის მიხედვით ერთეულების განაწილების ხასიათის შესწავლა. Ვარიაცია -ეს არის განსხვავებები თვისების ინდივიდუალურ მნიშვნელობებში შესწავლილი პოპულაციის ერთეულებს შორის. ვარიაციის შესწავლას დიდი პრაქტიკული მნიშვნელობა აქვს. ცვალებადობის ხარისხით შეიძლება ვიმსჯელოთ ნიშან-თვისების ცვალებადობის საზღვრებზე, ამ მახასიათებლის პოპულაციის ჰომოგენურობაზე, საშუალოს ტიპურობაზე, ვარიაციის განმსაზღვრელ ფაქტორთა ურთიერთობაზე. ვარიაციის ინდიკატორები გამოიყენება სტატისტიკური პოპულაციების დასახასიათებლად და დასალაგებლად.

სტატისტიკური განაწილების სერიების სახით შედგენილი სტატისტიკური დაკვირვების მასალების შეჯამებისა და დაჯგუფების შედეგები წარმოადგენს შესწავლილი პოპულაციის ერთეულების მოწესრიგებულ განაწილებას ჯგუფებად დაჯგუფების (ცვლადი) ატრიბუტის მიხედვით. თუ დაჯგუფების საფუძვლად ხარისხობრივი მახასიათებელია მიღებული, მაშინ ასეთი განაწილების სერია ეწოდება ატრიბუტული(განაწილება პროფესიის, სქესის, ფერის და ა.შ.). თუ განაწილების სერია აგებულია რაოდენობრივ საფუძველზე, მაშინ ასეთ სერიას უწოდებენ ვარიაციული(განაწილება სიმაღლის, წონის, ხელფასის და ა.შ.). ვარიაციის სერიის აგება ნიშნავს მოსახლეობის ერთეულების რაოდენობრივი განაწილების დალაგებას დამახასიათებელი მნიშვნელობების მიხედვით, ამ მნიშვნელობებით მოსახლეობის ერთეულების რაოდენობის დათვლას (სიხშირე), შედეგების დალაგებას ცხრილში.

ვარიანტის სიხშირის ნაცვლად, შესაძლებელია გამოვიყენოთ მისი თანაფარდობა დაკვირვებების მთლიან მოცულობასთან, რომელსაც სიხშირე (ფარდობითი სიხშირე) ეწოდება.

არსებობს ვარიაციის სერიების ორი ტიპი: დისკრეტული და ინტერვალი. დისკრეტული სერია- ეს არის ისეთი ვარიაციული სერია, რომლის აგება ემყარება უწყვეტი ცვლილების მქონე ნიშნებს (დისკრეტული ნიშნები). ეს უკანასკნელი მოიცავს საწარმოში დასაქმებულთა რაოდენობას, სახელფასო კატეგორიას, ოჯახში ბავშვების რაოდენობას და ა.შ. დისკრეტული ვარიაციული სერია არის ცხრილი, რომელიც შედგება ორი სვეტისგან. პირველ სვეტში მითითებულია ატრიბუტის სპეციფიკური მნიშვნელობა, ხოლო მეორე - პოპულაციის ერთეულების რაოდენობა ატრიბუტის კონკრეტული მნიშვნელობით. თუ ნიშანს აქვს მუდმივი ცვლილება (შემოსავლის ოდენობა, სამუშაო გამოცდილება, საწარმოს ძირითადი საშუალებების ღირებულება და ა. ინტერვალის ვარიაციის სერია.ინტერვალის ვარიაციის სერიის აგებისას ცხრილს ასევე აქვს ორი სვეტი. პირველი მიუთითებს მახასიათებლის მნიშვნელობას ინტერვალში "-დან -მდე" (ოფციები), მეორე - ინტერვალში შემავალი ერთეულების რაოდენობას (სიხშირე). სიხშირე (განმეორების სიხშირე) - ატრიბუტის მნიშვნელობების კონკრეტული ვარიანტის გამეორებების რაოდენობა. ინტერვალები შეიძლება იყოს დახურული და ღია. დახურული ინტერვალები შეზღუდულია ორივე მხრიდან, ე.ი. აქვს საზღვარი ქვედა ("დან") და ზედა ("დან"). ღია ინტერვალებს აქვს ერთი საზღვარი: ზედა ან ქვედა. თუ ოფციები განლაგებულია აღმავალი ან კლებადი თანმიმდევრობით, მაშინ რიგები გამოიძახება რეიტინგული.

ვარიაციული სერიებისთვის, არსებობს ორი ტიპის სიხშირეზე რეაგირების ვარიანტი: კუმულაციური სიხშირე და კუმულაციური სიხშირე. კუმულაციური სიხშირე გვიჩვენებს რამდენ დაკვირვებას აიღო მახასიათებლის მნიშვნელობა მითითებულ მნიშვნელობაზე ნაკლები მნიშვნელობებით. კუმულაციური სიხშირე განისაზღვრება მოცემული ჯგუფისთვის დამახასიათებელი სიხშირის მნიშვნელობების შეჯამებით წინა ჯგუფის ყველა სიხშირეზე. დაგროვილი სიხშირე ახასიათებს დაკვირვების ერთეულების პროპორციას, რომლებშიც მახასიათებლის მნიშვნელობები არ აღემატება დღის ჯგუფის ზედა ზღვარს. ამრიგად, დაგროვილი სიხშირე აჩვენებს ვარიანტის სპეციფიკურ წონას აგრეგატში, რომლის მნიშვნელობა არ აღემატება მოცემულს. სიხშირე, სიხშირე, აბსოლუტური და ფარდობითი სიმკვრივეები, კუმულაციური სიხშირე და სიხშირე არის ვარიანტის სიდიდის მახასიათებლები.

პოპულაციის სტატისტიკური ერთეულების ნიშნის ცვალებადობა, ისევე როგორც განაწილების ბუნება, შესწავლილია ვარიაციის სერიის ინდიკატორებისა და მახასიათებლების გამოყენებით, რომელიც მოიცავს სერიის საშუალო დონეს, საშუალო ხაზოვან გადახრას, სტანდარტულ გადახრას, დისპერსიას. , რხევის კოეფიციენტები, ვარიაცია, ასიმეტრია, ქურთოზი და ა.შ.

სადისტრიბუციო ცენტრის დასახასიათებლად გამოიყენება საშუალო მნიშვნელობები. საშუალო არის განზოგადებული სტატისტიკური მახასიათებელი, რომელშიც რაოდენობრივად არის განსაზღვრული ნიშან-თვისების ტიპიური დონე, რომელსაც ფლობენ შესწავლილი პოპულაციის წევრები. თუმცა, შეიძლება იყოს შემთხვევები, როდესაც არითმეტიკული საშუალებები ემთხვევა განაწილების განსხვავებულ ბუნებას, ამიტომ, როგორც ვარიაციული სერიის სტატისტიკური მახასიათებლები, გამოითვლება ეგრეთ წოდებული სტრუქტურული საშუალოები - რეჟიმი, მედიანა, აგრეთვე კვანტილები, რომლებიც ყოფენ განაწილებას. სერიები თანაბარ ნაწილებად (კვარტილები, დეცილები, პროცენტები და ა.შ.).

მოდა -ეს არის ფუნქციის მნიშვნელობა, რომელიც უფრო ხშირად გვხვდება განაწილების სერიაში, ვიდრე მისი სხვა მნიშვნელობები. დისკრეტული სერიებისთვის, ეს არის ყველაზე მაღალი სიხშირის ვარიანტი. ინტერვალის ვარიაციულ სერიებში, რეჟიმის დასადგენად, პირველ რიგში საჭიროა განისაზღვროს ის ინტერვალი, რომელშიც ის მდებარეობს, ე.წ. მოდალური ინტერვალი. თანაბარი ინტერვალებით ვარიაციულ სერიაში მოდალური ინტერვალი განისაზღვრება უმაღლესი სიხშირით, სერიებში არათანაბარი ინტერვალებით - მაგრამ უმაღლესი განაწილების სიმკვრივით. შემდეგ, თანაბარი ინტერვალებით რიგებში რეჟიმის დასადგენად, გამოიყენეთ ფორმულა

სადაც Mo არის მოდის ღირებულება; x Mo - მოდალური ინტერვალის ქვედა ზღვარი; თ-მოდალური ინტერვალის სიგანე; / მო - მოდალური ინტერვალის სიხშირე; / Mo j - პრემოდალური ინტერვალის სიხშირე; / Mo+1 არის პოსტმოდალური ინტერვალის სიხშირე და ამ გამოთვლის ფორმულაში არათანაბარი ინტერვალების მქონე სერიებისთვის, სიხშირეების ნაცვლად / Mo, / Mo, / Mo გამოყენებული უნდა იყოს განაწილების სიმკვრივეები. გონება 0 _| , გონება 0> UMO+"

თუ არსებობს ერთი რეჟიმი, მაშინ შემთხვევითი ცვლადის ალბათობის განაწილებას ეწოდება უნიმოდალური; თუ არსებობს ერთზე მეტი რეჟიმი, მას ეწოდება მულტიმოდალური (პოლიმოდალური, მულტიმოდალური), ორი რეჟიმის შემთხვევაში - ბიმოდალური. როგორც წესი, მულტიმოდალობა მიუთითებს იმაზე, რომ შესასწავლი განაწილება არ შეესაბამება ნორმალურ განაწილების კანონს. ერთგვაროვანი პოპულაციები, როგორც წესი, ხასიათდება უნიმოდალური განაწილებით. Multivertex ასევე მიუთითებს შესწავლილი პოპულაციის ჰეტეროგენულობაზე. ორი ან მეტი წვერის გამოჩენა აუცილებელს ხდის მონაცემების გადაჯგუფებას უფრო ჰომოგენური ჯგუფების იზოლირებისთვის.

ინტერვალის ვარიაციის სერიაში, რეჟიმი შეიძლება განისაზღვროს გრაფიკულად ჰისტოგრამის გამოყენებით. ამისათვის, ორი გადამკვეთი ხაზი იხაზება ჰისტოგრამის უმაღლესი სვეტის ზედა წერტილებიდან ორი მიმდებარე სვეტის ზედა წერტილებამდე. შემდეგ, მათი გადაკვეთის ადგილიდან, პერპენდიკულარი ქვეითდება აბსცისის ღერძზე. პერპენდიკულარულის შესაბამისი აბსცისაზე ფუნქციის მნიშვნელობა არის რეჟიმი. ხშირ შემთხვევაში, პოპულაციის განზოგადებულ ინდიკატორად დახასიათებისას უპირატესობა ენიჭება რეჟიმს და არა საშუალო არითმეტიკულს.

მედიანა -ეს არის მახასიათებლის ცენტრალური მნიშვნელობა; მას ფლობს რანჟირებული განაწილების სერიის ცენტრალური წევრი. დისკრეტულ სერიებში, მედიანის მნიშვნელობის საპოვნელად, ჯერ დგინდება მისი სერიული ნომერი. ამისათვის, კენტი რაოდენობის ერთეულებით, ერთი ემატება ყველა სიხშირის ჯამს, რიცხვი იყოფა ორზე. თუ არის 1-ების ლუწი რიცხვი, სერიაში იქნება 2 მედიანა 1, ასე რომ, ამ შემთხვევაში მედიანა განისაზღვრება, როგორც 2 მედიანური 1-ის მნიშვნელობების საშუალო. ამრიგად, დისკრეტული ვარიაციის სერიის მედიანა არის მნიშვნელობა, რომელიც ყოფს სერიას ორ ნაწილად, რომლებიც შეიცავს იგივე რაოდენობის ვარიანტებს.

ინტერვალის სერიაში, მედიანის რიგითი რიცხვის დადგენის შემდეგ, მედიანური ინტერვალი იპოვება დაგროვილი სიხშირეებით (სიხშირეებით), შემდეგ კი მედიანის გამოთვლის ფორმულის გამოყენებით განისაზღვრება თავად მედიანის მნიშვნელობა:

სადაც მე არის მედიანის მნიშვნელობა; x მე -მედიანური ინტერვალის ქვედა ზღვარი; თ-შუალედური ინტერვალის სიგანე; - განაწილების სერიის სიხშირეების ჯამი; /D - პრემედიანი ინტერვალის დაგროვილი სიხშირე; / მე - მედიანური ინტერვალის სიხშირე.

მედიანა შეგიძლიათ იხილოთ გრაფიკულად კუმულაციის გამოყენებით. ამისათვის კუმულაციის დაგროვილი სიხშირეების (სიხშირეების) შკალაზე, მედიანის რიგითი რიცხვის შესაბამისი წერტილიდან, აბსცისის ღერძის პარალელურად იხაზება სწორი ხაზი, სანამ არ გადაიკვეთება კუმულაციასთან. გარდა ამისა, მითითებული სწორი ხაზის კუმულატთან გადაკვეთის ადგილიდან, პერპენდიკულარი ეშვება აბსცისის ღერძზე. ნიშან-თვისების მნიშვნელობა x ღერძზე, რომელიც შეესაბამება შედგენილ ორდინატს (პერპენდიკულარულს) არის მედიანა.

მედიანა ხასიათდება შემდეგი თვისებებით.

  • 1. ეს არ არის დამოკიდებული იმ ატრიბუტების მნიშვნელობებზე, რომლებიც მდებარეობს მის ორივე მხარეს.
  • 2. მას აქვს მინიმალურობის თვისება, რაც ნიშნავს, რომ ატრიბუტის მნიშვნელობების აბსოლუტური გადახრების ჯამი მედიანადან არის მინიმალური მნიშვნელობა ატრიბუტის მნიშვნელობების სხვა მნიშვნელობიდან გადახრასთან შედარებით.
  • 3. ორი განაწილების ცნობილ მედიანასთან გაერთიანებისას შეუძლებელია ახალი განაწილების მედიანური მნიშვნელობის წინასწარ წინასწარ განსაზღვრა.

მედიანის ეს თვისებები ფართოდ გამოიყენება საჯარო მომსახურების პუნქტების ადგილმდებარეობის დიზაინის შესაქმნელად - სკოლები, კლინიკები, ბენზინგასამართი სადგურები, წყლის ტუმბოები და ა.შ. მაგალითად, თუ ქალაქის გარკვეულ კვარტალში იგეგმება პოლიკლინიკის აშენება, მაშინ უფრო მიზანშეწონილია მისი განთავსება კვარტალის ისეთ წერტილში, რომელიც ორად ყოფს არა კვარტალის სიგრძეს, არამედ მცხოვრებთა რაოდენობას.

რეჟიმის, მედიანისა და საშუალო არითმეტიკული თანაფარდობა მიუთითებს მახასიათებლის აგრეგატში განაწილების ბუნებაზე, საშუალებას გაძლევთ შეაფასოთ განაწილების სიმეტრია. Თუ x მე მაშინ არის სერიის მარჯვენა ასიმეტრია. ნორმალური განაწილებით X -მე - მო.

კ. პირსონმა, სხვადასხვა ტიპის მრუდების გასწორების საფუძველზე, დაადგინა, რომ ზომიერად ასიმეტრიული განაწილებისთვის, არითმეტიკული საშუალოს, მედიანასა და რეჟიმს შორის მართებულია შემდეგი სავარაუდო მიმართებები:

სადაც მე არის მედიანის მნიშვნელობა; Mo - მოდის ღირებულება; x არითმი - საშუალო არითმეტიკული მნიშვნელობა.

თუ საჭიროა ვარიაციის სერიის სტრუქტურის უფრო დეტალურად შესწავლა, მაშინ გამოითვლება დამახასიათებელი მნიშვნელობები, მედიანის მსგავსი. ასეთი მახასიათებლების მნიშვნელობები ყოფს ყველა განაწილების ერთეულს თანაბარ რიცხვებად, მათ უწოდებენ კვანტილებს ან გრადიენტებს. კვანტილები იყოფა კვარტლებად, დეცილებად, პროცენტულებად და ა.შ.

მეოთხედი მოსახლეობას ყოფს ოთხ თანაბარ ნაწილად. პირველი მეოთხედი გამოითვლება მედიანას მსგავსად, პირველი კვარტლის გამოთვლის ფორმულის გამოყენებით, წინასწარ განსაზღვრული პირველი კვარტალური ინტერვალით:

სადაც Qi არის პირველი მეოთხედის მნიშვნელობა; xQ ^ -პირველი მეოთხედის ინტერვალის ქვედა ზღვარი; - პირველი კვარტალური ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები;

დაგროვილი სიხშირე პირველი მეოთხედის ინტერვალის წინა ინტერვალში; Jq ( - პირველი მეოთხედის ინტერვალის სიხშირე.

პირველი მეოთხედი აჩვენებს, რომ მოსახლეობის ერთეულების 25% ნაკლებია მის ღირებულებაზე, ხოლო 75% მეტია. მეორე მეოთხედი უდრის მედიანას, ე.ი. Q2 =მე.

ანალოგიით, მესამე კვარტალი გამოითვლება, მანამდე იპოვა მესამე კვარტალური ინტერვალი:

სად არის მესამე მეოთხედის ინტერვალის ქვედა ზღვარი; - მესამე მეოთხედის ინტერვალის სიგანე; /, - ინტერვალის სერიის სიხშირეები; /X"-დაგროვილი სიხშირე წინა ინტერვალში

მესამე მეოთხედი ინტერვალი; Jq - მესამე მეოთხედის ინტერვალის სიხშირე.

მესამე მეოთხედი აჩვენებს, რომ მოსახლეობის 75% მის ღირებულებაზე ნაკლებია, ხოლო 25% მეტია.

განსხვავება მესამე და პირველ მეოთხედებს შორის არის ინტერკვარტილური დიაპაზონი:

სადაც Aq არის ინტერკვატური ინტერვალის მნიშვნელობა; Q 3 -მესამე მეოთხედის ღირებულება; Q, - პირველი მეოთხედის მნიშვნელობა.

დეცილები მოსახლეობას ყოფენ 10 თანაბარ ნაწილად. დეცილი არის მახასიათებლის მნიშვნელობა განაწილების სერიაში, რომელიც შეესაბამება მოსახლეობის მეათედს. კვარტილების ანალოგიით, პირველი დეცილი აჩვენებს, რომ მოსახლეობის ერთეულების 10% მის ღირებულებაზე ნაკლებია, ხოლო 90% მეტია, ხოლო მეცხრე დეცილი ცხადყოფს, რომ მოსახლეობის ერთეულების 90% მის ღირებულებაზე ნაკლებია, ხოლო 10% არის. მეტი. მეცხრე და პირველი დეცილების შეფარდება, ე.ი. დეცილური კოეფიციენტი, რომელიც ფართოდ გამოიყენება შემოსავლების დიფერენციაციის შესწავლისას ყველაზე მდიდარი მოსახლეობის 10% და ყველაზე ნაკლებად მდიდარი მოსახლეობის 10% შემოსავლის დონის თანაფარდობის გასაზომად. პროცენტული მაჩვენებელი ყოფს რეიტინგულ მოსახლეობას 100 თანაბარ ნაწილად. პროცენტების გამოთვლა, მნიშვნელობა და გამოყენება დეცილების მსგავსია.

კვარტილები, დეცილები და სხვა სტრუქტურული მახასიათებლები შეიძლება განისაზღვროს გრაფიკულად მედიანასთან ანალოგიით კუმულაციის გამოყენებით.

ვარიაციის ზომის გასაზომად გამოიყენება შემდეგი ინდიკატორები: ვარიაციის დიაპაზონი, საშუალო წრფივი გადახრა, სტანდარტული გადახრა და ვარიაცია. ვარიაციის დიაპაზონის სიდიდე მთლიანად დამოკიდებულია სერიის უკიდურესი წევრების განაწილების შემთხვევითობაზე. ეს მაჩვენებელი საინტერესოა იმ შემთხვევებში, როდესაც მნიშვნელოვანია იცოდეთ რა არის ატრიბუტის მნიშვნელობებში რყევების ამპლიტუდა:

სადაც R-ვარიაციის დიაპაზონის მნიშვნელობა; x max - მახასიათებლის მაქსიმალური მნიშვნელობა; x tt -ატრიბუტის მინიმალური მნიშვნელობა.

ვარიაციის დიაპაზონის გამოთვლისას სერიების წევრების დიდი უმრავლესობის მნიშვნელობა არ არის გათვალისწინებული, ხოლო ვარიაცია ასოცირდება სერიის წევრის თითოეულ მნიშვნელობასთან. ეს ნაკლოვანება მოკლებულია ინდიკატორებს, რომლებიც მიიღება საშუალოდ მიღებული ცალკეული ნიშან-თვისებების მნიშვნელობების გადახრებიდან მათი საშუალო მნიშვნელობიდან: საშუალო წრფივი გადახრა და სტანდარტული გადახრა. არსებობს პირდაპირი კავშირი საშუალოდან ცალკეულ გადახრებსა და კონკრეტული მახასიათებლის რყევებს შორის. რაც უფრო ძლიერია არასტაბილურობა, მით მეტია გადახრების აბსოლუტური ზომა საშუალოდან.

საშუალო წრფივი გადახრა არის ინდივიდუალური ვარიანტების გადახრების აბსოლუტური მნიშვნელობების საშუალო არითმეტიკული საშუალო მნიშვნელობიდან.

საშუალო ხაზოვანი გადახრა დაუჯგუფებელი მონაცემებისთვის

სადაც / pr - საშუალო წრფივი გადახრის მნიშვნელობა; x, - - მახასიათებლის მნიშვნელობა; X - P -მოსახლეობის ერთეულების რაოდენობა.

დაჯგუფებული სერიების საშუალო წრფივი გადახრა

სადაც / vz - საშუალო წრფივი გადახრის მნიშვნელობა; x, - მახასიათებლის მნიშვნელობა; X -თვისების საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; / - მოსახლეობის ერთეულების რაოდენობა ცალკეულ ჯგუფში.

გადახრის ნიშნები ამ შემთხვევაში იგნორირებულია, წინააღმდეგ შემთხვევაში ყველა გადახრის ჯამი იქნება ნულის ტოლი. საშუალო წრფივი გადახრა, რომელიც დამოკიდებულია გაანალიზებული მონაცემების დაჯგუფებაზე, გამოითვლება სხვადასხვა ფორმულების გამოყენებით: დაჯგუფებული და არაჯგუფური მონაცემებისთვის. საშუალო წრფივი გადახრა, თავისი პირობითობის გამო, ცვალებადობის სხვა მაჩვენებლებისგან დამოუკიდებლად, პრაქტიკაში შედარებით იშვიათად გამოიყენება (კერძოდ, სახელშეკრულებო ვალდებულებების შესრულების დასახასიათებლად მიწოდების ერთგვაროვნების თვალსაზრისით; საგარეო სავაჭრო ბრუნვის ანალიზში, თანამშრომლების შემადგენლობა, წარმოების რიტმი, პროდუქციის ხარისხი, წარმოების ტექნოლოგიური მახასიათებლების გათვალისწინებით და ა.შ.).

სტანდარტული გადახრა ახასიათებს, თუ რამდენად განსხვავდება შესწავლილი ნიშან-თვისების ინდივიდუალური მნიშვნელობები საშუალოდ პოპულაციის საშუალო მნიშვნელობიდან და გამოიხატება შესწავლილი მახასიათებლის ერთეულებში. სტანდარტული გადახრა, როგორც ვარიაციის ერთ-ერთი მთავარი საზომი, ფართოდ გამოიყენება ერთგვაროვან პოპულაციაში ნიშან-თვისების ცვალებადობის საზღვრების შესაფასებლად, ნორმალური განაწილების მრუდის ორდინატების მნიშვნელობების განსაზღვრისას, აგრეთვე. გამოთვლები, რომლებიც დაკავშირებულია ნიმუშზე დაკვირვების ორგანიზებასთან და ნიმუშის მახასიათებლების სიზუსტის დადგენასთან. დაუჯგუფებელი მონაცემების სტანდარტული გადახრა გამოითვლება შემდეგი ალგორითმის მიხედვით: საშუალოდან ყოველი გადახრა იკვრება, ყველა კვადრატი ჯამდება, რის შემდეგაც კვადრატების ჯამი იყოფა სერიების წევრთა რაოდენობაზე და კვადრატული ფესვი აღებულია. კოეფიციენტი:

სადაც Iip - სტანდარტული გადახრის მნიშვნელობა; Xj-ფუნქციის ღირებულება; X- ატრიბუტის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; P -მოსახლეობის ერთეულების რაოდენობა.

დაჯგუფებული გაანალიზებული მონაცემებისთვის, მონაცემთა სტანდარტული გადახრა გამოითვლება შეწონილი ფორმულის გამოყენებით

სადაც - სტანდარტული გადახრის მნიშვნელობა; Xj-ფუნქციის ღირებულება; X -თვისების საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის; fx-მოსახლეობის ერთეულების რაოდენობა კონკრეტულ ჯგუფში.

ფესვის ქვეშ გამოსახულებას ორივე შემთხვევაში დისპერსიას უწოდებენ. ამრიგად, ვარიაცია გამოითვლება, როგორც ნიშან-თვისებების მნიშვნელობების გადახრების საშუალო კვადრატი მათი საშუალო მნიშვნელობიდან. შეუწონავი (მარტივი) მახასიათებლის მნიშვნელობებისთვის, განსხვავება განისაზღვრება შემდეგნაირად:

შეწონილი დამახასიათებელი მნიშვნელობებისთვის

ასევე არსებობს დისპერსიის გამოთვლის სპეციალური გამარტივებული გზა: ზოგადი თვალსაზრისით

შეუწონავი (მარტივი) მახასიათებლების მნიშვნელობებისთვის შეწონილი დამახასიათებელი მნიშვნელობებისთვის
პირობითი ნულიდან დათვლის მეთოდის გამოყენებით

სადაც a 2 - დისპერსიის მნიშვნელობა; x, - - მახასიათებლის მნიშვნელობა; X -მახასიათებლის საშუალო მნიშვნელობა, თ-ჯგუფის ინტერვალის მნიშვნელობა, t 1 -წონა (A =

დისპერსიას აქვს დამოუკიდებელი გამოხატულება სტატისტიკაში და ვარიაციის ერთ-ერთი ყველაზე მნიშვნელოვანი მაჩვენებელია. იგი იზომება შესასწავლი ნიშან-თვისების საზომი ერთეულების კვადრატის შესაბამისი ერთეულებით.

დისპერსიას აქვს შემდეგი თვისებები.

  • 1. მუდმივი მნიშვნელობის დისპერსია არის ნული.
  • 2. ფუნქციის ყველა მნიშვნელობის შემცირება A-ს იგივე მნიშვნელობით არ ცვლის დისპერსიის მნიშვნელობას. ეს ნიშნავს, რომ გადახრების საშუალო კვადრატი შეიძლება გამოითვალოს არა ატრიბუტის მოცემული მნიშვნელობებით, არამედ მათი გადახრებიდან გარკვეული მუდმივი რიცხვიდან.
  • 3. ფუნქციის ყველა მნიშვნელობის შემცირება ჯერ ამცირებს დისპერსიას შიგნით 2-ჯერ, ხოლო სტანდარტული გადახრა - in ჯერ, ე.ი. ყველა მახასიათებლის მნიშვნელობა შეიძლება დაიყოს რაიმე მუდმივ რიცხვზე (ვთქვათ, სერიის ინტერვალის მნიშვნელობით), გამოვთვალოთ სტანდარტული გადახრა და შემდეგ გავამრავლოთ იგი მუდმივ რიცხვზე.
  • 4. თუ გამოვთვლით გადახრების საშუალო კვადრატს რომელიმე მნიშვნელობიდან და ზეგარკვეულწილად განსხვავდება საშუალო არითმეტიკისგან, მაშინ ის ყოველთვის იქნება მეტი არითმეტიკული საშუალოდან გამოთვლილი გადახრების საშუალო კვადრატზე. ამ შემთხვევაში, გადახრების საშუალო კვადრატი უფრო დიდი იქნება კარგად განსაზღვრული მნიშვნელობით - საშუალო და ამ პირობით აღებულ მნიშვნელობას შორის სხვაობის კვადრატით.

ალტერნატიული მახასიათებლის ვარიაცია არის შესწავლილი ქონების არსებობა ან არარსებობა მოსახლეობის ერთეულებში. რაოდენობრივად ალტერნატიული ატრიბუტის ცვალებადობა გამოიხატება ორი მნიშვნელობით: შესწავლილი თვისების არსებობა ერთეულში აღინიშნება ერთით (1), მისი არარსებობა კი ნულით (0). ერთეულების პროპორცია, რომლებსაც აქვთ შესასწავლი თვისება, აღინიშნება P-ით, ხოლო ერთეულების პროპორცია, რომლებსაც არ გააჩნიათ ეს თვისება, აღინიშნება გ.ამრიგად, ალტერნატიული ატრიბუტის ვარიაცია უდრის იმ ერთეულების პროპორციის ნამრავლს, რომლებსაც აქვთ მოცემული თვისება (P) იმ ერთეულების პროპორციით, რომლებსაც არ გააჩნიათ ეს თვისება. (G).მოსახლეობის ყველაზე დიდი ცვალებადობა მიიღწევა იმ შემთხვევებში, როდესაც მოსახლეობის ნაწილს, რომელიც შეადგენს მოსახლეობის მთლიანი მოცულობის 50%-ს, აქვს თვისება, ხოლო მოსახლეობის მეორე ნაწილს, ასევე 50%-ის ტოლი არ აქვს. ეს ფუნქცია, ხოლო დისპერსიას აღწევს მაქსიმალურ მნიშვნელობას 0.25, მ .ე. P = 0.5, G= 1 - P \u003d 1 - 0.5 \u003d 0.5 და o 2 \u003d 0.5 0.5 \u003d 0.25. ამ ინდიკატორის ქვედა ზღვარი ნულის ტოლია, რაც შეესაბამება სიტუაციას, რომელშიც არ არის ვარიაცია აგრეგატში. ალტერნატიული მახასიათებლის დისპერსიის პრაქტიკული გამოყენება არის ნდობის ინტერვალების აშენება ნიმუშის დაკვირვების ჩატარებისას.

რაც უფრო მცირეა განსხვავება და სტანდარტული გადახრა, მით უფრო ერთგვაროვანი იქნება პოპულაცია და მით უფრო ტიპიური იქნება საშუალო. სტატისტიკის პრაქტიკაში ხშირად ხდება საჭირო სხვადასხვა მახასიათებლების ვარიაციების შედარება. მაგალითად, საინტერესოა მუშების ასაკისა და მათი კვალიფიკაციის ვარიაციების, სამსახურის ხანგრძლივობისა და ხელფასის, ხარჯებისა და მოგების, სამსახურის ხანგრძლივობისა და შრომის პროდუქტიულობის და ა.შ. ასეთი შედარებისთვის, მახასიათებლების აბსოლუტური ცვალებადობის ინდიკატორები შეუსაბამოა: შეუძლებელია სამუშაო გამოცდილების ცვალებადობის შედარება, გამოხატული წლების განმავლობაში, ხელფასის ცვალებადობასთან, გამოხატული რუბლით. ასეთი შედარებების განსახორციელებლად, ისევე როგორც რამდენიმე პოპულაციაში ერთი და იმავე ატრიბუტის რყევების შედარებისთვის, სხვადასხვა არითმეტიკული საშუალებებით, გამოიყენება ვარიაციის ინდიკატორები - რხევის კოეფიციენტი, ცვალებადობის წრფივი კოეფიციენტი და ცვალებადობის კოეფიციენტი, რომელიც აჩვენებს ზომას. უკიდურესი მნიშვნელობების რყევები საშუალოზე.

რხევის ფაქტორი:

სადაც V R -რხევის კოეფიციენტის მნიშვნელობა; - ვარიაციის დიაპაზონის მნიშვნელობა; X -

ცვალებადობის ხაზოვანი კოეფიციენტი“.

სადაც vj-ცვალებადობის წრფივი კოეფიციენტის მნიშვნელობა; ᲛᲔ-საშუალო წრფივი გადახრის მნიშვნელობა; X -ნიშნის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

ცვალებადობის კოეფიციენტი:

სადაც ვა-ცვალებადობის კოეფიციენტის მნიშვნელობა; a - სტანდარტული გადახრის მნიშვნელობა; X -ნიშნის საშუალო მნიშვნელობა შესწავლილი პოპულაციისთვის.

რხევის კოეფიციენტი არის ცვალებადობის დიაპაზონის პროცენტი შესასწავლი ნიშან-თვისების საშუალო მნიშვნელობამდე, ხოლო ცვალებადობის ხაზოვანი კოეფიციენტი არის საშუალო წრფივი გადახრის თანაფარდობა შესასწავლი ნიშან-თვისების საშუალო მნიშვნელობასთან, გამოხატული პროცენტულად. ვარიაციის კოეფიციენტი არის სტანდარტული გადახრის პროცენტი შესასწავლი თვისების საშუალო მნიშვნელობამდე. ფარდობითი მნიშვნელობის სახით, გამოხატული პროცენტულად, ვარიაციის კოეფიციენტი გამოიყენება სხვადასხვა ნიშან-თვისებების ცვალებადობის ხარისხის შესადარებლად. ვარიაციის კოეფიციენტის გამოყენებით ფასდება სტატისტიკური პოპულაციის ჰომოგენურობა. თუ ვარიაციის კოეფიციენტი 33%-ზე ნაკლებია, მაშინ შესწავლილი პოპულაცია ერთგვაროვანია, ვარიაცია კი სუსტი. თუ ვარიაციის კოეფიციენტი 33%-ზე მეტია, მაშინ შესწავლილი პოპულაცია ჰეტეროგენულია, ვარიაცია ძლიერია და საშუალო მნიშვნელობა ატიპიურია და არ შეიძლება გამოყენებულ იქნას ამ პოპულაციის განზოგადების ინდიკატორად. გარდა ამისა, ვარიაციის კოეფიციენტები გამოიყენება სხვადასხვა პოპულაციაში ერთი მახასიათებლის რყევის შესადარებლად. მაგალითად, ორ საწარმოში მუშაკთა სტაჟის ცვალებადობის შესაფასებლად. რაც უფრო დიდია კოეფიციენტის მნიშვნელობა, მით უფრო მნიშვნელოვანია მახასიათებლის ცვალებადობა.

გამოთვლილი კვარტლების საფუძველზე, ასევე შესაძლებელია კვარტალური ვარიაციის ფარდობითი ინდიკატორის გამოთვლა ფორმულის გამოყენებით

სადაც ქ 2 და

კვარტლთაშორისი დიაპაზონი განისაზღვრება ფორმულით

მეოთხედი გადახრა გამოიყენება ვარიაციის დიაპაზონის ნაცვლად, რათა თავიდან იქნას აცილებული უკიდურესი მნიშვნელობების გამოყენებასთან დაკავშირებული უარყოფითი მხარეები:

არათანაბარი ინტერვალის ვარიაციული სერიებისთვის ასევე გამოითვლება განაწილების სიმკვრივე. იგი განისაზღვრება, როგორც შესაბამისი სიხშირის ან სიხშირის კოეფიციენტი გაყოფილი ინტერვალის მნიშვნელობაზე. არათანაბარი ინტერვალის სერიებში გამოიყენება აბსოლუტური და ფარდობითი განაწილების სიმკვრივეები. აბსოლუტური განაწილების სიმკვრივე არის სიხშირე ინტერვალის სიგრძის ერთეულზე. ფარდობითი განაწილების სიმკვრივე - სიხშირე ინტერვალის სიგრძის ერთეულზე.

ყოველივე ზემოთქმული მართალია განაწილების სერიებისთვის, რომელთა განაწილების კანონი კარგად არის აღწერილი ნორმალური განაწილების კანონით ან ახლოსაა მასთან.