შექმენით ინტერვალის განაწილების სერია. სტატისტიკის შეჯამება და დაჯგუფება

ლაბორატორია #1

მათემატიკური სტატისტიკის მიხედვით

თემა: ექსპერიმენტული მონაცემების პირველადი დამუშავება

3. შეფასება ქულებით. ერთი

5. უსაფრთხოების კითხვები.. 2

6. ლაბორატორიული სამუშაოს შესრულების მეთოდოლოგია .. 3

ობიექტური

მათემატიკური სტატისტიკის მეთოდებით ემპირიული მონაცემების პირველადი დამუშავების უნარ-ჩვევების შეძენა.

ექსპერიმენტული მონაცემების ნაკრების საფუძველზე შეასრულეთ შემდეგი დავალებები:

სავარჯიშო 1.განაწილების ინტერვალის ვარიაციის სერიის აგება.

დავალება 2.შექმენით ინტერვალის ცვალებადობის სერიის სიხშირეების ჰისტოგრამა.

დავალება 3.შეადგინეთ ემპირიული განაწილების ფუნქცია და ნახატი.

ა) რეჟიმი და მედიანა;

ბ) პირობითი საწყისი მომენტები;

გ) ნიმუში საშუალო;

დ) ნიმუშის ვარიაცია, შესწორებული პოპულაციის ვარიაცია, შესწორებული სტანდარტული გადახრა;

ე) ცვალებადობის კოეფიციენტი;

ე) ასიმეტრია;

ზ) ქურთოზი;

დავალება 5.განსაზღვრეთ შესასწავლი შემთხვევითი ცვლადის რიცხობრივი მახასიათებლების ჭეშმარიტი მნიშვნელობების საზღვრები მოცემული სანდოობით.

დავალება 6.პირველადი დამუშავების შედეგების აზრიანი ინტერპრეტაცია პრობლემის მდგომარეობის მიხედვით.

ქულა ქულებით

ამოცანები 1-56 ქულა

დავალება 62 ქულა

ლაბორატორიის დაცვა(ზეპირი ინტერვიუ საკონტროლო კითხვებზე და ლაბორატორიულ სამუშაოებზე) - 2 ქულა

ნამუშევარი წარმოდგენილია წერილობით A4 ფურცლებზე და მოიცავს:

1) სათაურის გვერდი (დანართი 1)

2) საწყისი მონაცემები.

3) ნამუშევრის პრეზენტაცია მითითებული ნიმუშის მიხედვით.

4) გაანგარიშების შედეგები (შესრულებული ხელით ან/და MS Excel-ის გამოყენებით) მითითებული თანმიმდევრობით.

5) დასკვნები - პირველადი დამუშავების შედეგების შინაარსიანი ინტერპრეტაცია პრობლემის მდგომარეობის მიხედვით.

6) ზეპირი გასაუბრება სამუშაო და საკონტროლო კითხვებზე.



5. უსაფრთხოების კითხვები


ლაბორატორიული სამუშაოს შესრულების მეთოდოლოგია

დავალება 1. შექმენით განაწილების ინტერვალის ვარიაციების სერია

სტატისტიკური მონაცემების ვარიაციების სერიის სახით წარმოდგენისთვის თანაბრად დაშორებული ვარიანტებით, აუცილებელია:

1. თავდაპირველ მონაცემთა ცხრილში იპოვეთ ყველაზე პატარა და უდიდესი მნიშვნელობები.

2. განსაზღვრეთ ვარიაციის დიაპაზონი :

3. განსაზღვრეთ h ინტერვალის სიგრძე, თუ ნიმუშში 1000-მდე მონაცემია, გამოიყენეთ ფორმულა: , სადაც n - ნიმუშის ზომა - მონაცემების რაოდენობა ნიმუშში; lgn აღებულია გამოთვლებისთვის).

გამოთვლილი თანაფარდობა მრგვალდება მოსახერხებელი მთელი რიცხვი .

4. ლუწი რაოდენობის ინტერვალებისთვის პირველი ინტერვალის დასაწყისის დასადგენად რეკომენდებულია მნიშვნელობის აღება; და კენტი რაოდენობის ინტერვალებისთვის.

5. ჩაწერეთ დაჯგუფების ინტერვალები და დაალაგეთ ისინი საზღვრების ზრდის მიხედვით

, ,………., ,

სად არის პირველი ინტერვალის ქვედა ზღვარი. მოსახერხებელი რიცხვი აღებულია არაუმეტეს, ბოლო ინტერვალის ზედა ზღვარი უნდა იყოს არანაკლებ. რეკომენდირებულია, რომ ინტერვალები შეიცავდეს შემთხვევითი ცვლადის საწყის მნიშვნელობებს და იყოს გამოყოფილი 5-დან 20-მდეინტერვალებით.

6. ჩამოწერეთ საწყისი მონაცემები დაჯგუფების ინტერვალებზე, ე.ი. გამოთვალეთ ორიგინალური ცხრილიდან შემთხვევითი ცვლადის მნიშვნელობების რაოდენობა, რომლებიც ხვდება მითითებულ ინტერვალებში. თუ ზოგიერთი მნიშვნელობა ემთხვევა ინტერვალების საზღვრებს, მაშინ ისინი მიეკუთვნება ან მხოლოდ წინა ან მხოლოდ შემდგომ ინტერვალს.

შენიშვნა 1.ინტერვალები არ უნდა იქნას მიღებული სიგრძით თანაბარი. იმ ადგილებში, სადაც მნიშვნელობები უფრო მკვრივია, უფრო მოსახერხებელია მცირე მოკლე ინტერვალების აღება და სადაც ნაკლებად ხშირად - უფრო დიდი.

შენიშვნა 2თუ ზოგიერთი მნიშვნელობისთვის მიიღება "ნულოვანი" ან სიხშირეების მცირე მნიშვნელობები, მაშინ აუცილებელია მონაცემების გადაჯგუფება, ინტერვალების გაფართოება (ნაბიჯის გაზრდა).

სოციალურ-ეკონომიკური ფენომენებისა და პროცესების შესწავლის ყველაზე მნიშვნელოვანი ეტაპია პირველადი მონაცემების სისტემატიზაცია და, ამის საფუძველზე, მთლიანი ობიექტის შემაჯამებელი მახასიათებლის მიღება განზოგადებული ინდიკატორების გამოყენებით, რაც მიიღწევა პირველადი სტატისტიკური მასალის შეჯამებით და დაჯგუფებით.

სტატისტიკური შეჯამება - ეს არის თანმიმდევრული ოპერაციების კომპლექსი კონკრეტული ცალკეული ფაქტების განზოგადებისთვის, რომლებიც ქმნიან კომპლექტს, რათა გამოავლინოს ტიპიური მახასიათებლები და შაბლონები, რომლებიც თან ახლავს შესასწავლ ფენომენს მთლიანობაში. სტატისტიკური შეჯამების ჩატარება მოიცავს შემდეგ ნაბიჯებს :

  • დაჯგუფების ფუნქციის არჩევანი;
  • ჯგუფების ფორმირების რიგითობის განსაზღვრა;
  • სტატისტიკური მაჩვენებლების სისტემის შემუშავება ჯგუფებისა და მთლიანად ობიექტის დასახასიათებლად;
  • შემაჯამებელი შედეგების წარმოდგენისთვის სტატისტიკური ცხრილების განლაგების შემუშავება.

სტატისტიკური დაჯგუფება ეწოდა შესწავლილი პოპულაციის ერთეულების ერთგვაროვან ჯგუფებად დაყოფას მათთვის არსებითი გარკვეული მახასიათებლების მიხედვით. დაჯგუფებები არის სტატისტიკური მონაცემების შეჯამების უმნიშვნელოვანესი სტატისტიკური მეთოდი, სტატისტიკური მაჩვენებლების სწორი გაანგარიშების საფუძველი.

არსებობს შემდეგი სახის დაჯგუფება: ტიპოლოგიური, სტრუქტურული, ანალიტიკური. ყველა ეს დაჯგუფება გაერთიანებულია იმით, რომ ობიექტის ერთეულები იყოფა ჯგუფებად გარკვეული ატრიბუტის მიხედვით.

დაჯგუფების ნიშანი ეწოდება ნიშანს, რომლითაც მოსახლეობის ერთეულები იყოფა ცალკეულ ჯგუფებად. სტატისტიკური კვლევის დასკვნები დამოკიდებულია დაჯგუფების ატრიბუტის სწორ არჩევანზე. დაჯგუფების საფუძვლად აუცილებელია გამოიყენოს მნიშვნელოვანი, თეორიულად დასაბუთებული ნიშნები (რაოდენობრივი თუ ხარისხობრივი).

დაჯგუფების რაოდენობრივი ნიშნები აქვს რიცხვითი გამოხატულება (სავაჭრო მოცულობა, პირის ასაკი, ოჯახის შემოსავალი და ა.შ.) და დაჯგუფების ხარისხობრივი მახასიათებლები ასახავს მოსახლეობის ერთეულის მდგომარეობას (სქესი, ოჯახური მდგომარეობა, საწარმოს დარგობრივი კუთვნილება, მისი საკუთრების ფორმა და ა.შ.).

დაჯგუფების საფუძვლის განსაზღვრის შემდეგ, უნდა გადაწყდეს საკითხი ჯგუფების რაოდენობის შესახებ, რომლებზეც უნდა დაიყოს საკვლევი პოპულაცია. ჯგუფების რაოდენობა დამოკიდებულია კვლევის მიზნებზე და დაჯგუფების საფუძველში მყოფი ინდიკატორის ტიპზე, პოპულაციის მოცულობაზე, ნიშან-თვისების ცვალებადობის ხარისხზე.

მაგალითად, საწარმოთა დაჯგუფება საკუთრების ფორმების მიხედვით ითვალისწინებს მუნიციპალურ, ფედერალურ და ფედერაციის სუბიექტების საკუთრებას. თუ დაჯგუფება ხორციელდება რაოდენობრივი ატრიბუტის მიხედვით, მაშინ განსაკუთრებული ყურადღება უნდა მიექცეს შესასწავლი ობიექტის ერთეულების რაოდენობას და დაჯგუფების ატრიბუტის რყევის ხარისხს.

როდესაც განისაზღვრება ჯგუფების რაოდენობა, მაშინ უნდა განისაზღვროს დაჯგუფების ინტერვალები. ინტერვალი - ეს არის ცვლადი მახასიათებლის მნიშვნელობები, რომლებიც დევს გარკვეულ საზღვრებში. თითოეულ ინტერვალს აქვს თავისი მნიშვნელობა, ზედა და ქვედა ზღვარი, ან თუნდაც ერთი მათგანი.

ინტერვალის ქვედა ზღვარი ეწოდება ატრიბუტის უმცირესი მნიშვნელობა ინტერვალში და ზედა ზღვარი - ატრიბუტის უდიდესი მნიშვნელობა ინტერვალში. ინტერვალის მნიშვნელობა არის განსხვავება ზედა და ქვედა ზღვრებს შორის.

დაჯგუფების ინტერვალები, მათი ზომის მიხედვით, არის: თანაბარი და არათანაბარი. თუ ნიშან-თვისების ცვალებადობა შედარებით ვიწრო საზღვრებში ვლინდება და განაწილება ერთგვაროვანია, მაშინ დაჯგუფება იქმნება თანაბარი ინტერვალებით. თანაბარი ინტერვალის მნიშვნელობა განისაზღვრება შემდეგი ფორმულით :

სადაც Xmax, Xmin - ატრიბუტის მაქსიმალური და მინიმალური მნიშვნელობები აგრეგატში; n არის ჯგუფების რაოდენობა.

უმარტივესი დაჯგუფება, რომელშიც თითოეული შერჩეული ჯგუფი ხასიათდება ერთი ინდიკატორით, არის განაწილების სერია.

სტატისტიკური განაწილების სერია - ეს არის მოსახლეობის ერთეულების მოწესრიგებული განაწილება ჯგუფებად გარკვეული ატრიბუტის მიხედვით. განაწილების სერიის ფორმირების მახასიათებლის მიხედვით განასხვავებენ ატრიბუტულ და ვარიაციულ განაწილების სერიებს.

ატრიბუტული ისინი უწოდებენ თვისებრივი მახასიათებლების მიხედვით აგებულ განაწილების სერიებს, ანუ ნიშნებს, რომლებსაც არ აქვთ რიცხვითი გამოხატულება (განაწილება შრომის ტიპის მიხედვით, სქესის მიხედვით, პროფესიის მიხედვით და ა.შ.). ატრიბუტების განაწილების სერიები ახასიათებს მოსახლეობის შემადგენლობას ამა თუ იმ არსებითი მახასიათებლის მიხედვით. რამდენიმე პერიოდის განმავლობაში აღებული ეს მონაცემები საშუალებას გვაძლევს შევისწავლოთ სტრუქტურის ცვლილება.

ვარიაციის რიგები რაოდენობრივ საფუძველზე აგებული განაწილების სერიები. ნებისმიერი ვარიაციის სერია შედგება ორი ელემენტისგან: ვარიანტები და სიხშირეები. Პარამეტრები ატრიბუტის ინდივიდუალურ მნიშვნელობებს, რომლებსაც ის იღებს ვარიაციის სერიაში, ეწოდება, ანუ ცვლადის ატრიბუტის სპეციფიკური მნიშვნელობა.

სიხშირეები ეწოდება ცალკეული ვარიანტის რიცხვს ან ვარიაციის სერიის თითოეულ ჯგუფს, ანუ ეს არის რიცხვები, რომლებიც აჩვენებენ რამდენად ხშირად ხდება გარკვეული ვარიანტები განაწილების სერიაში. ყველა სიხშირის ჯამი განსაზღვრავს მთელი მოსახლეობის ზომას, მის მოცულობას. სიხშირეები სიხშირეებს უწოდებენ, გამოხატული ერთეულის წილადებში ან მთლიანის პროცენტულად. შესაბამისად, სიხშირეების ჯამი უდრის 1 ან 100%-ს.

ნიშან-თვისების ვარიაციის ბუნებიდან გამომდინარე, განასხვავებენ ვარიაციის სერიის სამ ფორმას: რანჟირებულ სერიას, დისკრეტულ სერიას და ინტერვალურ სერიას.

რანჟირებული ვარიაციების სერია - ეს არის მოსახლეობის ცალკეული ერთეულების განაწილება შესასწავლი ნიშან-თვისების აღმავალი ან დაღმავალი თანმიმდევრობით. რანჟირება აადვილებს რაოდენობრივი მონაცემების ჯგუფებად დაყოფას, მახასიათებლის უმცირესი და უდიდესი მნიშვნელობების დაუყოვნებლივ გამოვლენას და მნიშვნელობების ხაზგასმას, რომლებიც ყველაზე ხშირად მეორდება.

დისკრეტული ვარიაციის სერია ახასიათებს მოსახლეობის ერთეულების განაწილებას დისკრეტული ატრიბუტის მიხედვით, რომელიც იღებს მხოლოდ მთელ მნიშვნელობებს. მაგალითად, სატარიფო კატეგორია, ოჯახში ბავშვების რაოდენობა, საწარმოში დასაქმებულთა რაოდენობა და ა.შ.

თუ ნიშანს აქვს უწყვეტი ცვლილება, რომელიც გარკვეულ საზღვრებში შეუძლია მიიღოს ნებისმიერი მნიშვნელობა ("-დან --მდე"), მაშინ ამ ნიშნისთვის თქვენ უნდა ააგოთ ინტერვალის ვარიაციის სერია . მაგალითად, შემოსავლის ოდენობა, სამუშაო გამოცდილება, საწარმოს ძირითადი საშუალებების ღირებულება და ა.შ.

ამოცანების ამოხსნის მაგალითები თემაზე „სტატისტიკური შეჯამება და დაჯგუფება“

დავალება 1 . არის ინფორმაცია სტუდენტების მიერ გასული სასწავლო წლის გამოწერით მიღებული წიგნების შესახებ.

შექმენით დიაპაზონი და დისკრეტული ვარიაციული განაწილების სერია, რომელიც აღნიშნავს სერიის ელემენტებს.

გადაწყვეტილება

ეს ნაკრები არის ვარიანტების ნაკრები სტუდენტების მიერ მიღებული წიგნების რაოდენობის მიხედვით. მოდით დავთვალოთ ასეთი ვარიანტების რაოდენობა და მოვაწყოთ ისინი ვარიაციული რანჟირებული და ვარიაციული დისკრეტული განაწილების სერიების სახით.

დავალება 2 . არსებობს მონაცემები ძირითადი საშუალებების ღირებულების შესახებ 50 საწარმოსთვის, ათასი რუბლი.

შექმენით სადისტრიბუციო სერია, ხაზს უსვამს საწარმოთა 5 ჯგუფს (თანაბარი ინტერვალით).

გადაწყვეტილება

გადაწყვეტისთვის ჩვენ ვირჩევთ საწარმოების ძირითადი საშუალებების ღირებულების ყველაზე დიდ და უმცირეს მნიშვნელობებს. ეს არის 30.0 და 10.2 ათასი რუბლი.

იპოვეთ ინტერვალის ზომა: h \u003d (30.0-10.2): 5 \u003d 3.96 ათასი რუბლი.

შემდეგ პირველ ჯგუფში შედის საწარმოები, რომელთა ძირითადი საშუალებების ოდენობაა 10,2 ათასი რუბლიდან. მდე 10,2 + 3,96 = 14,16 ათასი რუბლი. ასეთი საწარმო იქნება 9, მეორე ჯგუფში შედის საწარმოები, რომელთა ძირითადი საშუალებების ოდენობა იქნება 14,16 ათასი რუბლიდან. მდე 14.16 + 3.96 = 18.12 ათასი რუბლი. ასეთი საწარმო 16 იქნება, ანალოგიურად ვხვდებით მესამე, მეოთხე და მეხუთე ჯგუფში შემავალი საწარმოების რაოდენობას.

მიღებული განაწილების სერია მოთავსებულია ცხრილში.

დავალება 3 . მსუბუქი მრეწველობის რამდენიმე საწარმოსთვის მიღებული იქნა შემდეგი მონაცემები:

გააკეთეთ საწარმოთა დაჯგუფება მუშაკთა რაოდენობის მიხედვით, თანაბარი ინტერვალებით ჩამოაყალიბეთ 6 ჯგუფი. დათვალეთ თითოეული ჯგუფისთვის:

1. საწარმოთა რაოდენობა
2. მუშათა რაოდენობა
3. წარმოებული პროდუქციის მოცულობა წელიწადში
4. საშუალო ფაქტობრივი გამომუშავება ერთ მუშაკზე
5. ძირითადი საშუალებების ოდენობა
6. ერთი საწარმოს ძირითადი საშუალებების საშუალო ზომა
7. ერთი საწარმოს მიერ წარმოებული პროდუქციის საშუალო ღირებულება

ჩაწერეთ გაანგარიშების შედეგები ცხრილებში. გამოიტანეთ საკუთარი დასკვნები.

გადაწყვეტილება

გადაწყვეტისთვის ჩვენ ვირჩევთ საწარმოში დასაქმებულთა საშუალო რაოდენობის უდიდეს და უმცირეს მნიშვნელობებს. ეს არის 43 და 256.

იპოვეთ ინტერვალის ზომა: h = (256-43): 6 = 35,5

შემდეგ პირველ ჯგუფში შევა საწარმოები, სადაც მუშათა საშუალო რაოდენობა მერყეობს 43-დან 43-მდე + 35,5 = 78,5 ადამიანი. ასეთი საწარმო იქნება 5, მეორე ჯგუფში იქნება საწარმოები, რომლებშიც დასაქმებულთა საშუალო რაოდენობა იქნება 78,5-დან 78,5-მდე + 35,5 = 114 ადამიანი. ასეთი საწარმო 12 იქნება, ანალოგიურად ვხვდებით მესამე, მეოთხე, მეხუთე და მეექვსე ჯგუფში შემავალი საწარმოების რაოდენობას.

მიღებული განაწილების სერიებს ვათავსებთ ცხრილში და გამოვთვლით საჭირო ინდიკატორებს თითოეული ჯგუფისთვის:

დასკვნა : როგორც ცხრილიდან ჩანს, საწარმოთა მეორე ჯგუფი ყველაზე მრავალრიცხოვანია. იგი მოიცავს 12 საწარმოს. ყველაზე პატარაა მეხუთე და მეექვსე ჯგუფი (თითოეული ორი საწარმო). ეს არის ყველაზე დიდი საწარმოები (მუშათა რაოდენობის მიხედვით).

ვინაიდან მეორე ჯგუფი ყველაზე მრავალრიცხოვანია, ამ ჯგუფის საწარმოების მიერ წლიური გამოშვების მოცულობა და ძირითადი საშუალებების მოცულობა ბევრად აღემატება სხვებს. ამავდროულად, ამ ჯგუფის საწარმოებში ერთი მუშის საშუალო ფაქტობრივი გამომუშავება არ არის ყველაზე მაღალი. აქ მეოთხე ჯგუფის საწარმოები ლიდერობენ. ამ ჯგუფში ასევე მოდის ძირითადი საშუალებების საკმაოდ დიდი რაოდენობა.

დასასრულს აღვნიშნავთ, რომ ძირითადი საშუალებების საშუალო ზომა და ერთი საწარმოს პროდუქციის საშუალო ღირებულება პირდაპირპროპორციულია საწარმოს სიდიდის (მუშათა რაოდენობის მიხედვით).

თუ შესწავლილი შემთხვევითი ცვლადი უწყვეტია, მაშინ დაკვირვებული მნიშვნელობების რანჟირება და დაჯგუფება ხშირად არ გვაძლევს საშუალებას გამოვყოთ მისი მნიშვნელობების ცვალებადობის დამახასიათებელი ნიშნები. ეს აიხსნება იმით, რომ შემთხვევითი ცვლადის ინდივიდუალური მნიშვნელობები შეიძლება განსხვავდებოდეს ისე, როგორც სასურველია ერთმანეთისგან და, შესაბამისად, დაკვირვებული მონაცემების მთლიანობაში იშვიათად შეიძლება მოხდეს რაოდენობის იგივე მნიშვნელობები და სიხშირეები. ვარიანტები ცოტათი განსხვავდება ერთმანეთისგან.

ასევე არაპრაქტიკულია დისკრეტული შემთხვევითი ცვლადის დისკრეტული სერიის აგება, რომლის შესაძლო მნიშვნელობების რაოდენობა დიდია. ასეთ შემთხვევებში უნდა აშენდეს ინტერვალის ვარიაციის სერია განაწილება.

ასეთი სერიის ასაგებად, შემთხვევითი ცვლადის დაკვირვებული მნიშვნელობების ცვალებადობის მთელი ინტერვალი იყოფა სერიად. ნაწილობრივი ინტერვალები და ყოველ ნაწილობრივ ინტერვალში სიდიდის მნიშვნელობების გაჩენის სიხშირის დათვლა.

ინტერვალის ვარიაციის სერიაეწოდება შემთხვევითი ცვლადის მნიშვნელობების ცვალებადობის ინტერვალების მოწესრიგებულ კომპლექტს შესაბამისი სიხშირეებით ან დარტყმების ფარდობითი სიხშირით თითოეულ მათგანში რაოდენობის მნიშვნელობებით.

ინტერვალის სერიის შესაქმნელად დაგჭირდებათ:

  1. განსაზღვრა ღირებულება ნაწილობრივი ინტერვალები;
  2. განსაზღვრა სიგანე ინტერვალები;
  3. დააყენეთ თითოეული ინტერვალისთვის ზედა და ქვედა ზღვარი ;
  4. დააჯგუფეთ დაკვირვების შედეგები.

1 . დაჯგუფების ინტერვალების რაოდენობისა და სიგანის არჩევის საკითხი უნდა გადაწყდეს თითოეულ კონკრეტულ შემთხვევაში მიზნები კვლევა, მოცულობა სინჯის აღება და ვარიაციის ხარისხი თვისება ნიმუშში.

ინტერვალების სავარაუდო რაოდენობა შეიძლება შეფასდეს მხოლოდ ნიმუშის ზომის მიხედვით ერთ-ერთი შემდეგი გზით:

  • ფორმულის მიხედვით სტურგესი : k = 1 + 3.32 log n ;
  • ცხრილი 1-ის გამოყენებით.

ცხრილი 1

2 . ზოგადად სასურველია იგივე სიგანის ინტერვალები. ინტერვალების სიგანის დასადგენად გამოთვალეთ:

  • ვარიაციის დიაპაზონი R - ნიმუშის მნიშვნელობები: R = x max - x min ,

სადაც xmax და xmin - მაქსიმალური და მინიმალური ნიმუშის ვარიანტები;

  • თითოეული ინტერვალის სიგანე განისაზღვრება შემდეგი ფორმულით: h = R/k .

3 . ქვედა ხაზი პირველი ინტერვალი x h1 არჩეულია ისე, რომ მინიმალური ნიმუშის ვარიანტი xmin დაეცა დაახლოებით ამ ინტერვალის შუაში: x h1 = x min - 0,5 სთ .

ინტერვალებიმიღებული წინა ინტერვალის ბოლოს ნაწილობრივი ინტერვალის სიგრძის დამატებით :

xhi = xhi-1 +სთ.

ინტერვალების სკალის აგება, რომელიც დაფუძნებულია ინტერვალების საზღვრების გაანგარიშებაზე, გრძელდება მნიშვნელობამდე x გამარჯობა აკმაყოფილებს ურთიერთობას:

x გამარჯობა< x max + 0,5·h .

4 . ინტერვალების მასშტაბის შესაბამისად, ატრიბუტის მნიშვნელობები დაჯგუფებულია - თითოეული ნაწილობრივი ინტერვალისთვის გამოითვლება სიხშირეების ჯამი. n i დაჭერილი ვარიანტი მე - ინტერვალი. ამ შემთხვევაში, ინტერვალი მოიცავს შემთხვევითი ცვლადის მნიშვნელობებს, რომლებიც აღემატება ან ტოლია ქვედა ზღვარზე და ნაკლებია, ვიდრე ინტერვალის ზედა ზღვარი.

პოლიგონი და ჰისტოგრამა

სიცხადისთვის აგებულია სტატისტიკური განაწილების სხვადასხვა გრაფიკები.

დისკრეტული ვარიაციული სერიის მონაცემებზე დაყრდნობით ვაშენებთ მრავალკუთხედი სიხშირეები ან ფარდობითი სიხშირეები.

სიხშირის პოლიგონი x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; ნკ ). აბსცისის ღერძზე სიხშირეების მრავალკუთხედის ასაგებად, ვარიანტები გათვალისწინებულია x i , ხოლო y ღერძზე - შესაბამისი სიხშირეები n i . ქულები ( x i ; n i ) ერთმანეთთან არის დაკავშირებული სწორი ხაზების სეგმენტებით და მიიღება სიხშირის მრავალკუთხედი (ნახ. 1).

შედარებითი სიხშირის პოლიგონიეწოდება პოლიხაზი, რომლის სეგმენტები აკავშირებს წერტილებს ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; ). ფარდობითი სიხშირეების მრავალკუთხედის აბსცისაზე ასაგებად, გააუქმეთ ოფციები x i , ხოლო y ღერძზე - მათ შესაბამისი ფარდობითი სიხშირეები ვი . ქულები ( x i ; ვი ) დაკავშირებულია სწორი ხაზების სეგმენტებით და მიიღება ფარდობითი სიხშირეების მრავალკუთხედი.

Როდესაც უწყვეტი ფუნქცია მიზანშეწონილია აშენება ჰისტოგრამა .

სიხშირის ჰისტოგრამაეწოდება საფეხურიანი ფიგურა, რომელიც შედგება მართკუთხედებისგან, რომელთა ფუძეები სიგრძის ნაწილობრივი ინტერვალებია და სიმაღლეები თანაფარდობის ტოლია NIH (სიხშირის სიმკვრივე).

სიხშირეების ჰისტოგრამის ასაგებად, ნაწილობრივი ინტერვალები გამოსახულია აბსცისის ღერძზე და სეგმენტები დახაზულია მათ ზემოთ აბსცისის ღერძის პარალელურად მანძილზე. NIH .

დაჯგუფება- ეს არის მოსახლეობის დაყოფა ჯგუფებად, რომლებიც გარკვეულწილად ერთგვაროვანია.

სამსახურის დავალება. ონლაინ კალკულატორით შეგიძლიათ:

  • შექმენით ვარიაციების სერია, ააგეთ ჰისტოგრამა და მრავალკუთხედი;
  • ვარიაციის ინდიკატორების პოვნა (საშუალო, რეჟიმი (გრაფიკულის ჩათვლით), მედიანა, ვარიაციის დიაპაზონი, კვარტილები, დეცილები, დიფერენციაციის კვარტალური კოეფიციენტი, ვარიაციის კოეფიციენტი და სხვა ინდიკატორები);

ინსტრუქცია. სერიის დასაჯგუფებლად, თქვენ უნდა აირჩიოთ მიღებული ვარიაციის სერიის ტიპი (დისკრეტული ან ინტერვალი) და მიუთითოთ მონაცემების რაოდენობა (სტრიქონების რაოდენობა). მიღებული გამოსავალი ინახება Word ფაილში (იხილეთ სტატისტიკური მონაცემების დაჯგუფების მაგალითი).

შეყვანის მონაცემების რაოდენობა
",0);">

თუ დაჯგუფება უკვე გაკეთებულია და დისკრეტული ვარიაციის სერიაან ინტერვალის სერია, მაშინ უნდა გამოიყენოთ ონლაინ კალკულატორი Variation ინდიკატორები. ჰიპოთეზის ტესტირება განაწილების ტიპის შესახებდამზადებულია სერვისის გამოყენებით Study of form distribution.

სტატისტიკური დაჯგუფების სახეები

ვარიაციების სერია. დისკრეტული შემთხვევითი ცვლადის დაკვირვების შემთხვევაში, იგივე მნიშვნელობა შეიძლება რამდენჯერმე შეგვხვდეს. შემთხვევითი x i ცვლადის ასეთი მნიშვნელობები ჩაწერილია, რაც მიუთითებს n i რამდენჯერ გამოჩნდება n დაკვირვებაში, ეს არის ამ მნიშვნელობის სიხშირე.
უწყვეტი შემთხვევითი ცვლადის შემთხვევაში დაჯგუფება გამოიყენება პრაქტიკაში.
  1. ტიპოლოგიური დაჯგუფება- ეს არის შესწავლილი თვისობრივად ჰეტეროგენული მოსახლეობის დაყოფა კლასებად, სოციალურ-ეკონომიკურ ტიპებად, ერთეულთა ერთგვაროვან ჯგუფებად. ამ დაჯგუფების შესაქმნელად გამოიყენეთ დისკრეტული ვარიაციული სერიის პარამეტრი.
  2. სტრუქტურული დაჯგუფება ე.წ, რომელშიც ერთგვაროვანი პოპულაცია იყოფა ჯგუფებად, რომლებიც ახასიათებენ მის სტრუქტურას ზოგიერთი განსხვავებული მახასიათებლის მიხედვით. ამ დაჯგუფების შესაქმნელად გამოიყენეთ ინტერვალის სერიის პარამეტრი.
  3. დაჯგუფება, რომელიც ავლენს შესწავლილ ფენომენებსა და მათ მახასიათებლებს შორის კავშირს, ე.წ ანალიტიკური ჯგუფი(იხილეთ სერიების ანალიტიკური დაჯგუფება).

სტატისტიკური დაჯგუფების აგების პრინციპები

აღმავალი რიგით დალაგებულ დაკვირვებების სერიას ვარიაციის სერია ეწოდება. დაჯგუფების ნიშანიარის ნიშანი, რომლითაც მოსახლეობა იყოფა ცალკეულ ჯგუფებად. მას ჯგუფის საფუძველს უწოდებენ. დაჯგუფება შეიძლება დაფუძნდეს როგორც რაოდენობრივ, ასევე თვისობრივ მახასიათებლებზე.
დაჯგუფების საფუძვლის განსაზღვრის შემდეგ უნდა გადაწყდეს საკითხი ჯგუფების რაოდენობის შესახებ, რომლებშიც უნდა დაიყოს საკვლევი პოპულაცია.

სტატისტიკური მონაცემების დასამუშავებლად პერსონალური კომპიუტერების გამოყენებისას ობიექტის ერთეულების დაჯგუფება ხორციელდება სტანდარტული პროცედურების გამოყენებით.
ერთ-ერთი ასეთი პროცედურა ეფუძნება Sturgess-ის ფორმულის გამოყენებას ჯგუფების ოპტიმალური რაოდენობის დასადგენად:

k = 1+3.322*lg(N)

სადაც k არის ჯგუფების რაოდენობა, N არის მოსახლეობის ერთეულების რაოდენობა.

ნაწილობრივი ინტერვალების სიგრძე გამოითვლება როგორც h=(x max -x min)/k

შემდეგ დათვალეთ დაკვირვებების დარტყმების რაოდენობა ამ ინტერვალებში, რომლებიც აღებულია როგორც სიხშირე n i. რამდენიმე სიხშირე, რომელთა მნიშვნელობები 5-ზე ნაკლებია (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
ახალი მნიშვნელობებით აღებულია x i =(c i-1 +c i)/2 ინტერვალების შუა წერტილები.

რა არის სტატისტიკური მონაცემების დაჯგუფება და როგორ არის დაკავშირებული ის განაწილების სერიებთან, განხილული იყო ამ ლექციაში, სადაც ასევე შეგიძლიათ გაიგოთ, თუ რა არის დისკრეტული და ვარიაციული განაწილების სერია.

სადისტრიბუციო სერიები არის სტატისტიკური სერიების ერთ-ერთი სახეობა (მათ გარდა, სტატისტიკაში გამოიყენება დინამიკის სერიები), ისინი გამოიყენება სოციალური ცხოვრების ფენომენების შესახებ მონაცემების გასაანალიზებლად. ვარიაციული სერიების აგება საკმაოდ შესაძლებელი ამოცანაა ყველასთვის. თუმცა, არსებობს წესები, რომლებიც უნდა გვახსოვდეს.

როგორ ავაშენოთ დისკრეტული ვარიაციული განაწილების სერია

მაგალითი 1 ხელმისაწვდომია მონაცემები 20 გამოკითხულ ოჯახში ბავშვების რაოდენობის შესახებ. შექმენით დისკრეტული ვარიაციული სერია ოჯახების განაწილებაბავშვების რაოდენობის მიხედვით.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

გადაწყვეტილება:

  1. დავიწყოთ ცხრილის განლაგებით, რომელშიც შემდეგ შევიყვანთ მონაცემებს. ვინაიდან განაწილების რიგებს აქვს ორი ელემენტი, ცხრილი შედგება ორი სვეტისგან. პირველი სვეტი ყოველთვის არის ვარიანტი - რასაც ჩვენ ვსწავლობთ - მის სახელს ვიღებთ ამოცანიდან (წინადადების დასასრული დავალებით პირობებში) - ბავშვების რაოდენობის მიხედვით- ასე რომ, ჩვენი ვერსია ბავშვების რაოდენობაა.

მეორე სვეტი არის სიხშირე - რამდენად ხშირად ხდება ჩვენი ვარიანტი შესწავლილ ფენომენში - ჩვენ ასევე ვიღებთ სვეტის სახელს ამოცანიდან - ოჯახების განაწილება - ასე რომ, ჩვენი სიხშირე არის ბავშვების შესაბამისი რაოდენობის მქონე ოჯახების რაოდენობა.

  1. ახლა, საწყისი მონაცემებიდან, ჩვენ ვირჩევთ იმ მნიშვნელობებს, რომლებიც ერთხელ მაინც ხდება. ჩვენს შემთხვევაში ეს

და მოდით დავალაგოთ ეს მონაცემები ჩვენი ცხრილის პირველ სვეტში ლოგიკური თანმიმდევრობით, ამ შემთხვევაში გავზარდოთ 0-დან 4-მდე. მივიღებთ

და დასასრულს, მოდით გამოვთვალოთ რამდენჯერ ხდება პარამეტრების თითოეული მნიშვნელობა.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

შედეგად ვიღებთ სრულ ცხრილს ან ოჯახების განაწილების საჭირო სერიას ბავშვების რაოდენობის მიხედვით.

ვარჯიში . არსებობს მონაცემები საწარმოს 30 მუშაკის სატარიფო კატეგორიების შესახებ. შექმენით დისკრეტული ვარიაციული სერია მუშაკების განაწილებისთვის ხელფასის კატეგორიის მიხედვით. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

როგორ ავაშენოთ განაწილების ინტერვალის ვარიაციების სერია

მოდით ავაშენოთ ინტერვალის განაწილების სერია და ვნახოთ, როგორ განსხვავდება მისი კონსტრუქცია დისკრეტული სერიებისგან.

მაგალითი 2 არსებობს მონაცემები 16 საწარმოს მიერ მიღებული მოგების ოდენობის შესახებ, მილიონი რუბლი. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. შექმენით ინტერვალის ვარიაციული სერია საწარმოების მოგების მოცულობის მიხედვით განაწილებისთვის, თანაბარი ინტერვალებით 3 ჯგუფის შერჩევა.

სერიის აგების ზოგადი პრინციპი, რა თქმა უნდა, შენარჩუნდება, იგივე ორი სვეტი, იგივე ვარიანტები და სიხშირე, მაგრამ ამ შემთხვევაში ვარიანტები განლაგდება ინტერვალში და სიხშირეები განსხვავებულად დაითვლება.

გადაწყვეტილება:

  1. დავიწყოთ წინა დავალების მსგავსად ცხრილის განლაგების აგებით, რომელშიც შემდეგ შევიყვანთ მონაცემებს. ვინაიდან განაწილების რიგებს აქვს ორი ელემენტი, ცხრილი შედგება ორი სვეტისგან. პირველი სვეტი ყოველთვის არის ვარიანტი - რასაც ჩვენ ვსწავლობთ - მის სახელს ვიღებთ ამოცანიდან (წინადადების დასასრული დავალების პირობებში) - მოგების ოდენობით - რაც ნიშნავს, რომ ჩვენი ვარიანტი არის მოგების ოდენობა. მიღებული.

მეორე სვეტი არის სიხშირე - რამდენად ხშირად ხდება ჩვენი ვარიანტი შესწავლილ ფენომენში - ჩვენ ასევე ვიღებთ სვეტის სახელს დავალებიდან - საწარმოთა განაწილება - ეს ნიშნავს, რომ ჩვენი სიხშირე არის საწარმოების რაოდენობა შესაბამისი მოგებით, ეს შემთხვევა ხვდება ინტერვალში.

შედეგად, ჩვენი ცხრილის განლაგება ასე გამოიყურება:

სადაც i არის ინტერვალის მნიშვნელობა ან სიგრძე,

Xmax და Xmin - ფუნქციის მაქსიმალური და მინიმალური მნიშვნელობა,

n არის ჯგუფების საჭირო რაოდენობა პრობლემის მდგომარეობის მიხედვით.

მოდით გამოვთვალოთ ინტერვალის მნიშვნელობა ჩვენი მაგალითისთვის. ამისათვის საწყის მონაცემებს შორის ვპოულობთ ყველაზე დიდს და უმცირესს

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - მაქსიმალური ღირებულებაა 118 მილიონი რუბლი, ხოლო მინიმალური 9 მილიონი რუბლი. გამოვთვალოთ ფორმულა.

გამოთვლაში მივიღეთ რიცხვი 36, (3) სამი პერიოდის განმავლობაში, ასეთ სიტუაციებში ინტერვალის მნიშვნელობა უნდა დამრგვალდეს უფრო დიდზე, რათა გამოთვლების შემდეგ მაქსიმალური მონაცემები არ დაიკარგოს, რის გამოც მნიშვნელობა გაანგარიშებისას ინტერვალი არის 36,4 მილიონი რუბლი.

  1. ახლა მოდით ავაშენოთ ინტერვალები - ჩვენი ვარიანტები ამ პრობლემაში. პირველი ინტერვალი იწყება მინიმალური მნიშვნელობიდან, მას ემატება ინტერვალის მნიშვნელობა და მიიღება პირველი ინტერვალის ზედა ზღვარი. შემდეგ პირველი ინტერვალის ზედა ზღვარი ხდება მეორე ინტერვალის ქვედა ზღვარი, მას ემატება ინტერვალის მნიშვნელობა და მიიღება მეორე ინტერვალი. და ა.შ. იმდენჯერ, რამდენჯერაც საჭიროა მდგომარეობის მიხედვით ინტერვალების აშენება.

ყურადღება მიაქციეთ, თუ ჩვენ არ დავამრგვალებთ ინტერვალის მნიშვნელობას 36.4-ზე, მაგრამ დავტოვებთ მას 36.3-ზე, მაშინ ბოლო მნიშვნელობა იქნება 117.9. მონაცემთა დაკარგვის თავიდან ასაცილებლად აუცილებელია ინტერვალის მნიშვნელობის დამრგვალება უფრო დიდ მნიშვნელობამდე.

  1. მოდით დავთვალოთ საწარმოების რაოდენობა, რომლებიც ხვდებიან თითოეულ კონკრეტულ ინტერვალში. მონაცემთა დამუშავებისას უნდა გვახსოვდეს, რომ ამ ინტერვალში ინტერვალის ზედა მნიშვნელობა არ არის გათვალისწინებული (არ შედის ამ ინტერვალში), მაგრამ მხედველობაში მიიღება შემდეგ ინტერვალში (ინტერვალის ქვედა ზღვარი შედის ამ ინტერვალში და ზედა არ შედის), გარდა ბოლო ინტერვალისა.

მონაცემთა დამუშავებისას უმჯობესია არჩეული მონაცემები მიუთითოთ ჩვეულებრივი ხატებით ან ფერით დამუშავების გასამარტივებლად.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

ჩვენ აღვნიშნავთ პირველ ინტერვალს ყვითლად - და განვსაზღვრავთ, რამდენი მონაცემი შედის ინტერვალში 9-დან 45.4-მდე, ხოლო ეს 45.4 მხედველობაში მიიღება მეორე ინტერვალში (იმ პირობით, რომ ის არის მონაცემებში) - შედეგად, ჩვენ მიიღეთ 7 საწარმო პირველ ინტერვალში. და ასე შემდეგ ყველა ინტერვალით.

  1. (დამატებითი მოქმედება) გამოვთვალოთ საწარმოების მიერ მიღებული მოგების ჯამური ოდენობა თითოეულ ინტერვალზე და ზოგადად. ამისათვის დაამატეთ სხვადასხვა ფერებით მონიშნული მონაცემები და მიიღეთ მთლიანი მოგების ღირებულება.

პირველი ინტერვალისთვის 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 მილიონი რუბლი

მეორე ინტერვალისთვის - 48 + 57 + 48 + 56 + 63 = 272 მილიონი რუბლი.

მესამე ინტერვალისთვის - 118 + 87 + 98 + 88 = 391 მილიონი რუბლი.

ვარჯიში . არსებობს მონაცემები ანაბრის ზომის შესახებ 30 მეანაბრე ბანკში, ათასი რუბლი. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

აშენება ინტერვალის ვარიაციის სერიამეანაბრეების განაწილება შენატანების ზომით, თანაბარი ინტერვალებით გამოყოფს 4 ჯგუფს. თითოეული ჯგუფისთვის გამოთვალეთ შენატანების მთლიანი ოდენობა.