სტატისტიკური ანალიზის მეთოდები. მონაცემთა ანალიზი: სტატისტიკური კვლევის მეთოდები

თქვენი კარგი სამუშაოს გაგზავნა ცოდნის ბაზაში მარტივია. გამოიყენეთ ქვემოთ მოცემული ფორმა

სტუდენტები, კურსდამთავრებულები, ახალგაზრდა მეცნიერები, რომლებიც იყენებენ ცოდნის ბაზას სწავლასა და მუშაობაში, ძალიან მადლობლები იქნებიან თქვენი.

მასპინძლობს http://www.allbest.ru/

  • 3. დინამიკის სერია
  • ლიტერატურა

1. აბსოლუტური და ფარდობითი ღირებულებები

შეჯამებისა და დაჯგუფების შედეგად სტატისტიკური მასალამკვლევარის ხელში არის ყველაზე მრავალფეროვანი ინფორმაცია შესწავლილი ფენომენებისა და პროცესების შესახებ. თუმცა, მიღებულ შედეგებზე ფიქრი დიდი შეცდომა იქნებოდა, რადგან მოცემული კრიტერიუმების მიხედვით დაჯგუფებული და ტაბულური ან გრაფიკული სახით ასახული ეს მონაცემები მაინც მხოლოდ ერთგვარი ილუსტრაციაა. შუალედური შედეგი, რომელიც აუცილებლად გასაანალიზებელია - ამ შემთხვევაში სტატისტიკური. სტატისტიკურიანალიზი - ეს შესრულება შეისწავლა ობიექტი in ხარისხიანი დაიშალა სისტემები, იმათ. კომპლექსი ელემენტები და კავშირები, წარმოქმნის in მისი ურთიერთქმედება ორგანული მთლიანი.

ასეთი ანალიზის შედეგად უნდა აშენდეს შესასწავლი ობიექტის მოდელი და, რაკი სტატისტიკაზეა საუბარი, მოდელის აგებისას გამოყენებული იყოს სტატისტიკურად მნიშვნელოვანი ელემენტები და მიმართებები.

რეალურად, სტატისტიკური ანალიზი მიზნად ისახავს ასეთი მნიშვნელოვანი ელემენტებისა და ურთიერთობების იდენტიფიცირებას.

აბსოლუტურიინდიკატორები(მნიშვნელობები) - მთლიანი მნიშვნელობები გამოთვლილი ან აღებული შემაჯამებელი სტატისტიკური ანგარიშებიდან ყოველგვარი ტრანსფორმაციის გარეშე. აბსოლუტური მაჩვენებლები ყოველთვის ნომინალურია და აისახება საზომ ერთეულებში, რომლებიც დაწესდა სტატისტიკური დაკვირვების პროგრამის შედგენისას (აღძრული სისხლის სამართლის საქმეების რაოდენობა, ჩადენილი დანაშაულების რაოდენობა, განქორწინებების რაოდენობა და ა.შ.).

აბსოლუტური ინდიკატორები ძირითადია ნებისმიერი შემდგომი სტატისტიკური ოპერაციებისთვის, მაგრამ ისინი თავისთავად ნაკლებად გამოსადეგია ანალიზისთვის. აბსოლუტური თვალსაზრისით, მაგალითად, ძნელია ვიმსჯელოთ დანაშაულის დონეზე სხვადასხვა ქალაქებშიან რეგიონებში და პრაქტიკულად შეუძლებელია პასუხის გაცემა კითხვაზე, სად არის დანაშაული უფრო მაღალი და სად დაბალი, რადგან ქალაქები ან რეგიონები შეიძლება მნიშვნელოვნად განსხვავდებოდეს მოსახლეობის, ტერიტორიისა და სხვა მნიშვნელოვანი პარამეტრების მიხედვით.

ნათესავირაოდენობებისტატისტიკაში ისინი განზოგადებულ ინდიკატორებს წარმოადგენენ, რომლებიც ავლენენ ორი შედარებითი სტატისტიკური მნიშვნელობის თანაფარდობის რიცხვით ფორმას. ფარდობითი მნიშვნელობების გაანგარიშებისას, ყველაზე ხშირად ადარებენ ორ აბსოლუტურ მნიშვნელობას, მაგრამ შესაძლებელია როგორც საშუალო, ისე ფარდობითი მნიშვნელობების შედარება, ახალი ფარდობითი ინდიკატორების მიღებით. ფარდობითი მნიშვნელობის გამოთვლის უმარტივესი მაგალითია პასუხი კითხვაზე: რამდენჯერ არის ერთი რიცხვი მეორეზე დიდი?

ფარდობითი მნიშვნელობების გათვალისწინებისას აუცილებელია გავითვალისწინოთ შემდეგი. პრინციპში, ყველაფრის შედარება შესაძლებელია, თუნდაც A4 ფურცლის ხაზოვანი ზომები ლომონოსოვის ფაიფურის ქარხნის მიერ წარმოებული პროდუქციის რაოდენობასთან. თუმცა ასეთი შედარება არაფერს მოგვცემს. ფარდობითი რაოდენობების ნაყოფიერი გაანგარიშების ყველაზე მნიშვნელოვანი პირობა შეიძლება ჩამოყალიბდეს შემდეგნაირად:

1. შედარებული სიდიდეების საზომი ერთეულები უნდა იყოს ერთნაირი ან საკმაოდ შესადარებელი. დანაშაულის, სისხლის სამართლის საქმეებისა და მსჯავრდებულების რაოდენობა კორელაციური ინდიკატორია, ე.ი. დაკავშირებული, მაგრამ არა შედარებადი საზომი ერთეულების თვალსაზრისით. ერთ სისხლის სამართლის საქმეზე შეიძლება განიხილებოდეს რამდენიმე დანაშაული და მსჯავრდდეს პირთა ჯგუფი; რამდენიმე მსჯავრდებულს შეუძლია ჩაიდინოს ერთი დანაშაული და, პირიქით, ერთ მსჯავრდებულს შეუძლია ჩაიდინოს მრავალი ქმედება. დანაშაულის, საქმეებისა და ნასამართლევების რაოდენობა შედარებულია მოსახლეობის რაოდენობასთან, სისხლის სამართლის სისტემის პერსონალის რაოდენობასთან, ხალხის ცხოვრების დონესთან და იმავე წლის სხვა მონაცემებთან. უფრო მეტიც, ერთი წლის განმავლობაში განხილული მაჩვენებლები საკმაოდ შედარებადია ერთმანეთთან.

2. შესადარებელი მონაცემები აუცილებლად უნდა შეესაბამებოდეს ერთმანეთს მათი მიღების დროის ან ტერიტორიის, ან ორივეს მიხედვით.

აბსოლუტური ღირებულება, თან რომელიც შედარებით სხვა inნიღბები, დაურეკა საფუძველი ან ბაზა შედარება, შეადარედამოჩუქურთმებული მაჩვენებელი - სიდიდე შედარებები. მაგალითად, რუსეთში დანაშაულის დინამიკის თანაფარდობის გაანგარიშებისას 2000-2010 წლებში. 2000 წლის მონაცემები იქნება საბაზისო. ისინი შეიძლება იქნას მიღებული როგორც ერთეული (შემდეგ ფარდობითი ღირებულებაგამოიხატება როგორც ფაქტორი), 100-ზე (პროცენტულად). შედარებული მნიშვნელობების განზომილებიდან გამომდინარე, არჩეულია ფარდობითი მნიშვნელობის გამოხატვის ყველაზე მოსახერხებელი, საჩვენებელი და ვიზუალური ფორმა.

თუ შედარებული მნიშვნელობა ბევრად აღემატება საფუძველს, მიღებული თანაფარდობა საუკეთესოდ გამოიხატება კოეფიციენტებით. მაგალითად, დანაშაული გარკვეული პერიოდის განმავლობაში (წლებში) გაიზარდა 2,6-ჯერ. დროში გამოხატვა ამ შემთხვევაში უფრო საჩვენებელი იქნება, ვიდრე პროცენტულად. პროცენტულად, ფარდობითი მნიშვნელობები გამოიხატება, როდესაც შედარების მნიშვნელობა დიდად არ განსხვავდება ბაზისგან.

სტატისტიკაში გამოყენებული ფარდობითი მნიშვნელობები, მათ შორის იურიდიული, არის განსხვავებული ტიპები. სამართლებრივ სტატისტიკაში გამოიყენება ფარდობითი მნიშვნელობების შემდეგი ტიპები:

1. მოსახლეობის სტრუქტურის დამახასიათებელი ურთიერთობები, ან განაწილების ურთიერთობები;

2. ნაწილის მიმართება მთლიანთან ან ინტენსივობის მიმართება;

3. მიმართებები, რომლებიც ახასიათებს დინამიკას;

4. ხარისხისა და შედარების ურთიერთობა.

ნათესავისიდიდეგანაწილება - ეს ნათესავი ღირებულება, გამოხატული in პროცენტი ინდივიდუალური ნაწილები აგრეგატები შეისწავლა ფენომენებს(დანაშაული, კრიმინალი, სამოქალაქო საქმეები, სასამართლო პროცესი, მიზეზები, პრევენციული ღონისძიებები და ა.შ.) რომ მათ გენერალი სულ, მიღებულია უკან 100% . ეს არის სტატისტიკაში გამოყენებული შედარებითი მონაცემების ყველაზე გავრცელებული (და უმარტივესი) სახეობა. ეს არის, მაგალითად, დანაშაულის სტრუქტურა (დანაშაულის სახეების მიხედვით), ნასამართლობის სტრუქტურა (დანაშაულის სახეობების მიხედვით, მსჯავრდებულთა ასაკის მიხედვით) და ა.შ.

სტატისტიკური ანალიზის აბსოლუტური მნიშვნელობა

დამოკიდებულებაინტენსივობა(ნაწილისა და მთლიანის თანაფარდობა) - განზოგადებული ფარდობითი მნიშვნელობა, რომელიც ასახავს კონკრეტული მახასიათებლის გავრცელებას დაკვირვებაში აგრეგატები.

იურიდიულ სტატისტიკაში გამოყენებული ინტენსივობის ყველაზე გავრცელებული მაჩვენებელი დანაშაულის ინტენსივობაა. . დანაშაულის ინტენსივობა, როგორც წესი, აისახება დანაშაულის მაჩვენებლით , იმათ. დანაშაულთა რაოდენობა 100 თუ 10 ათას მოსახლეზე.

KP \u003d (P * 100000) / ნ

სადაც P - აბსოლუტური რიცხვირეგისტრირებული დანაშაულები, H არის მოსახლეობის აბსოლუტური რიცხვი.

წინაპირობა, რომელიც განსაზღვრავს ამგვარი ინდიკატორების გამოთვლის შესაძლებლობას, როგორც ზემოთ აღინიშნა, არის ის, რომ გამოყენებული ყველა აბსოლუტური ინდიკატორი აღებული იყოს ერთ ტერიტორიაზე და დროის ერთ პერიოდში.

ურთიერთობები,დამახასიათებელიდინამიკა, წარმოდგენა განზოგადება ნათესავი რაოდენობით, აჩვენებს შეცვლა in დრო იმათ ან სხვა ინდიკატორები ლეგალური სტატისტიკა. დროის ინტერვალი ჩვეულებრივ აღებულია როგორც წელი.

1-ის ან 100%-ის ტოლი საფუძვლისთვის (ბაზისთვის) აღებულია ინფორმაცია გარკვეული წლის შესწავლილი მახასიათებლის შესახებ, რომელიც იყო შესწავლილი ფენომენისთვის დამახასიათებელი. საბაზისო წლის მონაცემები მოქმედებს როგორც ფიქსირებული ბაზა, რომელზედაც პროცენტულია შემდგომი წლების მაჩვენებლები.

სტატისტიკური ანალიზის ამოცანები ხშირად მოითხოვს ყოველწლიურ (ან სხვა პერიოდებს) შედარებებს, როდესაც ბაზა მიღებულია მონაცემები ყველას წინა წლის(თვე ან სხვა პერიოდი). ასეთ ბაზას ე.წ მობილური. ეს ჩვეულებრივ გამოიყენება დროის სერიების ანალიზში (დინამიკის სერია).

ურთიერთობებიხარისხიდაშედარებებისაშუალებას გაძლევთ შეადაროთ სხვადასხვა ინდიკატორი, რათა დაადგინოთ რომელი მნიშვნელობაა ბევრად უფრო დიდი ვიდრე მეორე, რამდენად განსხვავდება ერთი ფენომენი მეორისგან ან მსგავსია, რა არის საერთო და განსხვავებული დაკვირვებულ სტატისტიკურ პროცესებში და ა.შ.

ინდექსი არის შედარების სპეციალურად შექმნილი ფარდობითი ინდიკატორი (დროში, სივრცეში, პროგნოზთან შედარებით და ა. პირობები. ყველაზე გავრცელებული ინდექსები ეკონომიკურ სტატისტიკაშია, თუმცა ისინიც გარკვეულ როლს თამაშობენ სამართლებრივი ფენომენების ანალიზში.

ინდექსები შეუცვლელია იმ შემთხვევებში, როდესაც აუცილებელია განსხვავებული ინდიკატორების შედარება, რომელთა მარტივი შეჯამება შეუძლებელია. ამიტომ, ინდექსები ჩვეულებრივ განისაზღვრება როგორც რიცხვები-ინდიკატორებიამისთვისგაზომვებიშუადინამიკებიაგრეგატებიჰეტეროგენულიელემენტები.

სტატისტიკაში, ინდექსები ჩვეულებრივ აღინიშნება ასო I (i)-ით. Დიდი ასოან კაპიტალი - დამოკიდებულია იმაზე, საუბარია ინდივიდუალურ (კერძო) ინდექსზე თუ ზოგადია.

Ინდივიდუალურიინდექსებიი) ასახავს მიმდინარე პერიოდის ინდიკატორის შეფარდებას შედარებული პერიოდის შესაბამის მაჩვენებელთან.

კონსოლიდირებულიინდექსებიგამოიყენება კომპლექსური სოციალურ-ეკონომიკური ფენომენების კორელაციის ანალიზში და შედგება ორი ნაწილისაგან: ფაქტობრივი ინდექსირებული სიდიდე და თანაგაზომვა („წონა“).

2. საშუალო და მათი გამოყენება იურიდიულ სტატისტიკაში

აბსოლუტური და ფარდობითი ინდიკატორების დამუშავების შედეგია განაწილების სერიების აგება. მწკრივი განაწილება - ესუბრძანაonხარისხიანიანრაოდენობრივიგამორჩეულიგანაწილებაერთეულებიაგრეგატები. ამ სერიის ანალიზი არის ნებისმიერი სტატისტიკური ანალიზის საფუძველი, რაც არ უნდა რთული აღმოჩნდეს მომავალში.

სადისტრიბუციო სერია შეიძლება აშენდეს ხარისხობრივი ან რაოდენობრივი მახასიათებლების საფუძველზე. პირველ შემთხვევაში ე.წ ატრიბუტულიმეორეში - ვარიაციული. ამ შემთხვევაში რაოდენობრივ ნიშან-თვისებაში განსხვავებას უწოდებენ ვარიაციადა თავად ეს ნიშანი - ვარიანტი. იურიდიულ სტატისტიკას ყველაზე ხშირად სწორედ ვარიაციულ სერიებთან აქვს საქმე.

ვარიაციული სერია ყოველთვის შედგება ორი სვეტისაგან (გრაფიკი). ერთი მიუთითებს რაოდენობრივი ატრიბუტის მნიშვნელობას ზრდადი თანმიმდევრობით, რომელსაც, ფაქტობრივად, ეწოდება ოფციები, რომლებიც მითითებულია x. მეორე სვეტი (სვეტი) მიუთითებს ერთეულების რაოდენობაზე, რომლებიც დამახასიათებელია ამა თუ იმ ვარიანტისთვის. მათ სიხშირეებს უწოდებენ და აღინიშნება ლათინური ასოებით .

ცხრილი 2.1

ვარიანტი x

სიხშირე

სხვა მნიშვნელოვანი სტატისტიკური მაჩვენებლების, კერძოდ, ვარიაციის საშუალო და მაჩვენებლების გაანგარიშებისას ძალზე მნიშვნელოვანია ამა თუ იმ თვისების გამოვლინების სიხშირე.

ვარიაციის სერია, თავის მხრივ, შეიძლება იყოს დისკრეტულიან ინტერვალი. დისკრეტული სერიები, როგორც სახელი გულისხმობს, აგებულია დისკრეტულად განსხვავებული მახასიათებლების საფუძველზე, ხოლო ინტერვალური სერიები აგებულია უწყვეტი ვარიაციების საფუძველზე. ასე, მაგალითად, დამნაშავეთა განაწილება ასაკის მიხედვით შეიძლება იყოს დისკრეტული (18, 19,20 წლის და ა.შ.) ან უწყვეტი (18 წლამდე, 18-25 წლამდე, 25-30 წლამდე და ა.შ.). უფრო მეტიც, თავად ინტერვალური სერიები შეიძლება აშენდეს როგორც დისკრეტული, ასევე მიხედვით უწყვეტი პრინციპი. პირველ შემთხვევაში, მიმდებარე ინტერვალების საზღვრები არ მეორდება; ჩვენს მაგალითში ინტერვალები ასე გამოიყურება: 18 წლამდე, 18-25, 26-30, 31-35 და ა.შ. ასეთ სერიას ეძახიან უწყვეტიდისკრეტულირიგი. ინტერვალირიგითანუწყვეტივარიაციავარაუდობს წინა ინტერვალის ზედა ზღვრის დამთხვევას ქვედა ზღვარიშემდგომი.

პირველივე ინდიკატორი, რომელიც აღწერს ვარიაციულ სერიას საშუალო რაოდენობები. ისინი მნიშვნელოვან როლს ასრულებენ იურიდიულ სტატისტიკაში, რადგან მხოლოდ მათი დახმარებით არის შესაძლებელი პოპულაციების დახასიათება რაოდენობრივი ცვლადი მახასიათებლის მიხედვით, რომლითაც შეიძლება მათი შედარება. საშუალო სიდიდეების დახმარებით შესაძლებელია ჩვენთვის საინტერესო იურიდიულად მნიშვნელოვანი ფენომენების აგრეგატები გარკვეული რაოდენობრივი მახასიათებლების მიხედვით შევადაროთ და ამ შედარებიდან გამოვიტანოთ საჭირო დასკვნები.

საშუალორაოდენობებიასახავს ყველაზე გენერალი ტენდენცია (კანონზომიერება), შესწავლილი ფენომენების მთელი მასის თანდაყოლილი. ის იჩენს თავს ტიპიური რაოდენობრივი მახასიათებელი, ე.ი. ყველა ხელმისაწვდომი (ცვლადი) ინდიკატორის საშუალო მნიშვნელობაში.

სტატისტიკამ შეიმუშავა საშუალოების მრავალი სახეობა: არითმეტიკული, გეომეტრიული, კუბური, ჰარმონიული და ა.შ. თუმცა, ისინი პრაქტიკულად არ გამოიყენება იურიდიულ სტატისტიკაში, ამიტომ ჩვენ განვიხილავთ საშუალოდ მხოლოდ ორ ტიპს - საშუალო არითმეტიკული და გეომეტრიული საშუალო.

ყველაზე გავრცელებული და ცნობილი საშუალოა საშუალოარითმეტიკა. მის გამოსათვლელად გამოითვლება ინდიკატორების ჯამი და იყოფა საერთო რაოდენობაინდიკატორები. მაგალითად, 4 კაციანი ოჯახი შედგება 38 და 40 წლის მშობლებისგან და 7 და 10 წლის ორი ბავშვისგან. ვაჯამებთ ასაკს: 38 + 40 + 7 + 10 და მიღებული 95-ის ჯამი ვყოფთ 4-ზე. საშუალო ასაკიოჯახი - 23,75 წელი. ან გამოვთვალოთ გამომძიებლების საშუალო თვიური დატვირთვა, თუ 8 კაციანი განყოფილება აგვარებს თვეში 25 საქმეს. გაყავით 25 8-ზე და მიიღეთ თვეში 3125 საქმე თითო გამომძიებელზე.

იურიდიულ სტატისტიკაში საშუალო არითმეტიკული გამოიყენება თანამშრომლების (გამომძიებლები, პროკურორები, მოსამართლეები და ა.შ.) დატვირთვის გაანგარიშებისას, დანაშაულის აბსოლუტური ზრდის გაანგარიშებისას, ნიმუშის გამოთვლისას და ა.შ.

თუმცა, ზემოთ მოყვანილ მაგალითში, საშუალო თვიური დატვირთვა ერთ მკვლევარზე არასწორად იყო გამოთვლილი. ფაქტია, რომ მარტივი არითმეტიკული საშუალო არ ითვალისწინებს სიხშირეშესწავლილი თვისება. ჩვენს მაგალითში, მკვლევარის საშუალო თვიური დატვირთვა ისეთივე სწორი და ინფორმატიულია, როგორც ცნობილი ანეკდოტის "საშუალო ტემპერატურა საავადმყოფოში", რომელიც, როგორც მოგეხსენებათ, ოთახის ტემპერატურაა. არითმეტიკული საშუალოს გამოთვლისას შესწავლილი ნიშან-თვისების გამოვლინების სიხშირის გათვალისწინების მიზნით გამოიყენება შემდეგნაირად. საშუალოარითმეტიკაშეწონილიან საშუალო დისკრეტული ვარიაციული სერიებისთვის. (დისკრეტული ვარიაციული სერია - ნიშნის ცვლილების თანმიმდევრობა დისკრეტული (შეწყვეტილი) მაჩვენებლების მიხედვით).

საშუალო შეწონილი არითმეტიკული (შეწონილი საშუალო) არ აქვს ფუნდამენტური განსხვავება მარტივი საშუალო არითმეტიკისგან. მასში ერთი და იგივე მნიშვნელობის ჯამი იცვლება ამ მნიშვნელობის მის სიხშირეზე გამრავლებით, ე.ი. ამ შემთხვევაში, თითოეული მნიშვნელობა (ვარიანტი) შეწონილია გაჩენის სიხშირის მიხედვით.

ასე რომ, გამომძიებლების საშუალო დატვირთვის გამოთვლით, საქმეების რაოდენობა უნდა გავამრავლოთ იმ გამომძიებელთა რაოდენობაზე, რომლებმაც გამოიძიეს ზუსტად ასეთი შემთხვევები. ჩვეულებრივ მოსახერხებელია ასეთი გამოთვლების წარმოდგენა ცხრილების სახით:

ცხრილი 2.2

შემთხვევების რაოდენობა

(ვარიანტი X)

მკვლევართა რაოდენობა (სიხშირე )

ნამუშევრის ვარიანტი

სიხშირეებზე ( X)

2. გამოთვალეთ რეალური შეწონილი საშუალო ფორმულით:

სადაც x- სისხლის სამართლის საქმეების რაოდენობა და - გამომძიებელთა რაოდენობა.

ამრიგად, საშუალო შეწონილი არის არა 3.125, არამედ 4.375. თუ დაფიქრდებით, ასე უნდა იყოს: ყოველ ცალკეულ გამომძიებელზე დატვირთვა იზრდება იმის გამო, რომ ჩვენი ჰიპოთეტური განყოფილების ერთი გამომძიებელი უსაქმური აღმოჩნდა - ან, პირიქით, იკვლევდა განსაკუთრებით მნიშვნელოვან და რთული საქმე. მაგრამ სტატისტიკური კვლევის შედეგების ინტერპრეტაციის საკითხი განიხილება შემდეგი თემა. ზოგიერთ შემთხვევაში, კერძოდ, დაჯგუფებული სიხშირეების შემთხვევაში დისკრეტული განაწილება- საშუალოს გამოთვლა, ერთი შეხედვით, აშკარა არ არის. დავუშვათ, ჩვენ უნდა გამოვთვალოთ საშუალო არითმეტიკული ხულიგნობისთვის მსჯავრდებულთა ასაკის მიხედვით განაწილებისთვის. განაწილება ასე გამოიყურება:

ცხრილი 2.3

(ვარიანტი X)

მსჯავრდებულთა რაოდენობა (სიხშირე )

ინტერვალის შუა წერტილი

ნამუშევრის ვარიანტი

სიხშირეებზე ( X)

(21-18) /2+18=19,5

გარდა ამისა, საშუალო გამოითვლება ზოგადი წესის მიხედვით და არის 23.6 წელი ამ დისკრეტული სერიისთვის. იმ შემთხვევაში, თუ ე.წ. ღია რიგები, ანუ იმ სიტუაციებში, როდესაც უკიდურესი ინტერვალები განისაზღვრება "ნაკლები x" ან მეტი x", უკიდურესი ინტერვალების მნიშვნელობა დაყენებულია სხვა ინტერვალების მსგავსად.

3. დინამიკის სერია

სტატისტიკის მიერ შესწავლილი სოციალური ფენომენები არის ქ მუდმივი განვითარებადა შეცვლა. სოციალურ-სამართლებრივი ინდიკატორები შეიძლება წარმოდგენილი იყოს არა მხოლოდ სტატიკური ფორმით, რომელიც ასახავს გარკვეულ ფენომენს, არამედ როგორც დროსა და სივრცეში მიმდინარე პროცესს, ასევე შესასწავლი მახასიათებლების ურთიერთქმედების სახით. სხვა სიტყვებით რომ ვთქვათ, დროის სერიები აჩვენებს თვისების განვითარებას, ე.ი. მისი ცვლილება დროში, სივრცეში ან გარემო პირობებიდან გამომდინარე.

ეს სერია არის საშუალო მნიშვნელობების თანმიმდევრობა მითითებულ დროში (თითოეული კალენდარული წლისთვის).

სოციალური ფენომენების უფრო ღრმა შესწავლისთვის და მათი ანალიზისთვის საკმარისი არ არის დინამიკის სერიის დონეების მარტივი შედარება, საჭიროა გამოვთვალოთ დინამიკის სერიის მიღებული ინდიკატორები: აბსოლუტური ზრდა, ზრდის ტემპი, ზრდის ტემპი, საშუალო. ზრდისა და ზრდის ტემპები, აბსოლუტური შემცველობა ერთი პროცენტიანი ზრდა.

დინამიკის სერიის ინდიკატორების გაანგარიშება ხორციელდება მათი დონეების შედარების საფუძველზე. ამ შემთხვევაში, დინამიური სერიის დონეების შედარების ორი გზა არსებობს:

ძირითადი ინდიკატორები, როდესაც ყველა შემდგომი დონე შედარებულია ზოგიერთ საწყისთან, საფუძვლად აღებული;

ჯაჭვის ინდიკატორები, როდესაც დინამიკის სერიის ყოველი მომდევნო დონე შედარებულია წინასთან.

აბსოლუტური ზრდა გვიჩვენებს, რამდენი ერთეულია მიმდინარე პერიოდის დონე მეტი ან ნაკლები, ვიდრე საბაზისო ან წინა პერიოდის დონე კონკრეტული პერიოდისთვის.

აბსოლუტური ზრდა (P) გამოითვლება, როგორც სხვაობა შედარებულ დონეებს შორის.

ბაზის აბსოლუტური ზრდა:

პ ბ = მე - ბაზები . (f.1).

ჯაჭვის აბსოლუტური ზრდა:

= მე - მე -1 (f.2).

ზრდის ტემპი (Tr) აჩვენებს რამდენჯერ (რა პროცენტით) მიმდინარე პერიოდის დონე მეტი ან ნაკლებია საბაზისო ან წინა პერიოდის დონეზე:

ბაზის ზრდის ტემპი:

(f.3)

ჯაჭვის ზრდის ტემპი:

(f.4)

ზრდის ტემპი (Tpr) გვიჩვენებს, რამდენი პროცენტით არის მიმდინარე პერიოდის დონე მეტი ან ნაკლები, ვიდრე საბაზისო ან წინა პერიოდის დონე, აღებული შედარების საფუძვლად და გამოითვლება როგორც აბსოლუტური ზრდის თანაფარდობა აბსოლუტურ დონესთან. , საფუძვლად აღებული.

ზრდის ტემპი ასევე შეიძლება გამოითვალოს ზრდის ტემპიდან 100%-ის გამოკლებით.

ბაზის ზრდის ტემპი:

ან (f.5)

ჯაჭვის ზრდის ტემპი:

ან (f.6)

საშუალო ზრდის ტემპი გამოითვლება დინამიკის სერიის ზრდის ტემპების გეომეტრიული საშუალო ფორმულით:

(ფორმა 7)

სად არის საშუალო ზრდის ტემპი;

- ზრდის ტემპები გარკვეული პერიოდის განმავლობაში;

- ზრდის ტემპების რაოდენობა.

მსგავსი ამოცანები სამზე მეტი ფესვის მაჩვენებლით, როგორც წესი, წყდება ლოგარითმის გამოყენებით. ალგებრადან ცნობილია, რომ ფესვის ლოგარითმი ლოგარითმის ტოლიაფესვის მნიშვნელობა გაყოფილი ფესვის მაჩვენებელზე, და რომ ლოგარითმი რამდენიმე ფაქტორის ნამრავლის ჯამის ტოლიაამ ფაქტორების ლოგარითმები.

ამრიგად, საშუალო ზრდის ტემპი გამოითვლება ფესვის აღებით ხარისხი ინდივიდუალური ნამუშევრებიდან - ჯაჭვის ზრდის ტემპები. საშუალო ზრდის ტემპი არის სხვაობა საშუალო ზრდის ტემპსა და ერთ (), ან 100%-ს შორის, როდესაც ზრდის ტემპი გამოხატულია პროცენტულად:

ან

დინამიური სერიის არარსებობის შემთხვევაში შუალედური დონეებისაშუალო ზრდისა და ზრდის ტემპები განისაზღვრება შემდეგი ფორმულით:

(f.8)

სად არის დინამიური სერიის საბოლოო დონე;

- დინამიური სერიის საწყისი დონე;

- დონეების რაოდენობა (თარიღები).

აშკარაა, რომ ფორმულებით (f.7 და f.8) გამოთვლილ საშუალო ზრდის ტემპებისა და ზრდის მაჩვენებლებს აქვთ იგივე რიცხვითი მნიშვნელობები.

1%-იანი ზრდის აბსოლუტური შინაარსი გვიჩვენებს, თუ რა აბსოლუტური მნიშვნელობა შეიცავს 1%-იან ზრდას და გამოითვლება, როგორც აბსოლუტური ზრდის თანაფარდობა ზრდის ტემპთან.

აბსოლუტური შემცველობა 1%-იანი ზრდით:

ძირითადი: (f.9)

ჯაჭვი: (f.10)

გაანგარიშება და ანალიზი აბსოლუტური მნიშვნელობაყოველი პროცენტული ზრდა ხელს უწყობს შესასწავლი ფენომენის განვითარების ბუნების უფრო ღრმად გააზრებას. ჩვენი მაგალითის მონაცემები აჩვენებს, რომ მიუხედავად ზრდის ტემპების რყევებისა და ზრდის სრულდება ინდივიდუალური წლებიუცვლელი რჩება 1%-იანი ზრდის აბსოლუტური შინაარსის ძირითადი მაჩვენებლები, ხოლო ჯაჭვური მაჩვენებლები, რომლებიც ახასიათებს ყოველ მომდევნო წელს წინა წელთან შედარებით ერთი პროცენტის ზრდის აბსოლუტური მნიშვნელობის ცვლილებას, მუდმივად იზრდება.

დროის სერიების აგების, დამუშავებისა და ანალიზის დროს ხშირად ჩნდება დროის გარკვეული პერიოდის განმავლობაში შესწავლილი ფენომენების საშუალო დონის განსაზღვრის საჭიროება. საშუალო ქრონოლოგიური ინტერვალის სერია გამოითვლება თანაბარი ინტერვალებით საშუალო არითმეტიკული მარტივი ფორმულით, არათანაბარი ინტერვალებით - არითმეტიკული შეწონილი საშუალოთ:

სად - საშუალო დონეინტერვალის სერია;

- სერიის საწყისი დონეები;

- დონეების რაოდენობა.

დინამიკის მომენტური სერიებისთვის, იმ პირობით, რომ თარიღებს შორის დროის ინტერვალები თანაბარია, საშუალო დონე გამოითვლება ქრონოლოგიური საშუალო ფორმულის გამოყენებით:

(f.11)

სად არის საშუალო ქრონოლოგიური მნიშვნელობა;

1 ,., - სერიის აბსოლუტური დონე;

- დინამიკის სერიის აბსოლუტური დონეების რაოდენობა.

დინამიკის მომენტების სერიის დონეების საშუალო ქრონოლოგიური მაჩვენებელი უდრის ამ სერიის მაჩვენებლების ჯამს, გაყოფილი ინდიკატორების რაოდენობაზე ერთის გარეშე; ამ შემთხვევაში, საწყისი და საბოლოო დონეები უნდა იქნას მიღებული ნახევარში, რადგან თარიღების (მომენტების) რაოდენობა ჩვეულებრივ ერთით მეტია პერიოდების რაოდენობაზე.

საწყისი მონაცემების პრეზენტაციის შინაარსისა და ფორმის მიხედვით (დინამიკის ინტერვალის ან მომენტის სერია, ტოლი ან უდროო დროის ინტერვალები) გამოთვლა სხვადასხვა სოციალური მაჩვენებლებიმაგალითად, დანაშაულთა და სამართალდარღვევათა საშუალო წლიური რაოდენობა (ტიპების მიხედვით), საბრუნავი კაპიტალის ნაშთების საშუალო ზომა, დამნაშავეთა საშუალო რაოდენობა და ა.შ. გამოიყენეთ შესაბამისი ანალიტიკური გამონათქვამები.

4. სტატისტიკური მეთოდებიურთიერთკავშირები

წინა კითხვებში განვიხილეთ, თუ შეიძლება ასე ვთქვა, „ერთგანზომილებიანი“ განაწილების - ვარიაციული სერიების ანალიზი. ეს არის ძალიან მნიშვნელოვანი, მაგრამ შორს არის სტატისტიკური ანალიზის ერთადერთი ტიპი. ვარიაციული სერიების ანალიზი არის სტატისტიკური ანალიზის უფრო "მოწინავე" ტიპების საფუძველი, უპირველეს ყოვლისა სწავლაურთიერთკავშირები. ასეთი კვლევის შედეგად ვლინდება მიზეზ-შედეგობრივი კავშირი მოვლენებს შორის, რაც შესაძლებელს ხდის განისაზღვროს ნიშნების რომელი ცვლილებები გავლენას ახდენს შესწავლილი ფენომენებისა და პროცესების ვარიაციებზე. ამავდროულად, ნიშნებს, რომლებიც იწვევენ სხვების ცვლილებას, ეწოდება ფაქტორული (ფაქტორები), ხოლო ნიშნებს, რომლებიც იცვლება მათი გავლენით - ეფექტური.

სტატისტიკურ მეცნიერებაში არსებობს ორი სახის ურთიერთობა სხვადასხვა ნიშნებიხოლო მათი ინფორმაცია - ფუნქციური კავშირი (მყარად განსაზღვრული) და სტატისტიკური (სტოქასტური).

ამისთვის ფუნქციონალურიკავშირებიდამახასიათებელია სრული კორესპონდენცია ფაქტორის ატრიბუტის ცვლილებასა და ეფექტური მნიშვნელობის ცვლილებას შორის. ეს ურთიერთობა თანაბრად ვლინდება ნებისმიერი მოსახლეობის ყველა ერთეულში. უმარტივესი მაგალითი: ტემპერატურის ზრდა აისახება თერმომეტრში ვერცხლისწყლის მოცულობაში. ამ შემთხვევაში გარემოს ტემპერატურა მოქმედებს როგორც ფაქტორი, ხოლო ვერცხლისწყლის მოცულობა - როგორც ეფექტური თვისება.

ფუნქციური ურთიერთობები დამახასიათებელია ისეთი მეცნიერებების მიერ შესწავლილი ფენომენებისთვის, როგორიცაა ქიმია, ფიზიკა, მექანიკა, რომლებშიც შესაძლებელია „სუფთა“ ექსპერიმენტების დაყენება, რომელშიც აღმოფხვრილია გარე ფაქტორების გავლენა. ფაქტია რომ ფუნქციური კავშირიორს შორის შესაძლებელია მხოლოდ იმ შემთხვევაში, თუ მეორე მნიშვნელობა (შედეგობრივი ატრიბუტი) დამოკიდებულია მხოლოდ და ექსკლუზიურადპირველიდან. საჯარო ღონისძიებებში ეს ძალზე იშვიათია.

სოციალურ-სამართლებრივი პროცესები, რომლებიც ერთდროული ზემოქმედების შედეგია დიდი რიცხვიფაქტორები აღწერილია სტატისტიკური ურთიერთობების, ანუ ურთიერთობების საშუალებით სტოქასტურად (შემთხვევით) განმსაზღვრელიროდესაც ერთი ცვლადის სხვადასხვა მნიშვნელობები შეესაბამება მეორე ცვლადის სხვადასხვა მნიშვნელობებს.

სტოქასტური დამოკიდებულების ყველაზე მნიშვნელოვანი (და გავრცელებული) შემთხვევაა კორელაციადამოკიდებულება. ასეთი დამოკიდებულებით, მიზეზი განსაზღვრავს ეფექტს არა ცალსახად, არამედ მხოლოდ გარკვეული ალბათობით. ასეთი ურთიერთობების იდენტიფიცირებას ეთმობა სტატისტიკური ანალიზის ცალკე სახეობა - კორელაციური ანალიზი.

მთავარი დავალებაკორელაციური ანალიზი - მკაცრად მათემატიკური მეთოდების საფუძველზე დადგინდეს შესწავლილ მახასიათებლებს შორის არსებული ურთიერთობის რაოდენობრივი გამოხატულება. არსებობს რამდენიმე მიდგომა იმის შესახებ, თუ როგორ არის ზუსტად გამოთვლილი კორელაცია და, შესაბამისად, რამდენიმე სახის კორელაციის კოეფიციენტი: შემთხვევითობის კოეფიციენტი A.A. ჩუპროვის (ხარისხობრივ მახასიათებლებს შორის კავშირის გასაზომად), კ. პირსონის ასოციაციის კოეფიციენტი, ასევე სპირმანისა და კენდალის რანგის კორელაციის კოეფიციენტები. ზოგადად, ასეთი კოეფიციენტები აჩვენებს ალბათობას, რომლითაც ჩნდება შესწავლილი ურთიერთობები. შესაბამისად, რაც უფრო მაღალია კოეფიციენტი, მით უფრო გამოხატულია კავშირი მახასიათებლებს შორის.

შესწავლილ ფაქტორებს შორის შეიძლება არსებობდეს როგორც პირდაპირი, ასევე ინვერსიული კორელაციები. პირდაპირკორელაციადამოკიდებულებაშეინიშნება იმ შემთხვევებში, როდესაც ფაქტორის მნიშვნელობების ცვლილება შეესაბამება მიღებული ატრიბუტის მნიშვნელობის იგივე ცვლილებებს, ანუ როდესაც ფაქტორის ატრიბუტის მნიშვნელობა იზრდება, ეფექტური ატრიბუტის მნიშვნელობაც იზრდება და პირიქით. პირიქით. მაგალითად, არსებობს პირდაპირი კორელაცია კრიმინოგენურ ფაქტორებსა და დანაშაულს შორის ("+" ნიშნით). თუ ერთი ატრიბუტის მნიშვნელობების ზრდა იწვევს მეორის მნიშვნელობების საპირისპირო ცვლილებებს, მაშინ ასეთი ურთიერთობა ე.წ. საპირისპირო. მაგალითად, რაც უფრო მაღალია სოციალური კონტროლი საზოგადოებაში, მით უფრო დაბალია დანაშაულის მაჩვენებელი (კავშირი „-“ ნიშანთან).

პირდაპირი და უკუკავშირი შეიძლება იყოს სწორი და მრუდი.

სწორხაზოვანი (წრფივი) ურთიერთობები ჩნდება, როდესაც ატრიბუტი-ფაქტორის მნიშვნელობების მატებასთან ერთად ხდება ატრიბუტი-შედეგის მნიშვნელობის ზრდა (პირდაპირი) ან შემცირება (უკუ). მათემატიკურად, ასეთი ურთიერთობა გამოიხატება რეგრესიის განტოლებით: ზე = + X, სადაც ზე - ნიშანი-შედეგი; და - შესაბამისი შეერთების კოეფიციენტები; X - ნიშნის ფაქტორი.

მრუდი კავშირები განსხვავებულია. ფაქტორის ატრიბუტის მნიშვნელობის ზრდა არათანაბრად მოქმედებს მიღებული ატრიბუტის მნიშვნელობაზე. თავდაპირველად, ეს ურთიერთობა შეიძლება იყოს პირდაპირი, შემდეგ კი პირიქით. ცნობილი მაგალითია დანაშაულთა ურთიერთობა დამნაშავეთა ასაკთან. ჯერ ერთი, პირთა დანაშაულებრივი აქტივობა იზრდება დამნაშავეთა ასაკის მატებასთან (დაახლოებით 30 წლამდე) პირდაპირპროპორციულად, შემდეგ კი ასაკის მატებასთან ერთად მცირდება კრიმინალური აქტივობა. უფრო მეტიც, დამნაშავეთა განაწილების მრუდის პიკი ასაკის მიხედვით გადაადგილებულია საშუალოდან მარცხნივ (უფრო ახალგაზრდა ასაკისკენ) და ასიმეტრიულია.

კორელაციური პირდაპირი ბმულები შეიძლება იყოს ერთიშესახებფაქტორული, როდესაც ერთ ნიშან-ფაქტორსა და ერთ ნიშან-შედეგს შორის ურთიერთობას იკვლევენ (წყვილთა კორელაცია). ისინიც შეიძლება იყვნენ მრავალფაქტორიანი,როდესაც შესწავლილია მრავალი ურთიერთმოქმედი ნიშან-ფაქტორის გავლენა ნიშან-შედეგზე (მრავალჯერადი კორელაცია).

მაგრამ, რაც არ უნდა იყოს გამოყენებული კორელაციის კოეფიციენტებიდან, როგორი კორელაციაც არ უნდა გამოიკვლიოს, მხოლოდ სტატისტიკურ ინდიკატორებზე დაფუძნებული კავშირის დადგენა შეუძლებელია ნიშნებს შორის. ინდიკატორების საწყისი ანალიზი ყოველთვის არის ანალიზი ხარისხობრივი, რომლის დროსაც ხდება ფენომენის სოციალურ-სამართლებრივი ხასიათის შესწავლა და გაგება. ამ შემთხვევაში გამოიყენება ის მეცნიერული მეთოდები და მიდგომები, რომლებიც დამახასიათებელია მეცნიერების დარგისთვის, რომელიც სწავლობს ამ მოვლენას (სოციოლოგია, სამართალი, ფსიქოლოგია და ა.შ.). შემდეგ, დაჯგუფებებისა და საშუალოების ანალიზი საშუალებას გაძლევთ წამოაყენოთ ჰიპოთეზები, შექმნათ მოდელები, განსაზღვროთ კავშირის ტიპი და დამოკიდებულება. მხოლოდ ამის შემდეგ განისაზღვრება დამოკიდებულების რაოდენობრივი მახასიათებელი - ფაქტობრივად, კორელაციის კოეფიციენტი.

ლიტერატურა

1. ავანესოვი გ.ა. კრიმინოლოგიური პროგნოზირების საფუძვლები. სახელმძღვანელო. მოსკოვი: სსრკ შინაგან საქმეთა სამინისტროს უმაღლესი სკოლა, 1970 წ.

2. ავრუტინ კ.ე., გილინსკი ია.ი. დანაშაულის კრიმინოლოგიური ანალიზი რეგიონში: მეთოდოლოგია, ტექნიკა, ტექნიკა. ლ., 1991 წ.

3. Adamov E. et al. ფირმების ეკონომიკა და სტატისტიკა: სახელმძღვანელო / რედ. ს.დ. ილიენკოვა. მ.: ფინანსები და სტატისტიკა, 2008 წ.

4. ბალაკინა ნ.ნ. სტატისტიკა: პროკ. - მეთოდი. კომპლექსი. ხაბაროვსკი: IVESEP, ფილიალი ხაბაროვსკში, 2008 წ.

5. ბლუვშტეინ იუ.დ., ვოლკოვი გ.ი. დროის სერიებიდანაშაული: სასწავლო გზამკვლევი. მინსკი, 1984 წ.

6. ბოროვიკოვი ვ.პ., ბოროვიკოვი ი.პ. STATISTICA - სტატისტიკური ანალიზი და მონაცემთა დამუშავება ქ Windows გარემო. მ.: საინფორმაციო და გამომცემლობა "ფილინი", 1997 წ.

7. ბოროდინი ს.ვ. დანაშაულის წინააღმდეგ ბრძოლა: თეორიული მოდელიყოვლისმომცველი პროგრამა. მოსკოვი: ნაუკა, 1990 წ.

8. სტატისტიკის კითხვები // რუსეთის ფედერაციის სტატისტიკის სახელმწიფო კომიტეტის ყოველთვიური სამეცნიერო და საინფორმაციო ჟურნალი მ., 2002-2009 წ.

9. გუსაროვი ვ.მ. სტატისტიკა: პროკ. შემწეობა უნივერსიტეტებისთვის. M.: UNITI-DANA, 2009 წ.

10. დობრინინა ნ.ვ., ნიმენია ი.ნ. სტატისტიკა: პროკ. - მეთოდი. შემწეობა. სანქტ-პეტერბურგი: SPbGIEU, 2009 წ.

11. ელისეევა ი.ი., იუზბაშევი მ.მ. ზოგადი თეორიასტატისტიკა: სახელმძღვანელო უნივერსიტეტებისთვის / რედ.I. I. Eliseeva. 4th ed. მ.: ფინანსები და სტატისტიკა, 1999 წ.

12. ელისეევა ი.ი., იუზბაშევი მ.მ. სტატისტიკის ზოგადი თეორია: სახელმძღვანელო. - მ.: ფინანსები და სტატისტიკა, 1995 წ.

13. Eremina T., Matyatina V., Plushevskaya Yu. რუსეთის ეკონომიკის სექტორების განვითარების პრობლემები // ეკონომიკის კითხვები. 2009. No7.

14. ეფიმოვა მ.რ., განჩენკო ო.ი., პეტროვა ე.ვ. სემინარი სტატისტიკის ზოგად თეორიაზე: პროკ. შემწეობა, მე-2 გამოცემა, შესწორებული. და დამატებითი მ.: ფინანსები და სტატისტიკა, 2009 წ.

15. ეფიმოვა მ.რ., პეტროვა ე.ვ., რუმიანცევი ვ.ნ. სტატისტიკის ზოგადი თეორია: სახელმძღვანელო. - მ.: INFRA-M, 1998 წ.

16. კირილოვი ლ.ა. კრიმინოლოგიური შესწავლა და დანაშაულის პრევენცია შინაგან საქმეთა ორგანოების მიერ მ., 1992 წ.

17. კოსოფლეჩევი ნ.პ., კრიმინოლოგიური კვლევის მეთოდები. მ., 1984 წ.

18. ლი დ.ა. დანაშაული რუსეთში: სისტემის ანალიზი. მ., 1997 წ.

19. ლი დ.ა. კრიმინალური სტატისტიკური აღრიცხვა: სტრუქტურული და ფუნქციური ნიმუშები. მ .: საინფორმაციო და საგამომცემლო სააგენტო "რუსული სამყარო", 1998 წ.

20. მაკაროვა ნ.ვ., ტროფიმეც ვ.ია. სტატისტიკა Excel-ში: Proc. შემწეობა. მ.: ფინანსები და სტატისტიკა, 2009 წ.

21. ნესტეროვი ლ.ი. ახალი ტენდენციები ეროვნული სიმდიდრის სტატისტიკაში // სტატისტიკის კითხვები. 2008. No11.

22. პეტროვა ე.ვ. და სხვა სემინარი ტრანსპორტის სტატისტიკაზე: პროკ. შემწეობა. მ.: ფინანსები და სტატისტიკა, 2008 წ.

23. დანაშაული რუსეთში ოთხმოცდაათიან წლებში და კანონიერების ზოგიერთი ასპექტი და მასთან ბრძოლა. მ., 1995 წ.

24. დანაშაული, სტატისტიკა, სამართალი // რედ. პროფ. ა.ი. ვალი. მოსკოვი: კრიმინოლოგიური ასოციაცია, 1997 წ.

25. როსტოვი კ.ტ. დანაშაული რუსეთის რეგიონებში (სოციალური და კრიმინოლოგიური ანალიზი). სანქტ-პეტერბურგი: რუსეთის შინაგან საქმეთა სამინისტროს სანქტ-პეტერბურგის აკადემია, 1998 წ.

26. ინსტრუქციები აღწერის პირისთვის 2002 წლის სრულიად რუსეთის მოსახლეობის აღწერის ჩატარებისა და აღწერის დოკუმენტების შევსების პროცედურის შესახებ. M.: PIK "ოფსეტი", 2003 წ.

27. სავიუკ ლ.კ. იურიდიული სტატისტიკა: სახელმძღვანელო. მ.: იურისტი, 1999 წ.

28. სალინ ვ.ნ., შპაკოვსკაია ე.პ. სოციალურ-ეკონომიკური სტატისტიკა: სახელმძღვანელო უნივერსიტეტებისთვის. მოსკოვი: გარდანიკის იურისტი, 2008 წ.

29. Sidenko A.V., Popov G.Yu., Matveeva V.M. სტატისტიკა: სახელმძღვანელო. მოსკოვი: ბიზნესი და მომსახურება, 2008 წ.

30. სამართალდარღვევათა სოციალური პრევენცია: რჩევა, რეკომენდაციები // რედ. დიახ. ქერიმოვი. მ., 1989 წ.

31. სოციალური სტატისტიკა: სახელმძღვანელო უნივერსიტეტებისთვის // რედ. ი.ი. ელისეევა. მე-3 გამოცემა. მ.: ფინანსები და სტატისტიკა, 2009 წ.

მასპინძლობს Allbest.ru-ზე

მსგავსი დოკუმენტები

    სტატისტიკური ანალიზის ძირითადი მეთოდების განხილვა. კუნგურსკის მუნიციპალური რაიონის შესწავლა. გამოთვლების განხორციელება წელიწდეულის მაჩვენებლების მიხედვით. აპლიკაციის შედეგების საფუძველზე ტერიტორიის დემოგრაფიისა და სოციალურ-ეკონომიკური განვითარების ანალიზი.

    საკურსო ნაშრომი, დამატებულია 24.06.2015

    Საშუალო ღირებულება - თავისუფალი მახასიათებელიპროცესის კანონზომიერებებს იმ პირობებში, რომელშიც ის მიმდინარეობს. საშუალო მნიშვნელობების გამოთვლის ფორმები და მეთოდები. საშუალოების გამოყენება პრაქტიკაში: დიფერენციაციის გამოთვლა ხელფასებიეკონომიკის სექტორების მიხედვით.

    ნაშრომი, დამატებულია 12/04/2007

    განქორწინების ანალიზის სტატისტიკური მეთოდები. განქორწინებების სტატისტიკური ანალიზი ამურის რეგიონში. განქორწინებების დინამიკისა და სტრუქტურის ანალიზი. ამურის რეგიონის ქალაქებისა და ოლქების დაჯგუფება განქორწინებების რაოდენობის მიხედვით წელიწადში. საშუალო მნიშვნელობების გაანგარიშება და ვარიაციის ინდიკატორები.

    საკურსო ნაშრომი, დამატებულია 04/12/2014

    საბინაო უზრუნველყოფის სტატისტიკური ანალიზის ასპექტები. მოსახლეობის საბინაო უზრუნველყოფის ანალიზის სტატისტიკური მეთოდების გამოყენება. რაიონების მოსახლეობის ჰომოგენურობის ანალიზი დემოგრაფიული დატვირთვის ფაქტორის მიხედვით. კორელაცია-რეგრესიული ანალიზი.

    საკურსო ნაშრომი, დამატებულია 18/01/2009

    ორგანიზაცია სახელმწიფო სტატისტიკარუსეთში. მოთხოვნები შეგროვებული მონაცემებისთვის. სტატისტიკური დაკვირვების ფორმები, სახეები და მეთოდები. სტატისტიკური დაკვირვების მომზადება. სტატისტიკური დაკვირვების შეცდომები. სტატისტიკის მონიტორინგის მეთოდები.

    რეზიუმე, დამატებულია 02.12.2007წ

    სისხლის სამართლის სტატისტიკის მონიტორინგის პროგრამის შემუშავება, მისი ძირითადი ეტაპები და მოთხოვნები, განხორციელების მეთოდები და პროცედურები. საკვლევ ტერიტორიაზე დანაშაულის მდგომარეობის დადგენა. სტატისტიკური დაკვირვების შედეგების რეგისტრაციის წესები.

    ტესტი, დამატებულია 05/18/2010

    სტატისტიკური დოკუმენტაციის კლასიფიკაცია. დოკუმენტების სახეები: წერილობითი, იკონოგრაფიული, სტატისტიკური და ფონეტიკური. მასალების ანალიზის მეთოდები და გზები: არაფორმალიზებული (ტრადიციული) და ფორმალიზებული. კონტენტ ანალიზის განხორციელების პროცედურა.

    პრეზენტაცია, დამატებულია 16/02/2014

    შინაარსი საშუალო ზომის. საშუალოების მეთოდი სოციალური ფენომენების შესწავლისას. სოციალური ფენომენების შესწავლისას საშუალოების მეთოდის გამოყენების აქტუალობა უზრუნველყოფილია სინგულარულიდან ზოგადზე გადასვლის შესაძლებლობით, შემთხვევითობიდან რეგულარულზე.

    საკურსო ნაშრომი, დამატებულია 01/13/2009

    სტატისტიკური დაკვირვების ცნება. მართკუთხა და მრუდის ანალიზი კორელაციები. სტატისტიკური დაკვირვების ფორმულებისა და მნიშვნელობების გაცნობა. ინდექსების ურთიერთკავშირის გამოთვლების ანალიზი, ჰისტოგრამის აგება, განაწილების სერიის ელემენტები.

    ტესტი, დამატებულია 03/27/2012

    სტატისტიკური ანალიზის ძირითადი მაჩვენებლების მახასიათებლები სოციალური კონდიცირება საზოგადოებრივი ჯანდაცვის in რუსეთის ფედერაცია. ჯანმრთელობის შეფასების დონეები სოციალური მედიცინის თვალსაზრისით. მოსახლეობის ბავშვთა ნაწილის კლასიფიკაცია ჯანმრთელობის ჯგუფების მიხედვით.

საკმარისად დეტალურად საშინაო ლიტერატურა. რუსული საწარმოების პრაქტიკაში კი მხოლოდ ზოგიერთი მათგანი გამოიყენება. განვიხილოთ შემდეგი მეთოდები სტატისტიკური დამუშავება.

Ზოგადი ინფორმაცია

შიდა საწარმოების პრაქტიკაში ის უპირატესად გავრცელებულია სტატისტიკური კონტროლის მეთოდები. თუ ვსაუბრობთ ტექნოლოგიური პროცესის რეგულირებაზე, მაშინ ის ძალიან იშვიათად აღინიშნება. სტატისტიკური მეთოდების გამოყენებაითვალისწინებს, რომ საწარმოში იქმნება შესაბამისი კვალიფიკაციის მქონე სპეციალისტთა ჯგუფი.

მნიშვნელობა

ISO სერიის მიხედვით. 9000, მომწოდებელმა უნდა განსაზღვროს სტატისტიკური მეთოდების საჭიროება, რომლებიც გამოიყენება შესაძლებლობების შემუშავების, რეგულირებისა და ტესტირების დროს. წარმოების პროცესიდა პროდუქტის მახასიათებლები. გამოყენებული მეთოდები ეფუძნება ალბათობის თეორიას და მათემატიკურ გამოთვლებს. მონაცემთა ანალიზის სტატისტიკური მეთოდებიშეიძლება განხორციელდეს პროდუქტის სასიცოცხლო ციკლის ნებისმიერ ეტაპზე. ისინი უზრუნველყოფენ პროდუქციის ჰეტეროგენურობის ხარისხის ან მათი თვისებების ცვალებადობის შეფასებას და ანგარიშს დადგენილ ნომინალებთან ან საჭირო მნიშვნელობებთან, აგრეთვე მისი შექმნის პროცესის ცვალებადობას. სტატისტიკური მეთოდებიამეთოდები, რომლითაც შეგიძლიათ მოცემული სიზუსტედა საიმედოობა განსჯის იმ ფენომენების მდგომარეობის შესახებ, რომლებიც შესასწავლია. ისინი საშუალებას გაძლევთ იწინასწარმეტყველოთ გარკვეული პრობლემები, განავითაროთ ოპტიმალური გადაწყვეტილებები შესწავლილი ფაქტობრივი ინფორმაციის, ტენდენციებისა და შაბლონების საფუძველზე.

გამოყენების ინსტრუქცია

ძირითადი სფეროები, რომლებშიც გავრცელებულია სტატისტიკური მეთოდებია:


განვითარებული ქვეყნების პრაქტიკა

სტატისტიკური მეთოდებიაბაზა, რომელიც უზრუნველყოფს მაღალი სამომხმარებლო მახასიათებლების მქონე პროდუქციის შექმნას. ეს ტექნიკა ფართოდ გამოიყენება ინდუსტრიულ ქვეყნებში. სტატისტიკური მეთოდები, ფაქტობრივად, არის გარანტია იმისა, რომ მომხმარებლები იღებენ პროდუქტს, რომელიც აკმაყოფილებს დადგენილ მოთხოვნებს. მათი გამოყენების ეფექტი დადასტურებულია პრაქტიკით. სამრეწველო საწარმოებიᲘაპონია. სწორედ მათ შეიტანეს წვლილი ამ ქვეყანაში წარმოების უმაღლესი დონის მიღწევაში. რამდენად ეფექტურია ეს ტექნიკა უცხო ქვეყნების მრავალწლიანი გამოცდილება. კერძოდ, ცნობილია, რომ Hewlelt Packard-მა, სტატისტიკური მეთოდების გამოყენებით, ერთ-ერთ შემთხვევაში შეძლო თვეში ქორწინებების რაოდენობა 9000-დან 45 ერთეულამდე დაეყვანა.

განხორციელების სირთულეები

შიდა პრაქტიკაში, არსებობს მთელი რიგი დაბრკოლებები, რომლებიც არ იძლევა გამოყენების საშუალებას კვლევის სტატისტიკური მეთოდებიინდიკატორები. სირთულეები წარმოიქმნება იმის გამო, რომ:


პროგრამის შემუშავება

უნდა ითქვას, რომ ხარისხის სფეროში გარკვეული სტატისტიკური მეთოდების საჭიროების დადგენა, შერჩევა, კონკრეტული ტექნიკის დაუფლება საკმაოდ რთული და ხანგრძლივი სამუშაოა ნებისმიერი შიდა საწარმოსთვის. მისი ეფექტური განხორციელებისთვის მიზანშეწონილია სპეციალური გრძელვადიანი პროგრამის შემუშავება. მან უნდა უზრუნველყოს სამსახურის ფორმირება, რომლის ამოცანები მოიცავს ორგანიზაციას და მეთოდოლოგიური გზამკვლევისტატისტიკური მეთოდების გამოყენება. პროგრამის ფარგლებში აუცილებელია შესაბამისი ტექნიკური საშუალებებით აღჭურვა, სპეციალისტების მომზადება და საწარმოო ამოცანების შემადგენლობის განსაზღვრა, რომელიც უნდა გადაწყდეს შერჩეული მეთოდებით. დაუფლება რეკომენდებულია უმარტივესი მიდგომების გამოყენებით დასაწყებად. მაგალითად, შეგიძლიათ გამოიყენოთ ცნობილი ელემენტარული წარმოება. შემდგომში მიზანშეწონილია სხვა მეთოდებზე გადასვლა. მაგალითად, ეს შეიძლება იყოს დისპერსიის ანალიზი, ინფორმაციის შერჩევითი დამუშავება, პროცესების რეგულირება, ფაქტორული კვლევისა და ექსპერიმენტების დაგეგმვა და ა.შ.

კლასიფიკაცია

ეკონომიკური ანალიზის სტატისტიკური მეთოდები მოიცავსსხვადასხვა ხრიკები. ზედმეტია იმის თქმა, რომ საკმაოდ ბევრი მათგანია. თუმცა, იაპონიაში ხარისხის მენეჯმენტის დარგის წამყვანი ექსპერტი კ.იშიკავა გვირჩევს შვიდი ძირითადი მეთოდის გამოყენებას:

  1. პარეტოს სქემები.
  2. ინფორმაციის დაჯგუფება საერთო მახასიათებლების მიხედვით.
  3. საკონტროლო ბარათები.
  4. მიზეზებისა და შედეგების დიაგრამები.
  5. ჰისტოგრამები.
  6. საკონტროლო ფურცლები.
  7. Scatter სქემები.

მენეჯმენტის სფეროში საკუთარ გამოცდილებაზე დაყრდნობით, იშიკავა ამტკიცებს, რომ საწარმოში არსებული ყველა საკითხისა და პრობლემის 95% შეიძლება გადაწყდეს ამ შვიდი მიდგომის გამოყენებით.

პარეტოს სქემა

ეს ემყარება გარკვეულ თანაფარდობას. მას ეწოდა "პარეტოს პრინციპი". მისი თქმით, გამომწვევი მიზეზების 20%-დან, შედეგების 80% ჩნდება. ნათლად და გასაგებად აჩვენებს თითოეული გარემოების შედარებით გავლენას საერთო პრობლემაკლებადობით. ეს გავლენა შეიძლება გამოკვლეული იყოს თითოეული მიზეზით გამოწვეული დანაკარგების, დეფექტების რაოდენობაზე. ფარდობითი გავლენა ილუსტრირებულია ზოლებით, ფაქტორების კუმულაციური გავლენა კუმულაციური სწორი ხაზით.

მიზეზისა და ეფექტის დიაგრამა

მასზე შესასწავლი პრობლემა პირობითად არის გამოსახული ჰორიზონტალური სწორი ისრის სახით, ხოლო პირობები და ფაქტორები, რომლებიც ირიბად ან პირდაპირ გავლენას ახდენენ მასზე, ირიბი ისრების სახით. მშენებლობისას მხედველობაში უნდა იქნას მიღებული თუნდაც ერთი შეხედვით უმნიშვნელო გარემოებები. ეს გამოწვეულია იმით, რომ პრაქტიკაში საკმაოდ ხშირია შემთხვევები, როდესაც პრობლემის გადაწყვეტა უზრუნველყოფილია რამდენიმე ერთი შეხედვით უმნიშვნელო ფაქტორის გამორიცხვით. მიზეზები, რომლებიც გავლენას ახდენენ ძირითად გარემოებებზე (პირველი და შემდგომი ბრძანებების) გამოსახულია დიაგრამაზე ჰორიზონტალური მოკლე ისრებით. დეტალური დიაგრამა იქნება თევზის ჩონჩხის სახით.

ინფორმაციის დაჯგუფება

ეს ეკონომიკურ-სტატისტიკური მეთოდიგამოიყენება ინდიკატორების ნაკრების ორგანიზებისთვის, რომლებიც მიიღეს ობიექტის ერთი ან რამდენიმე პარამეტრის შეფასებით და გაზომვით. როგორც წესი, ასეთი ინფორმაცია წარმოდგენილია მნიშვნელობების დაუგეგმავი თანმიმდევრობის სახით. ეს შეიძლება იყოს სამუშაო ნაწილის ხაზოვანი ზომები, დნობის წერტილი, მასალის სიმტკიცე, დეფექტების რაოდენობა და ა.შ. ასეთი სისტემის საფუძველზე ძნელია დასკვნის გაკეთება პროდუქტის თვისებებზე ან მისი შექმნის პროცესებზე. შეკვეთა ხდება გამოყენებით ხაზის დიაგრამები. ისინი ნათლად აჩვენებენ ცვლილებებს დაკვირვებულ პარამეტრებში გარკვეული პერიოდის განმავლობაში.

საკონტროლო ფურცელი

როგორც წესი, იგი წარმოდგენილია სიხშირის განაწილების ცხრილის სახით, ობიექტის პარამეტრების გაზომილი მნიშვნელობების შესაბამის ინტერვალებში. საკონტროლო სიები შედგენილია კვლევის მიზნიდან გამომდინარე. ინდიკატორის მნიშვნელობების დიაპაზონი დაყოფილია თანაბარ ინტერვალებად. მათი რიცხვი ჩვეულებრივ არჩეულია მიღებული გაზომვების რაოდენობის კვადრატული ფესვის ტოლი. ფორმა უნდა იყოს მარტივი, რათა აღმოიფხვრას პრობლემები შევსების, წაკითხვის, შემოწმებისას.

ზოლიანი დიაგრამა

იგი წარმოდგენილია საფეხურიანი მრავალკუთხედის სახით. იგი ნათლად ასახავს გაზომვის ინდიკატორების განაწილებას. Დიაპაზონი დააყენეთ ღირებულებებიდაყოფილია თანაბარ ინტერვალებად, რომლებიც განლაგებულია x ღერძის გასწვრივ. ყოველი ინტერვალისთვის შენდება მართკუთხედი. მისი სიმაღლე უდრის მოცემულ ინტერვალში მნიშვნელობის გაჩენის სიხშირეს.

Scatterplots

ისინი გამოიყენება ორს შორის ურთიერთობის შესახებ ჰიპოთეზის შესამოწმებლად ცვლადები. მოდელი აგებულია შემდეგნაირად. ერთი პარამეტრის მნიშვნელობა გამოსახულია აბსცისის ღერძზე, ხოლო მეორე ინდიკატორის მნიშვნელობა ორდინატზე. შედეგად, დიაგრამაზე ჩნდება წერტილი. ეს მოქმედებები მეორდება ცვლადის ყველა მნიშვნელობისთვის. თუ არსებობს კავშირი, კორელაციური ველი გაფართოვდება და მიმართულება არ დაემთხვევა y-ღერძის მიმართულებას. თუ შეზღუდვა არ არის, ის იქნება ერთ-ერთი ღერძის პარალელურად ან წრის ფორმა ექნება.

საკონტროლო ბარათები

ისინი გამოიყენება პროცესის შეფასებისას კონკრეტული პერიოდის განმავლობაში. საკონტროლო სქემების ფორმირება ეფუძნება შემდეგ დებულებებს:

  1. ყველა პროცესი დროთა განმავლობაში გადახრის დადგენილ პარამეტრებს.
  2. ფენომენის არასტაბილური მიმდინარეობა შემთხვევით არ იცვლება. გადახრები, რომლებიც სცილდება მოსალოდნელი ლიმიტების საზღვრებს, არის არა შემთხვევითი.
  3. ინდივიდუალური ცვლილებების პროგნოზირება შესაძლებელია.
  4. სტაბილური პროცესი შეიძლება შემთხვევით გადახრილი იყოს მოსალოდნელ საზღვრებში.

გამოიყენეთ რუსული საწარმოების პრაქტიკაში

უნდა ითქვას, რომ საშინაო და საგარეო გამოცდილება აჩვენებს, რომ ყველაზე ეფექტური სტატისტიკური მეთოდი აღჭურვილობისა და ტექნოლოგიური პროცესების სტაბილურობისა და სიზუსტის შესაფასებლად არის საკონტროლო სქემების შედგენა. ეს მეთოდი ასევე გამოიყენება საწარმოო პოტენციური სიმძლავრეების რეგულირებისას. რუკების აგებისას საჭიროა შესასწავლი პარამეტრის სწორად შერჩევა. რეკომენდირებულია უპირატესობა მიენიჭოს იმ ინდიკატორებს, რომლებიც პირდაპირ კავშირშია პროდუქტის დანიშნულ გამოყენებასთან, რომელთა გაზომვაც შესაძლებელია და რომლებზეც შეიძლება გავლენა იქონიოს პროცესის კონტროლმა. თუ ასეთი არჩევანი რთულია ან არ არის გამართლებული, შესაძლებელია შეფასდეს კონტროლირებად პარამეტრთან დაკავშირებული (ურთიერთდაკავშირებული) მნიშვნელობები.

ნიუანსები

თუ რაოდენობრივი კრიტერიუმის მიხედვით რუკებისთვის საჭირო სიზუსტით მაჩვენებლების გაზომვა ეკონომიკურად ან ტექნიკურად შეუძლებელია, გამოიყენება ალტერნატიული ნიშანი. მას უკავშირდება ისეთი ტერმინები, როგორიცაა „ქორწინება“ და „ნაკლი“. ეს უკანასკნელი გაგებულია, როგორც პროდუქტის ყოველი ცალკეული შეუსაბამობა დადგენილ მოთხოვნებთან. ქორწინება არის პროდუქტი, რომლის მიწოდება მომხმარებლისთვის დაუშვებელია, მასში ხარვეზების არსებობის გამო.

თავისებურებები

თითოეულ ტიპის ბარათს აქვს თავისი სპეციფიკა. ეს უნდა იქნას გათვალისწინებული კონკრეტული შემთხვევისთვის მათი არჩევისას. ბარათები რაოდენობრივი კრიტერიუმით უფრო მგრძნობიარეა პროცესის ცვლილებების მიმართ, ვიდრე ის, რომელიც იყენებს ალტერნატიულ ფუნქციას. თუმცა, პირველები უფრო შრომატევადია. ისინი გამოიყენება:

  1. გამართვის პროცესი.
  2. ტექნოლოგიის დანერგვის შესაძლებლობების შეფასება.
  3. აღჭურვილობის სიზუსტის შემოწმება.
  4. ტოლერანტობის განმარტებები.
  5. მრავალჯერადი რუკებები მისაღები გზებიპროდუქტის შექმნა.

დამატებით

თუ პროცესის დარღვევას ახასიათებს კონტროლირებადი პარამეტრის გადაადგილება, საჭიროა X-რუკების გამოყენება. თუ მნიშვნელობების დისპერსიის ზრდაა, უნდა აირჩიონ R ან S მოდელები. თუმცა, აუცილებელია გავითვალისწინოთ მთელი რიგი მახასიათებლები. კერძოდ, S-დიაგრამების გამოყენება შესაძლებელს გახდის პროცესის უწესრიგობის უფრო ზუსტად და სწრაფად დადგენას, ვიდრე R-მოდელები იგივეებით.ამავდროულად, ამ უკანასკნელის აგება არ საჭიროებს კომპლექსურ გათვლებს.

დასკვნა

ეკონომიკაში შესაძლებელია გამოვიკვლიოთ ფაქტორები, რომლებიც ვლინდება მსვლელობისას ხარისხობრივი შეფასება, სივრცეში და დინამიკაში. მათი გამოყენება შესაძლებელია წინასწარმეტყველური გამოთვლების შესასრულებლად. ეკონომიკური ანალიზის სტატისტიკური მეთოდები არ მოიცავს მეთოდებს ეკონომიკური პროცესებისა და მოვლენების მიზეზ-შედეგობრივი კავშირების შეფასების, შესრულების გაუმჯობესების პერსპექტიული და გამოუყენებელი რეზერვების იდენტიფიცირების მეთოდებს. სხვა სიტყვებით რომ ვთქვათ, ფაქტორული ტექნიკა არ შედის განხილულ მიდგომებში.

სტატისტიკა"ბიოსტატისტიკა".

1. ნომინალური;
2. რიგითი;
3. ინტერვალი;

ნიმუშები

წარმომადგენელი

ნიმუში ჩარჩო მარტივი შემთხვევითი ნიმუში ინტერვალის შერჩევა

სტრატიფიცირებული შერჩევა

კასეტურიდა შერჩევის კვოტა

ნულოვანი ჰიპოთეზა

ალტერნატიული ჰიპოთეზა ძალა

თავდაჯერებულობის დონე».


სათაური: სტატისტიკური მონაცემების ანალიზის საფუძვლები
Დეტალური აღწერა:

ნებისმიერი სამეცნიერო კვლევის დასრულების შემდეგ, ფუნდამენტური თუ ექსპერიმენტული, ტარდება მიღებული მონაცემების სტატისტიკური ანალიზი. იმისთვის, რომ სტატისტიკური ანალიზი წარმატებით განხორციელდეს და ამოცანები გადაწყდეს, კვლევა სწორად უნდა დაიგეგმოს. ამიტომ, სტატისტიკის საფუძვლების გააზრების გარეშე, შეუძლებელია სამეცნიერო ექსპერიმენტის შედეგების დაგეგმვა და დამუშავება. თუმცა, სამედიცინო განათლებაარ იძლევა არა მხოლოდ სტატისტიკის ცოდნას, არამედ საფუძვლებსაც კი უმაღლესი მათემატიკა. ამიტომ, ძალიან ხშირად შეიძლება შეგვხვდეს მოსაზრება, რომ ბიოსამედიცინო კვლევებში სტატისტიკური დამუშავებით მხოლოდ სტატისტიკოსი უნდა იყოს დაკავებული, ხოლო სამედიცინო მკვლევარმა ყურადღება უნდა გაამახვილოს საკუთარ სამედიცინო საკითხებზე. სამეცნიერო მუშაობა. შრომის ასეთი დანაწილება, რომელიც გულისხმობს დახმარებას მონაცემთა ანალიზში, სავსებით გამართლებულია. ამასთან, სტატისტიკის პრინციპების გაგება აუცილებელია მინიმუმ იმისთვის, რომ თავიდან ავიცილოთ პრობლემის არასწორი დაყენება სპეციალისტისთვის, რომელთანაც კომუნიკაცია კვლევის დაწყებამდე ისეთივე მნიშვნელოვანია, როგორც მონაცემთა დამუშავების ეტაპზე.

სანამ სტატისტიკური ანალიზის საფუძვლებზე ვისაუბრებთ, აუცილებელია განვმარტოთ ტერმინის მნიშვნელობა. სტატისტიკა". არსებობს მრავალი განმარტება, მაგრამ ყველაზე სრული და ლაკონური, ჩვენი აზრით, არის სტატისტიკის განმარტება, როგორც „მონაცემების შეგროვების, წარმოდგენისა და ანალიზის მეცნიერება“. თავის მხრივ, სტატისტიკის გამოყენებას ცოცხალი სამყაროს აპლიკაციებში ეწოდება "ბიომეტრია" ან " ბიოსტატისტიკა".

უნდა აღინიშნოს, რომ ძალიან ხშირად სტატისტიკა მცირდება მხოლოდ ექსპერიმენტული მონაცემების დამუშავებაზე, მათი მოპოვების სტადიაზე ყურადღების მიქცევის გარეშე. თუმცა, სტატისტიკური ცოდნა აუცილებელია უკვე ექსპერიმენტის დაგეგმვისას, რათა მის დროს მიღებულმა მაჩვენებლებმა მკვლევარს მისცეს სანდო ინფორმაცია. აქედან გამომდინარე, შეგვიძლია ვთქვათ, რომ ექსპერიმენტის შედეგების სტატისტიკური ანალიზი იწყება ჯერ კიდევ კვლევის დაწყებამდე.

უკვე გეგმის შემუშავების ეტაპზე მკვლევარმა მკაფიოდ უნდა გააცნობიეროს რა ტიპის ცვლადები იქნება მის ნამუშევარში. ყველა ცვლადი შეიძლება დაიყოს ორ კლასად: ხარისხობრივი და რაოდენობრივი. რა დიაპაზონი შეიძლება მიიღოს ცვლადმა, დამოკიდებულია გაზომვის მასშტაბზე. არსებობს ოთხი ძირითადი მასშტაბი:

1. ნომინალური;
2. რიგითი;
3. ინტერვალი;
4. რაციონალური (ურთიერთობების მასშტაბი).

ნომინალურ სკალაში („სახელების“ მასშტაბი) არის მხოლოდ სიმბოლოები ზოგიერთი კლასის ობიექტების აღწერისთვის, მაგალითად, „სქესი“ ან „პაციენტის პროფესია“. ნომინალური მასშტაბი გულისხმობს, რომ ცვლადი მიიღებს მნიშვნელობებს, რომელთა შორის რაოდენობრივი კავშირის დადგენა შეუძლებელია. ამრიგად, შეუძლებელია მათემატიკური ურთიერთობის დამყარება მამრობითი და მდედრობითი სქესის წარმომადგენლებს შორის. ჩვეულებრივი რიცხვითი აღნიშვნები (ქალები - 0, მამაკაცები - 1, ან პირიქით) მოცემულია აბსოლუტურად თვითნებურად და განკუთვნილია მხოლოდ კომპიუტერული დამუშავებისთვის. ნომინალური სკალა ხარისხობრივია მისი სუფთა სახით; ამ სკალის ცალკეული კატეგორიები გამოიხატება სიხშირით (დაკვირვებების რაოდენობა ან პროპორცია, პროცენტები).

რიგითი (ორდინალური) სკალა ითვალისწინებს, რომ მასში ცალკეული კატეგორიები შეიძლება განლაგდეს აღმავალი ან კლებადობით. სამედიცინო სტატისტიკაში, რიგითი სკალის კლასიკური მაგალითია დაავადების სიმძიმის გრადაცია. ამ შემთხვევაში, ჩვენ შეგვიძლია ავაშენოთ სიმძიმე აღმავალი თანმიმდევრობით, მაგრამ მაინც არ გვაქვს რაოდენობრივი ურთიერთობების დაზუსტების შესაძლებლობა, ანუ რიგითი მასშტაბით გაზომილ მნიშვნელობებს შორის მანძილი უცნობია ან არ აქვს მნიშვნელობა. მარტივია „სიმძიმის“ ცვლადის მნიშვნელობების რიგის დადგენა, მაგრამ შეუძლებელია იმის დადგენა, რამდენჯერ განსხვავდება მძიმე მდგომარეობა ზომიერი მდგომარეობისგან.

რიგითი მასშტაბი ეხება სქესს რაოდენობრივი ტიპებიმონაცემები და მისი გრადაციები შეიძლება აღიწეროს როგორც სიხშირით (როგორც ხარისხობრივი მასშტაბით) ასევე ზომებით ცენტრალური ღირებულებებირომელზეც ქვემოთ გავამახვილებთ ყურადღებას.

ინტერვალური და რაციონალური სკალები არის წმინდა რაოდენობრივი მონაცემების ტიპები. ინტერვალის სკალაში უკვე შეგვიძლია განვსაზღვროთ, თუ რამდენად განსხვავდება ცვლადის ერთი მნიშვნელობა მეორისგან. ამრიგად, სხეულის ტემპერატურის 1 გრადუსით ცელსიუსით მატება ყოველთვის ნიშნავს ერთეულების ფიქსირებული რაოდენობის მიერ გამოთავისუფლებული სითბოს ზრდას. თუმცა, ინტერვალის სკალაში არის როგორც დადებითი, ასევე უარყოფითი მნიშვნელობები(აბსოლუტური ნულის გარეშე). ამ მხრივ, შეუძლებელია იმის თქმა, რომ 20 გრადუსი ცელსიუსით ორჯერ თბილია ვიდრე 10. ჩვენ შეგვიძლია მხოლოდ იმის თქმა, რომ 20 გრადუსი უფრო თბილია, ვიდრე 10, როგორც 30 უფრო თბილია, ვიდრე 20.

რაციონალურ სკალას (ფარდობის სკალას) აქვს ერთი საცნობარო წერტილი და მხოლოდ დადებითი ღირებულებები. მედიცინაში ყველაზე რაციონალური მასშტაბები კონცენტრაციაა. მაგალითად, გლუკოზის დონე 10 მმოლ/ლ არის ორჯერ მეტი კონცენტრაცია 5 მმოლ/ლ-თან შედარებით. ტემპერატურისთვის რაციონალური მასშტაბი არის კელვინის მასშტაბი, სადაც არის აბსოლუტური ნული (სითბოს არარსებობა).

უნდა დავამატოთ, რომ ნებისმიერი რაოდენობრივი ცვლადი შეიძლება იყოს უწყვეტი, როგორც სხეულის ტემპერატურის გაზომვის შემთხვევაში (ეს არის უწყვეტი ინტერვალის სკალა), ან დისკრეტული, თუ ვითვლით სისხლის უჯრედების რაოდენობას ან ლაბორატორიული ცხოველების შთამომავლებს (ეს არის დისკრეტული რაციონალური მასშტაბი).

ამ განსხვავებებს გადამწყვეტი მნიშვნელობა აქვს ექსპერიმენტული შედეგების სტატისტიკური ანალიზის მეთოდების არჩევისთვის. ასე რომ, ნომინალური მონაცემებისთვის, chi-square ტესტი გამოიყენება, ხოლო ცნობილი სტუდენტის ტესტი მოითხოვს, რომ ცვლადი (ინტერვალი ან რაციონალური) იყოს უწყვეტი.

ცვლადის ტიპის საკითხის გადაწყვეტის შემდეგ აუცილებელია ფორმირების დაწყება ნიმუშები. ნიმუში არის გარკვეული კლასის ობიექტების მცირე ჯგუფი (მედიცინაში, პოპულაცია). აბსოლუტურად ზუსტი მონაცემების მისაღებად აუცილებელია მოცემული კლასის ყველა ობიექტის შესწავლა, თუმცა პრაქტიკული (ხშირად ფინანსური) მიზეზების გამო შესწავლილია მოსახლეობის მხოლოდ ნაწილი, რომელსაც ნიმუშს უწოდებენ. სამომავლოდ, სტატისტიკური ანალიზი მკვლევარს საშუალებას აძლევს, გარკვეული სიზუსტით გაავრცელოს მიღებული შაბლონები მთელ პოპულაციაზე. ფაქტობრივად, ყველა ბიოსამედიცინო სტატისტიკა მიზნად ისახავს მაქსიმალურად ზუსტი შედეგების მიღებას დაკვირვების მინიმალური რაოდენობით, რადგან ადამიანთა კვლევაში ასევე მნიშვნელოვანია ეთიკური საკითხი. ჩვენ არ შეგვიძლია გარისკვის საშუალება დიდი რაოდენობითპაციენტები, ვიდრე საჭიროა.

ნიმუშის შექმნა რეგულირდება მთელი რიგი სავალდებულო მოთხოვნებით, რომელთა დარღვევამ შეიძლება გამოიწვიოს მცდარი დასკვნები კვლევის შედეგებიდან. პირველი, ნიმუშის ზომა მნიშვნელოვანია. შესწავლილი პარამეტრების შეფასების სიზუსტე დამოკიდებულია ნიმუშის ზომაზე. აქ მხედველობაში უნდა იქნას მიღებული სიტყვა „სიზუსტე“. Როგორ მეტი ზომებიშესწავლილი ჯგუფებიდან მით უფრო ზუსტ (მაგრამ არა აუცილებლად სწორ) შედეგებს იღებს მეცნიერი. იმისათვის, რომ შერჩევის კვლევების შედეგები გადაცემული იყოს მთლიან პოპულაციაზე, ნიმუში უნდა იყოს წარმომადგენელი. შერჩევის წარმომადგენლობა გულისხმობს, რომ იგი ასახავს მოსახლეობის ყველა არსებით თვისებას. ანუ შესწავლილ ჯგუფებში ისეთივე სიხშირით გვხვდება სხვადასხვა სქესის, ასაკის, პროფესიის, სოციალური სტატუსის მქონე პირები, როგორც მთელ მოსახლეობაში.

თუმცა, საკვლევი ჯგუფის შერჩევის დაწყებამდე უნდა გადაწყვიტოს კონკრეტული პოპულაციის შესწავლის აუცილებლობა. პოპულაციის მაგალითი შეიძლება იყოს ყველა პაციენტი გარკვეული ნოზოლოგიით ან სამუშაო ასაკის ადამიანები და ა.შ. ამრიგად, სამხედრო ასაკის ახალგაზრდების პოპულაციისთვის მიღებული შედეგები ძნელად შეიძლება ექსტრაპოლირებული იყოს პოსტმენოპაუზურ ქალებზე. მახასიათებლების ნაკრები, რომელიც ექნება საკვლევ ჯგუფს, განსაზღვრავს კვლევის მონაცემების „განზოგადებადობას“.

ნიმუშების გენერირება შესაძლებელია სხვადასხვა გზით. ყველაზე მარტივი არჩევანია შემთხვევითი რიცხვების გენერატორით. საჭირო თანხაობიექტები პოპულაციისგან ან ნიმუში ჩარჩო(ნიმუშების ჩარჩო). ამ მეთოდს ე.წ მარტივი შემთხვევითი ნიმუში". თუ შემთხვევით აირჩევთ საწყის წერტილს შერჩევის ჩარჩოში და შემდეგ იღებთ ყოველ მეორე, მეხუთე ან მეათე ობიექტს (დამოკიდებულია იმაზე, თუ რა ჯგუფის ზომაა საჭირო კვლევაში), მიიღებთ ინტერვალის შერჩევა. ინტერვალური შერჩევა არ არის შემთხვევითი, ვინაიდან შერჩევის ჩარჩოში მონაცემების პერიოდული გამეორების შესაძლებლობა არასოდეს არის გამორიცხული.

შესაძლებელია შეიქმნას ე.წ. სტრატიფიცირებული შერჩევა”, რომელიც ვარაუდობს, რომ პოპულაცია შედგება რამდენიმე განსხვავებული ჯგუფისგან და ეს სტრუქტურა უნდა განმეორდეს ექსპერიმენტულ ჯგუფში. მაგალითად, თუ მამაკაცებისა და ქალების თანაფარდობა პოპულაციაში არის 30:70, მაშინ სტრატიფიცირებულ ნიმუშში მათი თანაფარდობა იგივე უნდა იყოს. ზე ეს მიდგომაკრიტიკულად მნიშვნელოვანია, რომ არ მოხდეს ნიმუშის ზედმეტად დაბალანსება, ანუ თავიდან იქნას აცილებული მისი მახასიათებლების ერთგვაროვნება, წინააღმდეგ შემთხვევაში მკვლევარმა შეიძლება გამოტოვოს შანსი, აღმოაჩინოს განსხვავებები ან ურთიერთობები მონაცემებში.

ჯგუფების ფორმირების აღწერილი მეთოდების გარდა, არსებობს ასევე კასეტურიდა შერჩევის კვოტა. პირველი გამოიყენება, როდესაც ნიმუშის ჩარჩოს შესახებ სრული ინფორმაციის მოპოვება რთულია მისი ზომის გამო. შემდეგ ნიმუში ყალიბდება პოპულაციაში შემავალი რამდენიმე ჯგუფიდან. მეორე - კვოტა - სტრატიფიცირებული ნიმუშის მსგავსია, მაგრამ აქ ობიექტების განაწილება არ შეესაბამება პოპულაციაში არსებულს.

შერჩევის ზომას რომ დავუბრუნდეთ, უნდა ითქვას, რომ ის მჭიდრო კავშირშია პირველი და მეორე ტიპის სტატისტიკური შეცდომების ალბათობასთან. სტატისტიკური შეცდომები შესაძლოა გამოწვეული იყოს იმით, რომ კვლევა არ სწავლობს მთელ მოსახლეობას, არამედ მის ნაწილს. I ტიპის შეცდომა არის მცდარი გადახრა ნულოვანი ჰიპოთეზა. თავის მხრივ, ნულოვანი ჰიპოთეზა არის დაშვება, რომ ყველა შესწავლილი ჯგუფი აღებულია ერთი და იგივე ზოგადი პოპულაციისგან, რაც ნიშნავს, რომ მათ შორის განსხვავებები ან ურთიერთობები შემთხვევითია. თუ ანალოგიას გამოვხატავთ დიაგნოსტიკურ ტესტებთან, მაშინ I ტიპის შეცდომა არის ცრუ დადებითი შედეგი.

II ტიპის შეცდომა არის არასწორი გადახრა ალტერნატიული ჰიპოთეზა, რომლის მნიშვნელობა მდგომარეობს იმაში, რომ ჯგუფებს შორის განსხვავებები ან ურთიერთობები განპირობებულია არა შემთხვევითი დამთხვევით, არამედ შესწავლილი ფაქტორების გავლენით. და ისევ ანალოგია დიაგნოსტიკასთან: მეორე სახის შეცდომა არის ცრუ უარყოფითი შედეგი. ამ შეცდომასთან არის დაკავშირებული ცნება ძალა, რომელიც მოგვითხრობს იმაზე, თუ რამდენად ეფექტურია გარკვეული სტატისტიკური მეთოდი მოცემულ პირობებში, მის მგრძნობელობაზე. სიმძლავრე გამოითვლება ფორმულით: 1-β, სადაც β არის II ტიპის შეცდომის ალბათობა. ეს მაჩვენებელი ძირითადად დამოკიდებულია ნიმუშის ზომაზე. რაც უფრო დიდია ჯგუფის ზომები, მით ნაკლებია II ტიპის შეცდომის ალბათობა და მით უფრო მაღალია სტატისტიკური ტესტების სიმძლავრე. ეს დამოკიდებულება მინიმუმ კვადრატულია, ანუ ნიმუშის ზომის განახევრებით შემცირება გამოიწვევს სიმძლავრის მინიმუმ ოთხჯერ ვარდნას. მინიმალური დასაშვები სიმძლავრე ითვლება 80%, ხოლო პირველი სახის ცდომილების მაქსიმალური დასაშვები დონე არის 5%. თუმცა, ყოველთვის უნდა გვახსოვდეს, რომ ეს საზღვრები თვითნებურია და შეიძლება შეიცვალოს კვლევის ბუნებიდან და მიზნებიდან გამომდინარე. როგორც წესი, ძალაუფლების თვითნებური ცვლილება აღიარებულია სამეცნიერო საზოგადოების მიერ, მაგრამ შემთხვევების აბსოლუტურ უმრავლესობაში, პირველი ტიპის შეცდომის დონე არ შეიძლება აღემატებოდეს 5%-ს.

ყოველივე ზემოთქმული პირდაპირ კავშირშია კვლევის დაგეგმვის ეტაპთან. თუმცა, ბევრი მკვლევარი შეცდომით მოიხსენიებს სტატისტიკურ მონაცემთა დამუშავებას მხოლოდ როგორც რაიმე სახის მანიპულირებას, რომელიც შესრულებულია სამუშაოს ძირითადი ნაწილის დასრულების შემდეგ. ხშირად, დაუგეგმავი ექსპერიმენტის დასრულების შემდეგ, ჩნდება დაუძლეველი სურვილი, შეუკვეთოთ სტატისტიკური მონაცემების ანალიზი მხარეზე. მაგრამ სტატისტიკოსისთვისაც კი ძალიან რთული იქნება მკვლევარის მიერ მოსალოდნელი შედეგის გამოტანა „ნაგვის გროვიდან“. ამიტომ, ბიოსტატისტიკის არასაკმარისი ცოდნის გამო, აუცილებელია სტატისტიკურ ანალიზში დახმარების აღმოჩენა ექსპერიმენტის დაწყებამდეც კი.

რაც შეეხება თავად ანალიზის პროცედურას, უნდა აღინიშნოს სტატისტიკური ტექნიკის ორი ძირითადი ტიპი: აღწერითი და მტკიცებულებებზე დაფუძნებული (ანალიტიკური). აღწერილობითი ტექნიკა მოიცავს ტექნიკას მონაცემების კომპაქტურად და ადვილად გასაგებად წარმოდგენისთვის. ეს მოიცავს ცხრილებს, გრაფიკებს, სიხშირეებს (აბსოლუტური და ფარდობითი), ცენტრალური ტენდენციის საზომებს (საშუალო, მედიანა, რეჟიმი) და მონაცემთა გაფანტვის ზომებს (ვარიანსი, სტანდარტული გადახრა, კვარტლთაშორისი ინტერვალი და ა.შ.). სხვა სიტყვებით რომ ვთქვათ, აღწერითი მეთოდები ახასიათებს შესწავლილ ნიმუშებს.

ხელმისაწვდომი რაოდენობრივი მონაცემების აღწერის ყველაზე პოპულარული (თუმცა ხშირად შეცდომაში შემყვანი) გზაა შემდეგი ინდიკატორების განსაზღვრა:

  • ნიმუშში დაკვირვების რაოდენობა ან მისი ზომა;
  • საშუალო მნიშვნელობა (საშუალო არითმეტიკული);
  • სტანდარტული გადახრა არის საზომი, თუ რამდენად ფართოდ იცვლება ცვლადების მნიშვნელობები.

მნიშვნელოვანია გვახსოვდეს, რომ საშუალო არითმეტიკული და სტანდარტული გადახრა არის ცენტრალური ტენდენციისა და გაფანტვის საზომი ნიმუშების საკმაოდ მცირე რაოდენობაში. ასეთ ნიმუშებში, ობიექტების უმეტესობის მნიშვნელობები თანაბრად სავარაუდოაგადახრილია საშუალოდან და მათი განაწილება ქმნის სიმეტრიულ „ზარს“ (გაუსის ან გაუს-ლაპლასის მრუდი). ასეთ განაწილებას ასევე უწოდებენ "ნორმალურს", მაგრამ სამედიცინო ექსპერიმენტის პრაქტიკაში ეს ხდება მხოლოდ შემთხვევების 30% -ში. თუ ცვლადის მნიშვნელობები ნაწილდება ასიმეტრიულად ცენტრის ირგვლივ, მაშინ ჯგუფები საუკეთესოდ არის აღწერილი მედიანისა და კვანტილების გამოყენებით (პროცენტილები, კვარტილები, დეცილები).

ჯგუფების აღწერის დასრულების შემდეგ, აუცილებელია პასუხის გაცემა მათი ურთიერთობის შესახებ და კვლევის შედეგების მთელ პოპულაციაზე განზოგადების შესაძლებლობის შესახებ. ამისთვის გამოიყენება ბიოსტატისტიკის მტკიცებულებებზე დაფუძნებული მეთოდები. სწორედ მათ ახსოვს მკვლევარები, უპირველეს ყოვლისა, როცა საქმე სტატისტიკური მონაცემების დამუშავებას ეხება. ჩვეულებრივ მუშაობის ამ ეტაპს „სტატისტიკური ჰიპოთეზების ტესტირებას“ უწოდებენ.

ჰიპოთეზის ტესტირების ამოცანები შეიძლება დაიყოს ორად დიდი ჯგუფები. პირველი ჯგუფი პასუხობს კითხვას, არის თუ არა განსხვავებები ჯგუფებს შორის რაიმე ინდიკატორის დონის მიხედვით, მაგალითად, ჰეპატიტის მქონე პაციენტებში და ჯანმრთელ ადამიანებში ღვიძლის ტრანსამინაზების დონის განსხვავებები. მეორე ჯგუფი საშუალებას გაძლევთ დაამტკიცოთ ურთიერთობის არსებობა ორ ან მეტ ინდიკატორს შორის, მაგალითად, ღვიძლისა და იმუნური სისტემის ფუნქცია.

პრაქტიკული თვალსაზრისით, პირველი ჯგუფის ამოცანები შეიძლება დაიყოს ორ ქვეტიპად:

  • ინდიკატორის შედარება მხოლოდ ორ ჯგუფში (ჯანმრთელი და ავადმყოფი, მამაკაცი და ქალი);
  • სამი ან მეტი ჯგუფის შედარება (პრეპარატის სხვადასხვა დოზების შესწავლა).

გასათვალისწინებელია, რომ სტატისტიკური მეთოდები მნიშვნელოვნად განსხვავდება ხარისხობრივი და რაოდენობრივი მონაცემებისთვის.

იმ სიტუაციაში, როდესაც შესასწავლი ცვლადი არის ხარისხობრივი და მხოლოდ ორი ჯგუფის შედარება ხდება, chi-square ტესტის გამოყენება შესაძლებელია. ეს საკმაოდ ძლიერი და ფართოდ ცნობილი კრიტერიუმია, თუმცა საკმარისად ეფექტური არ არის, თუ დაკვირვებების რაოდენობა მცირეა. ამ პრობლემის გადასაჭრელად, არსებობს რამდენიმე მეთოდი, როგორიცაა იეტსის კორექტირება უწყვეტობისთვის და ფიშერის ზუსტი მეთოდი.

თუ შესწავლილი ცვლადი რაოდენობრივია, მაშინ შეიძლება გამოყენებულ იქნას სტატისტიკური ტესტის ორიდან ერთი. პირველი ტიპის კრიტერიუმები ეფუძნება ზოგადი პოპულაციის განაწილების სპეციფიკურ ტიპს და მოქმედებს ამ პოპულაციის პარამეტრებით. ასეთ კრიტერიუმებს უწოდებენ "პარამეტრულ" და ისინი ჩვეულებრივ ემყარება მნიშვნელობების ნორმალური განაწილების ვარაუდს. არაპარამეტრული ტესტები არ ეფუძნება ვარაუდს ზოგადი პოპულაციის განაწილების ტიპის შესახებ და არ იყენებს მის პარამეტრებს. ზოგჯერ ასეთ კრიტერიუმებს უწოდებენ "განაწილების ტესტებს". გარკვეულწილად, ეს მცდარია, რადგან ნებისმიერი არაპარამეტრული ტესტი ვარაუდობს, რომ ყველა შედარებულ ჯგუფში განაწილება ერთნაირი იქნება, წინააღმდეგ შემთხვევაში შეიძლება ცრუ დადებითი შედეგების მიღება.

არსებობს ორი პარამეტრული ტესტი, რომელიც გამოიყენება ნორმალურად განაწილებული პოპულაციიდან მიღებული მონაცემებისთვის: სტუდენტის t-ტესტი ორი ჯგუფის შესადარებლად და ფიშერის F-ტესტი დისპერსიების თანასწორობის შესამოწმებლად (ანუ ANOVA). გაცილებით მეტი არაპარამეტრული კრიტერიუმებია. სხვადასხვა ტესტები განსხვავდება ერთმანეთისგან იმ დაშვებებით, რომლებზეც ისინი ემყარება, გამოთვლების სირთულით, სტატისტიკური სიმძლავრით და ა.შ. თუმცა, ვილკოქსონის ტესტი (დაკავშირებული ჯგუფებისთვის) და მან-უიტნის ტესტი, ასევე ცნობილი როგორც ტესტი. ვილკოქსონი ამისთვის დამოუკიდებელი ნიმუშები. ეს ტესტები მოსახერხებელია იმით, რომ ისინი არ საჭიროებენ ვარაუდებს მონაცემთა განაწილების ბუნების შესახებ. მაგრამ თუ აღმოჩნდება, რომ ნიმუშები აღებულია ნორმალურად განაწილებული პოპულაციისგან, მაშინ მათი სტატისტიკური ძალა მნიშვნელოვნად არ განსხვავდება სტუდენტური ტესტისგან.

სტატისტიკური მეთოდების სრული აღწერა შეგიძლიათ იხილოთ აქ სპეციალური ლიტერატურათუმცა, მთავარი ის არის, რომ ყოველი სტატისტიკური ტესტი მოითხოვს წესების (დაშვებების) და პირობების ერთობლიობას მისი გამოყენებისთვის, ხოლო რამდენიმე მეთოდის მექანიკური ჩამოთვლა "სასურველი" შედეგის მოსაძებნად აბსოლუტურად მიუღებელია. სამეცნიერო წერტილიხედვა. ამ თვალსაზრისით, სტატისტიკური ტესტები ახლოს არის წამლებთან - თითოეულს აქვს ჩვენებები და უკუჩვენებები. გვერდითი მოვლენებიდა წარუმატებლობის ალბათობა. და ისეთივე საშიშია სტატისტიკური ტესტების უკონტროლო გამოყენება, რადგან მათზეა დაფუძნებული ჰიპოთეზები და დასკვნები.

სტატისტიკური ანალიზის სიზუსტის საკითხის უფრო სრულყოფილი გაგებისთვის აუცილებელია განვსაზღვროთ და გავაანალიზოთ კონცეფცია " თავდაჯერებულობის დონე."ნდობის ალბათობა არის მნიშვნელობა, რომელიც აღებულია, როგორც ზღვარი სავარაუდო და წარმოუდგენელ მოვლენებს შორის. ტრადიციულად, იგი აღინიშნება ასო "პ"-ით. მრავალი მკვლევარისთვის, სტატისტიკური ანალიზის ჩატარების ერთადერთი მიზანია სასურველი p მნიშვნელობის გამოთვლა, რომელიც, როგორც ჩანს, მძიმეებით აყენებს ცნობილი ფრაზა"აღსრულების შეწყალება შეუძლებელია." მაქსიმალური დასაშვები ნდობის დონეა 0.05. უნდა გვახსოვდეს, რომ ნდობის დონე არ არის რაიმე მოვლენის ალბათობა, არამედ ნდობის საკითხი. ანალიზის დაწყებამდე ნდობის ალბათობის გამოვლენით, ჩვენ ამით განვსაზღვრავთ ჩვენი კვლევის შედეგებში ნდობის ხარისხს. და, მოგეხსენებათ, გადაჭარბებული გულუბრყვილობა და ზედმეტი ეჭვი თანაბრად უარყოფითად მოქმედებს ნებისმიერი სამუშაოს შედეგებზე.

ნდობის დონე მიუთითებს I ტიპის შეცდომის მაქსიმალურ ალბათობაზე, რომელსაც მკვლევარი დასაშვებად მიიჩნევს. ნდობის დონის შემცირება, სხვა სიტყვებით რომ ვთქვათ, ჰიპოთეზების ტესტირების პირობების გამკაცრება, ზრდის II ტიპის შეცდომების ალბათობას. ამიტომ, ნდობის დონის არჩევა უნდა განხორციელდეს პირველი და მეორე სახის შეცდომების დადგომის შესაძლო ზიანის გათვალისწინებით. მაგალითად, ბიოსამედიცინო სტატისტიკაში მიღებული მკაცრი ლიმიტები, რომლებიც განსაზღვრავს ცრუ დადებითი შედეგების პროპორციას არაუმეტეს 5%-ისა, არის მწვავე აუცილებლობა, რადგან სამედიცინო კვლევის შედეგების საფუძველზე ახალი მკურნალობა შემოდის ან უარყოფილია, და ეს არის ათასობით ადამიანის სიცოცხლის საკითხი.

უნდა გვახსოვდეს, რომ თავად p მნიშვნელობა არ არის ძალიან ინფორმატიული ექიმისთვის, რადგან ის მხოლოდ ნულოვანი ჰიპოთეზის მცდარი უარის ალბათობის შესახებ საუბრობს. ეს მაჩვენებელი არაფერს ამბობს, მაგალითად, თერაპიული ეფექტის ზომაზე საკვლევი პრეპარატის გამოყენებისას ზოგად პოპულაციაში. აქედან გამომდინარე, არსებობს მოსაზრება, რომ ნდობის დონის ნაცვლად, უკეთესი იქნება კვლევის შედეგები ნდობის ინტერვალის ზომით შევაფასოთ. Ნდობის ინტერვალიარის მნიშვნელობების დიაპაზონი, რომლებშიც ჭეშმარიტი პოპულაციის მნიშვნელობა (საშუალო, მედიანა ან სიხშირე) შეიცავს გარკვეული ალბათობით. პრაქტიკაში უფრო მოსახერხებელია ორივე ამ მნიშვნელობის ქონა, რაც შესაძლებელს ხდის უფრო თავდაჯერებულად ვიმსჯელოთ მიღებული შედეგების გამოყენებადობაზე მთლიან პოპულაციაზე.

დასასრულს, რამდენიმე სიტყვა უნდა ითქვას იმ ინსტრუმენტებზე, რომელსაც იყენებს სტატისტიკოსი ან მკვლევარი, რომელიც დამოუკიდებლად აანალიზებს მონაცემებს. ხელით გათვლები დიდი ხანია გაქრა. სტატისტიკური კომპიუტერული პროგრამები, რომლებიც დღეს არსებობს, შესაძლებელს ხდის სტატისტიკური ანალიზის ჩატარებას სერიოზულის გარეშე მათემატიკური სწავლება. ისეთი ძლიერი სისტემები, როგორიცაა SPSS, SAS, R და ა.შ. საშუალებას აძლევს მკვლევარს გამოიყენოს რთული და ძლიერი სტატისტიკური მეთოდები. თუმცა, ეს ყოველთვის არ არის კარგი. სპეციფიკურ ექსპერიმენტულ მონაცემებზე გამოყენებული სტატისტიკური ტესტების გამოყენების ხარისხის ცოდნის გარეშე, მკვლევარს შეუძლია გამოთვლების გაკეთება და რამდენიმე რიცხვის მიღებაც კი, მაგრამ შედეგი ძალიან საეჭვო იქნება. Ისე, წინაპირობაექსპერიმენტის შედეგების სტატისტიკური დამუშავება უნდა იყოს კარგი ცოდნა მათემატიკური საფუძვლებისტატისტიკა.


სტატისტიკური მეთოდები - სტატისტიკური მონაცემების ანალიზის მეთოდები. გამოყავით გამოყენებითი სტატისტიკის მეთოდები, რომლებიც შეიძლება გამოყენებულ იქნას ყველა სფეროში სამეცნიერო გამოკვლევადა ნებისმიერი ინდუსტრია ეროვნული ეკონომიკა, და სხვა სტატისტიკური მეთოდები, რომელთა გამოყენებადობა შემოიფარგლება კონკრეტული სფეროთი. ეს ეხება ისეთ მეთოდებს, როგორიცაა სტატისტიკური მიღების კონტროლი, ტექნოლოგიური პროცესების სტატისტიკური კონტროლი, სანდოობა და ტესტირება და ექსპერიმენტების დიზაინი.

მონაცემთა ანალიზის სტატისტიკური მეთოდები გამოიყენება ადამიანის საქმიანობის თითქმის ყველა სფეროში. ისინი გამოიყენება ყოველთვის, როდესაც საჭიროა გარკვეული შინაგანი ჰეტეროგენურობის მქონე ჯგუფის (ობიექტების ან საგნების) შესახებ რაიმე განსჯის მიღება და დასაბუთება. მიზანშეწონილია განასხვავოთ სამი სახის სამეცნიერო და გამოყენებითი საქმიანობა მონაცემთა ანალიზის სტატისტიკური მეთოდების სფეროში (კონკრეტულ პრობლემებში ჩაძირვასთან დაკავშირებული მეთოდების სპეციფიკის ხარისხის მიხედვით):

ა) ზოგადი დანიშნულების მეთოდების შემუშავება და კვლევა, გამოყენების სფეროს სპეციფიკის გაუთვალისწინებლად;

ბ) სტატისტიკური მოდელების შემუშავება და კვლევა რეალური ფენომენებიდა პროცესები საქმიანობის კონკრეტული სფეროს საჭიროებების შესაბამისად;

გ) სტატისტიკური მეთოდებისა და მოდელების გამოყენება კონკრეტული მონაცემების სტატისტიკური ანალიზისთვის.

დისპერსიული ანალიზი.დისპერსიის ანალიზი (ლათინურიდან Dispersio - დისპერსია / ინგლისურად Analysis Of Variance - ANOVA) გამოიყენება ერთი ან მეტი ხარისხობრივი ცვლადის (ფაქტორების) გავლენის შესასწავლად ერთ დამოკიდებულ რაოდენობრივ ცვლადზე (პასუხი). დისპერსიის ანალიზი ეფუძნება ვარაუდი, რომ ზოგიერთი ცვლადი შეიძლება ჩაითვალოს მიზეზად (ფაქტორები, დამოუკიდებელი ცვლადები), ზოგი კი შედეგებად (დამოკიდებული ცვლადები). დამოუკიდებელ ცვლადებს ზოგჯერ უწოდებენ რეგულირებადი ფაქტორებისწორედ იმიტომ, რომ ექსპერიმენტში მკვლევარს აქვს შესაძლებლობა განასხვავოს ისინი და გააანალიზოს მიღებული შედეგი.

მთავარი მიზანიდისპერსიის ანალიზი (ANOVA) არის საშუალებებს შორის განსხვავებების მნიშვნელოვნების შესწავლა დისპერსიების შედარების (ანალიზის) საშუალებით. მთლიანი დისპერსიის მრავალ წყაროდ დაყოფა საშუალებას გაძლევთ შეადაროთ ჯგუფთაშორისი განსხვავების გამო დისპერსია ჯგუფში ცვალებადობის გამო გამოწვეულ დისპერსიასთან. თუ ნულოვანი ჰიპოთეზა მართალია (ზოგადი პოპულაციისგან შერჩეული დაკვირვების რამდენიმე ჯგუფში საშუალო თანასწორობის შესახებ), ჯგუფთაშორის ცვალებადობასთან დაკავშირებული დისპერსიის შეფასება ახლოს უნდა იყოს ჯგუფთაშორისი ვარიაციის შეფასებასთან. თუ თქვენ უბრალოდ ადარებთ ორი ნიმუშის საშუალებებს, დისპერსიის ანალიზი მისცემს იგივე შედეგს, როგორც ჩვეულებრივი დამოუკიდებელი ნიმუშის t-ტესტი (თუ თქვენ ადარებთ ორს დამოუკიდებელი ჯგუფებიობიექტები ან დაკვირვებები) ან t-ტესტი დამოკიდებული ნიმუშებისთვის (თუ ორი ცვლადი შედარებულია ობიექტების ან დაკვირვებების ერთსა და იმავე კომპლექტზე).


დისპერსიის ანალიზის არსიშედგება კონკრეტული ფაქტორების გავლენის გამო შესწავლილი ნიშან-თვისების მთლიანი დისპერსიის ცალკეულ კომპონენტებად დაყოფაში და ამ ფაქტორების შესწავლილ ნიშანზე ამ ფაქტორების გავლენის მნიშვნელობის შესახებ ჰიპოთეზების შემოწმებას. დისპერსიის კომპონენტების ერთმანეთთან შედარება ფიშერის F-ტესტის გამოყენებით, შესაძლებელია დადგინდეს, რა პროპორციაა მიღებული მახასიათებლის მთლიანი ცვალებადობის რეგულირებადი ფაქტორების მოქმედებით.

საწყისი მასალადისპერსიის ანალიზისთვის გამოიყენება სამი ან მეტი ნიმუშის შესწავლის მონაცემები, რომლებიც შეიძლება იყოს ტოლი ან არათანაბარი, როგორც დაკავშირებული, ასევე გათიშული. გამოვლენილი რეგულირებადი ფაქტორების რაოდენობის მიხედვით, ვარიაციის ანალიზი შეიძლება იყოს ერთფაქტორიანი (ამ შემთხვევაში შესწავლილია ერთი ფაქტორის გავლენა ექსპერიმენტის შედეგებზე), ორფაქტორიანი (ორი ფაქტორის გავლენის შესწავლისას) და მრავალფაქტორული (საშუალებას გაძლევთ შეაფასოთ არა მხოლოდ თითოეული ფაქტორის გავლენა ცალკე, არამედ მათი ურთიერთქმედებაც).

გამოიყენება დისპერსიის ანალიზიპარამეტრული მეთოდების ჯგუფს და ამიტომ ის უნდა იქნას გამოყენებული მხოლოდ მაშინ, როდესაც დადასტურდება, რომ განაწილება ნორმალურია.

გამოიყენება დისპერსიის ანალიზი, თუ დამოკიდებული ცვლადი იზომება თანაფარდობების, ინტერვალების ან რიგის სკალაზე, ხოლო ზემოქმედების ცვლადი არარიცხობრივი ხასიათისაა (სახელის სკალა).

დავალების მაგალითები.ამოცანებში, რომლებიც წყდება დისპერსიის ანალიზი, არის რიცხვითი ხასიათის პასუხი, რომელზეც მოქმედებს ნომინალური ხასიათის რამდენიმე ცვლადი. მაგალითად, რამდენიმე სახის პირუტყვის გასასუქებელი რაციონი ან მათი შენახვის ორი გზა და ა.შ.

მაგალითი 1: კვირის განმავლობაში რამდენიმე სააფთიაქო კიოსკი მუშაობდა სამ სხვადასხვა ადგილას. სამომავლოდ მხოლოდ ერთი შეგვიძლია დავტოვოთ. აუცილებელია იმის დადგენა, არის თუ არა სტატისტიკა მნიშვნელოვანი განსხვავებაკიოსკებში ნარკოტიკების გაყიდვის მოცულობას შორის. თუ კი, ჩვენ ვირჩევთ კიოსკს გაყიდვების ყველაზე მაღალი საშუალო დღიური მოცულობით. თუ გაყიდვების მოცულობის სხვაობა სტატისტიკურად უმნიშვნელო აღმოჩნდა, მაშინ სხვა მაჩვენებლები უნდა იყოს საფუძველი ჯიხურის არჩევისთვის.

მაგალითი 2: ჯგუფური საშუალებების კონტრასტების შედარება. შვიდი პოლიტიკური კუთვნილება დალაგებულია უკიდურესად ლიბერალურიდან უკიდურესად კონსერვატიულამდე და ხაზოვანი კონტრასტი გამოიყენება იმის შესამოწმებლად, არის თუ არა ჯგუფური აღმავალი ტენდენცია - ანუ, არის თუ არა მნიშვნელოვანი ხაზოვანი ზრდა საშუალო ასაკში, როდესაც განიხილება ჯგუფები დაკვეთით. მიმართულება ლიბერალიდან კონსერვატიულამდე.

მაგალითი 3: დისპერსიის ორმხრივი ანალიზი. პროდუქტის გაყიდვების რაოდენობაზე, გარდა მაღაზიის ზომისა, ხშირად გავლენას ახდენს პროდუქტის თაროების მდებარეობა. ეს მაგალითიშეიცავს ყოველკვირეული გაყიდვების მაჩვენებლებს, რომლებიც ხასიათდება ოთხი თაროების განლაგებით და სამი მაღაზიის ზომით. ანალიზის შედეგები აჩვენებს, რომ ორივე ფაქტორი - თაროების ადგილმდებარეობა საქონელთან და მაღაზიის ზომა - მოქმედებს გაყიდვების რაოდენობაზე, მაგრამ მათი ურთიერთქმედება არ არის მნიშვნელოვანი.

მაგალითი 4:უნივარიატიული ANOVA: რანდომიზებული ორი დამუშავების სრული ბლოკის დიზაინი. გამოკვლეულია სამი ცხიმისა და სამი ცომის ამომწურავი ყველა შესაძლო კომბინაციის გავლენა პურის გამოცხობაზე. ოთხი სხვადასხვა წყაროდან აღებული ფქვილის ოთხი ნიმუში იყო ბლოკის ფაქტორი. აუცილებელია იდენტიფიცირება ცხიმ-მწყემსავი ურთიერთქმედების მნიშვნელობის შესახებ. ამის შემდეგ, კონტრასტების არჩევის სხვადასხვა ვარიანტების დადგენა, რაც საშუალებას მოგცემთ გაარკვიოთ ფაქტორების დონის რომელი კომბინაციები განსხვავდება.

მაგალითი 5: იერარქიული (ბუდე) გეგმის მოდელი შერეული ეფექტებით. შესწავლილია ჩარხში დამონტაჟებული ოთხი შემთხვევით შერჩეული თავის გავლენა წარმოებული მინის კათოდის დამჭერების დეფორმაციაზე. (თავები ჩაშენებულია მანქანაში, ამიტომ ერთი და იგივე თავის გამოყენება არ შეიძლება სხვადასხვა მანქანებზე.) თავის ეფექტი განიხილება, როგორც შემთხვევითი ფაქტორი. ANOVA სტატისტიკა აჩვენებს, რომ მანქანებს შორის მნიშვნელოვანი განსხვავებები არ არის, მაგრამ არსებობს ნიშნები, რომ თავები შეიძლება განსხვავდებოდეს. განსხვავება ყველა მანქანას შორის არ არის მნიშვნელოვანი, მაგრამ ორი მათგანისთვის განსხვავება თავებს შორის არის მნიშვნელოვანი.

მაგალითი 6: განმეორებითი გაზომვების ანალიზის ცალცვალებადობა სპლიტ-ნაკვეთის გეგმის გამოყენებით. ეს ექსპერიმენტი ჩატარდა იმის დასადგენად, თუ რა გავლენას ახდენს ინდივიდის შფოთვის შეფასება გამოცდის შესრულებაზე ოთხი ზედიზედ მცდელობისას. მონაცემები ორგანიზებულია ისე, რომ ისინი შეიძლება ჩაითვალოს მთლიანი მონაცემთა ნაკრების ქვეჯგუფებად („მთელი ნაკვეთი“). შფოთვის ეფექტი არ იყო მნიშვნელოვანი, ხოლო მცდელობის ეფექტი იყო მნიშვნელოვანი.

კოვარიანტული ანალიზი.კოვარიანტული ანალიზი - მათემატიკური სტატისტიკის მეთოდების ერთობლიობა, რომელიც დაკავშირებულია ზოგიერთი შემთხვევითი ცვლადის საშუალო მნიშვნელობის დამოკიდებულების მოდელების ანალიზთან ერთდროულად (ძირითადი) ხარისხობრივი ფაქტორებისა და (ასოცირებული) რაოდენობრივი ფაქტორების ერთობლიობაზე. ფაქტორები F ადგენს პირობების კომბინაციებს, რომლებშიც მიიღეს დაკვირვებები X, Y და აღწერილია ინდიკატორის ცვლადების გამოყენებით, ხოლო თანმხლებ და ინდიკატორ ცვლადებს შორის შეიძლება იყოს როგორც შემთხვევითი, ასევე არა შემთხვევითი (კონტროლირებადი ექსპერიმენტში).

თუ შემთხვევითი ცვლადი Y არის ვექტორი, მაშინ საუბარია კოვარიანტობის მრავალვარიანტულ ანალიზზე.

ხშირად გამოიყენება კოვარიანტობის ანალიზიდისპერსიის ანალიზამდე X,Y დაკვირვების ნიმუშის ჰომოგენურობის (ერთგვაროვნება, წარმომადგენლობა) შემოწმება ყველა თანმხლები ფაქტორებისთვის.