მონაცემთა კორელაციური და რეგრესიული ანალიზი. კორელაციური ველის აგება

შემთხვევით ცვლადებს შორის დამოკიდებულების ექსპერიმენტული კვლევისთვის x და yჩაატაროს არაერთი დამოუკიდებელი ექსპერიმენტი. შედეგი მეექსპერიმენტი იძლევა მნიშვნელობების წყვილს (x z, შ დ), ი = 1, 2,..., პ.

ობიექტების სხვადასხვა თვისების დამახასიათებელი მნიშვნელობები შეიძლება იყოს დამოუკიდებელი ან ურთიერთდაკავშირებული. ურთიერთდამოკიდებულების გამოვლინების ფორმები ძალზე მრავალფეროვანია. როგორც მათი ორი ყველაზე გავრცელებული ტიპი, გამოირჩევა ფუნქციური (სრული) და კორელაციური (არასრული) ურთიერთობები.

ორი სიდიდის ფუნქციური დამოკიდებულებით, ერთის მნიშვნელობა - x სთაუცილებლად შეესაბამება სხვა რაოდენობის ერთ ან უფრო ზუსტად განსაზღვრულ მნიშვნელობებს -y (.საკმაოდ ხშირად, ფუნქციური კავშირი ვლინდება ფიზიკაში, ქიმიაში. რეალურ სიტუაციებში, არსებობს უსასრულო რაოდენობის თვისებები თავად ობიექტისა და გარემოზე, რომლებიც გავლენას ახდენენ ერთმანეთზე, ამიტომ ასეთი ურთიერთობა არ არსებობს, სხვა სიტყვებით რომ ვთქვათ, ფუნქციური ურთიერთობები არის მათემატიკური აბსტრაქციები.

საერთო ფაქტორების გავლენა, ობიექტების ქცევაში ობიექტური შაბლონების არსებობა იწვევს მხოლოდ სტატისტიკური დამოკიდებულების გამოვლინებას. სტატისტიკური არის დამოკიდებულება, რომლის დროსაც ერთ-ერთ რაოდენობაში ცვლილება იწვევს სხვათა (მეორის) განაწილების ცვლილებას, ხოლო ეს სხვა რაოდენობები იღებენ გარკვეულ მნიშვნელობებს გარკვეული ალბათობით. ფუნქციური დამოკიდებულება ამ შემთხვევაში უნდა ჩაითვალოს სტატისტიკური დამოკიდებულების განსაკუთრებულ შემთხვევად: ერთი ფაქტორის მნიშვნელობა შეესაბამება სხვა ფაქტორების მნიშვნელობებს ერთის ტოლი ალბათობით. სტატისტიკური დამოკიდებულების უფრო მნიშვნელოვანი შემთხვევაა კორელაციური დამოკიდებულება, რომელიც ახასიათებს ურთიერთობას ზოგიერთი შემთხვევითი ცვლადის მნიშვნელობებს შორის სხვების საშუალო მნიშვნელობასთან, თუმცა თითოეულ ცალკეულ შემთხვევაში ნებისმიერ ურთიერთდაკავშირებულ მნიშვნელობას შეუძლია მიიღოს სხვადასხვა მნიშვნელობები.

კორელაცია (რომელსაც ასევე უწოდებენ არასრულს, ან სტატისტიკურს) ჩნდება საშუალოდ მასობრივი დაკვირვებისთვის, როდესაც დამოკიდებული ცვლადის მოცემული მნიშვნელობები შეესაბამება დამოუკიდებელი ცვლადის სავარაუდო მნიშვნელობების გარკვეულ რაოდენობას. ახსნა - გაანალიზებულ ფაქტორებს შორის ურთიერთკავშირის სირთულე, რომელთა ურთიერთქმედებაზე გავლენას ახდენს დაუანგარიშებელი შემთხვევითი ცვლადები. მაშასადამე, ნიშნებს შორის ურთიერთობა მხოლოდ საშუალოდ, შემთხვევების მასაში ვლინდება. კორელაციით, არგუმენტის თითოეული მნიშვნელობა შეესაბამება ფუნქციის შემთხვევით განაწილებულ მნიშვნელობებს გარკვეულ ინტერვალში.

ტერმინი „კორელაცია“ პირველად გამოიყენა ფრანგმა პალეონტოლოგმა ჯ. კუვიერმა, რომელმაც გამოიტანა „ცხოველის ნაწილებისა და ორგანოების კორელაციის კანონი“ (ეს კანონი საშუალებას გაძლევთ აღადგინოთ მთელი ცხოველის გარეგნობა სხეულის ნაპოვნი ნაწილებიდან. ). ეს ტერმინი სტატისტიკაში შემოიტანა ინგლისელმა ბიოლოგმა და სტატისტიკოსმა ფ. გალტონმა (არა მხოლოდ კავშირი - მიმართება, არამედ "როგორც იყო კავშირი" - კორელაცია).

კორელაციები ყველგან გვხვდება. მაგალითად, სოფლის მეურნეობაში, ეს შეიძლება იყოს კავშირი მოსავლიანობასა და გამოყენებული სასუქის რაოდენობას შორის. ცხადია, ეს უკანასკნელნი მონაწილეობენ მოსავლის ფორმირებაში. მაგრამ თითოეულ კონკრეტულ მინდორზე, ნაკვეთზე, გამოყენებული სასუქების იგივე რაოდენობა გამოიწვევს მოსავლიანობის განსხვავებულ ზრდას, ვინაიდან ურთიერთქმედებაში არსებობს მრავალი სხვა ფაქტორი (ამინდი, ნიადაგის პირობები და ა.შ.), რომლებიც ქმნიან საბოლოო შედეგს. თუმცა, საშუალოდ, ასეთი ურთიერთობა შეინიშნება - შეტანილი სასუქების მასის მატება იწვევს მოსავლიანობის ზრდას.

შესწავლილ მახასიათებლებს შორის ურთიერთობის იდენტიფიცირების უმარტივესი ტექნიკაა კორელაციური ცხრილის აგება; მისი ვიზუალური წარმოდგენა არის კორელაციური ველი. ეს არის გრაფიკი, სადაც jq-ის მნიშვნელობები გამოსახულია აბსცისაზე, ორდინატის გასწვრივ. x-ზე.წერტილების მდებარეობით, მათი კონცენტრაციით გარკვეულ მიმართულებით, თვისობრივად შეიძლება ვიმსჯელოთ კავშირის არსებობაზე.

ბრინჯი. 7.3.

პოზიტიური კორელაცია შემთხვევით ცვლადებს შორის, პარაბოლურ ფუნქციონალურთან ახლოს, ნაჩვენებია ნახ. 6.1 , ა.ნახ. 6.1, b გვიჩვენებს სუსტი უარყოფითი კორელაციის მაგალითს და ნახ. 6.1, in -პრაქტიკულად არაკორელირებული შემთხვევითი ცვლადების მაგალითი. კორელაცია მაღალია, თუ დამოკიდებულების „შეიძლება იყოს წარმოდგენილი“ გრაფიკზე სწორი ხაზის სახით (დადებითი ან უარყოფითი დახრილობით).

არსებობს ორი ტიპი ურთიერთობები ეკონომიკურ ფენომენებს შორის: ფუნქციური და სტატისტიკური. ურთიერთობა ორ რაოდენობას შორის Xდა ორი ფენომენის წარმომადგენლობა, შესაბამისად, ე.წ ფუნქციონალური, თუ x-ის თითოეული მნიშვნელობა შეესაბამება x-ის ერთ მნიშვნელობას და პირიქით. ეკონომიკაში ფუნქციონალური ურთიერთობის მაგალითია შრომის პროდუქტიულობის დამოკიდებულება პროდუქციის მოცულობასა და სამუშაო დროის ხარჯზე. თუმცა უნდა აღინიშნოს, რომ თუ Xარის განმსაზღვრელი, არა შემთხვევითი ცვლადი, მაშინ მნიშვნელობა ფუნქციურად დამოკიდებულია მასზე ასევე განმსაზღვრელია. თუ Xშემთხვევითია, მაშინ ასევე შემთხვევითი ცვლადი.

თუმცა, ბევრად უფრო ხშირად ეკონომიკაში არ არის ფუნქციონალური, მაგრამ სტატისტიკური დამოკიდებულება, როდესაც დამოუკიდებელი ცვლადის თითოეული ფიქსირებული მნიშვნელობა Xშეესაბამება Y დამოკიდებული ცვლადის არა ერთ, არამედ ბევრ მნიშვნელობას და წინასწარ შეუძლებელია იმის თქმა, თუ რომელი მნიშვნელობა მიიღებს . ეს გამოწვეულია იმით, რომ ზე გარდა ცვლადისა Xასევე გავლენას ახდენს მრავალი უკონტროლო შემთხვევითი ფაქტორი. Ამ სიტუაციაში არის შემთხვევითი ცვლადი და ცვლადი Xშეიძლება იყოს დეტერმინისტული ან შემთხვევითი.

სტატისტიკური დამოკიდებულების განსაკუთრებული შემთხვევაა კორელაციური დამოკიდებულება, რაზეც ფაქტორი Xდა ეფექტური ინდიკატორის საშუალო მნიშვნელობა (მათემატიკური მოლოდინი). . სტატისტიკური დამოკიდებულების გამოვლენა შესაძლებელია მხოლოდ საკმარისად დიდი რაოდენობის დაკვირვების შედეგებით. გრაფიკულად, ორი მახასიათებლის სტატისტიკური დამოკიდებულების წარმოდგენა შესაძლებელია კორელაციური ველის გამოყენებით, რომლის აგებისას ფაქტორული მახასიათებლის მნიშვნელობა გამოსახულია აბსცისის ღერძზე. X, ხოლო ორდინატის გასწვრივ - მიღებული .

კორელაცია- სტატისტიკური ურთიერთობის განსაკუთრებული შემთხვევა, რომელშიც ცვლადის სხვადასხვა მნიშვნელობები შეესაბამება სხვა ცვლადის სხვადასხვა საშუალო მნიშვნელობებს. კორელაცია ვარაუდობს, რომ შესწავლილ ცვლადებს აქვთ რაოდენობრივი გამოხატულება.

თუ შესწავლილია ურთიერთობა ორ მახასიათებელს შორის, არსებობს წყვილთა კორელაცია; თუ შესწავლილია ურთიერთობა მრავალ მახასიათებელს შორის - მრავალჯერადი კორელაცია.

მაგალითად, ნახ.

1 წარმოადგენს მონაცემებს, რომლებიც ასახავს მათ შორის პირდაპირ კავშირს Xდა ზე(ნახ. 1, ა) და შებრუნებული ურთიერთობა (ნახ. 1, ბ). "a"-ს შემთხვევაში ეს არის პირდაპირი კავშირი, მაგალითად, საშუალო შემოსავალს ერთ სულ მოსახლეზე ( X) და დანაზოგი ( ზე) ოჯახში. „ბ“ შემთხვევაში ჩვენ ვსაუბრობთ შებრუნებულ ურთიერთობაზე. ეს არის ჩვენი მაგალითი, ურთიერთობა შრომის პროდუქტიულობას შორის ( X) და წარმოების ერთეულის ღირებულება ( ზე). ნახ. 1 თითოეული პუნქტიანი პერსონაჟი სწავლობს დაკვირვების ობიექტს საკუთარი მნიშვნელობებით Xდა ზე.

ბრინჯი. 1. კორელაციური ველი

ნახ. 1 ასევე აჩვენებს სწორ ხაზებს, ტიპის წრფივი რეგრესიის განტოლებებს, რომლებიც ახასიათებს დამოუკიდებელ ცვლადს შორის ფუნქციურ ურთიერთობას Xდა შესრულების ინდიკატორის საშუალო მნიშვნელობა ზე. ამრიგად, რეგრესიის განტოლების მიხედვით, იცის X, შესაძლებელია მხოლოდ საშუალო მნიშვნელობის აღდგენა ზე.

გრაფიკულად, ორი მახასიათებლის ურთიერთობა გამოსახულია კორელაციის ველის გამოყენებით. კოორდინატთა სისტემაში ფაქტორის ატრიბუტის მნიშვნელობები გამოსახულია აბსცისის ღერძზე, ხოლო შედეგად მიღებული ატრიბუტი გამოსახულია ორდინატთა ღერძზე. ამ ღერძებით გავლებული ხაზების ყოველი გადაკვეთა მითითებულია წერტილით. მჭიდრო კავშირების არარსებობის შემთხვევაში, გრაფიკზე ადგილი აქვს წერტილების შემთხვევით განლაგებას (ნახ. 11.1).


მიღებული დამოკიდებულება გრაფიკულად გამოვსახოთ კოორდინატთა სიბრტყის წერტილებით (ნახ. 3.1). სტატისტიკური ურთიერთობის ასეთ გამოსახულებას კორელაციური ველი ეწოდება.

შექმენით კორელაციური ველი და ჩამოაყალიბეთ ჰიპოთეზა კავშირის ფორმის შესახებ.

ორ მახასიათებელს შორის ურთიერთობის შესწავლისას საკმაოდ ნათელია რეგრესიის განტოლების ტიპის შერჩევის გრაფიკული მეთოდი. იგი ეფუძნება კორელაციის ველს. მრუდების ძირითადი ტიპები, რომლებიც გამოიყენება ურთიერთობების რაოდენობრივ შეფასებაში, ნაჩვენებია ნახ. 2.1.

ვინაიდან კორელაციური ველის ყველა წერტილი არ დევს რეგრესიის ხაზზე, ყოველთვის არის გაფანტვა როგორც x ფაქტორის გავლენის გამო, ანუ რეგრესია y x-ისთვის, ასევე გამოწვეული სხვა მიზეზებით (აუხსნელი ვარიაცია). რეგრესიის ხაზის ვარგისიანობა პროგნოზირებისთვის დამოკიდებულია იმაზე, თუ რამდენად არის გათვალისწინებული y თვისების მთლიანი ვარიაცია ახსნილი ვარიაციით. ცხადია, თუ რეგრესიის გამო კვადრატული გადახრების ჯამი მეტია კვადრატების ნარჩენ ჯამს, მაშინ რეგრესიის განტოლება სტატისტიკურად მნიშვნელოვანია და x ფაქტორი მნიშვნელოვან გავლენას ახდენს შედეგზე. ეს უდრის იმ ფაქტს, რომ განსაზღვრის კოეფიციენტი r2 მიუახლოვდება ერთიანობას.

შესაბამისად, ნახ. 3.5 ბ) და გ), ნარჩენების ჰეტეროსკედასტიურობა ნაჩვენებია ნახ. 3.9 და 3.10.

თუ მნიშვნელობები დამოუკიდებელია, მაშინ "კორელაციის ველი" ან pa-

თუ კორელაციის ველი შეიძლება მიახლოებული იყოს სწორი ხაზით, რომელსაც რეგრესიის ხაზს უწოდებენ, მაშინ გადადით წყვილის კორელაციის კოეფიციენტის გამოთვლაზე r. მისი რიცხვითი მნიშვნელობები არის [-1, 1] ინტერვალში. თუ r უდრის 1-ს ან -1-ს, მაშინ არის ფუნქციური მიწოდება ან უკუკავშირი. როდესაც r ახლოს არის ნულთან, არ არსებობს კავშირი ფენომენებს შორის და r 0.7-ზე კავშირი ითვლება მნიშვნელოვანად. კორელაციის კოეფიციენტი გამოითვლება ფორმულით

რკინიგზის ობიექტების ზემოაღნიშნული ჯგუფების იდენტიფიცირების შემდეგ გამოყენებული იქნა რკინიგზის ობიექტების თითოეული ჯგუფისთვის მოსახლეობის ჰომოგენურობის წინასწარი ანალიზის კიდევ ერთი მიახლოებითი მეთოდი - კვლევაში შემავალი თითოეული ფაქტორის კორელაციური ველების მშენებლობა ტრანსპორტირების ღირებულებასთან. შერჩეული პოპულაციების ჰომოგენურობის ან ჰეტეროგენურობის მთავარი მახასიათებელი იყო კორელაციური ველების წერტილების მდებარეობაში ხარვეზებისა და ნახტომების არარსებობა ან არსებობა.

კვლევისთვის, პროფესიული ლოგიკური ანალიზით წინასწარ იქნა შერჩეული ყველა შესაძლო ფაქტორი, საწარმოთათვის არსებული ცვლილებების მონაცემები ხელმისაწვდომია სამინისტროს ანგარიშში. ასეთ ფაქტორებად უნდა ჩაითვალოს ტრანსპორტის მთლიანი მოცულობა, სამუშაო ფლოტის ვაგონებისა და ლოკომოტივების საშუალო პროდუქტიულობა, ტვირთის ინტენსივობა, სატრანსპორტო ერთეულის კაპიტალის ინტენსივობა და შრომის პროდუქტიულობა და ა.შ. (სულ 11 ფაქტორი). ამრიგად, საწარმოთა ოთხი ჯგუფისთვის 44 კორელაციური ველი აშენდა.

მითითებული მნიშვნელობების დადგენის შემდეგ მიიღება წყვილის დამოკიდებულების განტოლება, რომლის გრაფიკულ გამოსახულებას კოორდინატთა ღერძებში ეწოდება თეორიული რეგრესიის ხაზი. თუ ყველა გაზომვა გამოყენებული იქნება ასეთ ველზე და არა მხოლოდ თეორიული რეგრესიის ხაზი, მაშინ მივიღებთ კორელაციის ველს.

ჩვენ ვაწარმოებთ წყაროს მასალის სისტემატიზაციას კორელაციის სფეროში და კორელაციის ცხრილში. ჩვენს მაგალითში, ფაქტორი არის მანქანების ღირებულება Cm, ხოლო ფუნქცია არის მუშათა საშუალო წლიური რაოდენობა P.

ინტერვალებად დაყოფის შედეგად, მთელი სიბრტყე, რომელზედაც არის გაზომვები ორივე ნიშნისთვის k და y, რომელსაც კორელაციური ველი ეწოდება, იქნება უჯრედები და თითოეული გაზომვა ხასიათდება არა მისი კოორდინატების ზუსტი მნიშვნელობებით, არამედ. მხოლოდ იმ ინტერვალის მნიშვნელობებით, რომელშიც ის არის მინიჭებული.

ნახ. 16 გვიჩვენებს კორელაციის ველს, რომელზეც არგუმენტის Сы მნიშვნელობების ინტერვალები მოცემულია აბსცისის ღერძის გასწვრივ, ხოლო P ფუნქციის მნიშვნელობის ინტერვალები მოცემულია ორდინატთა ღერძის გასწვრივ. კორელაციური ველი აგებულია ამ გზით. მეორადი ეწოდება.

პირველადი კორელაციის ველი ასევე შეიძლება აშენდეს ინტერვალების შესარჩევად. ამ ველში ყველა წერტილი აღინიშნება მათი კოორდინატების მნიშვნელობების გათვალისწინებით. წერტილების სიმკვრივის მიხედვით გამოიკვეთება ინტერვალები.

კორელაციური ველის აგებასთან ერთად, როგორც ზემოთ აღინიშნა, შედგენილია კორელაციური ცხრილი, რომელშიც ყველა გამოთვლა, რომელიც დაკავშირებულია საშუალოების განსაზღვრასთან, ემპირიული რეგრესიის ხაზის აგებასთან და ნორმალურ სისტემაში პარამეტრების განსაზღვრის საწყის მონაცემებთან. შესრულებულია განტოლებები.

მაგიდაზე. 36 ყველა მასალა დაყოფილია ინტერვალებად. მისი გამოყენებით ვაშენებთ მეორად კორელაციური ველს, რომელზეც გამოვსახავთ ცვლადების ყველა მნიშვნელობას და ვადგენთ საშუალო მნიშვნელობებს (/, //, ..., yn. საშუალო მნიშვნელობების დაკავშირება სწორი ხაზის სეგმენტების თითოეულ ინტერვალში ვიღებთ ემპირიულ რეგრესიის ხაზს (იხ. სურ. 16).

თითოეული ინტერვალის ცენტრიდან აბსცისის ღერძის პერპენდიკულარულს აღვადგენთ, თითოეულ მათგანს ვაყენებთ y-ის შესაბამის მნიშვნელობებს, მაგრამ ინტერვალებს r /, \u003d 1081, 1/2 \u003d 1774 და ა.შ. მიიღეს წერტილები ერთმანეთთან სწორი ხაზის სეგმენტებით. შედეგად მიღებული გატეხილი ხაზი არის ემპირიული რეგრესიის ხაზი მანქანების ღირებულებას Cm და მუშათა რაოდენობა P-ს შორის ურთიერთობისთვის. შესრულებული გამოთვლების ანალოგიით, ჩვენ შეგვიძლია ავაშენოთ კორელაციის ცხრილები და კორელაციის ველები, რათა დავადგინოთ ურთიერთობა P მუშათა რაოდენობას შორის. , სამუშაოს მოცულობა O, ასაწყობი ბეტონის და რკინაბეტონის კონსტრუქციების რაოდენობა / იჟ.ბ.
ბრინჯი. 18. მუშების რაოდენობისა და ბეტონის კონსტრუქციების გამოყენების მოცულობის დამოკიდებულების კორელაციის ცხრილი და მეორადი ველი. /info/5440"> წყვილი რეგრესიის განტოლებები და მოგვიანებით მიღებული მრავალჯერადი რეგრესია გამოიყენება, თუ ცვლადები შეიცვლება შემდეგ საზღვრებში: მუშათა რაოდენობა - 850-დან 7850 ადამიანამდე, მანქანების ღირებულება - 0,15-დან 3,15 მილიონ რუბლამდე. ასაწყობი კონსტრუქციების მოცულობა 10-დან 230 ათას მ-მდეა და გამოსახულია ვერტიკალური ღერძის გასწვრივ, დამოუკიდებელ მნიშვნელობებში - ჰორიზონტალურ გასწვრივ. კორელაციური ველი გამოიყენება ცვლადებს შორის ურთიერთობის ფორმის დასადგენად, გრაფიკი იძლევა მკვლევარი პირველი

უმცირესი კვადრატების მესამე წინაპირობა მოითხოვს, რომ ნარჩენების დისპერსია იყოს ჰომოსკედასტური. ეს ნიშნავს, რომ Xj ფაქტორის თითოეული მნიშვნელობისთვის ნარჩენებს e, - აქვთ იგივე დისპერსია. თუ LSM-ის გამოყენების ეს პირობა არ დაკმაყოფილებულია, მაშინ ხდება ჰეტეროსცედასტიურობა. ჰეტეროსკედასტიურობის არსებობა აშკარად ჩანს კორელაციური ველიდან (ნახ. 3.5).

კიდევ ერთი ტიპიური კვლევითი ამოცანა - ფენომენებს შორის ურთიერთობის შეფასება - წყდება მათემატიკური სტატისტიკაში კორელაციის თეორიის კარგად განვითარებული აპარატის გამოყენებით. ამისათვის საჭიროა სხვადასხვა საგნების რუკებზე (მაგალითად, D და C) ნაჩვენები შედარებული ფენომენების ნიმუშები. a და b მნიშვნელობები აღებულია იმავე /-th წერტილებში, ე.ი. მკაცრად კოორდინირებული, და შემდეგ დახაზეთ კორელაციის ველი.

1. სამუშაოს თემა.

2. მოკლე თეორიული ინფორმაცია.

3. სამუშაოს ბრძანება.

4. მათემატიკური მოდელის შემუშავების საწყისი მონაცემები.

5. მათემატიკური მოდელის შემუშავების შედეგები.

6. მოდელის შესწავლის შედეგები. პროგნოზის აგება.

7. დასკვნები.

2-4 ამოცანებში შეგიძლიათ გამოიყენოთ Excel PPP მოდელის მუშაობის გამოსათვლელად.

სამუშაო ნომერი 1.

დაწყვილებული რეგრესიის მოდელების აგება. ნარჩენების შემოწმება ჰეტეროსკედასტიურობისთვის.

15 საწარმოსთვის, რომლებიც აწარმოებენ იმავე ტიპის პროდუქტს, ცნობილია ორი მახასიათებლის მნიშვნელობა:

X -გამომავალი, ათასი ერთეული;

y -წარმოების ხარჯები, მილიონი რუბლი

x
5,3 18,4
15,1 22,0
24,2 32,3
7,1 16,4
11,0 22,2
8,5 21,7
14,5 23,6
10,2 18,5
18,6 26,1
19,7 30,2
21,3 28,6
22,1 34,0
4,1 14,2
12,0 22,1
18,3 28,2

საჭირო:

1. შექმენით კორელაციური ველი და ჩამოაყალიბეთ ჰიპოთეზა ურთიერთობის ფორმის შესახებ.

2. აშენების მოდელები:

ხაზოვანი წყვილის რეგრესია.

ნახევრად ჟურნალი წყვილთა რეგრესია.

2.3 სიმძლავრის წყვილის რეგრესია.
Ამისთვის:


2. შეაფასეთ ურთიერთობის სიმჭიდროვე კოეფიციენტის (ინდექსის) გამოყენებით.
კორელაციები.

3. მოდელის ხარისხის შეფასება კოეფიციენტის (ინდექსის) გამოყენებით.
განსაზღვრა და მიახლოების საშუალო შეცდომა
.

4. დაწერეთ დრეკადობის საშუალო კოეფიციენტის გამოყენებით
ფაქტორსა და შედეგს შორის ურთიერთობის სიძლიერის შედარებითი შეფასება
.

5. გამოყენება - ფიშერის კრიტერიუმი რეგრესიის მოდელირების შედეგების სტატისტიკური სანდოობის შესაფასებლად.

2-5 პუნქტებში გამოთვლილი მახასიათებლების მნიშვნელობების მიხედვით, აირჩიეთ საუკეთესო რეგრესიის განტოლება.

Golfreld-Quandt მეთოდის გამოყენებით, შეამოწმეთ ნარჩენები ჰეტეროსკედასტიურობისთვის.

ჩვენ ვაშენებთ კორელაციის ველს.

კორელაციური ველის წერტილების მდებარეობის გაანალიზებისას ვვარაუდობთ, რომ ნიშანს შორის ურთიერთობა Xდა ზეშეიძლება იყოს წრფივი, ე.ი. y=a+bx, ან არაწრფივი ფორმა: y=a+blnx, y=ax b.

შესწავლილი ურთიერთობის თეორიიდან გამომდინარე, ჩვენ ველით დამოკიდებულების მიღებას ზესაწყისი Xკეთილი y=a+bx,რადგან წარმოების ხარჯები შეიძლება დაიყოს ორ ტიპად: მუდმივი, წარმოების მოცულობისგან დამოუკიდებელი - როგორიცაა ქირა, ადმინისტრაციის მოვლა და ა.შ.; და ცვლადები, რომლებიც იცვლება გამომუშავების პროპორციულად bx,როგორიცაა მასალის მოხმარება, ელექტროენერგია და ა.შ.


2.1.ხაზოვანი წყვილის რეგრესიის მოდელი.

2.1.1. მოდით გამოვთვალოთ პარამეტრები და ხაზოვანი რეგრესია y=a+bx.

ჩვენ ვაშენებთ გაანგარიშების ცხრილს 1.

ცხრილი 1

Პარამეტრები და განტოლებები

Y x = a + bx


გაყოფილი :

რეგრესიის განტოლება:

=11.591+0.871x

გამოშვების ზრდით 1 ათასი რუბლით. წარმოების ხარჯები იზრდება 0,871 მილიონი რუბლით. საშუალოდ, ფიქსირებული ხარჯები 11,591 მილიონი რუბლია.

2.1.2. ჩვენ ვაფასებთ ურთიერთობის სიახლოვეს წყვილის კორელაციის ხაზოვანი კოეფიციენტის გამოყენებით.

მოდით წინასწარ განვსაზღვროთ მახასიათებლების სტანდარტული გადახრები.

სტანდარტული გადახრები:

Კორელაციის კოეფიციენტი:

ნიშნებს შორის Xდა არის ძალიან ძლიერი წრფივი კორელაცია.

2.1.3. მოდით შევაფასოთ აშენებული მოდელის ხარისხი.

ანუ ეს მოდელი ხსნის მთლიანი ვარიაციის 90.5%-ს ზე, აუხსნელი დისპერსიის წილი 9.5%-ს შეადგენს.

ამიტომ მოდელის ხარისხი მაღალია.

მაგრამმე .

პირველ რიგში, რეგრესიის განტოლებიდან, ჩვენ განვსაზღვრავთ თეორიულ მნიშვნელობებს ფაქტორის თითოეული მნიშვნელობისთვის.

მიახლოების შეცდომა A მე, მე=1…15:

საშუალო მიახლოების შეცდომა:

2.1.4. განვსაზღვროთ ელასტიურობის საშუალო კოეფიციენტი:

იგი აჩვენებს, რომ პროდუქციის 1%-ით მატებასთან ერთად წარმოების ხარჯები იზრდება საშუალოდ 0,515%-ით.

2.1.5. მოდით შევაფასოთ მიღებული განტოლების სტატისტიკური მნიშვნელობა.
მოდით შევამოწმოთ ჰიპოთეზა H0რომ გამოვლენილი დამოკიდებულება ზესაწყისი Xარის შემთხვევითი, ანუ მიღებული განტოლება სტატისტიკურად უმნიშვნელოა. ავიღოთ α=0,05. ვიპოვოთ ტაბულური (კრიტიკული) მნიშვნელობა F-ფიშერის კრიტერიუმი:

იპოვნეთ რეალური მნიშვნელობა - ფიშერის კრიტერიუმი:

აქედან გამომდინარე ჰიპოთეზა H0 H1 xდა შემთხვევითი არ არის.

ავაშენოთ მიღებული განტოლება.

2.2. სემილოგი წყვილთა რეგრესიის მოდელი.

2.2.1. მოდით გამოვთვალოთ პარამეტრები და რეგრესიაში:

y x \u003d a + blnx.

ჩვენ ვახაზავთ ამ განტოლებას, აღვნიშნავთ:

y=a + bz.

Პარამეტრები და განტოლებები

= ა+ბზ

განისაზღვრება უმცირესი კვადრატების მეთოდით:


ჩვენ ვიანგარიშებთ ცხრილს 2.

ცხრილი 2

გაყოფილი და კრამერის მეთოდით ამოხსნით, ვიღებთ განსაზღვრის ფორმულას :

რეგრესიის განტოლება:

= -1,136 + 9,902z

2.2.2. მოდით შევაფასოთ მახასიათებლებს შორის კავშირის სიახლოვე ზედა X.

განტოლებიდან გამომდინარე y = a + მილიარდი xწრფივი პარამეტრების მიმართ და და მისი წრფივება არ იყო დაკავშირებული დამოკიდებული ცვლადის ტრანსფორმაციასთან _ ზე, შემდეგ ცვლადებს შორის კავშირის სიმჭიდროვე ზედა X, შეფასებული წყვილის კორელაციის ინდექსის გამოყენებით Rxy, ასევე შეიძლება განისაზღვროს ხაზოვანი წყვილის კორელაციის კოეფიციენტის გამოყენებით r yz

სტანდარტული გადახრა :

კორელაციის ინდექსის მნიშვნელობა ახლოს არის 1-თან, შესაბამისად, ცვლადებს შორის ზედა Xარის ძალიან მჭიდრო კორელაცია = a + bz.

2.2.3. მოდით შევაფასოთ აშენებული მოდელის ხარისხი.

განვსაზღვროთ განსაზღვრის კოეფიციენტი:

ანუ ეს მოდელი ხსნის შედეგის მთლიანი ვარიაციის 83.8%-ს ზე, აუხსნელი ცვალებადობის წილი 16.2%-ს შეადგენს. ამიტომ მოდელის ხარისხი მაღალია.

მოდით ვიპოვოთ საშუალო მიახლოების შეცდომის მნიშვნელობა მაგრამმე .

პირველ რიგში, რეგრესიის განტოლებიდან, ჩვენ განვსაზღვრავთ თეორიულ მნიშვნელობებს ფაქტორის თითოეული მნიშვნელობისთვის. მიახლოების შეცდომა Და მე ,:

, მე=1…15.

საშუალო მიახლოების შეცდომა:

.

შეცდომა მცირეა, მოდელის ხარისხი მაღალია.

2.2.4 განვსაზღვროთ ელასტიურობის საშუალო კოეფიციენტი:

ის აჩვენებს, რომ პროდუქციის 1%-ით ზრდით, წარმოების ხარჯები იზრდება საშუალოდ 0,414%-ით.

2.2.5. მოდით შევაფასოთ მიღებული განტოლების სტატისტიკური მნიშვნელობა.
მოდით შევამოწმოთ ჰიპოთეზა H0რომ გამოვლენილი დამოკიდებულება ზესაწყისი Xშემთხვევითია, ე.ი. მიღებული განტოლება სტატისტიკურად უმნიშვნელოა. ავიღოთ α=0,05.

ვიპოვოთ ტაბულური (კრიტიკული) მნიშვნელობა - ფიშერის კრიტერიუმი:

იპოვნეთ რეალური მნიშვნელობა - ფიშერის კრიტერიუმი:

აქედან გამომდინარე ჰიპოთეზა H0უარყოფილი, ალტერნატიული ჰიპოთეზა მიღებული H1: 1-α=0,95 ალბათობით მიღებული განტოლება სტატისტიკურად მნიშვნელოვანია, ცვლადებს შორის კავშირი xდა შემთხვევითი არ არის.

ავაშენოთ რეგრესიის განტოლება კორელაციის ველზე

2.3. სიმძლავრის წყვილის რეგრესიის მოდელი.

2.3.1. მოდით გამოვთვალოთ პარამეტრები და სიმძლავრის რეგრესია:

პარამეტრების გამოთვლას წინ უძღვის ამ განტოლების წრფივირების პროცედურა:

და ცვლადების შეცვლა:

Y=lny, X=lnx, A=lna

განტოლების პარამეტრები:

განისაზღვრება უმცირესი კვადრატების მეთოდით:


ჩვენ ვიანგარიშებთ ცხრილს 3.

ჩვენ განვსაზღვრავთ :

რეგრესიის განტოლება:

მოდით ავაშენოთ რეგრესიის განტოლება კორელაციის ველზე:

2.3.2. მოდით შევაფასოთ მახასიათებლებს შორის კავშირის სიახლოვე ზედა Xწყვილის კორელაციის ინდექსის გამოყენებით R yx .

წინასწარ გამოთვალეთ თეორიული მნიშვნელობა თითოეული ფაქტორის მნიშვნელობისთვის x,და მერე:

კორელაციის ინდექსის მნიშვნელობა Rxy 1-თან ახლოს, შესაბამისად ცვლადებს შორის ზედა Xფორმის ძალიან მჭიდრო კორელაციაა:

2.3.3. მოდით შევაფასოთ აშენებული მოდელის ხარისხი.

მოდით განვსაზღვროთ განსაზღვრის ინდექსი:

R2=0,936 2 =0,878,

ანუ ეს მოდელი ხსნის შედეგის მთლიანი ვარიაციის 87.6%-ს y,ხოლო აუხსნელი ცვალებადობის წილი 12.4%-ს შეადგენს.

მოდელის ხარისხი მაღალია.

მოდით ვიპოვოთ საშუალო მიახლოების შეცდომის მნიშვნელობა.

მიახლოების შეცდომა A მე, მე=1…15:

საშუალო მიახლოების შეცდომა:

შეცდომა მცირეა, მოდელის ხარისხი მაღალია.

2.3.4. განვსაზღვროთ ელასტიურობის საშუალო კოეფიციენტი:

იგი აჩვენებს, რომ პროდუქციის 1%-ით მატებასთან ერთად წარმოების ხარჯები იზრდება საშუალოდ 0,438%-ით.

2.3.5 შევაფასოთ მიღებული განტოლების სტატისტიკური მნიშვნელობა.

მოდით შევამოწმოთ ჰიპოთეზა H0რომ გამოვლენილი დამოკიდებულება ზესაწყისი Xარის შემთხვევითი, ანუ მიღებული განტოლება სტატისტიკურად უმნიშვნელოა. ავიღოთ α=0,05.

ტაბულური (კრიტიკული) მნიშვნელობა - ფიშერის კრიტერიუმი:

რეალური ღირებულება - ფიშერის კრიტერიუმი:

აქედან გამომდინარე ჰიპოთეზა H0უარყოფილი, ალტერნატიული ჰიპოთეზა მიღებული H1: 1-α=0,95 ალბათობით მიღებული განტოლება სტატისტიკურად მნიშვნელოვანია, ცვლადებს შორის კავშირი xდა შემთხვევითი არ არის.

ცხრილი 3

3. საუკეთესო განტოლების არჩევა.

შევადგინოთ კვლევის შედეგების ცხრილი.

ცხრილი 4

ვაანალიზებთ ცხრილს და ვაკეთებთ დასკვნებს.

ú სამივე განტოლება აღმოჩნდა სტატისტიკურად მნიშვნელოვანი და სანდო, აქვს კორელაციის კოეფიციენტი (ინდექსი) 1-თან ახლოს, მაღალი (1-თან ახლოს) განსაზღვრის კოეფიციენტი (ინდექსი) და მიახლოების შეცდომა დასაშვებ ზღვრებში.

ú ამავდროულად, ხაზოვანი მოდელის მახასიათებლები მიუთითებს იმაზე, რომ იგი აღწერს ნიშნებს შორის ურთიერთობას xდა წ.

ú ამიტომ, რეგრესიის განტოლებად ვირჩევთ წრფივ მოდელს.

ორ სტატისტიკურ მახასიათებელს X და Y შორის კორელაციის საკითხის დასმისას ტარდება ექსპერიმენტი მათი მნიშვნელობების პარალელური აღრიცხვით.

მაგალითი 8.1.

დაადგინეთ, დამოკიდებულია თუ არა სირბილით სიგრძეზე ნახტომის შედეგი (ნიშანი X) საბოლოო აფრენის სიჩქარის მნიშვნელობაზე (ნიშანი Y). ამ კითხვაზე პასუხის გასაცემად, სპორტსმენის ან სპორტსმენთა ჯგუფის ყოველი ნახტომის X შედეგის აღრიცხვის პარალელურად, ფიქსირდება საბოლოო აფრენის Y სიჩქარის მნიშვნელობაც. დაე ისინი იყვნენ:

ცხრილი 5

მე
xi (სმ)
yi (მ/წმ) 10,7 10,5 10,1 9,8 10,1 10,5 9,1 9,6

წარმოვიდგინოთ ცხრილი 5, როგორც გრაფიკი მართკუთხა კოორდინატულ სისტემაში, სადაც გამოვსახავთ ნახტომის სიგრძეს (X) ჰორიზონტალურ ღერძზე და საბოლოო აფრენის სიჩქარის მნიშვნელობას ამ ნახტომში (Y) ვერტიკალურ ღერძზე. .
ფუნქცია PlayMyFlash(cmd)( Corel_.TPlay(cmd); )

№1 !!! №2 !!! №3 !!! №4 !!! №5!!! №6 !!! №7 !!! №8!!!

ბრინჯი. 8. კორელაციური ველის გრაფიკი.

ამგვარად მიღებული წერტილების სკატერ ზონას გრაფიკზე კორელაციის ველად დავარქმევთ. კორელაციის ველის ვიზუალურად გაანალიზებისას ნახატ 8-ში, ხედავთ, რომ ის, თითქოს, წაგრძელებულია სწორი ხაზის გასწვრივ. ეს სურათი დამახასიათებელია ეგრეთ წოდებული ხაზოვანი კორელაციური ურთიერთობისთვის მახასიათებლებს შორის. ამ შემთხვევაში, ზოგადად შეიძლება ვივარაუდოთ, რომ აფრენის საბოლოო სიჩქარის მატებასთან ერთად, ნახტომის სიგრძეც იზრდება და პირიქით. იმათ. განხილულ მახასიათებლებს შორის არის პირდაპირი (დადებითი) კავშირი.

ამ მაგალითთან ერთად, შეიძლება გამოიყოს შემდეგი მრავალი სხვა შესაძლო კორელაციური ველი (ნახ. 9-11):

ნახაზი 9 ასევე გვიჩვენებს წრფივ ურთიერთობას, მაგრამ ერთი ატრიბუტის მნიშვნელობების ზრდით, მეორეს მნიშვნელობები მცირდება და პირიქით, ე.ი. გამოხმაურება ან უარყოფითი. შეიძლება ვივარაუდოთ, რომ ნახაზ 11-ზე კორელაციური ველის წერტილები მიმოფანტულია რაღაც მრუდი ხაზის გარშემო. ამ შემთხვევაში ამბობენ, რომ ნიშნების მრუდი კორელაციაა.

მე-10 სურათზე გამოსახულ კორელაციის ველთან დაკავშირებით, არ შეიძლება ითქვას, რომ წერტილები განლაგებულია რაიმე სწორი ან მრუდი ხაზის გასწვრივ, მას აქვს სფერული ფორმა. ამ შემთხვევაში, X და Y თვისებები ერთმანეთისგან დამოუკიდებელია.

გარდა ამისა, კორელაციური ველის მიხედვით, დაახლოებით შეიძლება ვიმსჯელოთ კორელაციის სიახლოვეზე, თუ ეს ურთიერთობა არსებობს. აქ ამბობენ: რაც უფრო ნაკლებია წერტილები მიმოფანტული წარმოსახვითი საშუალო ხაზის გარშემო, მით უფრო მჭიდროა კორელაცია განხილულ მახასიათებლებს შორის.

კორელაციური ველების ვიზუალური ანალიზი დაგეხმარებათ გაიგოთ კორელაციური ურთიერთობის არსი, საშუალებას გაძლევთ გააკეთოთ ვარაუდი ურთიერთობის არსებობის, მიმართულების და სიმჭიდროვის შესახებ. მაგრამ ამ მეთოდის გამოყენებით დანამდვილებით შეუძლებელია იმის თქმა, არის თუ არა კავშირი ნიშნებს შორის, წრფივი თუ მრუდი, მჭიდრო კავშირი (სანდო) თუ სუსტი (არასანდო). მახასიათებლებს შორის წრფივი ურთიერთობის იდენტიფიცირებისა და შეფასების ყველაზე ზუსტი მეთოდია სტატისტიკური მონაცემებიდან სხვადასხვა კორელაციური ინდიკატორების განსაზღვრის მეთოდი.

3. კორელაციის კოეფიციენტები და მათი თვისებები

ხშირად ორ მახასიათებელს შორის ურთიერთობის სანდოობის დასადგენად (X, Y)გამოყენება არაპარამეტრული (რანგის) სპირმენის კორელაციის კოეფიციენტი და პირსონის პარამეტრული კორელაციის კოეფიციენტი . ამ კორელაციის ინდიკატორების მნიშვნელობა განისაზღვრება შემდეგი ფორმულებით:

(1)

სად: dx - x მახასიათებლის სტატისტიკური მონაცემების რანგები;

dy - y მახასიათებლის სტატისტიკური მონაცემების რანგები.

(2)

სადაც: - x მახასიათებლის სტატისტიკური მონაცემები,

y მახასიათებლის სტატისტიკური მონაცემები.

ამ კოეფიციენტებს აქვთ შემდეგი ძლიერი მახასიათებლები:

1. კორელაციის კოეფიციენტებზე დაყრდნობით, შეიძლება ვიმსჯელოთ მხოლოდ ნიშან-თვისებებს შორის სწორხაზოვანი კორელაციური ურთიერთობის შესახებ. მათი დახმარებით მრუდი კავშირზე ვერაფერს ვიტყვი.
2. კორელაციის კოეფიციენტების მნიშვნელობები არის განზომილებიანი მნიშვნელობა, რომელიც არ შეიძლება იყოს -1-ზე ნაკლები და +1-ზე მეტი, ე.ი.
3.
4. თუ კორელაციის კოეფიციენტების მნიშვნელობები ნულის ტოლია, ე.ი. = 0 ან = 0, შემდეგ კავშირი x, y მახასიათებლებს შორის დაკარგული.
5. თუ კორელაციის კოეფიციენტების მნიშვნელობები უარყოფითია, ე.ი.< 0 или < 0, то связь между признаками Х и Y საპირისპირო.
6. თუ კორელაციის კოეფიციენტების მნიშვნელობები დადებითია, ე.ი. > 0 ან y> 0, შემდეგ X და Y მახასიათებლებს შორის ურთიერთობა სწორი(დადებითი).
7. თუ კორელაციის კოეფიციენტები იღებენ მნიშვნელობებს +1 ან -1, ე.ი. = ± 1 ან = ± 1, შემდეგ კავშირი X და Y მახასიათებლებს შორის ხაზოვანი (ფუნქციური).
8. მხოლოდ კორელაციის კოეფიციენტების მნიშვნელობით შეუძლებელია ვიმსჯელოთ ნიშნებს შორის კორელაციის სანდოობაზე. ეს საიმედოობა ასევე დამოკიდებულია თავისუფლების ხარისხების რაოდენობა.

სადაც: n არის სტატისტიკური მონაცემების კორელაციური წყვილის რაოდენობა X და Y მახასიათებლებისთვის.

რაც უფრო დიდია n, მით უფრო მაღალია კავშირის სანდოობა იმავე კორელაციის კოეფიციენტთან.

გარდა ჩამოთვლილი საერთო თვისებებისა, განხილულ კორელაციის კოეფიციენტებსაც აქვთ განსხვავებები. მათი მთავარი განსხვავება ისაა, რომ პირსონის კოეფიციენტი ( შეიძლება გამოყენებულ იქნას მხოლოდ იმ შემთხვევაში, თუ X და Y მახასიათებლების განაწილება ნორმალურია, Spearman კოეფიციენტი () შეიძლება გამოყენებულ იქნას ნებისმიერი ტიპის განაწილებისთვის. თუ განხილულ მახასიათებლებს აქვთ ნორმალური განაწილება, მაშინ უფრო მიზანშეწონილია კორელაციური კავშირის არსებობის დადგენა პირსონის კოეფიციენტის გამოყენებით (), რადგან ამ შემთხვევაში მას ექნება უფრო მცირე ცდომილება ვიდრე სპირმენის კოეფიციენტი ().

მაგალითი 8.2.

დაადგინეთ არის თუ არა კავშირი სირბილიდან (X) შორიდან ნახტომის შედეგებსა და სპორტსმენთა ჯგუფის საბოლოო სირბილის სიჩქარეს (Y) შორის სპირმენის რანგის კორელაციის კოეფიციენტის გამოყენებით (მონაცემები მაგალითიდან 8.1, ცხრილი 5).

ფორმულაში (1) dx და dy არის სტატისტიკური მონაცემების რიგები, ე.ი. ათავსებს ვარიანტს მათ რეიტინგულ პოპულაციაში. თუ მთლიანობაში რამდენიმე იდენტური მონაცემია, მაშინ მათი რიგები თანაბარია და განისაზღვრება, როგორც ამ ვარიანტების მიერ დაკავებული ადგილების საშუალო მნიშვნელობა. Მაგალითად,

მონაცემები xi
dx წოდებები 4,5 4,5 4,5 4,5 7,5 7,5
3 + 4 + 5 + 6 7 + 8

ამ წესის გამოყენებით განვსაზღვრავთ მე-5 ცხრილის მონაცემების რანგებს. მოხერხებულობისთვის ყველაფერს ჩავწერთ ცხრილი 6-ის სახით.

ცხრილი 6

dx დი dx - dy
9,1 1 - 1 = 0 02 = 0
9,6 2 - 2 = 0 02 = 0
9,8 3 - 3 = 0 02 = 0
10,1 4 - 4 = 0 02 = 0
10,5 6,5 5 - 6,5 = - 1,5 (- 1,5)2 = 2,25
10,5 6,5 6 - 6,5 = - 0,5 (- 0,5)2 = 0,25
10,3 7 - 5 = 2 22 = 4
10,7 8 - 8 = 0 02 = 0
(dx-dy) = 0

ამ შემთხვევაში გვაქვს 8 წყვილი მნიშვნელობა, ე.ი. 8 კორელაციური წყვილი. ეს ნიშნავს n = 8. მიღებული შედეგის (1) ფორმულით ჩანაცვლებით გვექნება:

დასკვნა:

(0,92 > 0) , შემდეგ ნიშნებს შორის X და Y ზე X), და პირიქით - აფრენის სიჩქარის შემცირებით, ნახტომის სიგრძე მცირდება. Spearman-ის კორელაციის კოეფიციენტის სანდოობა განისაზღვრება რანგის კორელაციის კოეფიციენტის კრიტიკული მნიშვნელობების ცხრილით.

ბ) იმიტომ კორელაციის კოეფიციენტის მიღებული მნიშვნელობა = 0,9 აღემატება ცხრილის მნიშვნელობებს = 0,88, რაც შეესაბამება დონეს b = 99%, მაშინ დასკვნის სისწორეში ნდობა (a) 99% -ზე მეტია. ასეთი სანდოობა იძლევა დასკვნის (ა) გავრცელების საშუალებას მთელ მოსახლეობაზე, ე.ი. ყველა გრძელი ხტომისთვის.

თუ არ არის განხილული პოპულაციების წინასწარი შემოწმება განაწილების ნორმალურობაზე, მაშინ, პირსონის კორელაციის კოეფიციენტის არასანდოობის შემთხვევაში, კავშირის არსებობა ასევე უნდა შემოწმდეს Spearman-ის კოეფიციენტით.

მაგალითი 8.3.

რანგის კორელაციის კოეფიციენტს შეუძლია გამოავლინოს ურთიერთობები ცვლადებს შორის, რომლებსაც აქვთ რაიმე სტატისტიკური განაწილება. მაგრამ თუ ამ ცვლადებს აქვთ ნორმალური განაწილება (გაუსიანი), მაშინ უფრო ზუსტი ურთიერთობა შეიძლება დადგინდეს ნორმალიზებული (ბრეივ-პირსონის) კორელაციის კოეფიციენტის გამოყენებით.

დავუშვათ, რომ ჩვენს მაგალითში და - შეესაბამება ნორმალურ განაწილების კანონს და შევამოწმოთ კავშირის არსებობა ტესტის შედეგებს შორის X და Yნორმალიზებული კორელაციის კოეფიციენტის გაანგარიშების გამოყენებით.

ფორმულიდან (1) ჩანს, რომ გაანგარიშებისთვის აუცილებელია მახასიათებლების საშუალო მნიშვნელობების პოვნა X, Yდა თითოეული სტატისტიკის გადახრა მისი საშუალოდან. ამ მნიშვნელობების ცოდნით, შეგიძლიათ იპოვოთ თანხები, რომელთა გამოთვლა არ არის რთული

მე-5 ცხრილის მიხედვით, შეავსეთ ცხრილი 7:

ცხრილი 7

962 = 9216 10,7 0,6 0,62 = 0,36 96 0.6 = 57.6
262 = 676 10,5 0,4 0,42 = 0,16 26 0.4 = 10.4
10,3 0,2 0,04 5,4
- 4 9,8 - 0,3 0,09 1,2
10,1 0,00 1,0
10,5 0,4 0,16 3,2
- 92 9,1 - 1,0 1,00 9,2
- 64 9,6 - 0,5 0,25 32,0
= 23262 = 2,06 = 201

მე-7 სვეტის ჯამის ჩანაცვლებით ფორმულის მრიცხველში (1), ხოლო მე-3 და მე-6 სვეტების მნიშვნელში, მივიღებთ:

დასკვნა:

ა) იმიტომ კორელაციის კოეფიციენტის მნიშვნელობა დადებითია (0.92>0) , შემდეგ შორის X და Yარის პირდაპირი ურთიერთობა, ე.ი. აფრენის სიჩქარის ზრდით (ნიშანი ) ზრდის ნახტომის სიგრძეს (ნიშანი X) და პირიქით - აფრენის სიჩქარის შემცირებით მცირდება ნახტომის სიგრძე. ძალიან მნიშვნელოვანია ვიცოდეთ ნდობა დასკვნის სისწორეში.