ნეგატიური დამოკიდებულება მაკორექტირებელ ანალიზში. კურსი: კორელაციური ანალიზი

ბუნების ნებისმიერი კანონი ან სოციალური განვითარება შეიძლება წარმოდგენილი იყოს ურთიერთობების ნაკრების აღწერით. თუ ეს დამოკიდებულებები სტოქასტურია და ანალიზი ტარდება ზოგადი პოპულაციის ნიმუშზე, მაშინ კვლევის ეს სფერო ეხება დამოკიდებულებების სტატისტიკური შესწავლის ამოცანებს, რომლებიც მოიცავს კორელაციას, რეგრესიას, დისპერსიას, კოვარიანსულ ანალიზს და ანალიზს. საგანგებო ცხრილები.

    არის თუ არა კავშირი შესწავლილ ცვლადებს შორის?

    როგორ გავზომოთ კავშირების სიახლოვე?

სტატისტიკურ კვლევაში პარამეტრებს შორის ურთიერთობის ზოგადი სქემა ნაჩვენებია ნახ. ერთი.

ნახაზი S არის შესწავლილი რეალური ობიექტის მოდელი.განმარტებითი (დამოუკიდებელი, ფაქტორული) ცვლადები აღწერს ობიექტის ფუნქციონირების პირობებს. შემთხვევითი ფაქტორები არის ფაქტორები, რომელთა გავლენის გათვალისწინება რთულია ან რომლის გავლენა ამჟამად უგულებელყოფილია. მიღებული (დამოკიდებული, ახსნილი) ცვლადები ახასიათებს ობიექტის ფუნქციონირების შედეგს.

ურთიერთობის ანალიზის მეთოდის არჩევა ხდება გაანალიზებული ცვლადების ხასიათის გათვალისწინებით.

კორელაციური ანალიზი - სტატისტიკური მონაცემების დამუშავების მეთოდი, რომელიც შედგება ცვლადებს შორის ურთიერთობის შესწავლაში.

კორელაციური ანალიზის მიზანია ერთი ცვლადის შესახებ გარკვეული ინფორმაციის მიწოდება სხვა ცვლადის დახმარებით. იმ შემთხვევებში, როდესაც შესაძლებელია მიზნის მიღწევა, ამბობენ, რომ ცვლადები დაკავშირებულია. კორელაცია ასახავს მხოლოდ რაოდენობების წრფივ დამოკიდებულებას, მაგრამ არ ასახავს მათ ფუნქციურ კავშირს. მაგალითად, თუ გამოვთვლით კორელაციის კოეფიციენტს A = sin(x) და B = cos(x) მნიშვნელობებს შორის, მაშინ ის ახლოს იქნება ნულთან, ე.ი. რაოდენობას შორის კავშირი არ არის.

კორელაციის შესწავლისას გამოიყენება გრაფიკული და ანალიტიკური მიდგომები.

გრაფიკული ანალიზი იწყება კორელაციური ველის აგებით. კორელაციური ველი (ან სკატერპლატი) არის გრაფიკული კავშირი ორი მახასიათებლის გაზომვის შედეგებს შორის. მის ასაგებად, საწყისი მონაცემები გამოსახულია გრაფიკზე, სადაც ნაჩვენებია მნიშვნელობების თითოეული წყვილი (xi, yi), როგორც წერტილი xi და yi კოორდინატებით მართკუთხა კოორდინატულ სისტემაში.

კორელაციური ველის ვიზუალური ანალიზი საშუალებას გვაძლევს გამოვიტანოთ ვარაუდი ორ შესწავლილ ინდიკატორს შორის ურთიერთობის ფორმისა და მიმართულების შესახებ. ურთიერთობის ფორმის მიხედვით, კორელაციური დამოკიდებულებები ჩვეულებრივ იყოფა წრფივ (იხ. სურ. 1) და არაწრფივ (იხ. ნახ. 2). წრფივი დამოკიდებულებით, კორელაციური ველის გარსი ახლოს არის ელიფსთან. ორი შემთხვევითი ცვლადის წრფივი კავშირი არის ის, რომ როდესაც ერთი შემთხვევითი ცვლადი იზრდება, მეორე შემთხვევითი ცვლადი იზრდება (ან კლებულობს) წრფივი კანონის მიხედვით.

ურთიერთობის მიმართულება დადებითია, თუ ერთი ატრიბუტის მნიშვნელობის ზრდა იწვევს მეორის მნიშვნელობის ზრდას (იხ. სურ. 3) და უარყოფითია, თუ ერთი ატრიბუტის მნიშვნელობის ზრდა იწვევს მნიშვნელობის შემცირებას. მეორეს (იხ. სურ. 4).

დამოკიდებულებებს, რომლებსაც აქვთ მხოლოდ დადებითი ან მხოლოდ უარყოფითი მიმართულებები, მონოტონური ეწოდება.

კორელაციური ანალიზი- კორელაციის მათემატიკური თეორიის საფუძველზე შემთხვევით მოვლენებსა და მოვლენებს შორის ურთიერთობის შეფასების მეთოდების ერთობლიობა. ამ შემთხვევაში გამოიყენება უმარტივესი მახასიათებლები, რომლებიც საჭიროებენ მინიმალურ გამოთვლებს. ტერმინი „კორელაცია“ ჩვეულებრივ იდენტიფიცირებულია „ურთიერთობის“ და „ურთიერთდამოკიდებულების“ ცნებებთან. თუმცა, ისინი არ არიან ადეკვატური. კორელაცია ნიშანს შორის ურთიერთობის მხოლოდ ერთ-ერთი სახეობაა, რომელიც ვლინდება საშუალოდ და წრფივია. თუ ორ სიდიდეს შორის არის ცალსახა კავშირი, მაშინ ასეთ ურთიერთობას ფუნქციონალური ეწოდება და ერთ-ერთ სიდიდეს (მიზეზს) შეუძლია ცალსახად განსაზღვროს მეორე სიდიდის მნიშვნელობა (შედეგი). Funkts, დამოკიდებულება არის შემთხვევითი (ალბათური, სტოქასტური) დამოკიდებულების განსაკუთრებული გამოხატულება, როდესაც კავშირი არ ჩნდება ორი სიდიდის თითოეული მნიშვნელობისთვის, არამედ მხოლოდ საშუალოდ.

კ.ა. გამოიყენება ორი ან მეტი შემთხვევითი ცვლადის შესწავლისას ორი ყველაზე მნიშვნელოვანი რაოდენობრივი მახასიათებლის იდენტიფიცირების მიზნით: ამ სიდიდეებს შორის ურთიერთობის მათემატიკური განტოლება და მათ შორის ურთიერთობის სიახლოვის შეფასება. ამ მახასიათებლების განსაზღვრის საწყისი მონაცემებია დაკვირვების სინქრონული შედეგები (გაზომვა, ექსპერიმენტი), ანუ ერთდროულად მიღებული გამოცდილებიდან, სტატისტიკური მონაცემები ნიშნების შესახებ, რომელთა ურთიერთობაც შესწავლილია. საწყისი მონაცემები შეიძლება იყოს ცხრილების სახით დაკვირვების შედეგების ჩანაწერებით ან მათი ეკვივალენტური გამოსახულებებით მაგნიტურ ფირზე, პუნქტ ლენტაზე ან დაქუცმაცებულ ბარათებზე.

კ.ა. იპოვა ფართო გამოყენება მედიცინასა და ბიოლოგიაში სიახლოვის განსაზღვრისა და სხვადასხვა ნიშნებს შორის ურთიერთობის განტოლებების, ნაპრ, ანალიზის შედეგების, ნიშნების ან სპეციალური ინსპექტირების შედეგების შესახებ, რომლებიც ტარდება ჯანმრთელ ან ავადმყოფ ადამიანებზე (იხ. ფუნქციების კორელაცია ორგანიზმი). შედეგები და. გამოიყენება დაავადებების ობიექტური პროგნოზის, პაციენტის მდგომარეობის, დაავადების მიმდინარეობის შესაფასებლად (იხ. პროგნოზირება). აპრიორი, მხოლოდ თეორიული ბიოლის და თაფლის შედეგებით. კვლევებით, რთული ან შეუძლებელია იმის პროგნოზირება, თუ როგორ არის დაკავშირებული შესწავლილი თვისებები. ამ კითხვაზე პასუხის გასაცემად ტარდება დაკვირვება ან სპეციალური ექსპერიმენტი.

ორგანზომილებიანი კორელაციური ანალიზი გამოიყენება ნებისმიერი ორი ნიშნის გამოვლინების ექსპერიმენტული მონაცემების დამუშავებისას.

კორელაციური ცხრილი. Შენიშვნა. ცხრილი გვიჩვენებს X და Y ნიშნების ინტერვალებს, ისევე როგორც მათი გაჩენის სიხშირეს (ცხრილის ცენტრში), გამოითვლება ბულბოკონიუნქტივალური უბნის მიკროვასკულატურის მორფომეტრიული ანალიზის შედეგებით, სადაც Y არის დიამეტრი. ვენული და X არის არტერიოლის დიამეტრი (მმკ-ში).

ექსპერიმენტის თითოეული შედეგი არის შემთხვევითი ცვლადი და ობიექტური შაბლონები ჩნდება მხოლოდ გაზომვის შედეგების მთელ კომპლექტში. აქედან გამომდინარე, დასკვნები კეთდება ექსპერიმენტული მონაცემების მთელი ნაკრების დამუშავების შედეგების საფუძველზე და არა ცალკეულ მნიშვნელობებზე, რომლებიც შემთხვევითია. შემთხვევითი მოვლენის გავლენის შესამცირებლად, საწყისი მონაცემები გაერთიანებულია ჯგუფებად, რაც მიიღწევა კორელაციური ცხრილის შედგენით (იხ. ცხრილი). ასეთი ცხრილი შეიცავს ორი მახასიათებლის მნიშვნელობების ინტერვალებს (ან მათ შუა წერტილებს) - Y და X, ასევე X და Y მნიშვნელობების გაჩენის სიხშირეს ამ მნიშვნელობების შესაბამის ინტერვალში. ეს სიხშირეები, რომლებიც გამოითვლება ექსპერიმენტის შედეგებიდან, არის კონკრეტული ინტერვალის X და Y მნიშვნელობების ერთობლივი წარმოშობის ალბათობის პრაქტიკული შეფასება. კორელაციური ცხრილის აგება არის პირველი ნაბიჯი საწყისი ინფორმაციის დამუშავებაში. კორელაციური ცხრილების აგება და მათი შემდგომი სრული დამუშავება სწრაფად ხორციელდება უნივერსალურ ან სპეციალიზებულ კომპიუტერებზე (იხ. ელექტრონული კომპიუტერი). კორელაციური ცხრილის დაჯგუფებული მონაცემების მიხედვით გამოითვლება განტოლების ემპირიული მახასიათებლები და კავშირის სიმჭიდროვე. Y-სა და X-ს შორის ურთიერთობის განტოლების დასადგენად, Y მახასიათებლის საშუალო მნიშვნელობები გამოითვლება X მახასიათებლის თითოეულ ინტერვალში. მიიღეთ ყოველი i-ე ინტერვალისთვის Yxi-ის მნიშვნელობა, რომლის შეერთება ყველა i-ინტერვალისთვის იძლევა ემპირიულ რეგრესიის ხაზს, რომელიც ახასიათებს Y ატრიბუტის ურთიერთობის ფორმას X ატრიბუტთან საშუალოდ - Yx= ფუნქციის გრაფიკი. f(x). თუ არსებობდა ცალსახა ურთიერთობა Y და X მახასიათებლებს შორის, ურთიერთობის განტოლება საკმარისი იქნებოდა პრაქტიკული და თეორიული ამოცანების გადასაჭრელად, რადგან ის ყოველთვის შეიძლება გამოყენებულ იქნას Y მახასიათებლის მნიშვნელობის დასადგენად, თუ მოცემულია X მნიშვნელობა. პრაქტიკაში, Y-სა და X-ს შორის ურთიერთობა არ არის ცალსახა, ეს კავშირი შემთხვევითია და X-ის ერთი მნიშვნელობა შეესაბამება Y-ის რიგ მნიშვნელობებს. ამიტომ საჭიროა კიდევ ერთი მახასიათებელი, რომელიც ზომავს Y-სა და X-ს შორის ურთიერთობის სიძლიერეს, სიახლოვეს. ასეთი მახასიათებლებია დისპერსიის (კორელაციის) თანაფარდობა ηух და კორელაციის კოეფიციენტი ryx. ამ სიდიდეებიდან პირველი ახასიათებს Y-სა და X-ს შორის კავშირის სიმკვრივეს თვითნებურ f ფუნქციაში, ხოლო ryx გამოიყენება მხოლოდ მაშინ, როდესაც f არის წრფივი ფუნქცია.

ηyx და ryx-ის მნიშვნელობები ასევე უბრალოდ განისაზღვრება კორელაციის ცხრილიდან. გაანგარიშება ჩვეულებრივ ხორციელდება შემდეგი თანმიმდევრობით: განისაზღვრება ორივე ატრიბუტის X და Y საშუალო მნიშვნელობები, მათი სტანდარტული გადახრები σx და σy, შემდეგ კი ηxy ფორმულის მიხედვით:

და ryx ფორმულის მიხედვით:

სადაც n არის ექსპერიმენტების ჯამური რაოდენობა, Xcpi არის i-ე ინტერვალის X-ის საშუალო მნიშვნელობა, Ycpj არის j-ე ინტერვალის Y-ის საშუალო მნიშვნელობა, k, l არის X და Y მახასიათებლების ინტერვალების რაოდენობა. , შესაბამისად, mi(x) არის Xcpi მნიშვნელობების სიხშირე (რიცხვი). ηyx და ryx-ის განსაზღვრის სიზუსტის რაოდენობრივი მახასიათებლები მათი სტანდარტული გადახრებია, რომლებიც უდრის

η კოეფიციენტის მნიშვნელობები დევს ნულსა და ერთს შორის (0=<ηyx=<1). Если ηyx= 0 (рис., а), то это свидетельствует о том, что признаки Y и X недисперсированы, т. е. регрессия Yx = f(x) не дает связи между признаками Y и X, а при ηyx = 1 существует однозначная связь между Y и X (рис., б, ж). Для ηyx<1 признак Y только частично определяется признаком X, и необходимо изучение дополнительных признаков для повышения достоверности определения Y (рис., г, д, е, и).

r კოეფიციენტის მნიშვნელობა მდგომარეობს -1-სა და +1-ს შორის (-1=

მრავალვარიანტული კორელაციური ანალიზი - განტოლებისა და კავშირის სიმჭიდროვის დადგენა იმ შემთხვევებში, როდესაც შესწავლილი ნიშნების რაოდენობა ორზე მეტია. ასე რომ, თუ Y რთული მახასიათებელია და მისი შედეგი დამოკიდებულია X1, X2, ..., Xn მახასიათებლების სიმრავლის გამოჩენაზე, მაშინ ექსპერიმენტული მონაცემების მიხედვით უნდა განისაზღვროს: ., Хn, ე.ი. Yx1x2...xn = F(x1, x2...,xn) ; ბ) Y-სა და X1, X2,..., Xn სიმრავლეს შორის შეერთების სიმჭიდროვე.

მრავალგანზომილებიან კ-ზე ზედამხედველობის შედეგების წინასწარი დამუშავება და. არის ის, რომ თითოეული წყვილი მახასიათებლისთვის განისაზღვრება ryxi და rxixj კორელაციის კოეფიციენტების დისპერსიული მიმართებების ηyxi (i = 1,2,..., n) და ηxixj (i!=j) მნიშვნელობები. როგორც დაწყვილებული რეგრესია Yxi = fi(xi ). ეს მონაცემები შემდეგ გამოიყენება მრავალჯერადი რეგრესიის განტოლების დასადგენად Yx1x2...xn = F (x1,x2,...,xn), მრავალჯერადი დისპერსიის თანაფარდობა ηyx1x2...xn და მრავალჯერადი კორელაციის კოეფიციენტი Ryx1x2...xn . მრავალჯერადი რეგრესიის განტოლება შესაძლებელს ხდის Y მახასიათებლის მნიშვნელობის განსაზღვრას X1, X2, ..., Xn მნიშვნელობების სიმრავლით, ანუ თუ ეს განტოლება ხელმისაწვდომია, შესაძლებელია მნიშვნელობების პროგნოზირება. Y მიღებული ნაკრების კონკრეტული მნიშვნელობების შედეგებზე დაყრდნობით (მაგალითად, ანალიზის შედეგები X1, X2...Xn მახასიათებლების მიხედვით). მნიშვნელობა ηyx1x2...xn გამოიყენება, როგორც კავშირის სიმჭიდროვის მახასიათებელი Y-სა და X1, X2, ...Xn მახასიათებლების სიმრავლეს შორის F თვითნებური ფუნქციისთვის, ხოლო Ryx1x2...xn - იმ შემთხვევისთვის, როდესაც ფუნქცია F არის წრფივი. კოეფიციენტები ηyx1x2....xn და Ryx1x2...xn იღებენ მნიშვნელობებს ნულსა და ერთს შორის. მრავალგანზომილებიანი კ.ა. დამატებითი ფუნქციები შესაძლებელს ხდის მნიშვნელობების ηyx1x2...xn, Ryx1x2...xn მიუახლოვდეს ერთიანობას და ამით გააუმჯობესოს Y ფუნქციის პროგნოზის სიზუსტე მრავალჯერადი რეგრესიის განტოლების გამოყენებით.

მაგალითად, განვიხილოთ დაწყვილებული K.a.-ს შედეგები, აგრეთვე მრავალჯერადი რეგრესიის განტოლება და მრავალჯერადი კორელაციის კოეფიციენტი ნიშნებს შორის: Y - სტაბილური ფსევდოპარეზი, X1 - მარჯვენა კიდურებში მოტორული დეფექტის ლატერალიზაცია, X2. - იგივე მარცხნივ კიდურებში, X3 - ვეგეტატიური კრიზები. დისპერსიის კოეფიციენტების და წყვილის კორელაციის კოეფიციენტების მნიშვნელობები მათთვის იქნება, შესაბამისად, ηyx1 = 0.429, ηyx2 = 0.616, ηyx3 = -0.334, და ryx1 = 0.320, ryx2 = 0.586, ryx25. -0. მრავალჯერადი წრფივი რეგრესიის განტოლების მიხედვით Yх1х2х3 = 0,638 x1 + 0,839 x2 - 0,195 x3. მრავალჯერადი კორელაციის კოეფიციენტი გამოისახება როგორც Ryx1x2x3 =0.721. მაგალითიდან ჩანს, რომ X1, X2 და X3 მონაცემების მიხედვით, სტაბილური ფსევდოპარეზის პროგნოზირება შესაძლებელია პრაქტიკისთვის საკმარისი სიზუსტით.

მეთოდები და. ასევე შესაძლებელს ხდის დინამიური მახასიათებლების მიღებას და. ამ შემთხვევაში შესწავლილი ნიშნები (მაგ., ეკგ, ეეგ და სხვ.) განიხილება Y(t) და X(t) შემთხვევით ფუნქციებად. ამ ფუნქციებზე დაკვირვების შედეგების საფუძველზე ასევე განისაზღვრება ორი უმნიშვნელოვანესი მახასიათებელი: ა) საკომუნიკაციო ოპერატორის შეფასება (მათემატიკური განტოლება) Y (t) და X (t) შორის; ბ) მათ შორის კავშირის სიახლოვის შეფასება. შეერთების შებოჭილობის მახასიათებლებად აღებულია Y(t) და X(t) შემთხვევითი ფუნქციების დისპერსიული და კორელაციური ფუნქციები. ეს ფუნქციები არის დისპერსიული ურთიერთობებისა და კორელაციის კოეფიციენტების განზოგადება. ამრიგად, ნორმალიზებული ორმხრივი დისპერსიული ფუნქცია ηyx(t) თითოეული ფიქსირებული t მნიშვნელობის არის დისპერსიული კავშირი Y(t) და X(t) მახასიათებლებს შორის. ანალოგიურად, ნორმალიზებული ჯვარედინი კორელაციის ფუნქცია Ryx(t) არის t-ის ყოველი ფიქსირებული მნიშვნელობისთვის კორელაციის კოეფიციენტი Y(t) და X(t) მახასიათებლებს შორის. წრფივი დამოკიდებულების (დამოკიდებულების) მახასიათებელს ერთი და იგივე შესწავლილი სიდიდისთვის დროის სხვადასხვა მომენტში ეწოდება ავტოკორელაცია.

კ.ა. არის იდენტიფიკაციის პრობლემის გადაჭრის ერთ-ერთი მეთოდი, რომელიც ფართოდ გამოიყენება მათემატიკური მოდელების მოპოვებისა და სამედიცინო ბიოლის ავტომატიზაციის, კვლევისა და მკურნალობისას.

ბიბლიოგრაფია:გამოთვლითი სისტემები და გულის დაავადებების ავტომატური დიაგნოსტიკა, რედ. C. Caceres and L. Dreyfus, trans. ინგლისურიდან, მ., 1974; Gutman S. R. ელექტროენცეფალოგრამის ორ მოდელზე, რომლებიც კონვერგირდება ნორმალურ შემთხვევით პროცესზე, in: Upravlenie i inform. პროცესები ველურ ბუნებაში, რედ. V. V. Larina, გვ. 205, მ., 1971; Zaslavskaya R. M., Perepel-kin E. G. and Akhmetov K. Zh. კორელაციები ჰემოკოაგულაციისა და ლიპიდური ცვლის მაჩვენებლებს შორის სტენოკარდიის მქონე პაციენტებში დღის განმავლობაში, კარდიოლოგია, ტ. 111, 1977; K r a m e r G. სტატისტიკის მათემატიკური მეთოდები, ტრანს. ინგლისურიდან, მ., 1975; Pasternak E. B. და სხვები წინაგულების ფიბრილაციის დროს წინაგულების ელექტრული აქტივობის შესწავლა ინსტრუმენტული კორელაციური ანალიზის გამოყენებით, კარდიოლოგია, t. 17, Xia 7, გვ. 50, 1977; Sinitsyn B. S. ავტომატური კორელატორები და მათი გამოყენება, ნოვოსიბირსკი, 1964, ბიბლიოგრ.; At r-b and x V. Yu. სტატისტიკური ანალიზი ბიოლოგიურ და სამედიცინო კვლევებში, M., 1975, bibliogr.

V. N. Reibman, N. S. Reibman.

ფსიქოლოგიური კვლევის მასალების დამუშავებისას სტატისტიკური მეთოდების გამოყენება დიდ შესაძლებლობას იძლევა ექსპერიმენტული მონაცემებიდან სასარგებლო ინფორმაციის მოპოვება. ერთ-ერთი ყველაზე გავრცელებული სტატისტიკური მეთოდია კორელაციური ანალიზი.

ტერმინი „კორელაცია“ პირველად გამოიყენა ფრანგმა პალეონტოლოგმა ჯ. კუვიერმა, რომელმაც გამოიტანა „ცხოველის ნაწილებისა და ორგანოების კორელაციის კანონი“ (ეს კანონი საშუალებას გაძლევთ აღადგინოთ მთელი ცხოველის გარეგნობა სხეულის ნაპოვნი ნაწილებიდან. ). ეს ტერმინი სტატისტიკაში შემოიტანა ინგლისელმა ბიოლოგმა და სტატისტიკოსმა ფ. გალტონმა (არა მხოლოდ „კავშირი“ - ურთიერთობადა "თითქოს კავშირი" - კორელაცია).

კორელაციური ანალიზი არის ჰიპოთეზების ტესტი ცვლადებს შორის ურთიერთობის შესახებ კორელაციის კოეფიციენტების, ორგანზომილებიანი აღწერითი სტატისტიკის, ორი ცვლადის ურთიერთობის (ერთობლივი ცვალებადობის) რაოდენობრივი საზომის გამოყენებით. ამრიგად, ეს არის მეთოდების ნაკრები შემთხვევით ცვლადებს ან მახასიათებლებს შორის კორელაციის გამოსავლენად.

კორელაციური ანალიზი ორი შემთხვევითი ცვლადისთვის მოიცავს:

  • კორელაციური ველის აგება და კორელაციური ცხრილის შედგენა;
  • ნიმუშის კორელაციის კოეფიციენტებისა და კორელაციის კოეფიციენტების გამოთვლა;
  • ურთიერთობის მნიშვნელოვნების სტატისტიკური ჰიპოთეზის ტესტირება.

კორელაციური ანალიზის მთავარი მიზანია გამოავლინოს ორ ან მეტ ცვლადს შორის კავშირი, რომელიც განიხილება, როგორც ერთობლივი კოორდინირებული ცვლილება შესწავლილი ორი მახასიათებლისა. ამ ცვალებადობას აქვს სამი ძირითადი მახასიათებელი: ფორმა, მიმართულება და ძალა.

კორელაციის ფორმა შეიძლება იყოს წრფივი ან არაწრფივი. წრფივი ფორმა უფრო მოსახერხებელია კორელაციის იდენტიფიცირებისთვის და ინტერპრეტაციისთვის. ხაზოვანი კორელაციისთვის შეიძლება გამოიყოს ორი ძირითადი მიმართულება: დადებითი („წინ კავშირი“) და უარყოფითი („უკუკავშირი“).

კავშირის სიძლიერე პირდაპირ მიუთითებს იმაზე, თუ რამდენად გამოხატულია შესწავლილი ცვლადების ერთობლივი ცვალებადობა. ფსიქოლოგიაში ფენომენების ფუნქციური ურთიერთდაკავშირება ემპირიულად შეიძლება გამოვლინდეს მხოლოდ როგორც შესაბამისი ნიშნების ალბათური კავშირი. ალბათური ურთიერთობის ბუნების ვიზუალური წარმოდგენა მოცემულია სკატერის დიაგრამით - გრაფიკი, რომლის ღერძები შეესაბამება ორი ცვლადის მნიშვნელობებს და თითოეული საგანი არის წერტილი.

კორელაციის კოეფიციენტები გამოიყენება როგორც ალბათური ურთიერთობის რიცხვითი მახასიათებელი, რომლის მნიშვნელობები მერყეობს -1-დან +1-მდე დიაპაზონში. გამოთვლების შემდეგ მკვლევარი, როგორც წესი, ირჩევს მხოლოდ ყველაზე მძლავრ კორელაციებს, რომლებიც შემდგომ ინტერპრეტირებულია (ცხრილი 1).

„საკმარისად ძლიერი“ კორელაციების არჩევის კრიტერიუმი შეიძლება იყოს ან თავად კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობა (0,7-დან 1-მდე) ან ამ კოეფიციენტის ფარდობითი მნიშვნელობა, რომელიც განისაზღვრება სტატისტიკური მნიშვნელოვნების დონით (0,01-დან 0,1-მდე), დამოკიდებულია იმაზე. ნიმუშის ზომა. მცირე ნიმუშებში, შემდგომი ინტერპრეტაციისთვის, უფრო სწორია სტატისტიკური მნიშვნელოვნების დონის მიხედვით ძლიერი კორელაციების შერჩევა. კვლევებისთვის, რომლებიც ტარდება დიდ ნიმუშებზე, უმჯობესია გამოიყენოთ კორელაციის კოეფიციენტების აბსოლუტური მნიშვნელობები.

ამრიგად, კორელაციური ანალიზის ამოცანა მცირდება სხვადასხვა მახასიათებლებს შორის ურთიერთობის მიმართულების (დადებითი ან უარყოფითი) და ფორმის (წრფივი, არაწრფივი) დადგენით, მისი შებოჭილობის გაზომვით და, ბოლოს და ბოლოს, მიღებულის მნიშვნელოვნების დონის შემოწმებამდე. კორელაციის კოეფიციენტები.

ამჟამად შემუშავებულია მრავალი განსხვავებული კორელაციის კოეფიციენტი. ყველაზე ხშირად გამოიყენება -პირსონ, -სპირმენი და τ - კენდალი. თანამედროვე კომპიუტერული სტატისტიკური პროგრამები მენიუში „კორელაციები“ სწორედ ამ სამ კოეფიციენტს გვთავაზობს, სხვა კვლევითი ამოცანების გადასაჭრელად კი ჯგუფების შედარების მეთოდებს.

კორელაციის კოეფიციენტის გამოთვლის მეთოდის არჩევანი დამოკიდებულია მასშტაბის ტიპზე, რომელსაც მიეკუთვნება ცვლადები (ცხრილი 2).

ინტერვალით და ნომინალური სკალის მქონე ცვლადებისთვის გამოიყენება პირსონის კორელაციის კოეფიციენტი (პროდუქტის მომენტების კორელაცია). თუ ორი ცვლადიდან ერთს მაინც აქვს რიგითი მასშტაბი ან არ არის ნორმალურად განაწილებული, გამოიყენება Spearman-ის რანგის კორელაცია, ან

ტ-კენდალი. თუ ორი ცვლადიდან ერთ-ერთი დიქოტომიურია, შეიძლება გამოყენებულ იქნას წერტილის ორსერიანი კორელაცია (სტატისტიკურ კომპიუტერულ პროგრამაში SPSS, ეს შესაძლებლობა არ არის ხელმისაწვდომი, ამის ნაცვლად, შეიძლება გამოყენებულ იქნას რანგის კორელაციის გამოთვლა). იმ შემთხვევაში, თუ ორივე ცვლადი დიქოტომიურია, გამოიყენება ოთხველიანი კორელაცია (ამ ტიპის კორელაცია გამოითვლება SPSS-ის მიერ მანძილის ზომებისა და მსგავსების ზომების განსაზღვრის საფუძველზე). ორ არადიქოტომურ ცვლადს შორის კორელაციის კოეფიციენტის გამოთვლა შესაძლებელია მხოლოდ იმ შემთხვევაში, თუ მათ შორის კავშირი წრფივია (ცალმხრივი). თუ კავშირი, მაგალითად, U- ფორმის (ორაზროვანი), კორელაციის კოეფიციენტი არ არის შესაფერისი კავშირის სიძლიერის საზომად გამოსაყენებლად: მისი მნიშვნელობა ნულისკენ მიისწრაფვის.

ამრიგად, კორელაციის კოეფიციენტების გამოყენების პირობები იქნება შემდეგი:

  • ცვლადები, რომლებიც იზომება რაოდენობრივი (რანგი, მეტრიკული) სკალით ობიექტების იმავე ნიმუშზე;
  • ცვლადებს შორის ურთიერთობა მონოტონურია.

ძირითადი სტატისტიკური ჰიპოთეზა, რომელიც მოწმდება კორელაციური ანალიზით, არის არამიმართული და შეიცავს მტკიცებას, რომ კორელაცია ნულის ტოლია საერთო პოპულაციაში. H 0: r xy= 0. თუ იგი უარყოფილია, ალტერნატიული ჰიპოთეზა მიიღება H 1: r xy≠ 0 დადებითი ან უარყოფითი კორელაციის არსებობის შესახებ - დამოკიდებულია გამოთვლილი კორელაციის კოეფიციენტის ნიშანზე.

ჰიპოთეზების დაშვების ან უარყოფის საფუძველზე კეთდება მნიშვნელოვანი დასკვნები. თუ სტატისტიკური ტესტირების შედეგების მიხედვით H 0: r xy= 0 არ გადაიხრება a დონეზე, მაშინ მნიშვნელოვანი დასკვნა იქნება შემდეგი: ურთიერთობა შორის Xდა არ მოიძებნა. თუ ზე H 0 r xy= 0 გადახრის a დონეზე, რაც ნიშნავს, რომ პოზიტიური (უარყოფითი) ურთიერთობა იქნა ნაპოვნი მათ შორის Xდა . თუმცა, გამოვლენილი კორელაციების ინტერპრეტაციას სიფრთხილით უნდა მივუდგეთ. მეცნიერული თვალსაზრისით, უბრალოდ ორ ცვლადს შორის ურთიერთობის დადგენა არ გულისხმობს მიზეზობრივი კავშირის არსებობას. უფრო მეტიც, კორელაციის არსებობა არ ადგენს თანმიმდევრულ კავშირს მიზეზსა და შედეგს შორის. ეს უბრალოდ მიუთითებს იმაზე, რომ ორი ცვლადი უფრო მეტად არის დაკავშირებული ერთმანეთთან, ვიდრე მოსალოდნელია დამთხვევისგან. მიუხედავად ამისა, სიფრთხილით, კორელაციური მეთოდების გამოყენება მიზეზობრივი ურთიერთობების შესწავლისას სავსებით გამართლებულია. თავიდან უნდა იქნას აცილებული ისეთი კატეგორიული ფრაზები, როგორიცაა „ცვლადი X არის ინდიკატორის ზრდის მიზეზი“. ". ასეთი განცხადებები უნდა იყოს ჩამოყალიბებული, როგორც ვარაუდები, რომლებიც მკაცრად უნდა იყოს დასაბუთებული თეორიულად.

მათემატიკური პროცედურის დეტალური აღწერა თითოეული კორელაციის კოეფიციენტისთვის მოცემულია მათემატიკური სტატისტიკის სახელმძღვანელოებში; ; ; ჩვენ შემოვიფარგლებით ამ კოეფიციენტების გამოყენების შესაძლებლობის აღწერით, რაც დამოკიდებულია გაზომვის სკალის ტიპზე.

მეტრულ ცვლადების კორელაცია

ერთსა და იმავე ნიმუშზე გაზომილი ორი მეტრიკული ცვლადის ურთიერთობის შესასწავლად ვიყენებთ კორელაციის კოეფიციენტი -პირსონ. კოეფიციენტი თავისთავად ახასიათებს მხოლოდ ხაზოვანი ურთიერთობის არსებობას მახასიათებლებს შორის, რომლებიც ჩვეულებრივ აღინიშნება სიმბოლოებით. Xდა . წრფივი კორელაციის კოეფიციენტი არის პარამეტრული მეთოდი და მისი სწორი გამოყენება შესაძლებელია მხოლოდ იმ შემთხვევაში, თუ გაზომვის შედეგები წარმოდგენილია ინტერვალების შკალაზე, ხოლო გაანალიზებულ ცვლადებში მნიშვნელობების ძალიან განაწილება ნორმალურიდან მცირე რაოდენობით განსხვავდება. არსებობს მრავალი სიტუაცია, როდესაც მისი გამოყენება მიზანშეწონილია. მაგალითად: მოსწავლის ინტელექტსა და მის აკადემიურ მოსწრებას შორის კავშირის დამყარება; განწყობასა და პრობლემური სიტუაციიდან გამოსვლაში წარმატებას შორის; შემოსავლის დონესა და ტემპერამენტს შორის და ა.შ.

პირსონის კოეფიციენტი ფართოდ გამოიყენება ფსიქოლოგიასა და პედაგოგიკაში. მაგალითად, I. Ya. Kaplunovich-ისა და P. D. Rabinovich-ის, M.P. Nuzhdina-ს ნაშრომებში გამოყენებული იქნა პირსონის წრფივი კორელაციის კოეფიციენტის გაანგარიშება წამოყენებული ჰიპოთეზების დასადასტურებლად.

მონაცემთა „ხელით“ დამუშავებისას აუცილებელია კორელაციის კოეფიციენტის გამოთვლა, შემდეგ კი განსაზღვრა გვ- მნიშვნელობის დონე (მონაცემების გადამოწმების გამარტივების მიზნით, გამოიყენება კრიტიკული მნიშვნელობების ცხრილები rxy, რომლებიც შედგენილია ამ კრიტერიუმის გამოყენებით). პირსონის წრფივი კორელაციის კოეფიციენტის მნიშვნელობა არ უნდა აღემატებოდეს +1 და იყოს -1-ზე ნაკლები. ეს ორი რიცხვი +1 და -1 არის კორელაციის კოეფიციენტის ზღვარი. როდესაც გაანგარიშების შედეგად მიიღება მნიშვნელობა +1-ზე მეტი ან -1-ზე ნაკლები, ეს მიუთითებს იმაზე, რომ მოხდა გაანგარიშების შეცდომა.

კომპიუტერზე გაანგარიშებისას სტატისტიკური პროგრამა (SPSS, Statistica) თან ახლავს გამოთვლილ კორელაციის კოეფიციენტს უფრო ზუსტი მნიშვნელობით. გვ- დონე.

მიღებაზე ან უარყოფაზე სტატისტიკური გადაწყვეტილების მისაღებად H0ჩვეულებრივ მითითებული α = 0.05 და დაკვირვების დიდი მოცულობისთვის (100 ან მეტი) α = 0.01. Თუ p ≤ α, H 0უარყოფილია და კეთდება მნიშვნელოვანი დასკვნა, რომ შესწავლილ ცვლადებს შორის აღმოჩნდა სტატისტიკურად მნიშვნელოვანი (მნიშვნელოვანი) კავშირი (დადებითი ან უარყოფითი, კორელაციის ნიშნის მიხედვით). Როდესაც p > α, H0არ არის უარყოფილი, მნიშვნელოვანი დასკვნა შემოიფარგლება იმ განცხადებით, რომ კავშირი (სტატისტიკურად მნიშვნელოვანი) არ იქნა ნაპოვნი.

თუ კავშირი არ არის ნაპოვნი, მაგრამ არსებობს საფუძველი იმის დასაჯერებლად, რომ კავშირი რეალურად არსებობს, თქვენ უნდა შეამოწმოთ კავშირის არასანდოობის შესაძლო მიზეზები.

კომუნიკაციის არაწრფივი– ამისათვის გააანალიზეთ ორგანზომილებიანი სკატერის ნაკვეთი. თუ ურთიერთობა არაწრფივი, მაგრამ მონოტონურია, გადადით რანგის კორელაციებზე. თუ ურთიერთობა არ არის ერთფეროვანი, მაშინ დაყავით ნიმუში ნაწილებად, რომლებშიც ურთიერთობა ერთფეროვანია და გამოთვალეთ კორელაციები ცალ-ცალკე ნიმუშის თითოეული ნაწილისთვის, ან დაყავით ნიმუში კონტრასტულ ჯგუფებად და შემდეგ შეადარეთ ისინი გამოხატვის დონის მიხედვით. თვისება.

გამოკვეთის არსებობა და გამოხატული ასიმეტრია ერთი ან ორივე მახასიათებლის განაწილებაში.ამისათვის თქვენ უნდა დაათვალიეროთ ორივე მახასიათებლის სიხშირის განაწილების ჰისტოგრამები. თუ არსებობს უკიდეგანოები ან ასიმეტრიები, გამორიცხეთ უკუსვლები ან გადადით რანგის კორელაციაზე.

ნიმუშის ჰეტეროგენულობა(გააანალიზეთ 2D გაფანტვა). შეეცადეთ დაყოთ ნიმუში ნაწილებად, რომლებშიც ურთიერთობას შეიძლება ჰქონდეს განსხვავებული მიმართულებები.

თუ ურთიერთობა სტატისტიკურად მნიშვნელოვანია, მაშინ სანამ მნიშვნელოვანი დასკვნის გაკეთებამდე უნდა გამოირიცხოს ცრუ კორელაციის შესაძლებლობა:

  • კავშირი გარედან. თუ არსებობს outliers, გადადით რანგის კორელაციები ან გამორიცხეთ outliers;
  • ურთიერთობა განპირობებულია მესამე ცვლადის გავლენით. თუ არსებობს მსგავსი ფენომენი, აუცილებელია კორელაციის გამოთვლა არა მარტო მთლიანი ნიმუშისთვის, არამედ თითოეული ჯგუფისთვის ცალ-ცალკე. თუ "მესამე" ცვლადი მეტრიკულია, გამოთვალეთ ნაწილობრივი კორელაცია.

ნაწილობრივი კორელაციის კოეფიციენტი rxy-zგამოითვლება, თუ საჭიროა ორ ცვლადს შორის კავშირის შესამოწმებლად დაშვების შესამოწმებლად Xდა არ არის დამოკიდებული მესამე ცვლადის გავლენაზე . ძალიან ხშირად, ორი ცვლადი ერთმანეთთან კორელაციაშია მხოლოდ იმის გამო, რომ ორივე ცვლადი იცვლება მესამე ცვლადის გავლენის ქვეშ. სხვა სიტყვებით რომ ვთქვათ, ფაქტობრივად, არ არსებობს კავშირი შესაბამის თვისებებს შორის, მაგრამ ის სტატისტიკურ ურთიერთობაში ჩნდება საერთო მიზეზის გავლენით. მაგალითად, ორ ცვლადში ცვალებადობის საერთო მიზეზი შეიძლება იყოს ასაკი სხვადასხვა ასაკის ჯგუფში სხვადასხვა ფსიქოლოგიური მახასიათებლების ურთიერთობის შესწავლისას. ნაწილობრივი კორელაციის ინტერპრეტაციისას მიზეზობრიობის თვალსაზრისით, ფრთხილად უნდა იყოთ, რადგან თუ უკავშირდება Xდა თან და ნაწილობრივი კორელაცია rxy-zნულთან ახლოს, ეს სულაც არ მოჰყვება ამას საერთო მიზეზია Xდა .

რანგის ცვლადების კორელაცია

თუ კორელაციის კოეფიციენტი რაოდენობრივი მონაცემებისთვის მიუღებელია -პირსონ, შემდეგ წინასწარი რეიტინგის შემდეგ ორი ცვლადის ურთიერთობის შესახებ ჰიპოთეზის შესამოწმებლად, შეიძლება გამოყენებულ იქნას კორელაციები - შუბოსანიან τ -კენდალა. მაგალითად, ი.ა. ლავოჩკინის მიერ მუსიკალურად ნიჭიერი მოზარდების ფსიქოფიზიკური მახასიათებლების შესწავლისას გამოყენებული იქნა Spearman-ის კრიტერიუმი.

ორივე კოეფიციენტის (სპირმენის და კენდალის) სწორი გამოთვლისთვის, გაზომვების შედეგები უნდა იყოს წარმოდგენილი რანგების ან ინტერვალების სკალაში. ამ კრიტერიუმებს შორის ფუნდამენტური განსხვავებები არ არსებობს, მაგრამ ზოგადად მიღებულია, რომ კენდალის კოეფიციენტი უფრო „მნიშვნელოვანია“, რადგან ის აანალიზებს ცვლადებს შორის ურთიერთობას უფრო სრულად და დეტალურად, ახარისხებს ყველა შესაძლო შესაბამისობას მნიშვნელობების წყვილებს შორის. Spearman-ის კოეფიციენტი უფრო ზუსტად ითვალისწინებს ცვლადებს შორის კავშირის რაოდენობრივ ხარისხს.

სპირმენის წოდების კორელაციის კოეფიციენტიარის კლასიკური პირსონის კორელაციის კოეფიციენტის არაპარამეტრული ანალოგი, მაგრამ მისი გაანგარიშებისას გათვალისწინებულია არა შედარებული ცვლადების განაწილებასთან დაკავშირებული მაჩვენებლები (საშუალო არითმეტიკული და ვარიაცია), არამედ რანჟირება. მაგალითად, აუცილებელია განისაზღვროს კავშირი პიროვნების თვისებების რეიტინგულ შეფასებებს შორის, რომლებიც შედის ადამიანის წარმოდგენაში მისი "მე ვარ რეალური" და "მე ვარ იდეალური".

სპირმენის კოეფიციენტი ფართოდ გამოიყენება ფსიქოლოგიურ კვლევებში. მაგალითად, იუ.ვ.ბუშოვისა და ნ.ნ.ნესმელოვას ნაშრომში: სწორედ ის გამოიყენებოდა ადამიანის ინდივიდუალურ მახასიათებლებზე ხმის სიგნალების ხანგრძლივობის შეფასებისა და რეპროდუცირების სიზუსტის დამოკიდებულების შესასწავლად.

ვინაიდან ეს კოეფიციენტი ანალოგიურია -Pearson, მაშინ მისი გამოყენება ჰიპოთეზების შესამოწმებლად არის კოეფიციენტის გამოყენების მსგავსი -პირსონ. ანუ შემოწმებული სტატისტიკური ჰიპოთეზა, სტატისტიკური გადაწყვეტილების მიღების პროცედურა და აზრიანი დასკვნის ფორმულირება ერთი და იგივეა. კომპიუტერულ პროგრამებში (SPSS, Statistica) მნიშვნელოვნების დონეები იგივე კოეფიციენტებისთვის -პირსონი და -Spearman ყოველთვის ემთხვევა.

თანაფარდობის უპირატესობა -Spearman წინააღმდეგ თანაფარდობა -პირსონი - კომუნიკაციისადმი უფრო დიდი მგრძნობელობით. ჩვენ ვიყენებთ მას შემდეგ შემთხვევებში:

  • ნორმალური ფორმიდან მინიმუმ ერთი ცვლადის განაწილებაში მნიშვნელოვანი გადახრის არსებობა (დახრილობა, გამოკვეთა);
  • მრუდი (მონოტონური) კავშირის გამოჩენა.

კოეფიციენტის გამოყენების შეზღუდვა - სპირმენები არიან:

  • თითოეულ ცვლადზე მინიმუმ 5 დაკვირვება;
  • კოეფიციენტი დიდი რაოდენობით იდენტური წოდებებით ერთ ან ორივე ცვლადში იძლევა მსხვილ მნიშვნელობას.

რანგის კორელაციის კოეფიციენტი τ -კენდალაარის დამოუკიდებელი ორიგინალური მეთოდი, რომელიც დაფუძნებულია ორი ნიმუშის მნიშვნელობების წყვილის თანაფარდობის გაანგარიშებაზე, რომლებსაც აქვთ იგივე ან განსხვავებული ტენდენციები (მნიშვნელობების გაზრდა ან შემცირება). ამ თანაფარდობას ასევე უწოდებენ შესაბამისობის ფაქტორი. ამრიგად, ამ მეთოდის მთავარი იდეა ისაა, რომ ურთიერთობის მიმართულება შეიძლება შეფასდეს სუბიექტების წყვილებში შედარებით: თუ სუბიექტების წყვილს აქვს ცვლილება. Xმიმართულებით ემთხვევა ცვლილებას , ეს მიუთითებს პოზიტიურ ურთიერთობაზე, თუ იგივე არა - უარყოფით ურთიერთობაზე, მაგალითად, პიროვნული თვისებების შესწავლისას, რომლებსაც გადამწყვეტი მნიშვნელობა აქვს ოჯახის კეთილდღეობისთვის. ამ მეთოდში ერთი ცვლადი წარმოდგენილია როგორც მონოტონური მიმდევრობა (მაგალითად, ქმრის მონაცემები) სიდიდის აღმავალი წესით; სხვა ცვლადს (მაგალითად, ცოლის მონაცემებს) ენიჭება შესაბამისი სარეიტინგო ადგილები. კორელაციის კოეფიციენტების ფორმულაში გამოყენებულია ინვერსიების რაოდენობა (ერთფეროვნების დარღვევა პირველ რიგთან შედარებით).

დათვლისას τ- კენდალის "ხელით" მონაცემები პირველად დალაგებულია ცვლადის მიხედვით X. შემდეგ თითოეული საგნისთვის გამოითვლება რამდენჯერ არის მისი წოდება აღმოჩნდება ქვემოთ მოცემული საგნების წოდებაზე ნაკლები. შედეგი ჩაწერილია მატჩების სვეტში. ყველა მნიშვნელობის ჯამი "დამთხვევა" სვეტში არის - დამთხვევების ჯამური რაოდენობა ჩანაცვლებულია კენდალის კოეფიციენტის გამოთვლის ფორმულაში, რომელიც გამოთვლით უფრო მარტივია, მაგრამ ნიმუშის ზრდით, განსხვავებით - სპირმენ, გამოთვლების მოცულობა არა პროპორციულად, არამედ ექსპონენციალურად იზრდება. ასე, მაგალითად, როდის = 12 აუცილებელია 66 წყვილი საგნის დახარისხება და როდის = 489 - უკვე 1128 წყვილი, ანუ გამოთვლების რაოდენობა 17-ჯერ იზრდება. სტატისტიკურ პროგრამაში (SPSS, Statistica) კომპიუტერზე გაანგარიშებისას კენდალის კოეფიციენტი გამოითვლება კოეფიციენტების მსგავსად. -სპირმენი და -პირსონ. გამოთვლილი კორელაციის კოეფიციენტი τ -კენდალს უფრო ზუსტი ღირებულებით ახასიათებს გვ- დონე.

კენდალის კოეფიციენტის გამოყენება სასურველია, თუ თავდაპირველ მონაცემებში არის უკიდეგანო ნიშნები.

რანგის კორელაციის კოეფიციენტების მახასიათებელია ის, რომ მაქსიმალური რანგის კორელაციები (+1, –1) სულაც არ შეესაბამება მკაცრ პირდაპირ ან უკუპროპორციულ კავშირებს თავდაპირველ ცვლადებს შორის. Xდა : საკმარისია მათ შორის მხოლოდ ერთფეროვანი ფუნქციური კავშირი. რანგის კორელაციები აღწევს მაქსიმალურ მოდულის მნიშვნელობას, თუ ერთი ცვლადის უფრო დიდი მნიშვნელობა ყოველთვის შეესაბამება მეორე ცვლადის უფრო დიდ მნიშვნელობას (+1), ან ერთი ცვლადის უფრო დიდი მნიშვნელობა ყოველთვის შეესაბამება სხვა ცვლადის უფრო მცირე მნიშვნელობას და პირიქით (–1 ).

შესამოწმებელი სტატისტიკური ჰიპოთეზა, სტატისტიკური გადაწყვეტილების მიღების პროცედურა და აზრიანი დასკვნის ფორმულირება იგივეა რაც შემთხვევისთვის. -სპირმენი ან -პირსონ.

თუ სტატისტიკურად მნიშვნელოვანი კავშირი არ არის ნაპოვნი, მაგრამ არსებობს საფუძველი იმის დასაჯერებლად, რომ ნამდვილად არსებობს ურთიერთობა, ჯერ უნდა გადახვიდეთ კოეფიციენტიდან.

-Spearman თანაფარდობა τ -კენდალი (ან პირიქით) და შემდეგ შეამოწმეთ კავშირის არასანდოობის შესაძლო მიზეზები:

  • კომუნიკაციის არაწრფივი: ამისათვის შეხედეთ 2D სკატერის ნაკვეთს. თუ ურთიერთობა არ არის ერთფეროვანი, მაშინ დაყავით ნიმუში ნაწილებად, რომლებშიც ურთიერთობა ერთფეროვანია, ან დაყავით ნიმუში კონტრასტულ ჯგუფებად და შემდეგ შეადარეთ ისინი თვისების გამოხატვის დონის მიხედვით;
  • ნიმუშის ჰეტეროგენულობა: შეხედეთ ორგანზომილებიან სკატერის ნაკვეთს, შეეცადეთ დაყოთ ნიმუში ნაწილებად, რომლებშიც ურთიერთობას შეიძლება ჰქონდეს განსხვავებული მიმართულებები.

თუ კავშირი არის სტატისტიკურად მნიშვნელოვანი, მაშინ აზრობრივი დასკვნის გაკეთებამდე აუცილებელია მცდარი კორელაციის შესაძლებლობის გამორიცხვა (მეტრული კორელაციის კოეფიციენტების ანალოგიით).

დიქოტომიური ცვლადების კორელაცია

დიქოტომიური სკალაზე გაზომილი ორი ცვლადის შედარებისას, კორელაციის საზომია ეგრეთ წოდებული კოეფიციენტი j, რომელიც არის კორელაციის კოეფიციენტი დიქოტომიური მონაცემებისთვის.

ღირებულება კოეფიციენტი φ+1-სა და -1-ს შორისაა. ის შეიძლება იყოს როგორც დადებითი, ასევე უარყოფითი, რაც ახასიათებს კავშირის მიმართულებას ორ დიქოტომიურად გაზომილ მახასიათებელს შორის. თუმცა, φ-ის ინტერპრეტაციამ შეიძლება გამოიწვიოს კონკრეტული პრობლემები. ფ კოეფიციენტის გამოთვლის სქემაში შეტანილი დიქოტომიური მონაცემები არ ჰგავს ორგანზომილებიან ნორმალურ ზედაპირს, შესაბამისად, არასწორია ვივარაუდოთ, რომ ინტერპრეტირებული მნიშვნელობები rxy\u003d 0.60 და φ \u003d 0.60 იგივეა. კოეფიციენტი φ შეიძლება გამოითვალოს კოდირების მეთოდით, ასევე ე.წ. ოთხველიანი ცხრილის ან გაუთვალისწინებელი ცხრილის გამოყენებით.

კორელაციის φ კოეფიციენტის გამოსაყენებლად, უნდა დაკმაყოფილდეს შემდეგი პირობები:

  • შესადარებელი ნიშნები უნდა გაიზომოს დიქოტომიური სკალით;
  • Xდა იგივე უნდა იყოს.

ამ ტიპის კორელაცია გამოითვლება SPSS კომპიუტერულ პროგრამაში მანძილის ზომებისა და მსგავსების ზომების განსაზღვრის საფუძველზე. ზოგიერთი სტატისტიკური პროცედურა, როგორიცაა ფაქტორული ანალიზი, კლასტერული ანალიზი, მრავალვარიანტული სკალირება, ეფუძნება ამ ზომების გამოყენებას და ზოგჯერ ისინი თავად იძლევიან დამატებით შესაძლებლობებს მსგავსების ზომების გამოსათვლელად.

როდესაც ერთი ცვლადი იზომება დიქოტომიური მასშტაბით (ცვლადი X), ხოლო მეორე ინტერვალების ან თანაფარდობების მასშტაბით (ცვლადი ), გამოიყენება ბისერიული კორელაციის კოეფიციენტიმაგალითად, ჰიპოთეზების ტესტირებისას ბავშვის სქესის გავლენის შესახებ სიმაღლესა და წონაზე. ეს კოეფიციენტი მერყეობს -1-დან +1-მდე დიაპაზონში, მაგრამ მის ნიშანს არ აქვს მნიშვნელობა შედეგების ინტერპრეტაციისთვის. მისი გამოყენებისთვის უნდა დაიცვან შემდეგი პირობები:

  • შედარებით ნიშნები უნდა გაიზომოს სხვადასხვა მასშტაბით: ერთი X- დიქოტომიური მასშტაბით; სხვა – ინტერვალების ან თანაფარდობების მასშტაბით;
  • ცვლადი აქვს ნორმალური განაწილების კანონი;
  • შედარებულ ცვლადებში განსხვავებული მახასიათებლების რაოდენობა Xდა იგივე უნდა იყოს.

თუ ცვლადი Xიზომება დიქოტომიური მასშტაბით და ცვლადი რანგის შკალაში (ცვლადი ), შეიძლება გამოყენებულ იქნას რანგი-ბისერიული კორელაციის კოეფიციენტი, რომელიც მჭიდროდ არის დაკავშირებული კენდალის τ-სთან და თავის განმარტებაში იყენებს დამთხვევისა და ინვერსიის ცნებებს. შედეგების ინტერპრეტაცია იგივეა.

SPSS და Statistica კომპიუტერული პროგრამების გამოყენებით კორელაციური ანალიზის ჩატარება მარტივი და მოსახერხებელი ოპერაციაა. ამისათვის, Bivariate Correlations დიალოგური ფანჯრის (Analyze>Correlate> Bivariate…) გამოძახების შემდეგ თქვენ უნდა გადაიტანოთ შესასწავლი ცვლადები Variables ველში და აირჩიოთ მეთოდი, რომლითაც გამოვლინდება ცვლადებს შორის კორელაცია. შედეგის გამომავალი ფაილი შეიცავს კვადრატულ ცხრილს (კორელაციები) თითოეული გამოთვლილი კრიტერიუმისთვის. ცხრილის თითოეული უჯრა შეიცავს: კორელაციის კოეფიციენტის ძალიან მნიშვნელობას (კორელაციის კოეფიციენტი), გამოთვლილი კოეფიციენტის Sig-ის სტატისტიკურ მნიშვნელობას, საგნების რაოდენობას.

მიღებული კორელაციის ცხრილის სათაური და გვერდითი სვეტები შეიცავს ცვლადების სახელებს. ცხრილის დიაგონალი (ზედა მარცხენა - ქვედა მარჯვენა კუთხე) შედგება ერთეულებისგან, ვინაიდან ნებისმიერი ცვლადის კორელაცია საკუთარ თავთან მაქსიმალურია. ცხრილი სიმეტრიულია ამ დიაგონალის მიმართ. თუ პროგრამაში მონიშნულია ველი „მნიშვნელოვანი კორელაციების მონიშვნა“, მაშინ საბოლოო კორელაციის ცხრილში მონიშნული იქნება სტატისტიკურად მნიშვნელოვანი კოეფიციენტები: 0,05 და ნაკლებ დონეზე - ერთი ვარსკვლავით (*), ხოლო 0,01 დონეზე - ორი ვარსკვლავი (**).

ასე რომ, შევაჯამოთ: კორელაციური ანალიზის მთავარი მიზანია ცვლადებს შორის კავშირის დადგენა. კავშირის საზომი არის კორელაციის კოეფიციენტები, რომელთა არჩევანი პირდაპირ დამოკიდებულია სკალის ტიპზე, რომელშიც ცვლადები იზომება, შედარებულ ცვლადებში განსხვავებული მახასიათებლების რაოდენობასა და ცვლადების განაწილებაზე. ორ ცვლადს შორის კორელაციის არსებობა არ ნიშნავს მათ შორის მიზეზობრივი კავშირის არსებობას. მიუხედავად იმისა, რომ კორელაცია პირდაპირ არ მიუთითებს მიზეზობრიობაზე, ის შეიძლება იყოს მინიშნება მიზეზებზე. მის საფუძველზე შეიძლება ჩამოყალიბდეს ჰიპოთეზები. ზოგიერთ შემთხვევაში, კორელაციის ნაკლებობა უფრო ღრმა გავლენას ახდენს მიზეზობრიობის ჰიპოთეზაზე. ორი ცვლადის ნულოვანი კორელაცია შეიძლება მიუთითებდეს, რომ არ არსებობს ერთი ცვლადის გავლენა მეორეზე.

საკურსო სამუშაო

თემა: კორელაციური ანალიზი

შესავალი

1. კორელაციური ანალიზი

1.1 კორელაციის ცნება

1.2 კორელაციების ზოგადი კლასიფიკაცია

1.3 კორელაციური ველები და მათი აგების მიზანი

1.4 კორელაციური ანალიზის ეტაპები

1.5 კორელაციის კოეფიციენტები

1.6 ნორმალიზებული ბრავეს-პირსონის კორელაციის კოეფიციენტი

1.7 სპირმენის წოდების კორელაციის კოეფიციენტი

1.8 კორელაციის კოეფიციენტების ძირითადი თვისებები

1.9 კორელაციის კოეფიციენტების მნიშვნელოვნების შემოწმება

1.10 წყვილის კორელაციის კოეფიციენტის კრიტიკული მნიშვნელობები

2. მრავალვარიანტული ექსპერიმენტის დაგეგმვა

2.1 პრობლემის მდგომარეობა

2.2 გეგმის ცენტრის (მთავარი დონის) და ფაქტორების ცვალებადობის დონის განსაზღვრა

2.3 დაგეგმვის მატრიცის აგება

2.4 დისპერსიის ერთგვაროვნებისა და გაზომვების თანაბარი სიზუსტის შემოწმება სხვადასხვა სერიებში

2.5 რეგრესიის განტოლების კოეფიციენტები

2.6 განმეორებადობის დისპერსია

2.7 რეგრესიის განტოლების კოეფიციენტების მნიშვნელოვნების შემოწმება

2.8 რეგრესიის განტოლების ადეკვატურობის შემოწმება

დასკვნა

ბიბლიოგრაფია

შესავალი

ექსპერიმენტის დაგეგმვა არის მათემატიკური და სტატისტიკური დისციპლინა, რომელიც შეისწავლის ექსპერიმენტული კვლევის რაციონალური ორგანიზების მეთოდებს - შესწავლილი ფაქტორების ოპტიმალური არჩევანიდან და ექსპერიმენტის რეალური გეგმის განსაზღვრიდან მისი მიზნის შესაბამისად, შედეგების ანალიზის მეთოდებამდე. ექსპერიმენტის დაგეგმვის დასაწყისი ჩაეყარა ინგლისელი სტატისტიკოსის რ. ფიშერის (1935) ნაშრომებს, რომელმაც ხაზგასმით აღნიშნა, რომ რაციონალური ექსპერიმენტის დაგეგმვა იძლევა არანაკლებ მნიშვნელოვან სარგებელს შეფასებების სიზუსტეში, ვიდრე გაზომვის შედეგების ოპტიმალური დამუშავება. მე-20 საუკუნის 60-იან წლებში გაჩნდა ექსპერიმენტების დაგეგმვის თანამედროვე თეორია. მისი მეთოდები მჭიდრო კავშირშია ფუნქციების მიახლოების თეორიასთან და მათემატიკურ პროგრამირებასთან. აგებულია ოპტიმალური გეგმები და მათი თვისებები გამოკვლეულია მოდელების ფართო კლასისთვის.

ექსპერიმენტის დაგეგმვა არის ექსპერიმენტის გეგმის არჩევანი, რომელიც აკმაყოფილებს მითითებულ მოთხოვნებს, მოქმედებების ერთობლიობა, რომელიც მიმართულია ექსპერიმენტის სტრატეგიის შემუშავებაზე (აპრიორული ინფორმაციის მოპოვებიდან სამუშაო მათემატიკური მოდელის მოპოვებამდე ან ოპტიმალური პირობების განსაზღვრამდე). ეს არის ექსპერიმენტის მიზანმიმართული კონტროლი, რომელიც ხორციელდება შესასწავლი ფენომენის მექანიზმის არასრული ცოდნის პირობებში.

გაზომვების, შემდგომი მონაცემების დამუშავების, ასევე შედეგების მათემატიკური მოდელის სახით ფორმალიზების პროცესში წარმოიქმნება შეცდომები და იკარგება თავდაპირველ მონაცემებში შემავალი ინფორმაციის ნაწილი. ექსპერიმენტის დაგეგმვის მეთოდების გამოყენება შესაძლებელს ხდის მათემატიკური მოდელის შეცდომის დადგენას და მის ადეკვატურობაზე მსჯელობას. თუ მოდელის სიზუსტე არასაკმარისია, მაშინ ექსპერიმენტის დაგეგმვის მეთოდების გამოყენება შესაძლებელს ხდის მათემატიკური მოდელის მოდერნიზაციას დამატებითი ექსპერიმენტებით წინა ინფორმაციის დაკარგვის გარეშე და მინიმალური დანახარჯებით.

ექსპერიმენტის დაგეგმვის მიზანია ექსპერიმენტების ჩატარების ისეთი პირობებისა და წესების პოვნა, რომლითაც შესაძლებელი იქნება სანდო და სანდო ინფორმაციის მიღება ობიექტის შესახებ მინიმალური შრომითი ხარჯებით, აგრეთვე ამ ინფორმაციის კომპაქტური და მოსახერხებელი ფორმით წარმოდგენა რაოდენობრივად. სიზუსტის შეფასება.

დაგეგმვის ძირითად მეთოდებს შორის, რომლებიც გამოიყენება კვლევის სხვადასხვა ეტაპზე, გამოიყენება შემდეგი:

სკრინინგული ექსპერიმენტის დაგეგმვა, რომლის მთავარი მნიშვნელობა არის მნიშვნელოვანი ფაქტორების ჯგუფის შერჩევა ფაქტორების მთლიანობიდან, რომლებიც ექვემდებარება შემდგომ დეტალურ შესწავლას;

დისპერსიის ანალიზის ექსპერიმენტის შემუშავება, ე.ი. ხარისხობრივი ფაქტორების მქონე ობიექტების გეგმების შედგენა;

რეგრესიის ექსპერიმენტის დაგეგმვა, რომელიც საშუალებას გაძლევთ მიიღოთ რეგრესიის მოდელები (პოლინომიური და სხვა);

ექსტრემალური ექსპერიმენტის დაგეგმვა, რომელშიც მთავარი ამოცანაა კვლევის ობიექტის ექსპერიმენტული ოპტიმიზაცია;

დაგეგმვა დინამიური პროცესების შესწავლაში და ა.შ.

დისციპლინის შესწავლის მიზანია სტუდენტების მომზადება სპეციალობის საწარმოო და ტექნიკური საქმიანობისთვის დაგეგმვის თეორიისა და თანამედროვე საინფორმაციო ტექნოლოგიების გამოყენებით.

დისციპლინის მიზნები: სამეცნიერო და სამრეწველო ექსპერიმენტების დაგეგმვის, ორგანიზებისა და ოპტიმიზაციის თანამედროვე მეთოდების შესწავლა, ექსპერიმენტების ჩატარება და შედეგების დამუშავება.

1. კორელაციური ანალიზი

1.1 კორელაციის ცნება

მკვლევარს ხშირად აინტერესებს, თუ როგორ არის დაკავშირებული ორი ან მეტი ცვლადი ერთმანეთთან ერთ ან რამდენიმე შესწავლილ ნიმუშში. მაგალითად, შეიძლება თუ არა სიმაღლემ გავლენა მოახდინოს ადამიანის წონაზე, თუ წნევამ შეიძლება გავლენა მოახდინოს პროდუქტის ხარისხზე?

ცვლადებს შორის ამ სახის ურთიერთობას ეწოდება კორელაცია, ან კორელაცია. კორელაცია არის თანმიმდევრული ცვლილება ორ მახასიათებელში, რაც ასახავს იმ ფაქტს, რომ ერთი მახასიათებლის ცვალებადობა შეესაბამება მეორის ცვალებადობას.

ცნობილია, მაგალითად, რომ საშუალოდ არის დადებითი კავშირი ადამიანების სიმაღლესა და მათ წონას შორის და ისეთი, რომ რაც უფრო დიდია სიმაღლე, მით მეტია ადამიანის წონა. თუმცა, არის გამონაკლისები ამ წესიდან, როდესაც შედარებით დაბალი ადამიანები ჭარბწონიანები არიან და, პირიქით, ასთენიები, მაღალი ზრდის მქონე, მსუბუქი. ასეთი გამორიცხვის მიზეზი ის არის, რომ თითოეული ბიოლოგიური, ფიზიოლოგიური თუ ფსიქოლოგიური თვისება განისაზღვრება მრავალი ფაქტორის გავლენით: გარემო, გენეტიკური, სოციალური, ეკოლოგიური და ა.შ.

კორელაციები არის სავარაუდო ცვლილებები, რომელთა შესწავლა შესაძლებელია მხოლოდ წარმომადგენლობით ნიმუშებზე მათემატიკური სტატისტიკის მეთოდებით. ორივე ტერმინი - კორელაცია და კორელაციის დამოკიდებულება - ხშირად გამოიყენება ურთიერთშენაცვლებით. დამოკიდებულება ნიშნავს გავლენას, კავშირს - ნებისმიერი კოორდინირებული ცვლილება, რომელიც შეიძლება აიხსნას ასობით მიზეზით. კორელაციები არ შეიძლება ჩაითვალოს მიზეზობრივი კავშირის მტკიცებულებად, ისინი მხოლოდ მიუთითებენ, რომ ერთ მახასიათებელში ცვლილებებს, როგორც წესი, ახლავს გარკვეული ცვლილებები მეორეში.

კორელაციური დამოკიდებულება - ეს არის ცვლილებები, რომლებსაც ერთი მახასიათებლის მნიშვნელობები ახდენს სხვა მახასიათებლის სხვადასხვა მნიშვნელობების გაჩენის ალბათობას.

კორელაციური ანალიზის ამოცანა მცირდება სხვადასხვა მახასიათებლებს შორის ურთიერთობის მიმართულების (დადებითი ან უარყოფითი) და ფორმის (წრფივი, არაწრფივი) დადგენით, მისი შებოჭილობის გაზომვით და, ბოლოს და ბოლოს, მიღებული კორელაციის მნიშვნელოვნების დონის შემოწმებამდე. კოეფიციენტები.

კორელაციები განსხვავდება ფორმით, მიმართულებით და ხარისხით (სიძლიერე) .

კორელაციის ფორმა შეიძლება იყოს მართკუთხა ან მრუდი. მაგალითად, ურთიერთობა სიმულატორზე ტრენინგის სესიების რაოდენობასა და საკონტროლო სესიაზე სწორად გადაწყვეტილი პრობლემების რაოდენობას შორის შეიძლება იყოს პირდაპირი. Curvilinear შეიძლება იყოს, მაგალითად, ურთიერთობა მოტივაციის დონესა და დავალების ეფექტურობას შორის (სურათი 1). მოტივაციის მატებასთან ერთად ჯერ იზრდება დავალების ეფექტურობა, შემდეგ მიიღწევა მოტივაციის ოპტიმალური დონე, რომელიც შეესაბამება დავალების მაქსიმალურ ეფექტურობას; მოტივაციის შემდგომ ზრდას თან ახლავს ეფექტურობის დაქვეითება.

დიაგრამა 1 - კავშირი პრობლემის გადაჭრის ეფექტურობასა და მოტივაციური ტენდენციის სიძლიერეს შორის

მიმართულებით, კორელაცია შეიძლება იყოს დადებითი ("პირდაპირი") და უარყოფითი ("საპირისპირო"). დადებითი სწორი კორელაციით, ერთი ატრიბუტის უფრო მაღალი მნიშვნელობები შეესაბამება მეორის უფრო მაღალ მნიშვნელობებს, ხოლო ერთი ატრიბუტის ქვედა მნიშვნელობები შეესაბამება მეორის დაბალ მნიშვნელობებს (სურათი 2). უარყოფითი კორელაციით, კოეფიციენტები შებრუნებულია (სურათი 3). დადებითი კორელაციით, კორელაციის კოეფიციენტს აქვს დადებითი ნიშანი, უარყოფითი კორელაციით - უარყოფითი ნიშანი.

სურათი 2 - პირდაპირი კორელაცია

სურათი 3 - ინვერსიული კორელაცია


სურათი 4 - არანაირი კორელაცია

კორელაციის ხარისხი, სიმტკიცე ან შებოჭილობა განისაზღვრება კორელაციის კოეფიციენტის მნიშვნელობით. კავშირის სიძლიერე არ არის დამოკიდებული მის მიმართულებაზე და განისაზღვრება კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობით.

1.2 კორელაციების ზოგადი კლასიფიკაცია

კორელაციის კოეფიციენტიდან გამომდინარე, განასხვავებენ შემდეგ კორელაციებს:

ძლიერი ან დახურული კორელაციის კოეფიციენტით r>0.70;

საშუალო (0.50-ზე

ზომიერი (0.30 საათზე

სუსტი (0.20-ზე

ძალიან სუსტი (რ<0,19).

1.3 კორელაციური ველები და მათი აგების მიზანი

კორელაცია შესწავლილია ექსპერიმენტული მონაცემების საფუძველზე, რომლებიც არის ორი მახასიათებლის გაზომილი მნიშვნელობები (x i, y i). თუ ექსპერიმენტული მონაცემები მცირეა, მაშინ ორგანზომილებიანი ემპირიული განაწილება წარმოდგენილია x i და y i მნიშვნელობების ორმაგი სერია. ამ შემთხვევაში, მახასიათებლებს შორის კორელაცია შეიძლება აღწერილი იყოს სხვადასხვა გზით. არგუმენტსა და ფუნქციას შორის შესაბამისობა შეიძლება იყოს ცხრილით, ფორმულით, გრაფიკით და ა.შ.

კორელაციური ანალიზი, ისევე როგორც სხვა სტატისტიკური მეთოდები, ეფუძნება ალბათური მოდელების გამოყენებას, რომლებიც აღწერს შესწავლილი მახასიათებლების ქცევას გარკვეულ ზოგად პოპულაციაში, საიდანაც მიღებულია ექსპერიმენტული მნიშვნელობები x i და y i. რაოდენობრივ მახასიათებლებს შორის კორელაციის შესწავლისას, რომელთა მნიშვნელობები ზუსტად შეიძლება გაიზომოს მეტრულ მასშტაბებში (მეტრი, წამი, კილოგრამი და ა.შ.), ორგანზომილებიანი ნორმალურად განაწილებული ზოგადი პოპულაციის მოდელი ძალიან ხშირად ხდება. მიღებული. ასეთი მოდელი ასახავს x i და y i ცვლადებს შორის ურთიერთობას გრაფიკულად, როგორც წერტილების ლოკუსი მართკუთხა კოორდინატულ სისტემაში. ამ გრაფიკულ დამოკიდებულებას ასევე უწოდებენ გაფანტვის ან კორელაციის ველს.
ორგანზომილებიანი ნორმალური განაწილების ეს მოდელი (კორელაციური ველი) საშუალებას გაძლევთ მისცეთ კორელაციის კოეფიციენტის ვიზუალური გრაფიკული ინტერპრეტაცია, რადგან აგრეგატში განაწილება დამოკიდებულია ხუთ პარამეტრზე: μ x, μ y - საშუალო მნიშვნელობები (მათემატიკური მოლოდინები); σ x ,σ y არის X და Y შემთხვევითი ცვლადების სტანდარტული გადახრები და p არის კორელაციის კოეფიციენტი, რომელიც წარმოადგენს X და Y შემთხვევით ცვლადებს შორის ურთიერთობის საზომს.
თუ p \u003d 0, მაშინ მნიშვნელობები, x i, y i, მიღებული ორგანზომილებიანი ნორმალური პოპულაციისგან, განლაგებულია გრაფიკზე x, y კოორდინატებში წრეში შემოსაზღვრული ფართობის ფარგლებში (სურათი 5, ა). ამ შემთხვევაში, არ არსებობს კორელაცია X და Y შემთხვევით ცვლადებს შორის და მათ უწოდებენ არაკორელაციას. ორგანზომილებიანი ნორმალური განაწილებისთვის, არაკორელაცია ნიშნავს X და Y შემთხვევითი ცვლადების დამოუკიდებლობას.

ურთიერთობის კონცეფცია საკმაოდ გავრცელებულია ფსიქოლოგიურ კვლევებში. ფსიქოლოგმა უნდა იმუშაოს მასთან, როცა რაიმე დასკვნის გამოსატანად საჭირო გახდება ნიშნების ან ფენომენების ორი ან მეტი ინდიკატორის გაზომვების შედარება.

შესწავლილ ფენომენებს შორის ურთიერთობის ბუნება შეიძლება იყოს ცალსახა, ე.ი. ასეთი, როდესაც ერთი ატრიბუტის გარკვეული მნიშვნელობა შეესაბამება მეორის მკაფიო და განსაზღვრულ მნიშვნელობას. ასე რომ, მაგალითად, გონებრივი ფუნქციების ტესტების ნიმუშების ძიების ქვეტესტში, დაგროვებული "ნედლეული" ქულების რაოდენობა განისაზღვრება ფორმულით:
Xi \u003d Stz - Soz / Stz + Spz * Sbc,
სადაც Xi არის ვარიანტების მნიშვნელობა, Sтз არის ქვეტესტში აპრიორი მოცემული შაბლონების (შესატყვისების) რაოდენობა, Soz არის შეცდომით მითითებული შესატყვისების რაოდენობა ტესტის სუბიექტებთან, Soz არის შეუსაბამო (გამოტოვებული) რაოდენობა. ტესტის სუბიექტები, Sbс არის ტესტის სუბიექტების მიერ ტესტში ნანახი ყველა სიტყვის რაოდენობა.

ასეთ ურთიერთობას ფუნქციონალურს უწოდებენ: აქ ერთი ინდიკატორი მეორის ფუნქციაა, რაც არგუმენტია პირველთან მიმართებაში.

თუმცა, მკაფიო ურთიერთობა ყოველთვის არ არის ნაპოვნი. უფრო ხშირად ადამიანს უწევს საქმე სიტუაციასთან, რომელშიც მახასიათებლის ერთი მნიშვნელობა შეიძლება შეესაბამებოდეს მეორის რამდენიმე მნიშვნელობას. ეს მნიშვნელობები იცვლება მეტ-ნაკლებად განსაზღვრულ საზღვრებში. ამ ტიპის ურთიერთობას ეწოდება კორელაცია ან კორელაციური.

გამოიყენება კორელაციური გამონათქვამების რამდენიმე ტიპი. ასე რომ, იმ მახასიათებლებს შორის ურთიერთობის გამოსახატავად, რომლებსაც აქვთ მათი მნიშვნელობების ცვალებადობის რაოდენობრივი ხასიათი, გამოიყენება ცენტრალური ტენდენციის საზომები: ტაბულა, რასაც მოჰყვება წყვილის კორელაციის კოეფიციენტის გამოთვლა, მრავალჯერადი და ნაწილობრივი კორელაციის კოეფიციენტი, მრავალჯერადი განსაზღვრის კოეფიციენტი. , კორელაციის თანაფარდობა.

თუ საჭიროა მახასიათებლებს შორის ურთიერთობის შესწავლა, რომელთა ცვალებადობა ხარისხობრივ ხასიათს ატარებს (პიროვნების კვლევის პროექციული მეთოდების შედეგები, სემანტიკური დიფერენციალური მეთოდით კვლევები, კვლევები ღია მასშტაბის გამოყენებით და ა.შ.), მაშინ გამოიყენეთ ხარისხობრივი. ალტერნატიული კორელაციის კოეფიციენტი (ტეტრაქორული მაჩვენებელი), პირსონის კრიტერიუმი x2, პირსონისა და ჩუპროვის შემთხვევითობის (შემთხვევითობის) ინდიკატორები.

ხარისხობრივ-რაოდენობრივი კორელაციის დასადგენად, ე.ი. ასეთი კორელაცია, როდესაც ერთ ნიშანს აქვს თვისებრივი ცვალებადობა, ხოლო მეორე - რაოდენობრივი.გამოიყენება სპეციალური მეთოდები.

კორელაციის კოეფიციენტი (ტერმინი პირველად შემოიღო ფ. გალტონმა 1888 წელს) არის ორი შედარებული ნიმუში(ებ)ის ვარიანტს შორის კავშირის სიძლიერის მაჩვენებელი. როგორიც არ უნდა იყოს ფორმულა გამოყენებული კორელაციის კოეფიციენტის გამოსათვლელად, მისი მნიშვნელობა მერყეობს -1-დან +1-მდე. სრული დადებითი კორელაციის შემთხვევაში ეს კოეფიციენტი უდრის პლუს 1-ს, ხოლო სრული უარყოფითი კორელაციის შემთხვევაში არის მინუს 1. ეს ჩვეულებრივ არის სწორი ხაზი, რომელიც გადის მნიშვნელობების გადაკვეთის წერტილებში. თითოეული წყვილი მონაცემები.

თუ ვარიანტის მნიშვნელობები არ ჯდება სწორ ხაზზე, არამედ ქმნიან „ღრუბელს“, მაშინ კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობა ხდება ერთზე ნაკლები და „ღრუბელის“ დამრგვალებისას უახლოვდება ნულს. თუ კორელაციის კოეფიციენტი არის 0, ორივე ვარიანტი სრულიად დამოუკიდებელია ერთმანეთისგან.

კორელაციის კოეფიციენტის ნებისმიერი გამოთვლილი (ემპირიული) მნიშვნელობა უნდა შემოწმდეს ვალიდობაზე (სტატისტიკური მნიშვნელოვნება) კორელაციის კოეფიციენტის კრიტიკული მნიშვნელობების შესაბამისი ცხრილების მიმართ. თუ ემპირიული მნიშვნელობა ნაკლებია ან ტოლია ცხრილის მნიშვნელობის 5 პროცენტიანი დონისთვის (P = 0.05), კორელაცია არ არის მნიშვნელოვანი. თუ კორელაციის კოეფიციენტის გამოთვლილი მნიშვნელობა მეტია P = 0.01-ის ცხრილის მნიშვნელობაზე, მაშინ კორელაცია არის სტატისტიკურად მნიშვნელოვანი (მნიშვნელოვანი).

იმ შემთხვევაში, როდესაც კოეფიციენტის მნიშვნელობა არის 0,05 > P > 0,01 შორის, პრაქტიკაში საუბარია P = 0,05 კორელაციის მნიშვნელობაზე.

Bravais-Pearson-ის კორელაციის კოეფიციენტი (r) არის პარამეტრული ინდიკატორი შემოთავაზებული 1896 წელს, რომლის გამოსათვლელად შედარებულია ვარიანტის საშუალო არითმეტიკული და საშუალო კვადრატული მნიშვნელობები. ამ კოეფიციენტის გამოსათვლელად გამოიყენება შემდეგი ფორმულა (სხვადასხვა ავტორებისთვის ის შეიძლება განსხვავებულად გამოიყურებოდეს):
r= (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

სადაც E Xi Xi1 - წყვილი შესადარებელი ვარიანტების მნიშვნელობების ნამრავლების ჯამი, n არის შედარებული წყვილების რაოდენობა, NXap, X1ap - საშუალო არითმეტიკული ვარიანტები Xi, Xi; შესაბამისად, Qx, Qx, - x და x განაწილების სტანდარტული გადახრები.

Spearman რანგის კორელაციის კოეფიციენტი Rs (რანგის კორელაციის კოეფიციენტი, Spearman კოეფიციენტი) არის კორელაციის კოეფიციენტის უმარტივესი ფორმა და ზომავს ურთიერთობას მოცემული ვარიანტის წოდებებს (ადგილებს) შორის სხვადასხვა საფუძვლებზე, საკუთარი მნიშვნელობის გათვალისწინების გარეშე. აქ ურთიერთობა უფრო ხარისხობრივია, ვიდრე რაოდენობრივი.

როგორც წესი, ეს არაპარამეტრული ტესტი გამოიყენება იმ შემთხვევებში, როდესაც საჭიროა დასკვნების გაკეთება არა იმდენად მონაცემებს შორის ინტერვალების შესახებ, რამდენადაც მათი რიგების შესახებ, ასევე, როდესაც განაწილების მრუდები უკიდურესად ასიმეტრიულია და არ იძლევა ისეთი პარამეტრული ტესტების გამოყენებას, როგორიცაა. ბრავეს-პირსონის კორელაციის კოეფიციენტი (ამ შემთხვევაში შესაძლოა საჭირო გახდეს რაოდენობრივი მონაცემების რიგით მონაცემებად გადაქცევა). თუ კოეფიციენტი Rs ახლოს არის +1-თან, მაშინ ეს ნიშნავს, რომ გარკვეული მახასიათებლების მიხედვით შეფასებული ნიმუშის ორი მწკრივი პრაქტიკულად ემთხვევა, ხოლო თუ ეს კოეფიციენტი - 1-ს მიუახლოვდება, შეგვიძლია ვისაუბროთ სრულ შებრუნებულ ურთიერთობაზე.

ბრავეს-პირსონის კორელაციის კოეფიციენტის გაანგარიშების მსგავსად, უფრო მოსახერხებელია Rs კოეფიციენტის გამოთვლების წარმოდგენა ცხრილის სახით.

რეგრესია აზოგადებს ფუნქციური ურთიერთობის კონცეფციას ვარიანტის მნიშვნელობებს შორის ურთიერთობის სტოქასტური (ალბათური) ბუნების შემთხვევაში. რეგრესიის ამოცანების კატეგორიის გადაჭრის მიზანია გამომავალი უწყვეტი ვარიაციის მნიშვნელობის შეფასება შეყვანის ვარიანტების მნიშვნელობებისგან.