Negatívna závislosť v korekčnej analýze. Cvičenie: Korelačná analýza

Akýkoľvek zákon prírody alebo sociálneho vývoja môže byť reprezentovaný popisom súboru vzťahov. Ak sú tieto závislosti stochastické a analýza sa vykonáva na vzorke bežnej populácie, potom sa táto oblasť výskumu týka úloh štatistického štúdia závislostí, ktoré zahŕňajú koreláciu, regresiu, rozptyl, kovariančnú analýzu a analýzu kontingenčné tabuľky.

    Existuje vzťah medzi skúmanými premennými?

    Ako merať blízkosť spojení?

Všeobecná schéma vzťahu medzi parametrami v štatistickej štúdii je znázornená na obr. jeden.

Model reálneho skúmaného objektu je na obrázku S. Vysvetľujúce (nezávislé, faktorové) premenné popisujú podmienky fungovania objektu. Náhodné faktory sú faktory, ktorých vplyv je ťažké brať do úvahy alebo ktorých vplyv je v súčasnosti zanedbávaný. Výsledné (závislé, vysvetlené) premenné charakterizujú výsledok fungovania objektu.

Výber metódy analýzy vzťahu sa vykonáva s prihliadnutím na povahu analyzovaných premenných.

Korelačná analýza – metóda spracovania štatistických údajov, ktorá spočíva v štúdiu vzťahu medzi premennými.

Cieľom korelačnej analýzy je poskytnúť nejaké informácie o jednej premennej pomocou inej premennej. V prípadoch, keď je možné dosiahnuť cieľ, sa hovorí, že premenné sú korelované. Korelácia odráža len lineárnu závislosť veličín, ale neodráža ich funkčnú súvislosť. Ak napríklad vypočítame korelačný koeficient medzi hodnotami A = sin(x) a B = cos(x), bude sa blížiť k nule, t.j. medzi množstvami nie je žiadny vzťah.

Pri štúdiu korelácie sa používajú grafické a analytické prístupy.

Grafická analýza začína konštrukciou korelačného poľa. Korelačné pole (alebo bodový graf) je grafický vzťah medzi výsledkami merania dvoch prvkov. Na jeho zostavenie sa počiatočné údaje vynesú do grafu, ktorý zobrazuje každú dvojicu hodnôt (xi, yi) ako bod so súradnicami xi a yi v pravouhlom súradnicovom systéme.

Vizuálna analýza korelačného poľa nám umožňuje urobiť predpoklad o forme a smerovaní vzťahu medzi dvoma študovanými ukazovateľmi. Podľa formy vzťahu sa korelačné závislosti zvyčajne delia na lineárne (pozri obr. 1) a nelineárne (pozri obr. 2). Pri lineárnej závislosti je obálka korelačného poľa blízka elipse. Lineárny vzťah dvoch náhodných premenných je taký, že keď jedna náhodná premenná rastie, druhá náhodná premenná má tendenciu rásť (alebo klesať) podľa lineárneho zákona.

Smer vzťahu je pozitívny, ak zvýšenie hodnoty jedného atribútu vedie k zvýšeniu hodnoty druhého (pozri obr. 3) a negatívny, ak zvýšenie hodnoty jedného atribútu vedie k zníženiu hodnoty. druhej (pozri obr. 4).

Závislosti, ktoré majú iba pozitívny alebo iba negatívny smer, sa nazývajú monotónne.

KORELAČNÁ ANALÝZA- súbor metód na posudzovanie vzťahu medzi náhodnými javmi a udalosťami na základe matematickej teórie korelácie. V tomto prípade sa používajú najjednoduchšie charakteristiky, ktoré vyžadujú minimum výpočtov. Pojem „korelácia“ sa zvyčajne stotožňuje s pojmami „vzťah“ a „vzájomná závislosť“. Nie sú však adekvátne. Korelácia je len jedným z typov komunikácie medzi znakmi, ktorý sa prejavuje priemerne a je lineárny. Ak medzi dvoma veličinami existuje jednoznačný vzťah, potom sa takýto vzťah nazýva funkčný a jedna z veličín (príčina) môže jednoznačne určiť hodnotu druhej veličiny (následok). Funkts, závislosť je konkrétnym vyjadrením náhodnej (pravdepodobnostnej, stochastickej) závislosti, kedy sa súvislosť neobjavuje pre každú hodnotu dvoch veličín, ale len v priemere.

K. a. sa používa pri štúdiu dvoch alebo viacerých náhodných premenných s cieľom identifikovať dve najdôležitejšie kvantitatívne charakteristiky: matematickú rovnicu vzťahu medzi týmito veličinami a posúdenie blízkosti vzťahu medzi nimi. Východiskové údaje na určenie týchto charakteristík sú synchrónne výsledky pozorovania (meranie, experiment), t. j. súčasne získané zo skúseností štatistické údaje o znakoch, medzi ktorými sa skúma vzťah. Počiatočné údaje môžu byť uvedené vo forme tabuliek so záznamami o výsledkoch pozorovania alebo ich ekvivalentných znázorneniach na magnetickej páske, diernej páske alebo diernych štítkoch.

K. a. našli široké uplatnenie v medicíne a biológii na definovanie blízkosti a rovníc komunikácie medzi rôznymi znakmi, napr. výsledky analýz klinu, znakov alebo špeciálnych prehliadok, ktoré sa vykonávajú na zdravých alebo chorých ľuďoch (pozri. Korelácia funkcií človeka organizmus). Výsledky do. a. sa používajú na objektívne predpovede chorôb, posúdenie stavu pacienta, priebehu choroby (pozri Prognóza). A priori len podľa výsledkov teoretických biol, a med. štúdie, je ťažké alebo nemožné predpovedať, ako spolu súvisia skúmané vlastnosti. Na zodpovedanie tejto otázky sa vykoná pozorovanie alebo špeciálny experiment.

Dvojrozmerná korelačná analýza sa používa pri spracovaní experimentálnych údajov o prejave akýchkoľvek dvoch znakov.

TABUĽKA ZHODY. Poznámka. V tabuľke sú uvedené intervaly znakov X a Y, ako aj frekvenciu ich výskytu (v strede tabuľky), vypočítané z výsledkov morfometrickej analýzy mikrovaskulatúry bulbokonjunktiválnej oblasti, kde Y je priemer venula a X je priemer arterioly (v mmc).

Každý výsledok experimentu je náhodná premenná a objektívne vzory sa objavujú iba v celom súbore výsledkov meraní. Závery sa preto robia na základe výsledkov spracovania celého súboru experimentálnych údajov, a nie na základe jednotlivých hodnôt, ktoré sú náhodné. Na zníženie vplyvu náhodnej udalosti sa počiatočné údaje spájajú do skupín, čo sa dosiahne zostavením korelačnej tabuľky (pozri tabuľku). Takáto tabuľka obsahuje intervaly (alebo ich stredy) hodnôt dvoch znakov - Y a X, ako aj frekvenciu výskytu hodnôt X a Y v zodpovedajúcom intervale týchto hodnôt. Tieto frekvencie, vypočítané z výsledkov experimentu, sú praktickým odhadom pravdepodobnosti spoločného výskytu hodnôt X a Y konkrétneho intervalu. Zostrojenie korelačnej tabuľky je prvým krokom pri spracovaní počiatočných informácií. Konštrukcia korelačných tabuliek a ich ďalšie kompletné spracovanie prebieha rýchlo na univerzálnych alebo špecializovaných počítačoch (viď. Elektronický počítač). Podľa zoskupených údajov korelačnej tabuľky sa vypočítajú empirické charakteristiky rovnice a tesnosť spojenia. Na určenie rovnice vzťahu medzi Y a X sa vypočítajú priemerné hodnoty prvku Y v každom intervale prvku X. získajte pre každý i-tý interval hodnotu Yxi, ktorej súvislosť pre všetky i-intervaly dáva empirickú regresnú priamku charakterizujúcu formu vzťahu atribútu Y s atribútom X v priemere - graf funkcie Yx= f(x). Ak by medzi znakmi Y a X existoval jednoznačný vzťah, vzťahová rovnica by postačovala na riešenie praktických a teoretických problémov, pretože vždy sa dá použiť na určenie hodnoty znaku Y, ak je daná hodnota X. V praxi by vzťah medzi Y a X nie je jednoznačný, toto spojenie je náhodné a jedna hodnota X zodpovedá množstvu hodnôt Y. Preto je potrebná ešte jedna charakteristika, ktorá meria silu, blízkosť vzťahu medzi Y a X. Takýmito charakteristikami sú disperzný (korelačný) pomer ηух a korelačný koeficient ryx. Prvá z týchto veličín charakterizuje tesnosť spojenia medzi Y a X v ľubovoľnej funkcii f a ryx sa používa iba vtedy, keď je f lineárna funkcia.

Hodnoty ηyx a ryx sú tiež jednoducho určené z korelačnej tabuľky. Výpočet sa zvyčajne vykonáva v tomto poradí: určia sa priemerné hodnoty oboch atribútov X a Y, ich štandardné odchýlky σx a σy a potom ηxy podľa vzorca:

a ryx podľa vzorca:

kde n je celkový počet experimentov, Xcpi je priemerná hodnota X i-teho intervalu, Ycpj je priemerná hodnota Y j-tého intervalu, k, l je počet intervalov vlastností X a Y mi(x) je frekvencia (počet) hodnôt Xcpi. Kvantitatívne charakteristiky presnosti určenia ηyx a ryx sú ich smerodajné odchýlky, ktoré sa rovnajú

Hodnoty koeficientu η ležia medzi nulou a jednou (0=<ηyx=<1). Если ηyx= 0 (рис., а), то это свидетельствует о том, что признаки Y и X недисперсированы, т. е. регрессия Yx = f(x) не дает связи между признаками Y и X, а при ηyx = 1 существует однозначная связь между Y и X (рис., б, ж). Для ηyx<1 признак Y только частично определяется признаком X, и необходимо изучение дополнительных признаков для повышения достоверности определения Y (рис., г, д, е, и).

Hodnota koeficientu r leží medzi -1 a +1 (-1=

Multivariačná korelačná analýza - určenie rovnice a tesnosti spojenia v prípadoch, keď je počet študovaných prvkov väčší ako dva. Ak je teda Y komplexný znak a jeho výsledok závisí od vzhľadu súboru znakov X1, X2, ..., Xn, potom by sa podľa experimentálnych údajov malo určiť nasledovné: ., Хn, t.j. Yx1x2...xn = F(x1, x2...,xn) ; b) tesnosť spojenia medzi Y a súpravou X1, X2,..., Xn.

Predbežné spracovanie výsledkov supervízie na viacrozmerných K. a. spočíva v tom, že pre každú dvojicu znakov sú určené hodnoty rozptylových vzťahov ηyxi (i = 1,2,..., n) a ηxixj (i!=j) korelačných koeficientov ryxi a rxixj. ako párové regresie Yxi = fi(xi ). Na základe týchto údajov sú potom viacnásobné regresné rovnice Yx1x2...xn = F (x1,x2,...,xn), viacnásobný disperzný pomer ηyx1x2...xn a viacnásobný korelačný koeficient Ryx1x2...xn určený. Viacnásobná regresná rovnica umožňuje určiť hodnotu znaku Y pomocou súboru hodnôt X1, X2, ..., Xn, t.j. ak je táto rovnica k dispozícii, je možné predpovedať hodnoty Y na základe výsledkov konkrétnych hodnôt výsledného súboru (napríklad výsledky analýzy podľa prvkov X1, X2...Xn). Hodnota ηyx1x2...xn sa používa ako charakteristika tesnosti spojenia medzi Y a množinou znakov X1, X2, ...Xn pre ľubovoľnú funkciu F a Ryx1x2...xn - pre prípad, keď funkcia F je lineárna. Koeficienty ηyx1x2....xn a Ryx1x2...xn nadobúdajú hodnoty medzi nulou a jednou. Zahrnutie do úvahy pre viacrozmerné K. a. ďalšie funkcie umožňujú dostať hodnoty ηyx1x2...xn, Ryx1x2...xn bližšie k jednote a tým zlepšiť presnosť predikcie funkcie Y pomocou viacnásobnej regresnej rovnice.

Ako príklad uvažujme výsledky párovej K. a., ako aj viacnásobnú regresnú rovnicu a viacnásobný korelačný koeficient medzi znakmi: Y - stabilná pseudoparéza, X1 - lateralizácia motorického defektu na končatinách vpravo, X2 - to isté v končatinách vľavo, X3 - vegetatívne krízy. Hodnoty disperzných pomerov a párových korelačných koeficientov pre ne budú ηyx1 = 0,429, ηyx2 = 0,616, ηyx3 = -0,334 a ryx1 = 0,320, ryx2 = 0,586, ryx25 = -0,3. Podľa rovnice viacnásobnej lineárnej regresie Yх1х2х3 = 0,638 x1 + 0,839 x2 - 0,195 x3. Viacnásobný korelačný koeficient bude vyjadrený ako Ryx1x2x3 =0,721. Z príkladu je vidieť, že podľa údajov X1, X2 a X3 možno stabilnú pseudoparézu predpovedať s dostatočnou presnosťou pre prax.

Metódy do. a. tiež umožňujú získať dynamické charakteristiky a. V tomto prípade sú študované znaky (napr. EKG, EEG atď.) považované za náhodné funkcie Y(t) a X(t). Na základe výsledkov pozorovania týchto funkcií sa určujú aj dve najdôležitejšie charakteristiky: a) vyhodnotenie komunikačného operátora (matematická rovnica) medzi Y (t) a X (t); b) posúdenie tesnej súvislosti medzi nimi. Disperzné a korelačné funkcie náhodných funkcií Y (t) a X(t) sa berú ako charakteristiky tesnosti spojenia. Tieto funkcie sú zovšeobecnením disperzných vzťahov a korelačných koeficientov. Takže normalizovaná vzájomná disperzná funkcia ηyx(t) každej pevnej hodnoty t je disperzný vzťah medzi hodnotami znakov Y(t) a X(t). Podobne normalizovaná krížová korelačná funkcia Ryx(t) je pre každú pevnú hodnotu t korelačný koeficient medzi znakmi Y(t) a X(t). Charakteristika lineárneho vzťahu (závislosti) pre rovnakú študovanú veličinu v rôznych časových bodoch sa nazýva autokorelácia.

K. a. je jednou z metód riešenia problému identifikácie, ktorá je široko používaná pri získavaní matematických modelov a automatizácii medicínskeho biol, výskumu a liečby.

Bibliografia: Výpočtové systémy a automatická diagnostika srdcových chorôb, vyd. C. Caceres a L. Dreyfus, prekl. z angličtiny, M., 1974; Gutman S. R. O dvoch modeloch elektroencefalogramu konvergujúceho k normálnemu náhodnému procesu, in: Upravlenie i inform. procesy vo voľnej prírode, vyd. V. V. Larina, s. 205, M., 1971; Zaslavskaya R. M., Perepel-kin E. G. a Akhmetov K. Zh. Korelácie medzi ukazovateľmi hemokoagulácie a metabolizmu lipidov u pacientov s angínou počas dňa, Kardiológia, t. 111, 1977; K r a m e r G. Matematické metódy štatistiky, prekl. z angličtiny, M., 1975; Pasternak E. B. a kol.: Štúdium elektrickej aktivity predsiení pri fibrilácii predsiení pomocou inštrumentálnej korelačnej analýzy, Cardiology, t. 17, Xia 7, str. 50, 1977; Sinitsyn B. S. Automatické korelátory a ich aplikácia, Novosibirsk, 1964, bibliogr.; V r-b a x V. Yu Štatistická analýza v biologických a lekárskych výskumoch, M., 1975, bibliogr.

V. N. Reibman, N. S. Reibman.

Využitie štatistických metód pri spracovaní psychologických výskumných materiálov poskytuje skvelú príležitosť získať užitočné informácie z experimentálnych údajov. Jednou z najbežnejších štatistických metód je korelačná analýza.

Pojem „korelácia“ prvýkrát použil francúzsky paleontológ J. Cuvier, ktorý odvodil „zákon korelácie častí a orgánov zvierat“ (tento zákon umožňuje obnoviť vzhľad celého zvieraťa z nájdených častí tela ). Tento pojem zaviedol do štatistiky anglický biológ a štatistik F. Galton (nie len „spojenie“ - vzťah a "akoby spojenie" - korelácia).

Korelačná analýza je test hypotéz o vzťahoch medzi premennými pomocou korelačných koeficientov, dvojrozmernej deskriptívnej štatistiky, kvantitatívnej miery vzťahu (spoločnej variability) dvoch premenných. Ide teda o súbor metód na zisťovanie korelácií medzi náhodnými premennými alebo znakmi.

Korelačná analýza pre dve náhodné premenné zahŕňa:

  • vytvorenie korelačného poľa a zostavenie korelačnej tabuľky;
  • výpočet výberových korelačných koeficientov a korelačných pomerov;
  • testovanie štatistickej hypotézy významnosti vzťahu.

Hlavným účelom korelačnej analýzy je identifikovať vzťah medzi dvoma alebo viacerými skúmanými premennými, ktorý sa považuje za spoločnú koordinovanú zmenu dvoch skúmaných charakteristík. Táto variabilita má tri hlavné charakteristiky: tvar, smer a pevnosť.

Forma korelácie môže byť lineárna alebo nelineárna. Lineárna forma je vhodnejšia na identifikáciu a interpretáciu korelácie. Pre lineárnu koreláciu možno rozlíšiť dva hlavné smery: pozitívny („dopredné spojenie“) a negatívny („spätná väzba“).

Sila spojenia priamo naznačuje, aká výrazná je kĺbová variabilita študovaných premenných. Funkčné prepojenie javov možno v psychológii empiricky odhaliť len ako pravdepodobnostné prepojenie zodpovedajúcich znakov. Vizuálne znázornenie povahy pravdepodobnostného vzťahu je dané bodovým diagramom - grafom, ktorého osi zodpovedajú hodnotám dvoch premenných a každý subjekt je bod.

Korelačné koeficienty sa používajú ako číselná charakteristika pravdepodobnostného vzťahu, ktorého hodnoty sa pohybujú v rozmedzí od –1 do +1. Po výpočtoch výskumník spravidla vyberie len najsilnejšie korelácie, ktoré sa ďalej interpretujú (tab. 1).

Kritériom pre výber „dostatočne silných“ korelácií môže byť buď absolútna hodnota samotného korelačného koeficientu (od 0,7 do 1), alebo relatívna hodnota tohto koeficientu, určená hladinou štatistickej významnosti (od 0,01 do 0,1), v závislosti od veľkosť vzorky. V malých vzorkách je pre ďalšiu interpretáciu správnejšie vybrať silné korelácie na základe hladiny štatistickej významnosti. Pre štúdie, ktoré sa vykonávajú na veľkých vzorkách, je lepšie použiť absolútne hodnoty korelačných koeficientov.

Úloha korelačnej analýzy sa teda redukuje na určenie smeru (pozitívneho alebo negatívneho) a formy (lineárneho, nelineárneho) vzťahu medzi rôznymi znakmi, meranie jeho tesnosti a nakoniec kontrolu hladiny významnosti získaných korelačné koeficienty.

V súčasnosti bolo vyvinutých mnoho rôznych korelačných koeficientov. Najpoužívanejšie sú r-Pearson, r- Spearman a τ - Kendall. Moderné počítačové štatistické programy v menu „Korelácie“ ponúkajú práve tieto tri koeficienty a na riešenie iných výskumných problémov sa ponúkajú metódy porovnávania skupín.

Výber metódy výpočtu korelačného koeficientu závisí od typu škály, do ktorej premenné patria (tabuľka 2).

Pre premenné s intervalom a s nominálnou stupnicou sa používa Pearsonov korelačný koeficient (korelácia súčinových momentov). Ak aspoň jedna z dvoch premenných má ordinálnu stupnicu alebo nie je normálne rozdelená, použije sa Spearmanova poradová korelácia, resp.

t-Kendall. Ak je jedna z dvoch premenných dichotomická, možno použiť bodovú dvojsériovú koreláciu (v štatistickom počítačovom programe SPSS táto možnosť nie je dostupná, namiesto toho možno použiť výpočet poradovej korelácie). V prípade, že sú obe premenné dichotomické, použije sa štvorpoľová korelácia (tento typ korelácie vypočíta SPSS na základe definície mier vzdialenosti a miery podobnosti). Výpočet korelačného koeficientu medzi dvoma nedichotomickými premennými je možný len vtedy, ak je vzťah medzi nimi lineárny (jednosmerný). Ak je spojenie napr. U-tvarovaný (nejednoznačný), korelačný koeficient nie je vhodný na použitie ako miera pevnosti spojenia: jeho hodnota má tendenciu k nule.

Podmienky na uplatnenie korelačných koeficientov budú teda nasledovné:

  • premenné merané v kvantitatívnej (hodnotovej, metrickej) škále na tej istej vzorke objektov;
  • vzťah medzi premennými je monotónny.

Hlavná štatistická hypotéza, ktorá je testovaná korelačnou analýzou, je nesmerová a obsahuje tvrdenie, že korelácia sa vo všeobecnej populácii rovná nule. H0: r xy= 0. Ak sa zamietne, prijme sa alternatívna hypotéza H 1: r xy≠ 0 o prítomnosti pozitívnej alebo negatívnej korelácie - v závislosti od znamienka vypočítaného korelačného koeficientu.

Na základe prijatia alebo odmietnutia hypotéz sa vyvodzujú zmysluplné závery. Ak podľa výsledkov štatistického testovania H0: r xy= 0 sa neodchyľuje na úrovni a, potom bude zmysluplný záver nasledovný: vzťah medzi X a Y nenájdené. Ak pri H 0 r xy= 0 sa odchyľuje na úrovni a, čo znamená, že medzi nimi bol nájdený pozitívny (negatívny) vzťah X a Y. K interpretácii odhalených korelácií však treba pristupovať opatrne. Z vedeckého hľadiska jednoduché stanovenie vzťahu medzi dvoma premennými neznamená existenciu kauzálneho vzťahu. Okrem toho prítomnosť korelácie nestanovuje sekvenčný vzťah medzi príčinou a následkom. Jednoducho to naznačuje, že dve premenné spolu súvisia viac, ako by sa dalo očakávať od náhody. Napriek tomu, opatrne, použitie korelačných metód pri štúdiu kauzálnych vzťahov je plne opodstatnené. Treba sa vyhýbať kategorickým frázam ako „premenná X je dôvodom zvýšenia ukazovateľa“. Y". Takéto tvrdenia by mali byť formulované ako predpoklady, ktoré by mali byť prísne teoreticky podložené.

Podrobný popis matematického postupu pre každý korelačný koeficient je uvedený v učebniciach matematickej štatistiky; ; ; Obmedzíme sa na popis možnosti použitia týchto koeficientov v závislosti od typu meracej stupnice.

Korelácia metrických premenných

Na štúdium vzťahu dvoch metrických premenných nameraných na tej istej vzorke používame korelačný koeficient r-Pearson. Samotný koeficient charakterizuje prítomnosť iba lineárneho vzťahu medzi znakmi, zvyčajne označovanými symbolmi X a Y. Koeficient lineárnej korelácie je parametrická metóda a jej správna aplikácia je možná len vtedy, ak sú výsledky merania prezentované na stupnici intervalov a samotné rozloženie hodnôt v analyzovaných premenných sa v malej miere líši od normálu. Existuje veľa situácií, v ktorých je jeho použitie vhodné. Napríklad: vytvorenie spojenia medzi intelektom študenta a jeho akademickým výkonom; medzi náladou a úspechom pri vymanení sa z problémovej situácie; medzi úrovňou príjmu a temperamentom atď.

Pearsonov koeficient je široko používaný v psychológii a pedagogike. Napríklad v prácach I. Ya. Kaplunovicha a P. D. Rabinovicha, M. P. Nuzhdina bol na potvrdenie predložených hypotéz použitý výpočet Pearsonovho lineárneho korelačného koeficientu.

Pri „ručnom spracovaní“ údajov je potrebné vypočítať korelačný koeficient a následne určiť p- úroveň významnosti (na zjednodušenie overovania údajov sa používajú tabuľky kritických hodnôt rxy, ktoré sú zostavené pomocou tohto kritéria). Hodnota Pearsonovho lineárneho korelačného koeficientu nemôže prekročiť +1 a byť menšia ako -1. Tieto dve čísla +1 a -1 sú limity pre korelačný koeficient. Keď je výsledkom výpočtu hodnota väčšia ako +1 alebo menšia ako -1, znamená to, že sa vyskytla chyba výpočtu.

Pri výpočte na počítači štatistický program (SPSS, Statistica) doplní vypočítaný korelačný koeficient presnejšou hodnotou p-úroveň.

Pre štatistické rozhodnutie o prijatí alebo odmietnutí H0 zvyčajne nastavený α = 0,05 a pre veľký objem pozorovaní (100 alebo viac) α = 0,01. Ak p < a, H0 sa zamietne a urobí sa zmysluplný záver, že medzi skúmanými premennými bol zistený štatisticky významný (významný) vzťah (pozitívny alebo negatívny, v závislosti od znamienka korelácie). Kedy p > a, H0 sa nezamieta, zmysluplný záver sa obmedzuje na konštatovanie, že vzťah (štatisticky významný) nebol zistený.

Ak sa nenájde žiadne spojenie, ale existuje dôvod domnievať sa, že spojenie skutočne existuje, mali by ste skontrolovať možné dôvody nespoľahlivosti spojenia.

Komunikačná nelinearita– Na tento účel analyzujte dvojrozmerný bodový graf. Ak je vzťah nelineárny, ale monotónny, prejdite na hodnotiace korelácie. Ak vzťah nie je monotónny, potom rozdeľte vzorku na časti, v ktorých je vzťah monotónny, a vypočítajte korelácie samostatne pre každú časť vzorky, alebo rozdeľte vzorku do kontrastných skupín a potom ich porovnajte podľa úrovne vyjadrenia vlastnosť.

Prítomnosť odľahlých hodnôt a výrazná asymetria v rozložení jedného alebo oboch znakov. Aby ste to dosiahli, musíte sa pozrieť na histogramy frekvenčného rozloženia oboch funkcií. Ak existujú odľahlé hodnoty alebo asymetrie, vylúčte odľahlé hodnoty alebo prejdite na korelácie poradia.

Heterogenita vzorky(analyzujte 2D bodový graf). Pokúste sa rozdeliť vzorku na časti, v ktorých môže mať vzťah rôzne smery.

Ak je vzťah štatisticky významný, potom pred zmysluplným záverom je potrebné vylúčiť možnosť falošnej korelácie:

  • spojenie v dôsledku odľahlých hodnôt. Ak existujú odľahlé hodnoty, prejdite na hodnotiace korelácie alebo vylúčte odľahlé hodnoty;
  • vzťah je spôsobený vplyvom tretej premennej. Ak sa vyskytne podobný jav, je potrebné vypočítať koreláciu nielen pre celú vzorku, ale aj pre každú skupinu zvlášť. Ak je „tretia“ premenná metrická, vypočítajte čiastočnú koreláciu.

Parciálny korelačný koeficient rxy-z sa vypočíta, ak je potrebné otestovať predpoklad, že vzťah medzi dvoma premennými X a Y nezávisí od vplyvu tretej premennej Z. Veľmi často dve premenné navzájom korelujú len vďaka tomu, že sa obe menia v zhode pod vplyvom tretej premennej. Inými slovami, v skutočnosti neexistuje žiadna súvislosť medzi zodpovedajúcimi vlastnosťami, ale objavuje sa v štatistickom vzťahu pod vplyvom spoločnej príčiny. Napríklad spoločnou príčinou variability dvoch premenných môže byť vek pri skúmaní vzťahu rôznych psychologických charakteristík v skupine rôzneho veku. Pri interpretácii parciálnej korelácie z hľadiska kauzality treba byť opatrný, pretože ak Z koreluje s X a s Y a čiastočná korelácia rxy-z blízko nule, nemusí to nevyhnutne nasledovať Z je častým dôvodom X a Y.

Korelácia premenných poradia

Ak je korelačný koeficient neprijateľný pre kvantitatívne údaje r-Pearson, potom na testovanie hypotézy o vzťahu dvoch premenných po predbežnom zoradení možno použiť korelácie r- oštepár alebo τ -Kendalla. Napríklad v štúdii o psychofyzických charakteristikách hudobne nadaných adolescentov od I. A. Lavočkina bolo použité Spearmanovo kritérium.

Pre správny výpočet oboch koeficientov (Spearman a Kendall) musia byť výsledky meraní prezentované v stupnici radov alebo intervalov. Medzi týmito kritériami nie sú žiadne zásadné rozdiely, ale všeobecne sa uznáva, že Kendallov koeficient je „zmysluplnejší“, pretože podrobnejšie a podrobnejšie analyzuje vzťahy medzi premennými a triedi všetky možné korešpondencie medzi pármi hodnôt. Spearmanov koeficient presnejšie zohľadňuje kvantitatívnu mieru asociácie medzi premennými.

Spearmanov koeficient poradovej korelácie je neparametrickou obdobou klasického Pearsonovho korelačného koeficientu, pri jeho výpočte sa však zohľadňujú nie distribučné ukazovatele porovnávaných premenných (aritmetický priemer a rozptyl), ale poradia. Napríklad je potrebné určiť vzťah medzi hodnotiacimi hodnoteniami osobnostných čŕt, ktoré sú zahrnuté v predstave človeka o jeho „som skutočný“ a „som ideálny“.

Spearmanov koeficient je široko používaný v psychologickom výskume. Napríklad v práci Yu. V. Bushova a N. N. Nesmelovej: práve on bol použitý na štúdium závislosti presnosti odhadovania a reprodukovania trvania zvukových signálov od individuálnych charakteristík človeka.

Pretože tento koeficient je analogický r-Pearson, jeho použitie na testovanie hypotéz je podobné ako použitie koeficientu r-Pearson. To znamená, že testovaná štatistická hypotéza, postup pri štatistickom rozhodovaní a formulácia zmysluplného záveru sú rovnaké. V počítačových programoch (SPSS, Statistica) hladiny významnosti pre rovnaké koeficienty r-Pearson a r-Spearman sa vždy zhoduje.

Pomerová výhoda r-Spearman verzus pomer r-Pearson - vo väčšej citlivosti na komunikáciu. Používame ho v nasledujúcich prípadoch:

  • prítomnosť významnej odchýlky v rozdelení aspoň jednej premennej od normálnej formy (šikmosť, odľahlé hodnoty);
  • vzhľad krivočiareho (monotónneho) spojenia.

Obmedzenie pre uplatnenie koeficientu r- Spearmanovi sú:

  • pre každú premennú aspoň 5 pozorovaní;
  • koeficient s veľkým počtom rovnakých poradí v jednej alebo oboch premenných dáva zhrubnutú hodnotu.

Koeficient poradovej korelácie τ -Kendalla je nezávislá originálna metóda založená na výpočte pomeru párov hodnôt dvoch vzoriek, ktoré majú rovnaký alebo rozdielny trend (nárast alebo pokles hodnôt). Tento pomer sa nazýva aj faktor zhody. Hlavnou myšlienkou tejto metódy je teda to, že smer vzťahu možno posúdiť porovnaním subjektov v pároch: ak má pár subjektov zmenu v X sa zhoduje v smere so zmenou v Y, to naznačuje pozitívny vzťah, ak nie rovnaký - negatívny vzťah, napríklad pri skúmaní osobných vlastností, ktoré sú rozhodujúce pre blaho rodiny. V tejto metóde je jedna premenná reprezentovaná ako monotónna postupnosť (napríklad manželove údaje) vo vzostupnom poradí; inej premennej (napríklad údaje manželky) sú priradené zodpovedajúce miesta v rebríčku. Počet inverzií (porušenie monotónnosti v porovnaní s prvým riadkom) sa používa vo vzorci pre korelačné koeficienty.

Pri počítaní τ- Údaje Kendall „ručne“ sú najskôr zoradené podľa premennej X. Potom sa pre každý predmet vypočíta, koľkokrát sa umiestnil Y sa ukáže byť nižšia ako hodnosť nižšie uvedených subjektov. Výsledok je zaznamenaný v stĺpci Zápasy. Súčet všetkých hodnôt v stĺpci „Koincidencia“ je P- celkový počet zhôd sa dosadí do vzorca na výpočet Kendallovho koeficientu, ktorý je výpočtovo jednoduchší, ale s nárastom vzorky, na rozdiel od r- Spearman, objem výpočtov sa nezväčšuje proporcionálne, ale exponenciálne. Tak napríklad kedy N= 12 je potrebné zoradiť 66 dvojíc predmetov a kedy N= 489 - už 1128 párov, t.j. počet výpočtov sa zvyšuje viac ako 17-krát. Pri výpočte na počítači v štatistickom programe (SPSS, Statistica) sa Kendallov koeficient počíta podobne ako koeficienty r- Spearman a r-Pearson. Vypočítaný korelačný koeficient τ -Kendall sa vyznačuje presnejšou hodnotou p-úroveň.

Použitie Kendallovho koeficientu sa uprednostňuje, ak pôvodné údaje obsahujú odľahlé hodnoty.

Charakteristickým znakom koeficientov poradovej korelácie je, že maximálne korelácie poradia (+1, –1) nemusia nevyhnutne zodpovedať striktným priamym alebo nepriamo úmerným vzťahom medzi pôvodnými premennými. X a Y: postačuje len monotónne funkčné spojenie medzi nimi. Rankové korelácie dosahujú svoju maximálnu hodnotu modulo, ak väčšia hodnota jednej premennej vždy zodpovedá väčšej hodnote inej premennej (+1), alebo väčšia hodnota jednej premennej vždy zodpovedá menšej hodnote inej premennej a naopak (–1 ).

Štatistická hypotéza, ktorá sa má testovať, postup pri prijímaní štatistického rozhodnutia a formulácia zmysluplného záveru sú rovnaké ako v prípade r-Spearman alebo r-Pearson.

Ak sa nenájde štatisticky významný vzťah, ale existuje dôvod domnievať sa, že vzťah skutočne existuje, mali by ste najprv vychádzať z koeficientu

r-Spearman na pomer τ -Kendall (alebo naopak) a potom skontrolujte možné dôvody nespoľahlivosti spojenia:

  • komunikačná nelinearita: Ak to chcete urobiť, pozrite sa na 2D bodový graf. Ak vzťah nie je monotónny, potom rozdeľte vzorku na časti, v ktorých je vzťah monotónny, alebo rozdeľte vzorku do kontrastných skupín a potom ich porovnajte podľa úrovne prejavu znaku;
  • heterogenita vzorky: pozrite sa na dvojrozmerný bodový graf, skúste rozdeliť vzorku na časti, v ktorých môže mať vzťah rôzne smery.

Ak je súvislosť štatisticky významná, potom pred vyvodením zmysluplného záveru je potrebné vylúčiť možnosť falošnej korelácie (analogicky s metrickými korelačnými koeficientmi).

Korelácia dichotomických premenných

Pri porovnávaní dvoch premenných nameraných na dichotomickej škále je mierou korelácie takzvaný koeficient j, čo je korelačný koeficient pre dichotomické údaje.

Hodnota koeficient φ leží medzi +1 a -1. Môže byť pozitívny aj negatívny, charakterizujúci smer spojenia medzi dvoma dichotomicky meranými znakmi. Interpretácia φ však môže spôsobiť špecifické problémy. Dichotomické údaje zahrnuté v schéme na výpočet koeficientu φ nevyzerajú ako dvojrozmerný normálny povrch, preto je nesprávne predpokladať, že interpretované hodnoty rxy\u003d 0,60 a φ \u003d 0,60 sú rovnaké. Koeficient φ možno vypočítať kódovacou metódou, ako aj pomocou takzvanej štvorpolovej tabuľky alebo kontingenčnej tabuľky.

Na uplatnenie korelačného koeficientu φ musia byť splnené tieto podmienky:

  • porovnávané vlastnosti by sa mali merať na dichotomickej škále;
  • X a Y by mala byť rovnaká.

Tento typ korelácie je vypočítaný v počítačovom programe SPSS na základe definície mier vzdialenosti a miery podobnosti. Niektoré štatistické postupy, ako je faktorová analýza, zhluková analýza, multivariačné škálovanie, sú založené na aplikácii týchto mier a niekedy samotné poskytujú ďalšie možnosti na výpočet mier podobnosti.

Keď sa jedna premenná meria na dichotomickej škále (premenná X) a druhý v škále intervalov alebo pomerov (premenné Y), sa používa bisériový korelačný koeficient, napríklad pri testovaní hypotéz o vplyve pohlavia dieťaťa na výšku a váhu. Tento koeficient sa pohybuje v rozmedzí od -1 do +1, ale pre interpretáciu výsledkov nezáleží na jeho znamienku. Pre jeho použitie musia byť splnené nasledujúce podmienky:

  • porovnávané znaky by sa mali merať v rôznych mierkach: jedna X- v dichotomickej mierke; ďalší Y– v škále intervalov alebo pomerov;
  • premenlivý Y má normálny distribučný zákon;
  • počet rôznych znakov v porovnávaných premenných X a Y by mala byť rovnaká.

Ak premenná X merané na dichotomickej škále a premenná Y v rebríčku hodností (premenná Y), môže byť použité poradovo-dvojsériový korelačný koeficient, ktorý úzko súvisí s Kendallovým τ a vo svojej definícii používa pojmy koincidencia a inverzia. Interpretácia výsledkov je rovnaká.

Vykonávanie korelačnej analýzy pomocou počítačových programov SPSS a Statistica je jednoduchá a pohodlná operácia. Aby ste to dosiahli, po vyvolaní dialógového okna Bivariačné korelácie (Analyze>Correlate> Bivariate…), musíte presunúť skúmané premenné do poľa Variables a vybrať metódu, pomocou ktorej bude korelácia medzi premennými detekovaná. Výstupný súbor výsledkov obsahuje štvorcovú tabuľku (korelácie) pre každé vypočítané kritérium. Každá bunka tabuľky obsahuje: samotnú hodnotu korelačného koeficientu (Correlation Coefficient), štatistickú významnosť vypočítaného koeficientu Sig, počet subjektov.

Nadpis a bočné stĺpce výslednej korelačnej tabuľky obsahujú názvy premenných. Uhlopriečka (ľavý horný - pravý dolný roh) tabuľky pozostáva z jednotiek, pretože korelácia akejkoľvek premennej so sebou samým je maximálna. Stôl je symetrický okolo tejto uhlopriečky. Ak je v programe zaškrtnuté políčko "Označiť významné korelácie", potom sa vo výslednej tabuľke korelácií označia štatisticky významné koeficienty: na úrovni 0,05 a menej - jednou hviezdičkou (*) a na úrovni 0,01 - s dve hviezdičky (**).

Aby som to zhrnul: hlavným účelom korelačnej analýzy je identifikovať vzťah medzi premennými. Mierou súvislosti sú korelačné koeficienty, ktorých výber priamo závisí od typu škály, v ktorej sa premenné merajú, od počtu rôznych znakov v porovnávaných premenných a od distribúcie premenných. Prítomnosť korelácie medzi dvoma premennými neznamená, že medzi nimi existuje kauzálny vzťah. Hoci korelácia priamo nenaznačuje kauzalitu, môže byť kľúčom k príčinám. Na jeho základe možno vytvárať hypotézy. V niektorých prípadoch má nedostatok korelácie hlbší vplyv na hypotézu kauzality. Nulová korelácia dvoch premenných môže naznačovať, že neexistuje žiadny vplyv jednej premennej na druhú.

KURZOVÁ PRÁCA

Téma: Korelačná analýza

Úvod

1. Korelačná analýza

1.1 Pojem korelácie

1.2 Všeobecná klasifikácia korelácií

1.3 Korelačné polia a účel ich konštrukcie

1.4 Etapy korelačnej analýzy

1.5 Korelačné koeficienty

1.6 Normalizovaný Bravais-Pearsonov korelačný koeficient

1.7 Spearmanov koeficient poradovej korelácie

1.8 Základné vlastnosti korelačných koeficientov

1.9 Kontrola významnosti korelačných koeficientov

1.10 Kritické hodnoty párového korelačného koeficientu

2. Plánovanie viacrozmerného experimentu

2.1 Stav problému

2.2 Určenie stredu plánu (hlavná úroveň) a úrovne variácie faktorov

2.3 Zostavenie plánovacej matice

2.4 Kontrola homogenity disperzie a rovnakej presnosti meraní v rôznych sériách

2.5 Koeficienty regresnej rovnice

2.6 Disperzia reprodukovateľnosti

2.7 Kontrola významnosti koeficientov regresnej rovnice

2.8 Kontrola primeranosti regresnej rovnice

Záver

Bibliografia

ÚVOD

Plánovanie experimentu je matematicko-štatistická disciplína, ktorá študuje metódy racionálnej organizácie experimentálneho výskumu - od optimálneho výberu skúmaných faktorov a stanovenia skutočného plánu experimentu v súlade s jeho účelom až po metódy analýzy výsledkov. Začiatok plánovania experimentov položili práce anglického štatistika R. Fishera (1935), ktorý zdôraznil, že racionálne plánovanie experimentov prináša nemenej významný zisk v presnosti odhadov ako optimálne spracovanie výsledkov meraní. V 60. rokoch 20. storočia vznikla moderná teória plánovania experimentov. Jeho metódy úzko súvisia s teóriou aproximácie funkcií a matematickým programovaním. Konštruujú sa optimálne plány a skúmajú sa ich vlastnosti pre širokú triedu modelov.

Plánovanie experimentu je výber plánu experimentu, ktorý spĺňa špecifikované požiadavky, súbor akcií zameraných na vypracovanie stratégie experimentu (od získania apriórnych informácií až po získanie funkčného matematického modelu alebo určenie optimálnych podmienok). Ide o cieľavedomú kontrolu experimentu, realizovanú v podmienkach neúplného poznania mechanizmu skúmaného javu.

V procese meraní, následnom spracovaní údajov, ako aj formalizácii výsledkov vo forme matematického modelu dochádza k chybám a strate časti informácií obsiahnutých v pôvodných údajoch. Použitie metód plánovania experimentu umožňuje určiť chybu matematického modelu a posúdiť jeho primeranosť. Ak je presnosť modelu nedostatočná, potom použitie metód plánovania experimentu umožňuje modernizáciu matematického modelu o ďalšie experimenty bez straty predchádzajúcich informácií a s minimálnymi nákladmi.

Účelom plánovania experimentu je nájsť také podmienky a pravidlá na vykonávanie experimentov, za ktorých je možné získať spoľahlivé a spoľahlivé informácie o objekte s najnižšími nákladmi na pracovnú silu, ako aj prezentovať tieto informácie v kompaktnej a pohodlnej forme s kvantitatívnym posúdenie presnosti.

Medzi hlavné metódy plánovania používané v rôznych fázach štúdie sa používajú tieto:

Plánovanie skríningového experimentu, ktorého hlavným významom je výber skupiny významných faktorov z celkového počtu faktorov, ktoré sú predmetom ďalšieho podrobného štúdia;

Navrhovanie experimentu na analýzu rozptylu, t.j. vypracovanie plánov objektov s kvalitatívnymi faktormi;

Plánovanie regresného experimentu, ktorý umožňuje získať regresné modely (polynómy a iné);

Plánovanie extrémneho experimentu, v ktorom je hlavnou úlohou experimentálna optimalizácia predmetu štúdia;

Plánovanie pri štúdiu dynamických procesov a pod.

Účelom štúdia odboru je pripraviť študentov na výrobno-technickú činnosť v odbore s využitím metód teórie plánovania a moderných informačných technológií.

Ciele disciplíny: štúdium moderných metód plánovania, organizovania a optimalizácie vedeckých a priemyselných experimentov, uskutočňovania experimentov a spracovania výsledkov.

1. KORELAČNÁ ANALÝZA

1.1 Koncept korelácie

Výskumníka často zaujíma, ako spolu súvisia dve alebo viaceré premenné v jednej alebo viacerých skúmaných vzorkách. Môže napríklad výška ovplyvniť hmotnosť človeka alebo môže tlak ovplyvniť kvalitu produktu?

Tento druh vzťahu medzi premennými sa nazýva korelácia alebo korelácia. Korelácia je konzistentná zmena dvoch znakov, ktorá odráža skutočnosť, že variabilita jedného znaku je v súlade s variabilitou druhého.

Je napríklad známe, že medzi výškou ľudí a ich hmotnosťou je v priemere pozitívny vzťah, a to taký, že čím väčšia výška, tým väčšia váha človeka. Existujú však výnimky z tohto pravidla, keď majú ľudia relatívne nízkeho vzrastu nadváhu, a naopak, astenici s vysokým rastom sú ľahkí. Dôvodom takýchto vylúčení je, že každá biologická, fyziologická alebo psychologická vlastnosť je určená vplyvom mnohých faktorov: environmentálnych, genetických, sociálnych, ekologických atď.

Korelácie sú pravdepodobnostné zmeny, ktoré možno študovať len na reprezentatívnych vzorkách metódami matematickej štatistiky. Oba pojmy – korelácia a korelačná závislosť – sa často používajú zameniteľne. Závislosť znamená vplyv, spojenie – akékoľvek koordinované zmeny, ktoré možno vysvetliť stovkami dôvodov. Korelácie nemožno považovať za dôkaz kauzálneho vzťahu, len naznačujú, že zmeny jedného znaku sú spravidla sprevádzané určitými zmenami iného.

Korelačná závislosť - Toto sú zmeny, ktoré hodnoty jednej funkcie spôsobujú v pravdepodobnosti výskytu rôznych hodnôt inej funkcie.

Úloha korelačnej analýzy sa redukuje na určenie smeru (pozitívneho alebo negatívneho) a formy (lineárneho, nelineárneho) vzťahu medzi premenlivými znakmi, meranie jeho tesnosti a nakoniec kontrolu úrovne významnosti získanej korelácie. koeficienty.

Korelácie sa líšia formou, smerom a stupňom (sila) .

Tvar korelácie môže byť priamočiary alebo krivočiary. Napríklad vzťah medzi počtom tréningov na simulátore a počtom správne vyriešených problémov na kontrolnom stretnutí môže byť jednoduchý. Krivočiary môže byť napríklad vzťah medzi úrovňou motivácie a efektívnosťou úlohy (obrázok 1). S nárastom motivácie sa najprv zvyšuje efektívnosť úlohy, potom sa dosiahne optimálna úroveň motivácie, ktorá zodpovedá maximálnej efektívnosti úlohy; ďalší nárast motivácie je sprevádzaný poklesom efektívnosti.

Obrázok 1 - Vzťah medzi efektivitou riešenia problémov a silou motivačnej tendencie

V smere môže byť korelácia pozitívna („priama“) a negatívna („reverzná“). Pri pozitívnej priamej korelácii vyššie hodnoty jedného atribútu zodpovedajú vyšším hodnotám druhého a nižšie hodnoty jedného atribútu zodpovedajú nízkym hodnotám iného (obrázok 2). Pri negatívnej korelácii sú pomery obrátené (obrázok 3). Pri kladnej korelácii má korelačný koeficient kladné znamienko, pri zápornej korelácii - záporné znamienko.

Obrázok 2 - Priama korelácia

Obrázok 3 - Inverzná korelácia


Obrázok 4 - Žiadna korelácia

Mieru, silu alebo tesnosť korelácie určuje hodnota korelačného koeficientu. Sila spojenia nezávisí od jeho smeru a je určená absolútnou hodnotou korelačného koeficientu.

1.2 Všeobecná klasifikácia korelácií

V závislosti od korelačného koeficientu sa rozlišujú tieto korelácie:

Silné alebo blízke s korelačným koeficientom r>0,70;

Stredná (pri 0,50

Mierne (o 0:30

Slabé (pri 0,20

Veľmi slabé (v r<0,19).

1.3 Korelačné polia a účel ich konštrukcie

Korelácia je študovaná na základe experimentálnych údajov, ktorými sú namerané hodnoty (x i, y i) dvoch vlastností. Ak existuje málo experimentálnych údajov, potom je dvojrozmerné empirické rozdelenie reprezentované ako dvojitý rad hodnôt x i a y i. V tomto prípade možno koreláciu medzi znakmi opísať rôznymi spôsobmi. Korešpondencia medzi argumentom a funkciou môže byť daná tabuľkou, vzorcom, grafom atď.

Korelačná analýza, podobne ako iné štatistické metódy, je založená na použití pravdepodobnostných modelov, ktoré popisujú správanie sa skúmaných znakov v určitej všeobecnej populácii, z ktorej sa získavajú experimentálne hodnoty x i a y i. Pri skúmaní korelácie medzi kvantitatívnymi charakteristikami, ktorých hodnoty možno presne merať v jednotkách metrických mierok (metre, sekundy, kilogramy atď.), je veľmi často model dvojrozmernej normálne rozloženej všeobecnej populácie prijali. Takýto model zobrazuje vzťah medzi premennými x i a y i graficky ako miesto bodov v pravouhlom súradnicovom systéme. Táto grafická závislosť sa tiež nazýva bodový graf alebo korelačné pole.
Tento model dvojrozmerného normálneho rozdelenia (korelačné pole) vám umožňuje poskytnúť vizuálnu grafickú interpretáciu korelačného koeficientu, pretože agregované rozdelenie závisí od piatich parametrov: μ x , μ y – priemerné hodnoty (matematické očakávania); σ x ,σ y sú štandardné odchýlky náhodných premenných X a Y a p je korelačný koeficient, ktorý je mierou vzťahu medzi náhodnými premennými X a Y.
Ak p \u003d 0, potom hodnoty x i, y i, získané z dvojrozmernej normálnej množiny, sa nachádzajú na grafe v súradniciach x, y v rámci oblasti ohraničenej kružnicou (obrázok 5, a). V tomto prípade neexistuje žiadna korelácia medzi náhodnými premennými X a Y a nazývajú sa nekorelované. Pre dvojrozmerné normálne rozdelenie znamená nekorelácia zároveň nezávislosť náhodných premenných X a Y.

Pojem vzťah je v psychologických výskumoch celkom bežný. Psychológ s tým musí pracovať, keď je potrebné porovnať merania dvoch alebo viacerých ukazovateľov znakov alebo javov, aby mohol vyvodiť nejaké závery.

Charakter vzťahu medzi skúmanými javmi môže byť jednoznačný, t.j. také, keď určitá hodnota jedného atribútu zodpovedá jasnej a určitej hodnote iného. Takže napríklad v subteste na hľadanie vzorcov testov mentálnych funkcií je počet získaných „surových“ bodov určený vzorcom:
Xi \u003d Stz - Soz / Stz + Spz * Sbc,
kde Xi je hodnota variantov, Sтз je počet a priori daných vzorov (zhôd) v subteste, Soz je počet chybne označených zhôd s testovanými subjektmi, Soz je počet neindikovaných (chýbajúcich) zhôd s testované subjekty, Sbс je počet všetkých slov zobrazených testovanými subjektmi v teste.

Takýto vzťah sa nazýva funkčný: tu je jeden ukazovateľ funkciou druhého, čo je argument vo vzťahu k prvému.

Nie vždy sa však nájde jednoznačný vzťah. Častejšie sa musíme vysporiadať so situáciou, v ktorej jedna hodnota funkcie môže zodpovedať niekoľkým hodnotám inej. Tieto hodnoty sa líšia vo viac či menej definovaných hraniciach. Tento typ vzťahu sa nazýva korelácia alebo korelácia.

Používa sa niekoľko typov korelačných výrazov. Takže na vyjadrenie vzťahu medzi znakmi, ktoré majú kvantitatívny charakter variácie ich hodnôt, sa používajú miery centrálnej tendencie: tabelácia nasledovaná výpočtom párového korelačného koeficientu, koeficientu viacnásobnej a parciálnej korelácie, koeficientu viacnásobné určenie, korelačný pomer.

Ak je potrebné študovať vzťah medzi znakmi, ktorých variácia má kvalitatívny charakter (výsledky projektívnych metód výskumu osobnosti, štúdie s použitím metódy sémantického diferenciálu, štúdie s použitím otvorených škál a pod.), potom použite kvalitatívne alternatívny korelačný koeficient (tetrachorický indikátor), Pearsonovo kritérium x2, indikátory kontingencie (kontingencie) Pearsona a Chuprova.

Na zistenie kvalitatívno-kvantitatívnej korelácie, t.j. taká korelácia, keď jeden znak má kvalitatívnu variáciu a druhý - kvantitatívnu.Používajú sa špeciálne metódy.

Korelačný koeficient (termín prvýkrát zaviedol F. Galton v roku 1888) je indikátorom sily vzťahu medzi dvomi porovnateľnými možnosťami vzorky (vzoriek). Bez ohľadu na vzorec použitý na výpočet korelačného koeficientu sa jeho hodnota pohybuje od -1 do +1. V prípade úplnej pozitívnej korelácie sa tento koeficient rovná plus 1 a v prípade úplnej negatívnej korelácie je mínus 1. Zvyčajne ide o priamku prechádzajúcu priesečníkmi hodnôt každý pár údajov.

Ak hodnoty variantu nie sú zoradené na priamke, ale tvoria „oblak“, potom absolútna hodnota korelačného koeficientu bude menšia ako jedna a pri zaokrúhľovaní „oblaka“ sa približuje k nule. Ak je korelačný koeficient 0, obe možnosti sú od seba úplne nezávislé.

Akákoľvek vypočítaná (empirická) hodnota korelačného koeficientu sa musí skontrolovať na platnosť (štatistickú významnosť) v porovnaní s príslušnými tabuľkami kritických hodnôt korelačného koeficientu. Ak je empirická hodnota menšia alebo rovná tabuľkovej hodnote pre 5-percentnú úroveň (P = 0,05), korelácia nie je významná. Ak je vypočítaná hodnota korelačného koeficientu väčšia ako tabuľková hodnota pre P = 0,01, korelácia je štatisticky významná (významná).

V prípade, že je hodnota koeficientu medzi 0,05 > P > 0,01, v praxi sa hovorí o významnosti korelácie pre P = 0,05.

Bravaisov-Pearsonov korelačný koeficient (r) je parametrický ukazovateľ navrhnutý v roku 1896, na výpočet ktorého sa porovnávajú aritmetický priemer a stredné štvorcové hodnoty variantu. Na výpočet tohto koeficientu sa používa nasledujúci vzorec (pre rôznych autorov môže vyzerať inak):
r= (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

kde E Xi Xi1 - súčet súčinov hodnôt párovo porovnateľných možností, n je počet porovnávaných párov, NXap, X1ap - možnosti aritmetického priemeru Xi, Xi; v tomto poradí, Qx, Qx, - štandardné odchýlky rozdelenia x a x.

Spearmanov koeficient poradovej korelácie Rs (koeficient poradovej korelácie, Spearmanov koeficient) je najjednoduchšou formou korelačného koeficientu a meria vzťah medzi poradiami (miestami) daného variantu na rôznych základoch, bez zohľadnenia jeho vlastnej hodnoty. Tu je vzťah skôr kvalitatívny ako kvantitatívny.

Zvyčajne sa tento neparametrický test používa v prípadoch, keď je potrebné vyvodiť závery ani nie tak o intervaloch medzi údajmi, ako o ich poradí, a tiež vtedy, keď sú distribučné krivky extrémne asymetrické a neumožňujú použitie takých parametrických testov ako napr. Bravaisov-Pearsonov korelačný koeficient (v týchto prípadoch môže byť potrebné previesť kvantitatívne údaje na ordinálne údaje). Ak je koeficient Rs blízky +1, potom to znamená, že dva riadky vzorky zoradené podľa určitých charakteristík sa prakticky zhodujú a ak je tento koeficient blízky -1, môžeme hovoriť o úplnej inverznej závislosti.

Podobne ako výpočet Bravaisovho-Pearsonovho korelačného koeficientu je vhodnejšie prezentovať výpočty Rs koeficientu v tabuľkovej forme.

Regresia zovšeobecňuje koncept funkčného vzťahu na prípad stochastickej (pravdepodobnostnej) povahy vzťahu medzi hodnotami variantu. Účelom riešenia kategórie regresných problémov je odhadnúť hodnotu kontinuálneho výstupného rozptylu z hodnôt vstupných variantov.