Spearmanov koeficient poradovej korelácie je príkladom porovnania. Spearmanova korelačná analýza

V prípadoch, keď sa merania študovaných charakteristík uskutočňujú na rádovej škále alebo sa forma vzťahu líši od lineárneho, skúma sa vzťah medzi dvoma náhodnými premennými pomocou koeficientov poradovej korelácie. Zvážte Spearmanov koeficient poradovej korelácie. Pri jej výpočte je potrebné zoradiť (objednať) vzorové možnosti. Hodnotenie je zoskupenie experimentálnych údajov v určitom poradí, buď vzostupne alebo zostupne.

Operácia klasifikácie sa vykonáva podľa nasledujúceho algoritmu:

1. Nižšia hodnota je priradená nižšej hodnosti. Najvyššej hodnote je priradené poradie zodpovedajúce počtu zoradených hodnôt. Najnižšej hodnote je priradené poradie rovnajúce sa 1. Napríklad, ak n=7, potom najvyššia hodnota dostane poradové číslo 7, s výnimkou prípadov uvedených v druhom pravidle.

2. Ak je niekoľko hodnôt rovnakých, priradí sa im poradie, ktoré je priemerom tých hodností, ktoré by dostali, keby si neboli rovnaké. Ako príklad uvažujme vzostupnú vzorku pozostávajúcu zo 7 prvkov: 22, 23, 25, 25, 25, 28, 30. Hodnoty 22 a 23 sa vyskytujú raz, takže ich poradie je rovné R22=1 a R23 =2. Hodnota 25 sa vyskytuje 3-krát. Ak by sa tieto hodnoty neopakovali, ich poradie by sa rovnalo 3, 4, 5. Preto sa ich poradie R25 rovná aritmetickému priemeru 3, 4 a 5: . Hodnoty 28 a 30 sa neopakujú, takže ich poradie je R28=6 a R30=7. Nakoniec máme nasledujúcu korešpondenciu:

3. Celkový počet hodností sa musí zhodovať s vypočítanou hodnosťou, ktorá je určená vzorcom:

kde n je celkový počet hodnotených hodnôt.

Nesúlad medzi skutočným a vypočítaným počtom hodností bude znamenať chybu vo výpočte hodností alebo ich sčítaní. V tomto prípade musíte nájsť a opraviť chybu.

Spearmanov koeficient poradovej korelácie je metóda, ktorá vám umožňuje určiť silu a smer vzťahu medzi dvoma funkciami alebo dvoma hierarchiami funkcií. Použitie koeficientu hodnostnej korelácie má niekoľko obmedzení:

  • a) Očakávaná korelácia by mala byť monotónna.
  • b) Objem každej vzorky musí byť väčší alebo rovný 5. Na určenie hornej hranice vzorky sa používajú tabuľky kritických hodnôt (tabuľka 3 v prílohe). Maximálna hodnota n v tabuľke je 40.
  • c) Počas analýzy je pravdepodobné, že sa vyskytne veľký počet identických hodností. V tomto prípade je potrebné vykonať zmenu. Najpriaznivejší prípad je, keď obe študované vzorky predstavujú dve sekvencie nezhodných hodnôt.

Na vykonanie korelačnej analýzy musí mať výskumník dve vzorky, ktoré možno zoradiť, napríklad:

  • - dva znaky namerané v rovnakej skupine subjektov;
  • - dve individuálne hierarchie vlastností identifikované v dvoch subjektoch pre rovnaký súbor vlastností;
  • - dve skupinové hierarchie atribútov;
  • - individuálne a skupinové hierarchie znakov.

Výpočet začneme zoradením študovaných ukazovateľov samostatne pre každé zo znakov.

Analyzujme prípad s dvoma vlastnosťami meranými v rovnakej skupine subjektov. Najprv sú jednotlivé hodnoty zoradené podľa prvého znaku získaného rôznymi subjektmi a potom jednotlivé hodnoty podľa druhého znaku. Ak nižšie pozície jedného indikátora zodpovedajú nižším hodnotám iného indikátora a vyššie pozície jedného indikátora zodpovedajú vyšším hodnotám iného indikátora, potom tieto dva znaky spolu pozitívne súvisia. Ak vyššie úrovne jedného indikátora zodpovedajú nižším hodnotám iného indikátora, potom tieto dva znaky spolu negatívne súvisia. Aby sme našli rs, určíme rozdiely medzi poradím (d) pre každý subjekt. Čím menší je rozdiel medzi hodnoteniami, tým bližšie bude koeficient poradovej korelácie rs k "+1". Ak neexistuje žiadny vzťah, potom medzi nimi nebude žiadna korešpondencia, takže rs bude blízko nule. Čím väčší je rozdiel medzi poradím subjektov v dvoch premenných, tým bližšie k "-1" bude hodnota koeficientu rs. Spearmanov koeficient poradovej korelácie je teda mierou akéhokoľvek monotónneho vzťahu medzi dvoma skúmanými charakteristikami.

Zvážte prípad dvoch individuálnych hierarchií funkcií identifikovaných v dvoch predmetoch pre rovnakú množinu funkcií. V tejto situácii sú zoradené jednotlivé hodnoty získané každým z dvoch subjektov podľa určitého súboru funkcií. Objekt s najnižšou hodnotou by mal mať prvé miesto; atribút s vyššou hodnotou - druhé miesto atď. Je potrebné dbať na to, aby sa všetky atribúty merali v rovnakých jednotkách. Napríklad nie je možné zoradiť ukazovatele, ak sú vyjadrené v bodoch rôznej „ceny“, pretože nie je možné určiť, ktorý z faktorov bude na prvom mieste, pokiaľ ide o závažnosť, kým sa všetky hodnoty nezjednotia. stupnica. Ak vlastnosti, ktoré majú nízke hodnosti v jednom z predmetov, majú nízke hodnosti aj v druhom a naopak, tak jednotlivé hierarchie spolu pozitívne súvisia.

V prípade dvoch skupinových hierarchií znakov sú priemerné skupinové hodnoty získané v dvoch skupinách predmetov zoradené podľa rovnakého súboru znakov pre študované skupiny. Ďalej postupujeme podľa algoritmu uvedeného v predchádzajúcich prípadoch.

Analyzujme prípad s individuálnou a skupinovou hierarchiou funkcií. Začínajú oddeleným zoradením individuálnych hodnôt subjektu a priemerných skupinových hodnôt podľa rovnakého súboru vlastností, ktoré boli získané, s výnimkou subjektu, ktorý sa nezúčastňuje na hierarchii strednej skupiny, pretože jeho jednotlivec hierarchia sa s ním bude porovnávať. Ranková korelácia umožňuje posúdiť mieru konzistentnosti medzi individuálnou a skupinovou hierarchiou znakov.

Uvažujme, ako sa určuje významnosť korelačného koeficientu vo vyššie uvedených prípadoch. V prípade dvoch funkcií to bude určené veľkosťou vzorky. V prípade dvoch jednotlivých hierarchií prvkov závisí významnosť od počtu prvkov zahrnutých v hierarchii. V posledných dvoch prípadoch je významnosť určená počtom študovaných znakov a nie veľkosťou skupín. Význam r je teda vo všetkých prípadoch určený počtom hodnotených hodnôt n.

Pri testovaní štatistickej významnosti rs sa používajú tabuľky kritických hodnôt koeficientu poradovej korelácie zostavené pre rôzne počty hodnotených hodnôt a rôzne úrovne významnosti. Ak absolútna hodnota rs dosiahne kritickú hodnotu alebo ju prekročí, potom je korelácia významná.

Pri zvažovaní prvej možnosti (prípad s dvoma znakmi meranými v rovnakej skupine subjektov) sú možné nasledujúce hypotézy.

H0: Korelácia medzi premennými x a y sa nelíši od nuly.

H1: Korelácia medzi premennými x a y sa výrazne líši od nuly.

Ak pracujeme s ktorýmkoľvek z troch zostávajúcich prípadov, potom musíme predložiť ďalšiu dvojicu hypotéz:

H0: Korelácia medzi hierarchiami x a y je nenulová.

H1: Korelácia medzi x a y hierarchiami je výrazne odlišná od nuly.

Postupnosť akcií pri výpočte Spearmanovho koeficientu rank korelácie rs je nasledovná.

  • - Určite, ktoré dva prvky alebo dve hierarchie prvkov sa zúčastnia priraďovania ako premenné x a y.
  • - Zoraďte hodnoty premennej x, pričom poradie 1 priraďte najmenšej hodnote podľa pravidiel poradia. Umiestnite poradie do prvého stĺpca tabuľky v poradí podľa čísel predmetov alebo znakov.
  • - Zoraďte hodnoty premennej y. Umiestnite poradie do druhého stĺpca tabuľky v poradí podľa čísel predmetov alebo znakov.
  • - Vypočítajte rozdiely d medzi stupňami x a y pre každý riadok tabuľky. Výsledky sú umiestnené v nasledujúcom stĺpci tabuľky.
  • - Vypočítajte druhú mocninu rozdielov (d2). Umiestnite získané hodnoty do štvrtého stĺpca tabuľky.
  • - Vypočítajte súčet druhých mocnín rozdielov? d2.
  • - Ak sa vyskytnú rovnaké poradia, vypočítajte opravy:

kde tx je objem každej skupiny rovnakej úrovne vo vzorke x;

ty je veľkosť každej skupiny rovnakých radov vo vzorke y.

Vypočítajte koeficient hodnostnej korelácie v závislosti od prítomnosti alebo neprítomnosti identických hodností. Ak neexistujú identické poradia, koeficient poradovej korelácie rs sa vypočíta pomocou vzorca:

V prítomnosti rovnakých poradí sa koeficient r poradovej korelácie vypočíta pomocou vzorca:

kde? d2 je súčet druhých mocnín rozdielov medzi hodnotami;

Tx a Ty - opravy pre rovnaké hodnosti;

n je počet predmetov alebo funkcií, ktoré sa zúčastnili na hodnotení.

Určte kritické hodnoty r z tabuľky 3 v prílohe pre daný počet subjektov n. Významný rozdiel od nuly korelačného koeficientu bude pozorovaný za predpokladu, že rs nie je menšie ako kritická hodnota.

Korelačná analýza je metóda, ktorá umožňuje odhaliť vzťahy medzi určitým počtom náhodných premenných. Účelom korelačnej analýzy je identifikovať odhad sily súvislostí medzi takými náhodnými premennými alebo znakmi, ktoré charakterizujú určité reálne procesy.

Dnes navrhujeme zvážiť, ako sa Spearmanova korelačná analýza používa na vizuálne zobrazenie foriem spojenia v praktickom obchodovaní.

Spearmanova korelácia alebo základ korelačnej analýzy

Aby sme pochopili, čo je korelačná analýza, musíme najprv pochopiť pojem korelácia.

Zároveň, ak sa cena začne pohybovať smerom, ktorý potrebujete, je potrebné včas odblokovať pozície.


Pre túto stratégiu, ktorá je založená na korelačnej analýze, sa obchodujú nástroje s vysokým stupňom korelácie (EUR/USD a GBP/USD, EUR/AUD a EUR/NZD, AUD/USD a NZD/USD, CFD kontrakty atď.) .

Video: Aplikácia Spearmanovej korelácie na Forexový trh

37. Spearmanov koeficient poradovej korelácie.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanov koeficient poradovej korelácie sa používa, keď:
- premenné majú hodnotiacej stupnici merania;
- distribúcia údajov je príliš odlišná od normálne alebo nie je vôbec známy
- vzorky sú malé (N< 30).

Interpretácia Spearmanovho koeficientu poradovej korelácie sa nelíši od Pearsonovho koeficientu, ale jeho význam je trochu odlišný. Aby sme pochopili rozdiel medzi týmito metódami a logicky zdôvodnili oblasti ich použitia, porovnajme ich vzorce.

Pearsonov korelačný koeficient:

Spearmanov korelačný koeficient:

Ako vidíte, vzorce sa výrazne líšia. Porovnajte vzorce

Pearsonov vzorec korelácie používa aritmetický priemer a štandardnú odchýlku korelovaného radu, zatiaľ čo Spearmanov vzorec nie. Na získanie adekvátneho výsledku podľa Pearsonovho vzorca je teda potrebné, aby korelovaný rad bol blízko normálnemu rozdeleniu (priemer a smerodajná odchýlka sú normálne distribučné parametre). Pre Spearmanov vzorec to nie je relevantné.

Prvkom Pearsonovho vzorca je štandardizácia každej série v z-skóre.

Ako vidíte, prevod premenných na Z-škálu je prítomný vo vzorci Pearsonovho korelačného koeficientu. V súlade s tým je pre Pearsonov koeficient rozsah údajov absolútne irelevantný: môžeme napríklad korelovať dve premenné, z ktorých jedna má min. = 0 a max. = 1 a druhá min. = 100 a max. = 1000. Bez ohľadu na to, aký rozdielny je rozsah hodnôt, všetky sa prevedú na štandardné hodnoty z s rovnakou mierkou.

V Spearmanovom koeficiente takáto normalizácia neexistuje, takže

POVINNOU PODMIENKOU POUŽITIA KOEFICIENTU SPEERMAN JE ROVNOSŤ ROZSAHU DVOCH PREMENNÝCH.

Pred použitím Spearmanovho koeficientu pre dátové série s rôznymi rozsahmi je potrebné hodnosť. Poradie vedie k tomu, že hodnoty týchto sérií nadobúdajú rovnaké minimum = 1 (minimálne poradie) a maximum rovné počtu hodnôt (maximum, posledné poradie = N, t.j. maximálny počet prípadov v vzorka).

V akých prípadoch je možné urobiť bez poradia

Ide o prípady, kedy sú dáta pôvodne hodnotiacej stupnici. Napríklad test hodnotových orientácií Rokeach.

Sú to aj prípady, keď je počet možností hodnoty malý a vo vzorke je pevne stanovené minimum a maximum. Napríklad v sémantickom diferenciáli je minimum = 1, maximum = 7.

Príklad výpočtu Spearmanovho koeficientu poradovej korelácie

Rokeachov test hodnotových orientácií sa uskutočnil na dvoch vzorkách X a Y. Úloha: zistiť, nakoľko blízko sú si hierarchie hodnôt týchto vzoriek (doslova, nakoľko sú si podobné).

Porovná sa výsledná hodnota r=0,747 tabuľka kritických hodnôt. Podľa tabuľky pri N=18 je získaná hodnota spoľahlivá na úrovni p<=0,005

Hodnotové korelačné koeficienty podľa Spearmana a Kendala

Pre premenné patriace do ordinálnej stupnice alebo pre premenné, ktoré nesledujú normálne rozdelenie, ako aj pre premenné patriace do intervalovej stupnice, sa namiesto Pearsonovho koeficientu vypočíta Spearmanova poradová korelácia. Za týmto účelom sú jednotlivým hodnotám premenných priradené poradové miesta, ktoré sú následne spracované pomocou príslušných vzorcov. Ak chcete zobraziť koreláciu hodnotenia, zrušte začiarknutie políčka predvolená korelácia Pearson v dialógovom okne Bivariačné korelácie.... Namiesto toho aktivujte výpočet Spearmanovej korelácie. Tento výpočet poskytne nasledujúce výsledky. Koeficienty poradovej korelácie sú veľmi blízke zodpovedajúcim hodnotám Pearsonových koeficientov (pôvodné premenné majú normálne rozdelenie).

titkova-matmetody.pdf str. 45

Spearmanova metóda poradovej korelácie umožňuje určiť tesnosť (pevnosť) a smer

korelácia medzi dve znamenia alebo dva profily (hierarchie) znamenia.

Na výpočet poradovej korelácie je potrebné mať dve série hodnôt,

ktoré možno zoradiť. Tieto rozsahy hodnôt môžu byť:

1) dve znamenia merané v tom istom skupina testované subjekty;

2) dve individuálne hierarchie funkcií, identifikované v dvoch predmetoch pre to isté

súbor funkcií;

3) dva skupinové hierarchie funkcií,

4) individuálne a skupinové hierarchia funkcií.

Po prvé, ukazovatele sú zoradené samostatne pre každú z funkcií.

Spravidla sa nižšej hodnote prvku priradí nižšie hodnotenie.

V prvom prípade (dve vlastnosti) sú jednotlivé hodnoty zoradené podľa prvého

vlastnosť získaná rôznymi subjektmi a potom individuálne hodnoty pre druhú

znamenie.

Ak sú dva znaky pozitívne spojené, potom subjekty s nízkymi hodnosťami sú v

jeden z nich bude mať nízke hodnosti v druhom a subjekty s vysokými hodnosťami v

jedna z vlastností bude mať tiež vysoké hodnosti v druhej vlastnosti. Za počítanie rs

je potrebné určiť rozdiely (d) medzi hodnosťami získanými týmito subjektmi na oboch

znamenia. Potom sa tieto ukazovatele d určitým spôsobom transformujú a odpočítajú od 1. Než

čím menší je rozdiel medzi hodnoteniami, tým väčšie bude rs, tým bližšie bude k +1.

Ak neexistuje žiadna korelácia, všetky poradia budú zmiešané a nebude žiadna

žiadna zhoda. Vzorec je navrhnutý tak, že v tomto prípade bude rs blízko 0.

V prípade negatívnej korelácie nízky počet subjektov na jednom základe

bude zodpovedať vysokým hodnotám v inom atribúte a naopak. Čím väčší nesúlad

medzi radmi subjektov v dvoch premenných, čím bližšie rs je -1.

V druhom prípade (dva individuálne profily), individuálny

hodnoty získané každým z 2 subjektov podľa určitého (to istého pre nich

obaja) súbor funkcií. Prvý stupeň získa vlastnosť s najnižšou hodnotou; druhé miesto -

znak s vyššou hodnotou a pod. Je zrejmé, že všetky funkcie musia byť zmerané

rovnaké jednotky, inak nie je možné klasifikovať. Napríklad je to nemožné

zoraďte ukazovatele podľa Cattell Personality Questionnaire (16PF), ak sú vyjadrené v

„surové“ skóre, pretože rozsahy hodnôt sa líšia pre rôzne faktory: od 0 do 13, od 0 do

20 a od 0 do 26. Nevieme povedať, ktorý z faktorov bude na prvom mieste z hľadiska

závažnosť, kým neprivedieme všetky hodnoty do jednej stupnice (najčastejšie je to mierka stien).

Ak spolu jednotlivé hierarchie dvoch subjektov kladne súvisia, potom znamenia

mať nízke hodnosti v jednom z nich bude mať nízke hodnosti v druhom a naopak.

Napríklad, ak pre jeden subjekt má faktor E (dominancia) najnižšie hodnotenie, potom pre

iný subjekt, mal by mať nízke hodnotenie, ak má jeden subjekt faktor C

(emocionálna stabilita) má najvyššiu hodnosť, potom ju musí mať aj druhý subjekt

tento faktor má vysoké hodnotenie a tak ďalej.

V treťom prípade (dva skupinové profily) sú zoradené priemerné hodnoty skupiny,

dostali v 2 skupinách predmetov podľa určitého, pre dve skupiny zhodného, ​​súboru

znamenia. V nasledujúcom je spôsob uvažovania rovnaký ako v predchádzajúcich dvoch prípadoch.

V prípade 4. (individuálne a skupinové profily) sú zoradené samostatne

individuálne hodnoty subjektu a priemerné skupinové hodnoty pre rovnaký súbor

znaky, ktoré sa získavajú spravidla s vylúčením tohto individuálneho subjektu - on

nezúčastňuje sa priemerného skupinového profilu, s ktorým bude jeho jednotlivec porovnávaný

profilu. Ranková korelácia vám umožní skontrolovať, ako konzistentný jednotlivec a

skupinové profily.

Vo všetkých štyroch prípadoch je významnosť získaného korelačného koeficientu určená o

podľa počtu zoradených hodnôt N. V prvom prípade sa toto číslo zhoduje s

veľkosť vzorky n. V druhom prípade bude počet pozorovaní počtom funkcií,

tvoriace hierarchiu. V treťom a štvrtom prípade je N tiež počet zhodných

znaky, nie počet subjektov v skupinách. Podrobné vysvetlenia sú uvedené v príkladoch. Ak

absolútna hodnota rs dosahuje kritickú hodnotu alebo ju prekračuje, korelácia

spoľahlivý.

Hypotézy.

Existujú dve možné hypotézy. Prvý sa vzťahuje na prípad 1, druhý na ďalšie tri

Prvá verzia hypotéz

H0: Korelácia medzi premennými A a B sa nelíši od nuly.

H2: Korelácia medzi premennými A a B sa výrazne líši od nuly.

Druhá verzia hypotéz

H0: Korelácia medzi hierarchiami A a B sa nelíši od nuly.

H2: Korelácia medzi hierarchiami A a B je výrazne odlišná od nuly.

Obmedzenia koeficientu poradovej korelácie

1. Pre každú premennú je potrebné predložiť aspoň 5 pripomienok. Horná

limit odberu vzoriek je určený dostupnými tabuľkami kritických hodnôt .

2. Spearmanov koeficient poradovej korelácie rs s veľkým počtom zhodných

poradia pre jednu alebo obe zhodné premenné poskytujú hrubé hodnoty. V ideálnom prípade

obe korelované série musia byť dve nezhodné sekvencie

hodnoty. Ak táto podmienka nie je splnená, je potrebné vykonať úpravu

rovnaké hodnosti.

Spearmanov koeficient poradovej korelácie sa vypočíta podľa vzorca:

Ak v oboch porovnávaných radových sériách sú skupiny rovnakého poradia,

pred výpočtom koeficientu poradovej korelácie je potrebné o to isté opraviť

pozície Ta a Tv:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 – c) / 12,

kde a - objem každej skupiny identických hodností v radovej rade A, v objem každého

skupiny rovnakého postavenia v poradí B.

Na výpočet empirickej hodnoty rs použite vzorec:

38. Bodkovaný bisériový korelačný koeficient.

Koreláciu vo všeobecnosti pozri v otázke č.36 s 56 (64) 063.JPG

harchenko-korranaliz.pdf

Nech sa premenná X meria na silnej škále a premenná Y na dichotomickej. Bodový bisériový korelačný koeficient rpb sa vypočíta podľa vzorca:

Tu x 1 je priemerná hodnota pre X objektov s hodnotou „jedna“ pre Y;

x 0 - priemerná hodnota pre X objektov s hodnotou "nula" pre Y;

s x - štandardná odchýlka všetkých hodnôt pre X;

n 1 - počet objektov "jedna" v Y, n 0 - počet objektov "nula" v Y;

n = n 1 + n 0 je veľkosť vzorky.

Bodový biseriálny korelačný koeficient možno vypočítať aj pomocou iných ekvivalentných výrazov:

Tu x je celková stredná hodnota premennej X.

Bodový biseriálny korelačný koeficient rpb sa pohybuje od –1 do +1. Jeho hodnota sa rovná nule v prípade, že premenné s jednotkou pre Y mať priemer Y, rovný priemeru premenných s nulou nad Y.

Vyšetrenie hypotézy významnosti bodový biseriálny korelačný koeficient je potrebné skontrolovať nulová hypotézah 0 o rovnosti všeobecného korelačného koeficientu k nule: ρ = 0, čo sa vykonáva pomocou Studentovho kritéria. Empirická hodnota

v porovnaní s kritickými hodnotami t a (df) pre počet stupňov voľnosti df = n– 2

Ak je podmienka | t| ≤ ta(df), nulová hypotéza ρ = 0 nie je zamietnutá. Bodový biseriálny korelačný koeficient sa výrazne líši od nuly, ak je empirická hodnota | t| spadá do kritickej oblasti, to znamená, ak je podmienka | t| > ta(n– 2). Spoľahlivosť vzťahu vypočítaná pomocou bodového biseriálneho korelačného koeficientu rpb, možno určiť aj pomocou kritéria χ 2 pre počet stupňov voľnosti df= 2.

Bod-biserial korelácia

Následná úprava korelačného koeficientu súčinu momentov sa prejavila v bodkovanej dvojsérii r. Táto štatistika. ukazuje vzťah medzi dvoma premennými, z ktorých jedna je údajne spojitá a normálne rozdelená, zatiaľ čo druhá je diskrétna v presnom zmysle slova. Bod-biserial korelačný koeficient je označený r pbis Pretože v r pbis dichotómia odráža skutočnú povahu diskrétnej premennej a nie je umelá, ako v tomto prípade r bis, jeho znamienko je určené ľubovoľne. Preto pre všetky praktiky Ciele r pbis uvažované v rozsahu od 0,00 do +1,00.

Existuje aj taký prípad, keď sa dve premenné považujú za spojité a normálne rozdelené, ale obe sú umelo dichotomizované, ako v prípade biseriálnej korelácie. Na posúdenie vzťahu medzi takýmito premennými sa používa tetrachorický korelačný koeficient r tet, ktorú vyšľachtil aj Pearson. Hlavná (presné) vzorce a postupy výpočtu r tet sú dosť zložité. Preto s praxou. táto metóda používa aproximácie r tet získané na základe skrátených postupov a tabuliek.

/online/dictionary/dictionary.php?term=511

TEČKOVANÝ BISERIÁLNY KORELAČNÝ KOEFICIENT je korelačný koeficient medzi dvoma premennými, z ktorých jedna sa meria na dichotomickej škále a druhá na intervalovej škále. Používa sa v klasickej aj modernej testológii ako indikátor kvality testovej úlohy - spoľahlivosť-zhoda s celkovým skóre testu.

Na koreláciu premenných meraných v dichotomická a intervalová stupnica použitie dot-biserial korelačný koeficient.
Bod-biserial korelačný koeficient je metóda korelačnej analýzy pomeru premenných, z ktorých jedna sa meria v stupnici mien a má iba 2 hodnoty (napríklad muži / ženy, odpoveď je správna / odpoveď je nesprávne, je tam znamienko / nie je znamienko) a druhé v mierkových pomeroch alebo intervalovej stupnici. Vzorec na výpočet koeficientu bodovej dvojsériovej korelácie:

Kde:
m1 a m0 sú priemerné hodnoty X s hodnotou 1 alebo 0 v Y.
σx je štandardná odchýlka všetkých hodnôt pre X
n1 ,n0 – počet hodnôt X od 1 alebo 0 do Y.
n je celkový počet párov hodnôt

Najčastejšie sa tento typ korelačného koeficientu používa na výpočet vzťahu testovaných položiek so súhrnnou stupnicou. Toto je jeden typ overovacej kontroly.

39. Hodnotovo-dvojsériový korelačný koeficient.

Koreláciu vo všeobecnosti pozri v otázke č.36 s 56 (64) 063.JPG

harchenko-korranaliz.pdf str. 28

Poradový dvojsériový korelačný koeficient, ktorý sa používa, keď jedna z premenných ( X) sa uvádza v poradovej mierke a druhý ( Y) - v dichotómii, vypočítané podľa vzorca

.

Tu je priemerný rad objektov, ktoré majú jednotu Y; je priemerné poradie objektov s nulou in Y, n je veľkosť vzorky.

Vyšetrenie hypotézy významnosti poradovo-dvojsériový korelačný koeficient sa vykonáva podobne ako bodový dvojsériový korelačný koeficient pomocou Studentovho t-testu s náhradou vo vzorcoch rpb na rrb.

Keď sa jedna premenná meria na dichotomickej škále (premenná X), a druhý na stupnici poradia (premenná Y) s použitím koeficientu poradovej dvojsériovej korelácie. Pamätáme si, že premenná X, meraný v dichotomickej škále, nadobúda len dve hodnoty (kódy) 0 a 1. Zdôrazňme najmä: napriek tomu, že tento koeficient sa pohybuje v rozmedzí od –1 do +1, na jeho znamienku nezáleží pri interpretácii výsledky. Toto je ďalšia výnimka zo všeobecného pravidla.

Výpočet tohto koeficientu sa vykonáva podľa vzorca:

kde ' X 1 priemerné poradie nad týmito prvkami premennej Y, ktorý zodpovedá kódu (vlastnosti) 1 v premennej X;

„X 0 – priemerné poradie pre tie prvky premennej Y,čo zodpovedá kódu (vlastnosti) 0 v premennej X\

N- celkový počet prvkov v premennej X.

Na uplatnenie koeficientu hodnostnej dvojsériovej korelácie musia byť splnené tieto podmienky:

1. Porovnávané premenné sa musia merať na rôznych mierkach: jedna X- v dichotomickej mierke; ďalší Y– v rebríčku.

2. Počet rôznych znakov v porovnávaných premenných X a Y by mala byť rovnaká.

3. Na posúdenie úrovne spoľahlivosti koeficientu hodnostnej dvojsériovej korelácie by sa mal použiť vzorec (11.9) a tabuľka kritických hodnôt pre študentský test, keď k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Prípady, v ktorých je prítomná jedna z premenných dichotomická škála, a druhý v hodnosť (ordinálna), vyžadujú použitie poradovo-dvojsériový korelačný koeficient:

rpb=2 / n * (m1 - m0)

kde:
n je počet meraných objektov
m1 a m0 - priemerné poradie objektov s 1 alebo 0 v druhej premennej.
Tento koeficient sa používa aj pri kontrole platnosti testov.

40. Lineárny korelačný koeficient.

O korelácii vo všeobecnosti (a o lineárnej korelácii zvlášť) pozri otázku č.36 s 56 (64) 063.JPG

KORELAČNÝ KOEFICIENT pána PEARSONA

r-Pearson (Pearson r) sa používa na štúdium vzťahu medzi dvoma metrikamiiné premenné merané na tej istej vzorke. Je veľa situácií, v ktorých je vhodné ho použiť. Ovplyvňuje inteligencia výkon vo vyšších univerzitných ročníkoch? Súvisí výška platu zamestnanca s jeho dobrou vôľou voči kolegom? Ovplyvňuje nálada študenta úspešnosť riešenia zložitého aritmetického problému? Na zodpovedanie takýchto otázok musí výskumník zmerať dva ukazovatele, ktoré sú zaujímavé pre každého člena vzorky. Údaje na štúdium vzťahu sú potom tabuľkové, ako v príklade nižšie.

PRÍKLAD 6.1

V tabuľke je uvedený príklad údajov počiatočného merania pre dva ukazovatele inteligencie (verbálnej a neverbálnej) u 20 žiakov 8. ročníka.

Vzťah medzi týmito premennými je možné znázorniť pomocou bodového diagramu (pozri obrázok 6.3). Diagram ukazuje, že medzi meranými ukazovateľmi existuje určitý vzťah: čím väčšia je hodnota verbálnej inteligencie, tým (hlavne) je väčšia hodnota neverbálnej inteligencie.

Pred uvedením vzorca pre korelačný koeficient sa pokúsme vysledovať logiku jeho výskytu pomocou údajov z príkladu 6.1. Poloha každého /-bodu (predmet s číslom /) na rozptylovom diagrame voči ostatným bodom (obr. 6.3) môže byť daná veľkosťami a znakmi odchýlok zodpovedajúcich hodnôt premenných od ich priemerné hodnoty: (xj - MJ a (myseľ pri ). Ak sa znaky týchto odchýlok zhodujú, znamená to v prospech pozitívneho vzťahu (veľké hodnoty pre X zodpovedajú veľkým hodnotám pri alebo menšie hodnoty pre X zodpovedajú menším hodnotám y).

U predmetu č.1 odchýlka od priemeru X a podľa pri pozitívne a pre subjekt č. 3 sú obe odchýlky negatívne. V dôsledku toho údaje oboch naznačujú pozitívny vzťah medzi študovanými znakmi. Naopak, ak známky odchýlok od priemeru X a podľa pri líšiť, bude to indikovať negatívny vzťah medzi znakmi. Teda u predmetu č.4 odchýlka od priemeru X je negatívny, podľa y - pozitívne a pre predmet č. 9 - naopak.

Ak teda súčin odchýlok (x, - M X ) X (myseľ pri ) pozitívny, potom údaje /-subjektu naznačujú priamy (pozitívny) vzťah a ak negatívny, potom inverzný (negatívny) vzťah. V súlade s tým, ak Xwr sú väčšinou priamo úmerné, potom väčšina súčinov odchýlok bude kladná, a ak sú nepriamo úmerné, potom väčšina súčinov bude záporná. Preto súčet všetkých súčinov odchýlok pre danú vzorku môže slúžiť ako všeobecný ukazovateľ sily a smeru vzťahu:

S priamo úmerným vzťahom medzi premennými je táto hodnota veľká a pozitívna - pre väčšinu subjektov sa odchýlky zhodujú v znamienkach (veľké hodnoty jednej premennej zodpovedajú veľkým hodnotám druhej premennej a naopak). Ak X a pri mať spätnú väzbu, potom pre väčšinu subjektov budú veľké hodnoty jednej premennej zodpovedať menším hodnotám inej premennej, t.j. znamienka produktov budú záporné a súčet produktov ako celku bude tiež veľký v absolútnej hodnote, ale v zápornom znamienku. Ak medzi premennými neexistuje systematický vzťah, kladné členy (produkty odchýlok) budú vyvážené zápornými členmi a súčet všetkých produktov odchýlok bude blízky nule.

Aby súčet produktov nezávisel od veľkosti vzorky, stačí ho spriemerovať. Nás však nezaujíma miera vzťahu ako všeobecný parameter, ale ako jeho vypočítaný odhad – štatistika. Preto, čo sa týka disperzného vzorca, v tomto prípade urobíme to isté, súčet súčinov odchýlok vydelíme nie N, a v TV - 1. Ukazuje sa miera komunikácie, široko používaná vo fyzike a technických vedách, ktorá sa nazýva kovariancia (Covahance):


AT psychológia, na rozdiel od fyziky, sa väčšina premenných meria na ľubovoľných mierkach, keďže psychológov nezaujíma absolútna hodnota vlastnosti, ale relatívne postavenie subjektov v skupine. Okrem toho je kovariancia veľmi citlivá na rozsah (rozptyl), v ktorom sa znaky merajú. Aby bola miera komunikácie nezávislá od jednotiek merania ktoréhokoľvek atribútu, stačí rozdeliť kovarianciu na zodpovedajúce štandardné odchýlky. Tak sa to získalo pre-Mula K. Pearsonovho korelačného koeficientu:

alebo po nahradení výrazov za o x a


Ak boli hodnoty oboch premenných prevedené na r-hodnoty pomocou vzorca


potom vzorec r-Pearsonovho korelačného koeficientu vyzerá jednoduchšie (071.JPG):

/dikt/sociológia/článok/soc/soc-0525.htm

KORELAČNÁ LINEÁRNA- štatistický nekauzálny lineárny vzťah medzi dvoma kvantitatívnymi premennými X a pri. Merané pomocou "faktora K.L." Pearson, ktorý je výsledkom delenia kovariancie štandardnými odchýlkami oboch premenných:

,

kde s xy- kovariancia medzi premennými X a pri;

s X , s r- štandardné odchýlky pre premenné X a pri;

X i , r i- premenlivé hodnoty X a pri pre číslo objektu i;

X, r- aritmetické priemery premenných X a pri.

Pearsonov pomer r môže nadobúdať hodnoty z intervalu [-1; +1]. Význam r = 0 znamená žiadny lineárny vzťah medzi premennými X a pri(ale nevylučuje nelineárny štatistický vzťah). Kladné hodnoty koeficientu ( r> 0) označujú priamy lineárny vzťah; čím je jeho hodnota bližšie k +1, tým silnejší je štatistický priamy vzťah. Záporné hodnoty koeficientu ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 znamená prítomnosť úplného lineárneho spojenia, priameho alebo reverzného. V prípade úplného spojenia sú všetky body so súradnicami ( X i , r i) ležať na priamke r = a + bx.

"Koeficient K.L." Pearson sa používa aj na meranie tesnosti vzťahu v lineárnom párovom regresnom modeli.

41. Korelačná matica a korelačný graf.

Koreláciu vo všeobecnosti pozri v otázke č.36 s 56 (64) 063.JPG

korelačnej matice. Korelačná analýza často zahŕňa štúdium vzťahu nie dvoch, ale mnohých premenných meraných na kvantitatívnej škále na jednej vzorke. V tomto prípade sú korelácie vypočítané pre každý pár tohto súboru premenných. Výpočty sa zvyčajne vykonávajú na počítači a výsledkom je korelačná matica.

Korelačná matica(korelácia matice) je výsledkom výpočtu korelácií rovnakého typu pre každý pár z množiny R premenné merané v kvantitatívnej škále na jednej vzorke.

PRÍKLAD

Predpokladajme, že študujeme vzťahy medzi 5 premennými (vl, v2,..., v5; P= 5), merané na vzorke N=30Ľudské. Nižšie je uvedená tabuľka počiatočných údajov a korelačná matica.

A
súvisiace údaje:

Korelačná matica:

Je ľahké vidieť, že korelačná matica je štvorcová, symetrická vzhľadom na hlavnú uhlopriečku (takkakg, y = /) y), s jednotkami na hlavnej uhlopriečke (od r. G a = Gu = 1).

Korelačná matica je námestie: počet riadkov a stĺpcov sa rovná počtu premenných. Ona je symetrické vzhľadom na hlavnú uhlopriečku, keďže korelácia X s pri rovná sa korelácia pri s X. Jednotky sú umiestnené na jeho hlavnej uhlopriečke, pretože korelácia prvku so sebou samým je rovná jednej. V dôsledku toho nie sú predmetom analýzy všetky prvky korelačnej matice, ale tie, ktoré sú nad alebo pod hlavnou diagonálou.

počet korelačných koeficientov, Vlastnosti P, ktoré sa majú analyzovať pri štúdiu vzťahov, sú určené vzorcom: P(P- 1)/2. Vo vyššie uvedenom príklade je počet takýchto korelačných koeficientov 5(5 – 1)/2 = 10.

Hlavnou úlohou analýzy korelačnej matice je odhaľujúce štruktúru vzájomných vzťahov súboru vlastností. To umožňuje vizuálnu analýzu korelačné plejády- grafický obrázok štruktúruje štatistickyvýznamné súvislosti ak takýchto spojení nie je veľmi veľa (do 10-15). Ďalším spôsobom je použitie viacrozmerných metód: viacnásobná regresia, faktorová alebo zhluková analýza (pozri časť „Multivariačné metódy...“). Pomocou faktorovej alebo zhlukovej analýzy je možné identifikovať zoskupenia premenných, ktoré sú navzájom prepojené viac ako s inými premennými. Veľmi účinná je aj kombinácia týchto metód, napríklad ak je znakov veľa a nie sú homogénne.

Porovnanie korelácií -ďalšia úloha analýzy korelačnej matice, ktorá má dve možnosti. Ak je potrebné porovnať korelácie v jednom z riadkov korelačnej matice (pre jednu z premenných), použije sa porovnávacia metóda pre závislé vzorky (s. 148-149). Pri porovnávaní rovnomenných korelácií vypočítaných pre rôzne vzorky sa používa porovnávacia metóda pre nezávislé vzorky (s. 147-148).

Porovnávacie metódy korelácie v uhlopriečkach korelačná matica (na posúdenie stacionarity náhodného procesu) a porovnávanie niekoľko korelačné matice získané pre rôzne vzorky (pre ich homogenitu) sú časovo náročné a presahujú rámec tejto knihy. S týmito metódami sa môžete zoznámiť z knihy GV Suchodolského 1 .

Problém štatistickej významnosti korelácií. Problém je v tom, že postup testovania štatistických hypotéz zahŕňa jeden-viacnásobný test vykonaný na jednej vzorke. Ak sa použije rovnaká metóda veľa krát, aj keď vo vzťahu k rôznym premenným, potom sa zvyšuje pravdepodobnosť získania výsledku čisto náhodou. Vo všeobecnosti, ak zopakujeme rovnakú metódu testovania hypotéz na časy vo vzťahu k rôznym premenným alebo vzorkám, potom so stanovenou hodnotou a zaručene dostaneme potvrdenie hypotézy v ahk počet prípadov.

Predpokladajme, že sa analyzuje korelačná matica pre 15 premenných, teda vypočíta sa 15(15-1)/2 = 105 korelačných koeficientov. Pre testovanie hypotéz je nastavená úroveň a = 0,05. Testovaním hypotézy 105-krát získame jej potvrdenie päťkrát (!) bez ohľadu na to, či spojenie skutočne existuje. Keď to vieme a dostaneme povedzme 15 „štatisticky významných“ korelačných koeficientov, môžeme povedať, ktoré z nich sú získané náhodou a ktoré odrážajú skutočný vzťah?

Presne povedané, na štatistické rozhodnutie je potrebné znížiť úroveň a toľkokrát, ako je počet testovaných hypotéz. To sa však sotva odporúča, pretože pravdepodobnosť ignorovania skutočného spojenia (urobte chybu typu II) sa zvyšuje nepredvídateľným spôsobom.

Samotná korelačná matica nie je dostatočným základompre štatistické závery týkajúce sa jednotlivých koeficientov v ňom zahrnutýchkorelácie!

Existuje len jeden skutočne presvedčivý spôsob, ako vyriešiť tento problém: rozdeliť vzorku náhodne na dve časti a vziať do úvahy len tie korelácie, ktoré sú štatisticky významné v oboch častiach vzorky. Alternatívou môže byť použitie viacrozmerných metód (faktoriálna, zhluková alebo viacnásobná regresná analýza) - na výber a následnú interpretáciu skupín štatisticky významne súvisiacich premenných.

Problém chýbajúcich hodnôt. Ak v údajoch chýbajú hodnoty, potom sú možné dve možnosti výpočtu korelačnej matice: a) vymazanie hodnôt riadok po riadku (vylúčiťprípadyzoznamovo); b) párové vymazanie hodnôt (vylúčiťprípadypárovo). o vymazanie riadok po riadku pozorovania s medzerami, vymaže sa celý riadok pre objekt (predmet), ktorému chýba aspoň jedna hodnota pre niektorú z premenných. Táto metóda vedie k „správnej“ korelačnej matici v tom zmysle, že všetky koeficienty sú vypočítané z rovnakej množiny objektov. Ak sú však chýbajúce hodnoty v premenných rozložené náhodne, potom môže táto metóda viesť k tomu, že v uvažovanom súbore údajov nezostane žiadny objekt (každý riadok bude obsahovať aspoň jednu chýbajúcu hodnotu). Aby ste sa vyhli tejto situácii, použite inú metódu tzv párové odstránenie. Táto metóda berie do úvahy iba medzery v každom zvolenom páre stĺpcov premenných a ignoruje medzery v iných premenných. Korelácia pre pár premenných sa vypočíta pre tie objekty, kde nie sú žiadne medzery. V mnohých situáciách, najmä ak je počet medzier relatívne malý, povedzme 10 %, a medzery sú pomerne náhodne rozdelené, nevedie táto metóda k závažným chybám. Niekedy to však tak nie je. Napríklad pri systematickom skreslení (posune) odhadu môže byť systematické umiestnenie medzier „skryté“, čo je dôvodom rozdielu v korelačných koeficientoch postavených na rôznych podskupinách (napríklad pre rôzne podskupiny objektov). ). Ďalší problém spojený s vypočítanou korelačnou maticou v pároch odstránenie medzery nastáva pri použití tejto matice v iných typoch analýzy (napríklad pri viacnásobnej regresii alebo faktorovej analýze). Predpokladajú, že sa používa „správna“ korelačná matica s určitou úrovňou konzistencie a „korešpondencie“ rôznych koeficientov. Použitie matice so „zlými“ (zaujatými) odhadmi vedie k tomu, že program buď nedokáže takúto maticu analyzovať, alebo budú výsledky chybné. Preto, ak sa použije párová metóda eliminácie chýbajúcich údajov, je potrebné skontrolovať, či existujú alebo neexistujú systematické vzorce v rozložení medzier.

Ak párová eliminácia chýbajúcich údajov nevedie k žiadnemu systematickému posunu priemerov a rozptylov (štandardných odchýlok), potom budú tieto štatistiky podobné tým, ktoré sú vypočítané riadkovou metódou odstraňovania medzier. Ak existuje významný rozdiel, potom existuje dôvod predpokladať, že došlo k posunu v odhadoch. Napríklad, ak je priemer (alebo štandardná odchýlka) hodnôt premennej ALE, ktorý sa použil pri výpočte jeho korelácie s premennou AT, oveľa menej ako priemer (alebo štandardná odchýlka) rovnakých hodnôt premennej ALE, ktoré boli použité pri výpočte jej korelácie s premennou C, potom je dôvod očakávať, že tieto dve korelácie (A-Bnás) na základe rôznych podmnožín údajov. Dôjde k posunu v koreláciách spôsobených nenáhodným umiestnením medzier v hodnotách premenných.

Analýza korelačných plejád. Po vyriešení problému štatistickej významnosti prvkov korelačnej matice možno štatisticky významné korelácie znázorniť graficky vo forme korelačnej plejády alebo plejád. Korelačná galaxia - je to obrazec pozostávajúci z vrcholov a čiar, ktoré ich spájajú. Vrcholy zodpovedajú znakom a zvyčajne sa označujú číslami - číslami premenných. Čiary zodpovedajú štatisticky významným vzťahom a graficky vyjadrujú znamienko a niekedy /j-významnú úroveň vzťahu.

Korelačná galaxia môže odrážať všetkyštatisticky významné vzťahy korelačnej matice (niekedy tzv korelačný graf ) alebo len ich zmysluplne vybranú časť (napr. zodpovedajúcu jednému faktoru podľa výsledkov faktorovej analýzy).

PRÍKLAD KONŠTRUKCIE KORELOVANIA PLEIADI


Príprava na štátnu (záverečnú) certifikáciu absolventov: vytvorenie databázy USE (všeobecný zoznam účastníkov USE všetkých kategórií s uvedením predmetov) - zohľadnenie rezervných dní v prípade zhody predmetov;

  • Pracovný plán (27)

    rozhodnutie

    2. Činnosť vzdelávacej inštitúcie na skvalitňovanie obsahu a hodnotenie kvality v predmetoch prírodnej a matematickej výchovy MOU stredná škola č. 4, Litvinovská, Čapajevskaja,

  • je kvantitatívne hodnotenie štatistického štúdia vzťahu medzi javmi, používané v neparametrických metódach.

    Ukazovateľ ukazuje, ako sa pozorovaný súčet kvadratických rozdielov medzi radmi líši od prípadu žiadneho spojenia.

    Pridelenie služby. Pomocou tejto online kalkulačky môžete:

    • výpočet Spearmanovho koeficientu hodnostnej korelácie;
    • výpočet intervalu spoľahlivosti pre koeficient a vyhodnotenie jeho významnosti;

    Spearmanov koeficient poradovej korelácie sa týka ukazovateľov hodnotenia blízkosti komunikácie. Kvalitatívnu charakteristiku tesnosti vzťahu koeficientu poradovej korelácie, ako aj iných korelačných koeficientov, možno posúdiť pomocou Chaddockovej škály.

    Výpočet koeficientu pozostáva z nasledujúcich krokov:

    Vlastnosti Spearmanovho koeficientu poradovej korelácie

    Oblasť použitia. Koeficient poradovej korelácie slúži na hodnotenie kvality komunikácie medzi dvoma množinami. Okrem toho sa jeho štatistická významnosť používa pri analýze údajov o heteroskedasticite.

    Príklad. Na vzorke údajov pozorovaných premenných X a Y:

    1. vytvoriť tabuľku hodnotenia;
    2. nájdite Spearmanov koeficient poradovej korelácie a otestujte jeho významnosť na úrovni 2a
    3. posúdiť povahu závislosti
    rozhodnutie. Priraďte hodnotenia k prvku Y a faktoru X .
    XYporadie X, dxporadie Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Poradová matica.
    poradie X, dxporadie Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Kontrola správnosti zostavenia matice na základe výpočtu kontrolného súčtu:

    Súčet v stĺpcoch matice sa rovnajú navzájom a kontrolnému súčtu, čo znamená, že matica je zložená správne.
    Pomocou vzorca vypočítame Spearmanov koeficient poradovej korelácie.


    Vzťah medzi znakom Y a faktorom X je silný a priamy
    Význam Spearmanovho koeficientu poradovej korelácie
    Aby sa otestovala nulová hypotéza na hladine významnosti α, všeobecný Spearmanov koeficient poradovej korelácie sa rovná nule podľa konkurenčnej hypotézy Hi. p ≠ 0, je potrebné vypočítať kritický bod:

    kde n je veľkosť vzorky; ρ je Spearmanov koeficient poradovej korelácie vzorky: t(α, k) je kritický bod obojstrannej kritickej oblasti, ktorý sa zistí z tabuľky kritických bodov Studentovho rozdelenia podľa hladiny významnosti α a počtu stupne voľnosti k = n-2.
    Ak |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - nulová hypotéza sa zamieta. Medzi kvalitatívnymi znakmi existuje významná korelácia poradia.
    Podľa Studentovej tabuľky zistíme t(α/2, k) = (0,1/2;12) = 1,782

    Keďže T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    V praxi sa na určenie blízkosti vzťahu medzi dvoma znakmi často používa Spearmanov koeficient poradovej korelácie (P). Hodnoty každého prvku sú zoradené vzostupne (od 1 do n), potom sa určí rozdiel (d) medzi radmi zodpovedajúcimi jednému pozorovaniu.

    Príklad č. 1. Vzťah medzi objemom priemyselnej výroby a investíciami do fixného kapitálu v 10 regiónoch jedného z federálnych okresov Ruskej federácie v roku 2003 charakterizujú nasledujúce údaje.
    Vypočítajte Spearmanove koeficienty poradovej korelácie a Kendala. Skontrolujte ich významnosť pri α=0,05. Formulujte záver o vzťahu medzi objemom priemyselnej výroby a investíciami do fixných aktív v uvažovaných regiónoch Ruskej federácie.

    Priraďte hodnotenia k prvku Y a faktoru X . Nájdite súčet rozdielu štvorcov d 2 .
    Pomocou kalkulačky vypočítame Spearmanov koeficient poradovej korelácie:

    X Y poradie X, dx poradie Y, d y (dx - dy) 2
    1.3 300 1 2 1
    1.8 1335 2 12 100
    2.4 250 3 1 4
    3.4 946 4 8 16
    4.8 670 5 7 4
    5.1 400 6 4 4
    6.3 380 7 3 16
    7.5 450 8 5 9
    7.8 500 9 6 9
    17.5 1582 10 16 36
    18.3 1216 11 9 4
    22.5 1435 12 14 4
    24.9 1445 13 15 4
    25.8 1820 14 19 25
    28.5 1246 15 10 25
    33.4 1435 16 14 4
    42.4 1800 17 18 1
    45 1360 18 13 25
    50.4 1256 19 11 64
    54.8 1700 20 17 9
    364

    Vzťah medzi znakom Y faktorom X je silný a priamy.

    Odhad Spearmanovho koeficientu poradovej korelácie



    Podľa Študentovej tabuľky nájdeme Ttable.
    Tabuľka T \u003d (18; 0,05) \u003d 1,734
    Keďže Tobs > Ttabl zamietame hypotézu, že koeficient poradovej korelácie sa rovná nule. Inými slovami, Spearmanov koeficient poradovej korelácie je štatisticky významný.

    Intervalový odhad pre koeficient poradovej korelácie (interval spoľahlivosti)
    Interval spoľahlivosti pre Spearmanov koeficient poradovej korelácie: p(0,5431;0,9095).

    Príklad č. 2. Počiatočné údaje.

    5 4
    3 4
    1 3
    3 1
    6 6
    2 2
    Keďže matica má súvisiace hodnosti (rovnaké poradové číslo) 1. riadku, pretvoríme ich. Hodnosti sa znovu vytvárajú bez zmeny dôležitosti hodnosti, to znamená, že medzi číslami hodností musia byť zachované zodpovedajúce pomery (väčšie, menšie alebo rovné). Neodporúča sa ani nastaviť poradie nad 1 a pod hodnotu rovnajúcu sa počtu parametrov (v tomto prípade n = 6). Reformácia hodností je vykonaná v tabuľke.
    Nové hodnosti
    1 1 1
    2 2 2
    3 3 3.5
    4 3 3.5
    5 5 5
    6 6 6
    Keďže v matici sú viazané poradia 2. riadku, pretvoríme ich. Reformácia hodností je vykonaná v tabuľke.
    Čísla sedadiel v usporiadanom radeUmiestnenie faktorov podľa posudku znalcaNové hodnosti
    1 1 1
    2 2 2
    3 3 3
    4 4 4.5
    5 4 4.5
    6 6 6
    Poradová matica.
    poradie X, dxporadie Y, d y(dx - dy) 2
    5 4.5 0.25
    3.5 4.5 1
    1 3 4
    3.5 1 6.25
    6 6 0
    2 2 0
    21 21 11.5
    Keďže medzi hodnotami znakov x a y je niekoľko rovnakých, t.j. vytvoria sa viazané rady, potom sa v tomto prípade Spearmanov koeficient vypočíta ako:

    kde


    j - počet odkazov v poradí pre prvok x;
    A j je počet rovnakých radov v j-tom zväzku v x;
    k - počet kladiek v poradí pre prvok y;
    V k - počet rovnakých hodností v k-tom zväzku v r.
    A = [(23-2)]/12 = 0,5
    B = [(23-2)]/12 = 0,5
    D = A + B = 0,5 + 0,5 = 1

    Vzťah medzi znakom Y a faktorom X je mierny a priamy.