Spearmanin rankkorrelaatiokerroin on esimerkki vertailusta. Spearman-korrelaatioanalyysi

Tapauksissa, joissa tutkittujen ominaisuuksien mittaukset suoritetaan järjestysasteikolla tai yhteyden muoto poikkeaa lineaarisesta, kahden satunnaismuuttujan välisen suhteen tutkimus suoritetaan rankkorrelaatiokertoimien avulla. Tarkastellaan Spearmanin rankkorrelaatiokerrointa. Sitä laskettaessa on tarpeen järjestellä (järjestää) näytevaihtoehdot. Ranking on kokeellisten tietojen ryhmittely tiettyyn järjestykseen, joko nousevaan tai laskevaan järjestykseen.

Luokitustoiminto suoritetaan seuraavan algoritmin mukaan:

1. Pienemmälle arvolle annetaan alempi arvo. Korkeimmalle arvolle annetaan järjestys, joka vastaa rankattujen arvojen määrää. Pienimmälle arvolle annetaan arvo, joka on yhtä suuri kuin 1. Jos esimerkiksi n=7, niin korkein arvo saa arvon 7, lukuun ottamatta toisen säännön mukaisia ​​tapauksia.

2. Jos useat arvot ovat yhtä suuret, niille annetaan arvo, joka on keskiarvo niistä arvoista, jotka he olisivat saaneet, jos ne eivät olisi yhtä suuret. Esimerkkinä voidaan harkita nousevaa näytettä, joka koostuu 7 elementistä: 22, 23, 25, 25, 25, 28, 30. Arvot 22 ja 23 esiintyvät kerran, joten niiden järjestys on R22=1 ja R23. =2. Arvo 25 esiintyy 3 kertaa. Jos nämä arvot eivät toistu, niiden arvot olisivat yhtä suuria kuin 3, 4, 5. Siksi niiden arvo R25 on yhtä suuri kuin 3, 4 ja 5:n aritmeettinen keskiarvo: . Arvot 28 ja 30 eivät toistu, joten niiden arvot ovat R28=6 ja R30=7. Lopuksi meillä on seuraava kirjeenvaihto:

3. Sijoitusten kokonaismäärän on vastattava laskettua arvoa, joka määritetään kaavalla:

missä n on rankattujen arvojen kokonaismäärä.

Todellisen ja lasketun arvosanan välinen poikkeama osoittaa rivejen laskennassa tai niiden summauksessa tehdyn virheen. Tässä tapauksessa sinun on löydettävä ja korjattava virhe.

Spearmanin rankkorrelaatiokerroin on menetelmä, jonka avulla voit määrittää kahden ominaisuuden tai kahden piirrehierarkian välisen suhteen vahvuuden ja suunnan. Rankkorrelaatiokertoimen käytöllä on useita rajoituksia:

  • a) Odotetun korrelaation tulee olla monotoninen.
  • b) Kunkin näytteen tilavuuden on oltava suurempi tai yhtä suuri kuin 5. Näytteen ylärajan määrittämiseen käytetään kriittisten arvojen taulukoita (liitteen taulukko 3). Taulukon n:n enimmäisarvo on 40.
  • c) Analyysin aikana on todennäköistä, että esiintyy suuri määrä identtisiä arvoja. Tässä tapauksessa muutos on tehtävä. Edullisin tapaus on, kun molemmat tutkitut näytteet edustavat kahta yhteensopimattomien arvojen sarjaa.

Korrelaatioanalyysin suorittamiseksi tutkijalla on oltava kaksi näytettä, jotka voidaan luokitella, esimerkiksi:

  • - kaksi merkkiä mitattuna samassa ryhmässä;
  • - kaksi yksilöllistä ominaisuushierarkiaa, jotka on tunnistettu kahdessa koehenkilössä samalle ominaisuusjoukolle;
  • - kaksi attribuuttien ryhmähierarkiaa;
  • - Attribuuttien yksilö- ja ryhmähierarkiat.

Aloitamme laskennan järjestämällä tutkitut indikaattorit erikseen kullekin merkille.

Analysoidaan tapausta, jossa on kaksi ominaisuutta mitattuna samassa ryhmässä. Ensin yksittäiset arvot luokitellaan eri koehenkilöiden saaman ensimmäisen attribuutin mukaan ja sitten yksittäiset arvot toisen attribuutin mukaan. Jos yhden indikaattorin alemmat arvot vastaavat toisen indikaattorin alempia arvoja ja yhden indikaattorin korkeammat arvot vastaavat toisen indikaattorin korkeampia arvoja, nämä kaksi ominaisuutta liittyvät positiivisesti toisiinsa. Jos yhden indikaattorin korkeammat arvot vastaavat toisen indikaattorin alempia arvoja, nämä kaksi merkkiä liittyvät negatiivisesti. Löytääksemme rs:n määritämme kunkin aiheen arvojen (d) väliset erot. Mitä pienempi ero rivien välillä on, sitä lähempänä sijoituskorrelaatiokerroin rs on arvoa "+1". Jos suhdetta ei ole, niiden välillä ei ole vastaavuutta, joten rs on lähellä nollaa. Mitä suurempi ero koehenkilöiden välillä on kahdessa muuttujassa, sitä lähempänä "-1" on kertoimen rs arvo. Siten Spearmanin rankkorrelaatiokerroin on kahden tutkittavan ominaisuuden välisen monotonisen suhteen mitta.

Harkitse tapausta, jossa kaksi yksittäistä ominaisuushierarkiaa on tunnistettu kahdessa aiheessa samalle ominaisuusjoukolle. Tässä tilanteessa kummankin kohteen saamat yksittäiset arvot tietyn ominaisuusjoukon mukaan asetetaan paremmuusjärjestykseen. Alhaisimman arvon omaavalle ominaisuudelle tulee antaa ensimmäinen arvo. attribuutti, jolla on korkeampi arvo - toinen arvo jne. On huolehdittava siitä, että kaikki attribuutit mitataan samoilla yksiköillä. On esimerkiksi mahdotonta asettaa indikaattoreita paremmuusjärjestykseen, jos ne ilmaistaan ​​eri "hinnan" pisteissä, koska on mahdotonta määrittää, mikä tekijöistä on vakavuuden kannalta ensimmäinen, ennen kuin kaikki arvot on saatettu yhteen. mittakaavassa. Jos ominaisuuksilla, joilla on alhainen arvo jossakin oppiaineessa, on matalat arvot toisessa ja päinvastoin, yksittäiset hierarkiat liittyvät positiivisesti toisiinsa.

Kahden ominaisuushierarkian tapauksessa kahdessa kohderyhmässä saadut keskimääräiset ryhmäarvot luokitellaan tutkittujen ryhmien saman ominaisuusjoukon mukaan. Seuraavaksi noudatamme edellisissä tapauksissa annettua algoritmia.

Analysoidaan tapausta yksilöllisten ja ryhmien ominaisuuksien hierarkialla. He alkavat sijoittamalla erikseen koehenkilön yksittäiset arvot ja keskimääräiset ryhmäarvot saman ominaisuusjoukon mukaan, jotka saatiin, lukuun ottamatta tutkittavaa, joka ei osallistu keskimääräiseen ryhmähierarkiaan, koska hänen yksilönsä hierarkiaa verrataan siihen. Sijoituskorrelaation avulla voidaan arvioida ominaisuuksien yksilö- ja ryhmähierarkian yhdenmukaisuuden astetta.

Tarkastellaanpa, miten korrelaatiokertoimen merkitys määritetään edellä luetelluissa tapauksissa. Kahden ominaisuuden tapauksessa se määräytyy otoskoon mukaan. Kahden yksittäisen ominaisuushierarkian tapauksessa merkitys riippuu hierarkiaan sisältyvien ominaisuuksien lukumäärästä. Kahdessa viimeisessä tapauksessa merkityksen määrää tutkittujen ominaisuuksien määrä, ei ryhmien koko. Siten rs:n merkitys kaikissa tapauksissa määräytyy rankattujen arvojen n määrällä.

Testattaessa rs:n tilastollista merkitsevyyttä käytetään järjestyskorrelaatiokertoimen kriittisten arvojen taulukoita, jotka on laadittu erilaisille ranking-arvoille ja eri merkittävyystasoille. Jos rs:n itseisarvo saavuttaa kriittisen arvon tai ylittää sen, korrelaatio on merkitsevä.

Kun tarkastellaan ensimmäistä vaihtoehtoa (tapaus, jossa on kaksi ominaisuutta mitattuna samassa ryhmässä), seuraavat hypoteesit ovat mahdollisia.

H0: Muuttujien x ja y välinen korrelaatio ei eroa nollasta.

H1: Muuttujien x ja y välinen korrelaatio eroaa merkittävästi nollasta.

Jos työskentelemme jonkin kolmesta jäljellä olevasta tapauksesta, meidän on esitettävä toinen hypoteesipari:

H0: Korrelaatio x- ja y-hierarkioiden välillä on nollasta poikkeava.

H1: Korrelaatio x- ja y-hierarkioiden välillä eroaa merkittävästi nollasta.

Toimintojen järjestys Spearman-arvokorrelaatiokertoimen rs laskennassa on seuraava.

  • - Määritä, mitkä kaksi ominaisuutta tai kaksi ominaisuushierarkiaa osallistuvat yhteensovittamiseen x- ja y-muuttujina.
  • - Järjestä muuttujan x arvot ja anna arvo 1 pienimmälle arvolle järjestyssääntöjen mukaisesti. Sijoita rivit taulukon ensimmäiseen sarakkeeseen aiheiden tai merkkien numeroiden mukaiseen järjestykseen.
  • - Järjestä muuttujan y arvot. Sijoita rivit taulukon toiseen sarakkeeseen aiheiden tai merkkien numeroiden mukaiseen järjestykseen.
  • - Laske erot d rivien x ja y välillä taulukon kullekin riville. Tulokset sijoitetaan taulukon seuraavaan sarakkeeseen.
  • - Laske neliöerot (d2). Sijoita saadut arvot taulukon neljänteen sarakkeeseen.
  • - Laske erojen neliöiden summa? d2.
  • - Jos samat arvot esiintyvät, laske korjaukset:

missä tx on kunkin samanarvoisen ryhmän tilavuus näytteessä x;

ty on kunkin samanarvoisen ryhmän koko otoksessa y.

Laske korrelaatiokerroin sen mukaan, onko identtisiä arvoja vai ei. Jos identtisiä arvoja ei ole, korrelaatiokerroin rs lasketaan kaavalla:

Kun samat arvot ovat läsnä, korrelaatiokerroin rs lasketaan kaavalla:

missä?d2 on rivien välisten erojen neliöityjen summa;

Tx ja Ty - korjaukset samoille riveille;

n on sijoitukseen osallistuneiden aiheiden tai ominaisuuksien lukumäärä.

Määritä rs:n kriittiset arvot liitteen taulukosta 3 tietylle määrälle koehenkilöitä n. Merkittävä ero korrelaatiokertoimen nollasta havaitaan edellyttäen, että rs ei ole pienempi kuin kriittinen arvo.

Korrelaatioanalyysi on menetelmä, jonka avulla voit havaita suhteita tietyn määrän satunnaismuuttujia välillä. Korrelaatioanalyysin tarkoituksena on tunnistaa arvio tällaisten tiettyjä reaaliprosesseja kuvaavien satunnaismuuttujien tai ominaisuuksien välisten yhteyksien vahvuudesta.

Tänään ehdotamme pohtimaan, kuinka Spearmanin korrelaatioanalyysiä käytetään viestinnän muotojen visuaaliseen esittämiseen käytännön kaupassa.

Spearman-korrelaatio tai korrelaatioanalyysin perusta

Ymmärtääkseen mitä korrelaatioanalyysi on, on ensin ymmärrettävä korrelaation käsite.

Samanaikaisesti, jos hinta alkaa liikkua haluamaasi suuntaan, on positioiden esto avattava ajoissa.


Tässä korrelaatioanalyysiin perustuvassa strategiassa käydään kauppaa instrumenteilla, joilla on korkea korrelaatioaste (EUR/USD ja GBP/USD, EUR/AUD ja EUR/NZD, AUD/USD ja NZD/USD, CFD-sopimukset jne.) .

Video: Spearman-korrelaation soveltaminen Forex-markkinoille

37. Spearmanin rankkorrelaatiokerroin.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearmanin rankkorrelaatiokerrointa käytetään, kun:
- muuttujilla on ranking-asteikko mitat;
- tiedon jakelu on liian erilainen kuin normaali tai ei tunneta ollenkaan
- näytteet ovat pieniä (N< 30).

Spearmanin rankkorrelaatiokertoimen tulkinta ei poikkea Pearsonin kertoimesta, mutta sen merkitys on hieman erilainen. Ymmärtääksemme näiden menetelmien välisen eron ja perustellaksemme loogisesti niiden käyttöalueita, verrataan niiden kaavoja.

Pearson-korrelaatiokerroin:

Spearmanin korrelaatiokerroin:

Kuten näet, kaavat eroavat huomattavasti. Vertaa kaavoja

Pearson-korrelaatiokaava käyttää korreloidun sarjan aritmeettista keskiarvoa ja keskihajontaa, kun taas Spearmanin kaava ei. Siten riittävän Pearsonin kaavan mukaisen tuloksen saamiseksi on välttämätöntä, että korreloitu sarja on lähellä normaalijakaumaa (keskiarvo ja keskihajonta ovat normaalijakauman parametrit). Spearman-kaavan kannalta tällä ei ole merkitystä.

Pearsonin kaavan osa on jokaisen sarjan standardointi z-pisteet.

Kuten näet, muuttujien muuntaminen Z-asteikkoon on läsnä Pearsonin korrelaatiokerroinkaavassa. Näin ollen Pearson-kertoimelle datan mittakaava on täysin epäolennainen: voimme esimerkiksi korreloida kaksi muuttujaa, joista toisella on min. = 0 ja max. = 1, ja toinen min. = 100 ja max. = 1000. Riippumatta siitä, kuinka erilainen arvoalue on, ne kaikki muunnetaan vakio-z-arvoiksi, jotka ovat samat mittakaavaltaan.

Spearman-kertoimessa ei ole tällaista normalisointia, joten

PAKOLLINEN EHDOT SPEERMAN-KERTOINKÄYTTÖÖN ON KAHDEN MUUTTUJAN ALUEEN TASUUS.

Ennen kuin käytät Spearman-kerrointa tietosarjoille, joilla on eri alueita, on välttämätöntä sijoitus. Järjestys johtaa siihen, että näiden sarjojen arvot saavat saman minimiarvon = 1 (minimiarvo) ja maksimiarvon, joka on yhtä suuri kuin arvojen lukumäärä (maksimi, viimeinen arvo = N, eli tapausten enimmäismäärä näyte).

Missä tapauksissa on mahdollista tehdä ilman sijoitusta

Nämä ovat tapauksia, joissa tiedot ovat alun perin ranking-asteikko. Esimerkiksi Rokeach-arvoorientaatiotesti.

Nämä ovat myös tapauksia, joissa arvovaihtoehtojen määrä on pieni ja otoksessa on kiinteä minimi ja maksimi. Esimerkiksi semanttisessa differentiaalissa minimi = 1, maksimi = 7.

Esimerkki Spearman-arvokorrelaatiokertoimen laskemisesta

Rokeach-arvoorientaatiotesti suoritettiin kahdelle näytteelle X ja Y. Tehtävänä oli selvittää, kuinka lähellä näiden näytteiden arvohierarkiat ovat (kirjaimellisesti kuinka samankaltaisia ​​ne ovat).

Tuloksena olevaa arvoa r=0,747 verrataan kriittisten arvojen taulukko. Taulukon mukaan N=18:lla saatu arvo on luotettava tasolla p<=0,005

Rankkorrelaatiokertoimet Spearmanin ja Kendalin mukaan

Järjestysasteikkoon kuuluville muuttujille tai muuttujille, jotka eivät noudata normaalijakaumaa, sekä intervalliasteikkoon kuuluville muuttujille lasketaan Spearmanin rankkorrelaatio Pearson-kertoimen sijaan. Tätä varten muuttujien yksittäisille arvoille annetaan sijoituspaikat, jotka käsitellään myöhemmin sopivilla kaavoilla. Voit paljastaa rankkorrelaation poistamalla valinnan oletusarvoisesta Pearson-korrelaatiosta -valintaruudusta Bivariate Correlations... -valintaikkunassa. Aktivoi sen sijaan Spearman-korrelaatiolaskenta. Tämä laskelma antaa seuraavat tulokset. Rankkorrelaatiokertoimet ovat hyvin lähellä vastaavia Pearson-kertoimien arvoja (alkuperäisillä muuttujilla on normaalijakauma).

titkova-matmetody.pdf s. 45

Spearmanin rankkorrelaatiomenetelmän avulla voit määrittää tiiviyden (lujuuden) ja suunnan

välinen korrelaatio kaksi merkkiä tai kaksi profiilia (hierarkia) merkkejä.

Sijoituskorrelaation laskemiseksi tarvitaan kaksi arvosarjaa,

jotka voidaan luokitella. Nämä arvoalueet voivat olla:

1) kaksi merkkiä samalla mitattuna ryhmä koehenkilöt;

2) kaksi yksittäistä ominaisuushierarkiaa, tunnistettu kahdessa koehenkilössä samalle

joukko ominaisuuksia;

3) kaksi ominaisuuksien ryhmähierarkiat,

4) yksilö ja ryhmä ominaisuushierarkia.

Ensinnäkin indikaattorit luokitellaan erikseen kullekin ominaisuudelle.

Pääsääntöisesti ominaisuuden pienemmälle arvolle annetaan alempi arvo.

Ensimmäisessä tapauksessa (kaksi ominaisuutta) yksittäiset arvot luokitellaan ensimmäisen mukaan

eri koehenkilöiden saama ominaisuus ja sitten toisen yksittäiset arvot

merkki.

Jos kaksi merkkiä ovat positiivisesti yhteydessä toisiinsa, niin alhaalla olevat kohteet ovat mukana

toisella heistä on alhainen arvosana toisessa ja korkealuokkaisilla aiheilla

yhdellä ominaisuuksista on myös korkea arvosana toisessa ominaisuudessa. rs laskemiseen

on tarpeen määrittää erot (d) näiden koehenkilöiden molemmissa saavuttamien pisteiden välillä

merkkejä. Sitten nämä indikaattorit d muunnetaan tietyllä tavalla ja vähennetään luvusta 1. Kuin

mitä pienempi ero on, sitä suurempi rs on, sitä lähempänä +1:tä.

Jos korrelaatiota ei ole, kaikki arvot sekoittuvat ja niitä ei ole

ei osumia. Kaava on suunniteltu siten, että tässä tapauksessa rs on lähellä nollaa.

Negatiivisen korrelaation tapauksessa alhainen kohteiden joukko yhdellä perusteella

vastaa korkeita sijoituksia toisessa ominaisuudessa ja päinvastoin. Mitä enemmän ristiriitaa

kahden muuttujan koehenkilöiden välillä, mitä lähempänä rs on -1.

Toisessa tapauksessa (kaksi yksittäistä profiilia), yksilö

arvot, jotka kukin kahdesta koehenkilöstä on saanut tietyn mukaisesti (sama heille

molemmat) joukko ominaisuuksia. Ensimmäisellä sijalla on ominaisuus, jolla on pienin arvo; toinen arvo -

arvoltaan korkeampi merkki jne. On selvää, että kaikki ominaisuudet on mitattava

samat yksiköt, muuten sijoitus on mahdotonta. Esimerkiksi se on mahdotonta

järjestele indikaattorit Cattellin persoonallisuuskyselyn (16PF) mukaan, jos ne on ilmaistu

"raa'at" pisteet, koska arvoalueet ovat erilaisia ​​eri tekijöille: 0 - 13, 0 -

20 ja 0 - 26. Emme voi sanoa, mikä tekijöistä tulee ykkössijalle

vakavuus, kunnes saamme kaikki arvot yhdelle asteikolle (useimmiten tämä on seinien asteikko).

Jos kahden kohteen yksilölliset hierarkiat liittyvät positiivisesti toisiinsa, niin merkit

joilla on alhaisia ​​arvoja toisessa, on alhainen arvo toisessa ja päinvastoin.

Esimerkiksi, jos yhden kohteen tekijällä E (dominanssi) on alhaisin arvo, silloin

toisen kohteen, sen tulee olla alhainen, jos yhdellä koehenkilöllä on tekijä C

(emotionaalinen vakaus) on korkein, niin myös toisella tutkittavalla on oltava

tällä tekijällä on korkea arvo ja niin edelleen.

Kolmannessa tapauksessa (kaksi ryhmäprofiilia) ryhmien keskiarvot asetetaan paremmuusjärjestykseen,

vastaanotettu 2 ryhmässä aiheita tietyn, identtinen kahdelle ryhmälle, joukko

merkkejä. Seuraavassa päättely on sama kuin kahdessa edellisessä tapauksessa.

Neljännen (yksilö- ja ryhmäprofiili) tapauksessa ne luokitellaan erikseen

kohteen yksittäiset arvot ja keskimääräiset ryhmäarvot samalle sarjalle

merkit, jotka saadaan pääsääntöisesti ilman tätä yksittäistä subjektia - hän

ei osallistu keskimääräiseen ryhmäprofiiliin, johon hänen yksilöään verrataan

profiili. Sijoituskorrelaation avulla voit tarkistaa, kuinka johdonmukainen yksilö ja

ryhmäprofiilit.

Kaikissa neljässä tapauksessa saadun korrelaatiokertoimen merkitsevyys määräytyy

rankattujen arvojen lukumäärän mukaan N. Ensimmäisessä tapauksessa tämä luku on sama kuin

näytteen koko n. Toisessa tapauksessa havaintojen määrä on piirteiden lukumäärä,

muodostaen hierarkian. Kolmannessa ja neljännessä tapauksessa N on myös täsmäytyneiden lukumäärä

merkkejä, ei koehenkilöiden lukumäärää ryhmissä. Yksityiskohtaiset selitykset annetaan esimerkeissä. Jos

rs:n itseisarvo saavuttaa kriittisen arvon tai ylittää sen, korrelaatio

luotettava.

Hypoteesit.

On olemassa kaksi mahdollista hypoteesia. Ensimmäinen viittaa tapaukseen 1, toinen kolmeen muuhun

Ensimmäinen versio hypoteeseista

H0: Muuttujien A ja B välinen korrelaatio ei eroa nollasta.

H2: Muuttujien A ja B välinen korrelaatio eroaa merkittävästi nollasta.

Toinen versio hypoteeseista

H0: Hierarkioiden A ja B välinen korrelaatio ei eroa nollasta.

H2: Hierarkioiden A ja B välinen korrelaatio eroaa merkittävästi nollasta.

Rankkorrelaatiokertoimen rajoitukset

1. Jokaisesta muuttujasta on toimitettava vähintään 5 huomautusta. Yläosa

näytteenottoraja määräytyy saatavilla olevien kriittisten arvojen taulukoiden mukaan .

2. Spearmanin rankkorrelaatiokerroin rs suurella määrällä identtisiä

ranks yhdelle tai molemmille vastaaville muuttujille antaa karkeita arvoja. Ihannetapauksessa

molempien korreloitujen sarjojen on oltava kaksi yhteensopimatonta sarjaa

arvot. Jos tämä ehto ei täyty, on tehtävä säätö

samat rivit.

Spearmanin rankkorrelaatiokerroin lasketaan kaavalla:

Jos molemmissa vertailusarjoissa on samanarvoisia ryhmiä,

ennen rankkorrelaatiokertoimen laskemista on tarpeen korjata sama

sijoittuu Ta:lle ja Tv:lle:

Ta \u003d Σ (a3 - a) / 12,

TV \u003d Σ (v3 - c) / 12,

missä a - kunkin identtisten asteiden ryhmän määrä A-arvosarjassa, in kunkin tilavuus

samanarvoiset ryhmät sarjassa B.

Laskeaksesi rs:n empiirisen arvon, käytä kaavaa:

38. Pisteellinen biserialinen korrelaatiokerroin.

Korrelaatiosta yleisesti, katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Mitataan muuttuja X vahvalla asteikolla ja muuttuja Y kaksijakoisella asteikolla. Pisteen biserialinen korrelaatiokerroin rpb lasketaan kaavalla:

Tässä x 1 on X-objektin keskiarvo ja Y:n arvo "yksi";

x 0 - X-objektin keskiarvo, jonka Y:n arvo on "nolla";

s x - kaikkien X:n arvojen keskihajonta;

n 1 - objektien lukumäärä "yksi" Y:ssä, n 0 - objektien lukumäärä "nolla" Y:ssä;

n = n 1 + n 0 on otoskoko.

Pistebissarjakorrelaatiokerroin voidaan laskea myös käyttämällä muita vastaavia lausekkeita:

Tässä x on muuttujan yleinen keskiarvo X.

Pisteen biserialinen korrelaatiokerroin rpb vaihtelee -1:stä +1:een. Sen arvo on nolla, jos muuttujat ovat yksiköllä for Y on keskiarvo Y, yhtä suuri kuin nollalla olevien muuttujien keskiarvo Y.

Tutkimus merkitsevyyshypoteesit pisteen biserialinen korrelaatiokerroin on tarkistettava nollahypoteesih 0 yleisen korrelaatiokertoimen yhtäläisyydestä nollaan: ρ = 0, joka suoritetaan Studentin kriteerillä. Empiirinen arvo

verrattuna kriittisiin arvoihin t a (df) vapausasteiden lukumäärälle df = n– 2

Jos ehto | t| ≤ ta(df), nollahypoteesia ρ = 0 ei hylätä. Pisteen biserialinen korrelaatiokerroin eroaa merkittävästi nollasta, jos empiirinen arvo | t| putoaa kriittiselle alueelle, eli jos tila | t| > ta(n– 2). Suhteen luotettavuus lasketaan käyttämällä pisteen biserialista korrelaatiokerrointa rpb, voidaan määrittää myös kriteerin avulla χ 2 vapausasteiden lukumäärälle df= 2.

Piste-biserialinen korrelaatio

Momenttien tulon korrelaatiokertoimen myöhempi modifikaatio heijastui katkoviivassa r. Tämä tilasto osoittaa kahden muuttujan välisen suhteen, joista toinen on oletettavasti jatkuva ja normaalijakautuma, kun taas toinen on diskreetti sanan tarkassa merkityksessä. Piste-bissarjakorrelaatiokerroin on merkitty r pbis Koska sisään r pbis dikotomia heijastaa diskreetin muuttujan todellista luonnetta eikä ole keinotekoista, kuten tapauksessa r bis, sen merkki on määritetty mielivaltaisesti. Siksi kaikkiin käytäntöihin tavoitteet r pbis pidetään välillä 0,00 - +1,00.

On myös sellainen tapaus, jossa kahta muuttujaa pidetään jatkuvina ja normaalijakautuneena, mutta molemmat on keinotekoisesti dikotomisoitu, kuten biserialisen korrelaation tapauksessa. Tällaisten muuttujien välisen suhteen arvioimiseksi käytetään tetrakoorista korrelaatiokerrointa r tet, jonka on myös kasvattanut Pearson. Main (tarkat) kaavat ja laskentamenetelmät r tet ovat melko monimutkaisia. Siis käytännössä. tämä menetelmä käyttää approksimaatioita r tet lyhennettyjen menettelyjen ja taulukoiden perusteella.

/online/dictionary/dictionary.php?term=511

PISTETTY BISERIAALIKORRELAATIOKERTOIMINTA on kahden muuttujan välinen korrelaatiokerroin, joista toinen mitataan kaksijakoisella ja toinen intervalliasteikolla. Sitä käytetään klassisessa ja nykyaikaisessa testologiassa testitehtävän laadun indikaattorina - luotettavuus-yhdenmukaisuus testin kokonaispistemäärän kanssa.

Korreloidaksesi muuttujia mitattuna dikotominen ja intervalliasteikko käyttää piste-bissarja-korrelaatiokerroin.
Piste-biserialinen korrelaatiokerroin on menetelmä muuttujien suhteen korrelaatioanalyysiin, joista yksi mitataan nimiasteikolla ja ottaa vain 2 arvoa (esimerkiksi miehet / naiset, vastaus on oikea / vastaus on virheellinen, on merkki / ei ole merkkiä), ja toinen asteikkosuhteissa tai intervalliasteikossa. Kaava piste-bissarjakorrelaatiokertoimen laskemiseksi:

Missä:
m1 ja m0 ovat X:n keskiarvoja, joiden arvo on 1 tai 0 Y:ssä.
σx on X:n kaikkien arvojen keskihajonta
n1,n0 – X-arvojen määrä välillä 1 tai 0 - Y.
n on arvoparien kokonaismäärä

Useimmiten tämän tyyppistä korrelaatiokerrointa käytetään laskettaessa testikohteiden suhdetta yhteenvetoasteikolla. Tämä on eräänlainen vahvistustarkistus.

39. Rank-biserial-korrelaatiokerroin.

Korrelaatiosta yleisesti, katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

harchenko-korranaliz.pdf s. 28

Rank-biserial-korrelaatiokerroin, jota käytetään, kun yksi muuttujista ( X) esitetään järjestysasteikossa ja toinen ( Y) - dikotomisina, laskettuna kaavan mukaan

.

Tässä on niiden objektien keskimääräinen arvo, joissa on yhtenäisyyttä Y; on objektien keskimääräinen arvo nolla tuumaa Y, n on näytteen koko.

Tutkimus merkitsevyyshypoteesit rank-biserial-korrelaatiokerroin suoritetaan samalla tavalla kuin pistebissarjakorrelaatiokerroin käyttäen Studentin t-testiä korvaamalla kaavoissa rpb päällä rrb.

Kun yhtä muuttujaa mitataan dikotomisella asteikolla (muuttuja x), ja toinen asteikolla (muuttuja Y) käyttäen asteikon-biserialista korrelaatiokerrointa. Muistamme, että muuttuja x, kaksijakoisella asteikolla mitattuna se saa vain kaksi arvoa (koodia) 0 ja 1. Korostamme erityisesti, että huolimatta siitä, että tämä kerroin vaihtelee välillä –1 ja +1, sen merkillä ei ole väliä tulkinnan kannalta. tuloksia. Tämä on toinen poikkeus yleisestä säännöstä.

Tämä kerroin lasketaan kaavan mukaan:

missä ` X 1 keskimääräinen sijoitus verrattuna muuttujan elementteihin Y, joka vastaa muuttujan koodia (ominaisuus) 1 X;

`X 0 – muuttujan elementtien keskiarvo Y, joka vastaa muuttujan koodia (ominaisuutta) 0 X\

N- muuttujan elementtien kokonaismäärä x.

Rank-biserial-korrelaatiokertoimen soveltaminen edellyttää, että seuraavat ehdot täyttyvät:

1. Verrattavat muuttujat on mitattava eri asteikoilla: yksi X- dikotomisessa mittakaavassa; toinen Y- ranking-asteikolla.

2. Vaihtelevien ominaisuuksien lukumäärä verratuissa muuttujissa X ja Y pitäisi olla sama.

3. Rank-biserial-korrelaatiokertoimen luotettavuuden arvioimiseksi tulee käyttää Studentin testin kaavaa (11.9) ja kriittisten arvojen taulukkoa, kun k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Tapaukset, joissa jokin muuttujista on läsnä dikotominen mittakaava, ja toinen sisään sijoitus (järjestys), vaativat käyttöä rank-biserial-korrelaatiokerroin:

rpb = 2 / n * (m1 - m0)

missä:
n on mittauskohteiden lukumäärä
m1 ja m0 - niiden kohteiden keskimääräinen sijoitus, joiden toisessa muuttujassa on 1 tai 0.
Tätä kerrointa käytetään myös testien validiteetin tarkistamisessa.

40. Lineaarinen korrelaatiokerroin.

Korrelaatiosta yleensä (ja erityisesti lineaarisesta korrelaatiosta), katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

Mr. PEARSONIN KORRELAATIOKERTOINTI

r-Pearson (Pearson r) käytetään kahden mittarin välisen suhteen tutkimiseenmuut samasta otoksesta mitatut muuttujat. On monia tilanteita, joissa sitä kannattaa käyttää. Vaikuttaako älykkyys suoritukseen korkeakouluvuosina? Liittyykö työntekijän palkan suuruus hänen hyväntahtoisuuteensa kollegoita kohtaan? Vaikuttaako opiskelijan mieliala monimutkaisen aritmeettisen ongelman ratkaisun onnistumiseen? Vastatakseen tällaisiin kysymyksiin tutkijan on mitattava kaksi indikaattoria, jotka kiinnostavat jokaista otoksen jäsentä. Suhteen tutkimiseen tarvittavat tiedot on sitten taulukoitu, kuten alla olevassa esimerkissä.

ESIMERKKI 6.1

Taulukossa on esimerkki kahden älykkyysindikaattorin (verbaalisen ja ei-verbaalisen) alkumittaustiedoista 20 8. luokan oppilaalla.

Näiden muuttujien välinen suhde voidaan kuvata käyttämällä sirontadiagrammia (katso kuva 6.3). Kaavio osoittaa, että mitattujen indikaattoreiden välillä on jokin yhteys: mitä suurempi on verbaalisen älykkyyden arvo, sitä (pääasiassa) ei-verbaalisen älykkyyden arvo on.

Ennen kuin annat korrelaatiokertoimen kaavan, yritetään jäljittää sen esiintymisen logiikka esimerkin 6.1 tietojen avulla. Kunkin /-pisteen (kohteen numerolla /) sijainti sirontakaaviossa suhteessa muihin pisteisiin (kuva 6.3) voidaan antaa muuttujien vastaavien arvojen poikkeamien suuruuksilla ja etumerkeillä niiden arvoista. keskiarvot: (xj - MJ ja (mieli klo ). Jos näiden poikkeamien merkit ovat samat, tämä osoittaa positiivisen suhteen puolesta (suuret arvot X vastaavat suuria arvoja klo tai pienempiä arvoja varten X vastaavat pienempiä arvoja y).

Kohteen nro 1 osalta poikkeama keskiarvosta X ja klo positiivinen, ja aiheen nro 3 osalta molemmat poikkeamat ovat negatiivisia. Näin ollen molempien tiedot osoittavat positiivisen suhteen tutkittujen ominaisuuksien välillä. Päinvastoin, jos merkkejä poikkeamista keskiarvosta X ja klo eroavat toisistaan, tämä osoittaa merkkien välisen negatiivisen suhteen. Siten aiheen nro 4 poikkeama keskiarvosta X on negatiivinen, mukaan y - positiivinen, ja aiheen nro 9 osalta - päinvastoin.

Eli jos poikkeamien tulo (x, - M X ) X (mieli klo ) positiivinen, silloin /-subjektin tiedot osoittavat suoraa (positiivista) suhdetta ja jos negatiivista, niin käänteistä (negatiivista) suhdetta. Vastaavasti jos Xwy ovat enimmäkseen suoraan verrannollisia, silloin suurin osa poikkeamien tuloista on positiivisia, ja jos ne liittyvät käänteisesti, niin suurin osa tuloista on negatiivisia. Siksi tietyn näytteen poikkeamien tulojen summa voi toimia yleisenä indikaattorina suhteen vahvuudelle ja suunnalle:

Kun muuttujien välinen suhde on suoraan verrannollinen, tämä arvo on suuri ja positiivinen - suurimmalle osalle koehenkilöistä poikkeamat ovat etumerkissä samat (yhden muuttujan suuret arvot vastaavat toisen muuttujan suuria arvoja ja päinvastoin). Jos X ja klo saada palautetta, niin useimmille aiheille yhden muuttujan suuret arvot vastaavat toisen muuttujan pienempiä arvoja, eli tuotteiden merkit ovat negatiivisia, ja myös tuotteiden summa kokonaisuutena on suuri absoluuttisessa arvossa, mutta negatiivisessa etumerkissä. Jos muuttujien välillä ei ole systemaattista yhteyttä, positiiviset termit (poikkeamien tulot) tasapainotetaan negatiivisilla termeillä ja kaikkien poikkeamien tulojen summa on lähellä nollaa.

Jotta tuotteiden summa ei riipu otoskoosta, riittää sen keskiarvo. Mutta olemme kiinnostuneita suhteen mittaamisesta ei yleisenä parametrina, vaan laskennallisena arviona siitä - tilastoista. Siksi, mitä tulee dispersiokaavaan, tässä tapauksessa teemme samoin, jaamme poikkeamien tulojen summaa ei N, ja televisiossa - 1. Osoittautuu fysiikassa ja teknisissä tieteissä laajalti käytetty viestintämittari, jota kutsutaan ns. kovarianssi (Kovahance):


AT psykologiassa, toisin kuin fysiikassa, useimmat muuttujat mitataan mielivaltaisilla asteikoilla, koska psykologeja ei kiinnosta piirteen itseisarvo, vaan koehenkilöiden suhteellinen asema ryhmässä. Lisäksi kovarianssi on erittäin herkkä asteikolle (dispersiolle), jolla piirteitä mitataan. Jotta tiedonsiirron mitta olisi riippumaton kumman tahansa attribuutin mittayksiköistä, riittää jakaa kovarianssi vastaaviksi keskihajotuksiksi. Siten se saatiin varten-K. Pearsonin korrelaatiokertoimen muuli:

tai sen jälkeen, kun lausekkeet on korvattu o x:lla ja


Jos molempien muuttujien arvot muunnetaan r-arvoiksi kaavan avulla


silloin r-Pearson-korrelaatiokerroinkaava näyttää yksinkertaisemmalta (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORRELAATIO LINEAARINEN- tilastollinen ei-syy-lineaarinen suhde kahden kvantitatiivisen muuttujan välillä X ja klo. Mitattu käyttämällä "tekijää K.L." Pearson, joka on tulos jakamalla kovarianssi molempien muuttujien keskihajonnoista:

,

missä s xy- muuttujien välinen kovarianssi X ja klo;

s x , s y- muuttujien keskihajonnat X ja klo;

x i , y i- muuttuvat arvot X ja klo kohteen numerolle i;

x, y- muuttujien aritmeettiset keskiarvot X ja klo.

Pearsonin suhde r voi ottaa arvoja väliltä [-1; +1]. Merkitys r = 0 tarkoittaa, että muuttujien välillä ei ole lineaarista suhdetta X ja klo(mutta ei sulje pois epälineaarista tilastollista yhteyttä). Positiiviset kertoimen arvot ( r> 0) osoittavat suoraa lineaarista suhdetta; mitä lähempänä sen arvo on +1, sitä vahvempi on tilastollinen suora yhteys. Negatiiviset kertoimen arvot ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 tarkoittaa suoran tai käänteisen suoran lineaarisen yhteyden olemassaoloa. Jos yhteys on täydellinen, kaikki pisteet, joilla on koordinaatit ( x i , y i) makaa suoralla linjalla y = a + bx.

"Kerroin K.L." Pearsonia käytetään myös mittaamaan suhteen tiukkuutta lineaarisessa pariregressiomallissa.

41. Korrelaatiomatriisi ja korrelaatiograafi.

Korrelaatiosta yleisesti, katso kysymys nro 36 Kanssa. 56 (64) 063.JPG

korrelaatiomatriisi. Usein korrelaatioanalyysi sisältää tutkimuksen, jossa ei tutkita kahden, vaan usean muuttujan suhdetta mitattuna kvantitatiivisella asteikolla yhdestä otoksesta. Tässä tapauksessa korrelaatiot lasketaan tämän muuttujajoukon jokaiselle parille. Laskelmat suoritetaan yleensä tietokoneella ja tuloksena on korrelaatiomatriisi.

Korrelaatiomatriisi(korrelaatio matriisi) on tulos laskettaessa samantyyppisiä korrelaatioita jokaiselle joukon parille R muuttujat mitattuna kvantitatiivisella asteikolla yhdessä otoksessa.

ESIMERKKI

Oletetaan, että tutkimme 5 muuttujan välisiä suhteita (vl, v2,..., v5; P= 5), mitattuna näytteestä N = 30 ihmisen. Alla on taulukko lähtötiedoista ja korrelaatiomatriisi.

Ja
asiaan liittyvät tiedot:

Korrelaatiomatriisi:

On helppo nähdä, että korrelaatiomatriisi on neliömäinen, symmetrinen päälävistäjän (takkakg, y = /) y suhteen, yksiköt päädiagonaalissa (koska G ja = Gu = 1).

Korrelaatiomatriisi on neliö: rivien ja sarakkeiden määrä on yhtä suuri kuin muuttujien lukumäärä. Hän on symmetrinen suhteessa päädiagonaaliin, koska korrelaatio X Kanssa klo vastaa korrelaatiota klo Kanssa X. Yksiköt sijaitsevat sen päälävistäjällä, koska ominaisuuden korrelaatio itsensä kanssa on yhtä suuri kuin yksi. Näin ollen kaikki korrelaatiomatriisin elementit eivät ole analyysin kohteena, vaan ne, jotka ovat päädiagonaalin ylä- tai alapuolella.

korrelaatiokertoimien lukumäärä, Suhteiden tutkimuksessa analysoitavat P-ominaisuudet määritetään kaavalla: P(P- 1)/2. Yllä olevassa esimerkissä tällaisten korrelaatiokertoimien lukumäärä on 5(5 - 1)/2 = 10.

Korrelaatiomatriisin analyysin päätehtävä on paljastaa joukon piirteiden välisten suhteiden rakenteen. Tämä mahdollistaa visuaalisen analyysin korrelaatioplejadit- graafinen kuva rakenteet tilastollisestimerkittäviä yhteyksiä jos tällaisia ​​yhteyksiä ei ole kovin paljon (jopa 10-15). Toinen tapa on käyttää monimuuttujamenetelmiä: moniregressio-, tekijä- tai klusterianalyysi (katso kohta "Monimuuttujamenetelmät..."). Tekijä- tai klusterianalyysin avulla on mahdollista tunnistaa muuttujien ryhmittymiä, jotka liittyvät läheisemmin toisiinsa kuin muihin muuttujiin. Näiden menetelmien yhdistelmä on myös erittäin tehokas esimerkiksi, jos merkkejä on monia ja ne eivät ole homogeenisia.

Korrelaatioiden vertailu - lisätehtävä analysoida korrelaatiomatriisia, jossa on kaksi vaihtoehtoa. Jos on tarpeen vertailla korrelaatioita jollain korrelaatiomatriisin rivillä (yhdelle muuttujalle), käytetään riippuvien näytteiden vertailumenetelmää (s. 148-149). Eri näytteille laskettuja samannimistä korrelaatioita verrattaessa käytetään riippumattomien näytteiden vertailumenetelmää (s. 147-148).

Vertailumenetelmät korrelaatioita diagonaaleissa korrelaatiomatriisi (satunnaisprosessin stationaarisuuden arvioimiseksi) ja vertailu useita eri näytteille saadut korrelaatiomatriisit (niiden homogeenisuuden vuoksi) ovat aikaa vieviä ja tämän kirjan soveltamisalan ulkopuolella. Voit tutustua näihin menetelmiin GV Sukhodolskyn kirjasta 1 .

Korrelaatioiden tilastollisen merkittävyyden ongelma. Ongelmana on, että tilastollinen hypoteesien testausmenettely sisältää yksi-useita yhdelle näytteelle tehty testi. Jos käytetään samaa menetelmää monta kertaa, vaikka suhteessa eri muuttujiin, niin todennäköisyys saada tulos puhtaasti sattumalta kasvaa. Yleensä, jos toistamme saman hypoteesin testausmenetelmän aikoihin eri muuttujien tai näytteiden suhteen, niin vahvistetulla a:n arvolla saamme taatusti vahvistuksen hypoteesille ah tapausten määrä.

Oletetaan, että 15 muuttujan korrelaatiomatriisi analysoidaan, eli lasketaan 15(15-1)/2 = 105 korrelaatiokerrointa. Hypoteesien testaamiseksi asetetaan taso a = 0,05. Testaamalla hypoteesia 105 kertaa, saamme sen vahvistuksen viisi kertaa (!) riippumatta siitä, onko yhteys todella olemassa. Kun tiedämme tämän ja olemme saaneet esimerkiksi 15 "tilastollisesti merkitsevää" korrelaatiokerrointa, voimmeko sanoa, mitkä niistä on saatu sattumalta ja mitkä heijastavat todellista suhdetta?

Tarkkaan ottaen tilastollisen päätöksen tekemiseksi tasoa a on alennettava niin monta kertaa kuin testattavien hypoteesien määrä. Mutta tämä tuskin on suositeltavaa, koska todennäköisyys jättää huomiotta todella olemassa oleva yhteys (tehdä tyypin II virhe) kasvaa arvaamattomalla tavalla.

Pelkkä korrelaatiomatriisi ei ole riittävä perustasiihen sisältyviä yksittäisiä kertoimia koskevia tilastollisia päätelmiä vartenkorrelaatioita!

On vain yksi todella vakuuttava tapa ratkaista tämä ongelma: jakaa otos satunnaisesti kahteen osaan ja ottaa huomioon vain ne korrelaatiot, jotka ovat tilastollisesti merkitseviä molemmissa otoksen osissa. Vaihtoehtona voi olla monimuuttujamenetelmien käyttö (faktoriaalinen, klusteri- tai moniregressioanalyysi) - tilastollisesti merkitsevästi toisiinsa liittyvien muuttujien ryhmien valintaan ja myöhempään tulkintaan.

Puuttuvien arvojen ongelma. Jos tiedoista puuttuu arvoja, on kaksi vaihtoehtoa korrelaatiomatriisin laskemiseksi: a) arvojen rivi riviltä poistaminen (sulkea poistapauksialistallisesti); b) arvojen poistaminen pareittain (sulkea poistapauksiapareittain). klo rivi riviltä poisto havaintoja, joissa on aukkoja, koko rivi poistetaan objektilta (aiheelta), jolla on vähintään yksi puuttuva arvo jollekin muuttujalle. Tämä menetelmä johtaa "oikeaan" korrelaatiomatriisiin siinä mielessä, että kaikki kertoimet lasketaan samasta objektijoukosta. Kuitenkin, jos puuttuvat arvot jaetaan satunnaisesti muuttujiin, tämä menetelmä voi johtaa siihen, että tarkasteltavassa tietojoukossa ei jää yhtään objektia (jokaisella rivillä on vähintään yksi puuttuva arvo). Voit välttää tämän tilanteen käyttämällä toista menetelmää nimeltä pareittainen poisto. Tämä menetelmä ottaa huomioon vain aukot kussakin valitussa muuttujasarakeparissa ja jättää huomiotta muiden muuttujien aukot. Korrelaatio muuttujaparille lasketaan niille kohteille, joissa ei ole aukkoja. Monissa tilanteissa, varsinkin kun aukkojen määrä on suhteellisen pieni, esimerkiksi 10%, ja aukot jakautuvat melko satunnaisesti, tämä menetelmä ei johda vakaviin virheisiin. Joskus näin ei kuitenkaan ole. Esimerkiksi estimaatin systemaattisessa biasissa (siirtymässä) aukkojen systemaattinen sijainti voidaan "piilottaa", mikä on syynä eri osajoukkojen (esimerkiksi eri objektien alaryhmien) korrelaatiokertoimien eroon. ). Toinen ongelma, joka liittyy korrelaatiomatriisiin, joka on laskettu pareittain aukon poistaminen tapahtuu, kun tätä matriisia käytetään muuntyyppisissä analyyseissä (esimerkiksi moniregressio- tai tekijäanalyysissä). He olettavat, että "oikeaa" korrelaatiomatriisia käytetään tietyllä johdonmukaisuuden ja eri kertoimien "vastaavuuden" tasolla. Matriisin käyttö "huonoilla" (harhoilla) arvioilla johtaa siihen, että ohjelma joko ei pysty analysoimaan tällaista matriisia tai tulokset ovat virheellisiä. Siksi, jos käytetään parittaista menetelmää puuttuvan tiedon poistamiseksi, on tarpeen tarkistaa, onko aukkojen jakautumisessa systemaattisia kuvioita vai ei.

Jos puuttuvien tietojen pareittainen eliminointi ei johda systemaattiseen keskiarvojen ja varianssien (keskihajonnan) muutokseen, nämä tilastot ovat samanlaisia ​​kuin viivakohtaisella aukkojen poistomenetelmällä lasketut tilastot. Jos ero on merkittävä, on syytä olettaa, että arvioissa on tapahtunut muutos. Esimerkiksi, jos muuttujan arvojen keskiarvo (tai keskihajonta). MUTTA, jota käytettiin laskettaessa sen korrelaatiota muuttujan kanssa AT, paljon pienempi kuin muuttujan samojen arvojen keskiarvo (tai keskihajonta). MUTTA, joita käytettiin laskettaessa sen korrelaatiota muuttujan C kanssa, on syytä olettaa, että nämä kaksi korrelaatiota (A-Bmeille) perustuu eri tietoryhmiin. Korrelaatioissa tapahtuu muutos, joka johtuu muuttujien arvojen aukkojen ei-satunnaisesta sijainnista.

Korrelaatioplejadien analyysi. Korrelaatiomatriisin elementtien tilastollisen merkittävyyden ongelman ratkaisemisen jälkeen voidaan tilastollisesti merkitsevät korrelaatiot esittää graafisesti korrelaatioplejadin tai plejadin muodossa. Korrelaatiogalaksi - se on pisteistä ja niitä yhdistävistä viivoista koostuva kuvio. Huiput vastaavat ominaisuuksia ja on yleensä merkitty numeroilla - muuttujien numeroilla. Viivat vastaavat tilastollisesti merkittäviä suhteita ja ilmaisevat graafisesti suhteen etumerkin ja joskus /j-merkittävyystason.

Korrelaatiogalaksi voi heijastaa kaikki korrelaatiomatriisin tilastollisesti merkitseviä suhteita (jota joskus kutsutaan korrelaatiokaavio ) tai vain niiden mielekkäästi valittu osa (esimerkiksi tekijäanalyysin tulosten mukaan yhtä tekijää vastaava).

ESIMERKKI KORRELAATIOPLEIADI:N MUODOSTAMISESTA


Valmistelu valmistuneiden valtion (lopulliseen) sertifiointiin: USE-tietokannan muodostaminen (yleinen luettelo kaikkien luokkien USE-osallistujista, aiheet mainitaan) - varapäivien huomioiminen, jos aiheet vastaavat;

  • Työsuunnitelma (27)

    Ratkaisu

    2. Oppilaitoksen toiminta luonnon- ja matematiikan opetuksen aineiden sisällön parantamiseksi ja laadun arvioimiseksi MOU lukio nro 4, Litvinovskaya, Chapaevskaya,

  • on kvantitatiivinen arvio ilmiöiden välisten suhteiden tilastotutkimuksesta, jota käytetään ei-parametrisissä menetelmissä.

    Indikaattori näyttää kuinka havaittu rivien välisten erojen neliösumma eroaa tapauksesta, jossa yhteyttä ei ole.

    Palvelutehtävä. Tämän online-laskimen avulla voit:

    • Spearmanin rankkorrelaatiokertoimen laskeminen;
    • kertoimen luottamusvälin laskeminen ja sen merkityksen arviointi;

    Spearmanin rankkorrelaatiokerroin viittaa viestinnän läheisyyden arvioinnin indikaattoreihin. Rankkorrelaatiokertoimen ja muiden korrelaatiokertoimien suhteen tiukkuuden kvalitatiivinen ominaisuus voidaan arvioida Chaddock-asteikolla.

    Kerroinlaskenta koostuu seuraavista vaiheista:

    Spearmanin rankkorrelaatiokertoimen ominaisuudet

    Sovellusalue. Rankkorrelaatiokerroin käytetään arvioimaan kahden joukon välisen viestinnän laatua. Lisäksi sen tilastollista merkitsevyyttä käytetään analysoitaessa tietoja heteroskedastisuuden varalta.

    Esimerkki. Havaittujen muuttujien X ja Y datanäytteessä:

    1. tee sijoitustaulukko;
    2. Etsi Spearmanin rankkorrelaatiokerroin ja testaa sen merkitys tasolla 2a
    3. arvioida riippuvuuden luonnetta
    Ratkaisu. Anna arvot piirteelle Y ja tekijä X .
    XYsijoitus X, dxsijoitus Y, d y
    28 21 1 1
    30 25 2 2
    36 29 4 3
    40 31 5 4
    30 32 3 5
    46 34 6 6
    56 35 8 7
    54 38 7 8
    60 39 10 9
    56 41 9 10
    60 42 11 11
    68 44 12 12
    70 46 13 13
    76 50 14 14

    Sijoitusmatriisi.
    sijoitus X, dxsijoitus Y, d y(dx - dy) 2
    1 1 0
    2 2 0
    4 3 1
    5 4 1
    3 5 4
    6 6 0
    8 7 1
    7 8 1
    10 9 1
    9 10 1
    11 11 0
    12 12 0
    13 13 0
    14 14 0
    105 105 10

    Matriisin kokoamisen oikeellisuuden tarkistaminen tarkistussumman laskennan perusteella:

    Matriisin sarakkeiden summat ovat yhtä suuria keskenään ja tarkistussumman kanssa, mikä tarkoittaa, että matriisi on muodostettu oikein.
    Kaavan avulla laskemme Spearmanin rankkorrelaatiokertoimen.


    Ominaisuuden Y ja tekijä X välinen suhde on vahva ja suora
    Spearmanin rankkorrelaatiokertoimen merkitys
    Nollahypoteesin testaamiseksi merkitsevyystasolla α, että yleinen Spearman-arvokorrelaatiokerroin on nolla kilpailevan hypoteesin Hi alla. p ≠ 0, on tarpeen laskea kriittinen piste:

    missä n on näytteen koko; ρ on Spearmanin otosrankkorrelaatiokerroin: t(α, k) on kaksipuolisen kriittisen alueen kriittinen piste, joka saadaan Studentin jakauman kriittisten pisteiden taulukosta merkitsevyystason α ja lukujen mukaan. vapausasteet k = n-2.
    Jos |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - nollahypoteesi hylätään. Laadullisten ominaisuuksien välillä on merkittävä korrelaatio.
    Studentin taulukon mukaan saadaan t(α/2, k) = (0,1/2;12) = 1,782

    Koska T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

    Käytännössä Spearmanin rankkorrelaatiokerrointa (P) käytetään usein määrittämään kahden ominaisuuden välisen suhteen läheisyys. Kunkin ominaisuuden arvot asetetaan nousevaan järjestykseen (1:stä n:ään), jonka jälkeen määritetään yhtä havaintoa vastaavien rivejen välinen ero (d).

    Esimerkki #1. Teollisuustuotannon määrän ja kiinteään pääomaan tehtyjen investointien välistä suhdetta Venäjän federaation yhden liittovaltiopiirin 10 alueella vuonna 2003 kuvaavat seuraavat tiedot.
    Laskea Spearmanin rankkorrelaatiokertoimet ja Kendala. Tarkista niiden merkitys arvolla α=0,05. Muotoile johtopäätös teollisen tuotannon määrän ja käyttöomaisuuteen tehtyjen investointien välisestä suhteesta tarkasteltavina olevilla Venäjän federaation alueilla.

    Anna arvot piirteelle Y ja tekijä X . Laske neliöiden d 2 erotuksen summa.
    Laskemme Spearmanin rankkorrelaatiokertoimen laskimen avulla:

    X Y sijoitus X, dx sijoitus Y, d y (dx - dy) 2
    1.3 300 1 2 1
    1.8 1335 2 12 100
    2.4 250 3 1 4
    3.4 946 4 8 16
    4.8 670 5 7 4
    5.1 400 6 4 4
    6.3 380 7 3 16
    7.5 450 8 5 9
    7.8 500 9 6 9
    17.5 1582 10 16 36
    18.3 1216 11 9 4
    22.5 1435 12 14 4
    24.9 1445 13 15 4
    25.8 1820 14 19 25
    28.5 1246 15 10 25
    33.4 1435 16 14 4
    42.4 1800 17 18 1
    45 1360 18 13 25
    50.4 1256 19 11 64
    54.8 1700 20 17 9
    364

    Ominaisuuden Y tekijän X välinen suhde on vahva ja suora.

    Spearmanin rankkorrelaatiokertoimen estimointi



    Opiskelijataulukon mukaan löydämme Ttaulukon.
    T-taulukko \u003d (18; 0,05) \u003d 1,734
    Koska Tobs > Ttabl, hylkäämme hypoteesin, että sijoituskorrelaatiokerroin on yhtä suuri kuin nolla. Toisin sanoen Spearmanin rankkorrelaatiokerroin on tilastollisesti merkitsevä.

    Intervalliarvio sijoituskorrelaatiokertoimelle (luottamusväli)
    Luottamusväli Spearmanin rankkorrelaatiokertoimelle: p(0,5431;0,9095).

    Esimerkki #2. Alkutiedot.

    5 4
    3 4
    1 3
    3 1
    6 6
    2 2
    Koska matriisissa on 1. rivin toisiinsa liittyviä rivejä (sama järjestysnumero), muotoilemme ne uudelleen. Tasot muodostetaan uudelleen muuttamatta arvon tärkeyttä, eli vastaavat suhdeluvut (suurempi, pienempi tai yhtä suuri) on säilytettävä järjestysnumeroiden välissä. Ei myöskään ole suositeltavaa asettaa arvoa 1:n yläpuolelle ja parametrien lukumäärää vastaavan arvon alle (tässä tapauksessa n = 6). Rivien uudistaminen on tehty taulukossa.
    Uusia rivejä
    1 1 1
    2 2 2
    3 3 3.5
    4 3 3.5
    5 5 5
    6 6 6
    Koska matriisissa on 2. rivin sidotut rivit, muotoilemme ne uudelleen. Rivien uudistaminen on tehty taulukossa.
    Istuinnumerot järjestetyssä rivissäTekijöiden sijainti asiantuntijan arvion mukaanUusia rivejä
    1 1 1
    2 2 2
    3 3 3
    4 4 4.5
    5 4 4.5
    6 6 6
    Sijoitusmatriisi.
    sijoitus X, dxsijoitus Y, d y(dx - dy) 2
    5 4.5 0.25
    3.5 4.5 1
    1 3 4
    3.5 1 6.25
    6 6 0
    2 2 0
    21 21 11.5
    Koska ominaisuuksien x ja y arvojen joukossa on useita identtisiä, ts. sidotut rivit muodostetaan, niin tässä tapauksessa Spearman-kerroin lasketaan seuraavasti:

    missä


    j - linkkien lukumäärä ominaisuuden x järjestyksessä;
    Ja j on identtisten rivien lukumäärä j:nnessä nipussa x:ssä;
    k - pyöreiden lukumäärä piirteen y järjestyksessä;
    In k - identtisten rivien lukumäärä k:nnessä nipussa y:ssä.
    A = [(2 3 - 2)]/12 = 0,5
    B = [(2 3 - 2)]/12 = 0,5
    D = A + B = 0,5 + 0,5 = 1

    Ominaisuuden Y ja tekijä X välinen suhde on kohtalainen ja suora.