Ano ang ranggo sa istatistika. Kaso ng magkatulad na ranggo

1 Maikling kwento pangyayari pagsusuri ng ugnayan

Ang simula ng aplikasyon ng mga pamamaraan sa matematika at istatistika para sa pag-aaral ng mga dependency ng ugnayan ay nagsimula noong 70s ng ikalabinsiyam na siglo. Maraming mga istoryador - mga istatistika ang nangunguna sa kasaysayan ng pag-unlad ng ugnayan mula sa apatnapu't ng ikalabinsiyam na siglo - mula sa oras kung kailan Pranses na matematiko O. Nagmungkahi si Brave ng isang pormula para sa pamamahagi ng dalawang random na variable na nakakatugon sa mga kinakailangan ng batas normal na pamamahagi.

Gayunpaman, ang tunay na tagapagtatag ng teorya ng ugnayan ay itinuturing na English mathematician - statistician na si K. Pearson, na lumikha noong huling bahagi ng ikalabinsiyam at unang bahagi ng ikadalawampu siglo. teoryang ito. Sa loob nito, ang ugnayan ay gumaganap bilang isang anyo ng dialectical na koneksyon, kung saan ang set iba't ibang dahilan, parehong kinakailangan at random, parehong karaniwan para sa parehong mga halaga ng ugnayan, at pribado, na nakakaapekto lamang sa isa sa mga ito. Bukod dito, hindi lahat ng likas na relasyon ay sanhi.

Ang pagbuo ng teorya ay isinagawa sa tulong ng iba pang mga pag-aaral, nang ang mga pangunahing probisyon ng teorya ng ugnayan ay nalikha na. Bukod dito, sa larangan ng pag-aaral ng mga ugnayan, ang pagsasanay ay malinaw na nahiwalay sa teorya, na naglalagay ng mga mananaliksik sa mga ganitong kondisyon na hindi nakakatugon sa mga kinakailangan nito.

Ang batayan para sa pagbuo ng mga pamamaraan para sa pag-aaral ng mga ugnayan at regression ay ang data na nagpapakilala sa anumang, quantitatively na ipinahayag na mga palatandaan. Samakatuwid, ang mga mananaliksik sa pinakaunang mga hakbang ay natugunan ang gawain ng pag-uugnay ng mga katangian ng husay, halimbawa, ang relasyon sa pagitan ng kulay ng mata sa mga ama at anak na lalaki. Pangkalahatang prinsipyo, na naging batayan para sa pagbuo ng mga tagapagpahiwatig ng ugnayan ng mga katangiang husay, ay ang dalawang katangiang husay ay maaaring ituring na magkakaugnay kung ang pagkilos ng isa sa kanila A sa ilalim ng pagkilos ng tampok na B ay kapareho ng kapag ang tampok ay hindi B. Sa pagbuo ng prinsipyong ito, at inaalok iba't ibang disenyo mga tagapagpahiwatig tulad ng, halimbawa, ang mean square conjugation coefficient ng Pearson o ang mutual conjugation coefficient ng Chuprov.

Ang pag-aaral ng ugnayan ng mga katangian ng husay ay nagbunga pangkalahatang doktrina tungkol sa ugnayan, ang tinatawag na rank theory at ang teorya ng rank correlation batay dito. Ang English mathematician-statistician na si M. Kendall, ang may-akda ng isang monograph sa mga problema ng rank correlation, ay itinuro na ang teorya ng ranggo ay unang lumitaw bilang isang sangay ng teorya. mga random na proseso. Sa paunang yugto Ang mga ranggo ay madalas na nakikita bilang isang maginhawang kagamitan, salamat sa kung saan posible na gawin nang hindi sinusukat ang ganap na halaga ng mga variable at sa gayon ay makatipid ng oras at pagsisikap. Nang maglaon, ang mga istatistika ng ranggo ay nakakuha ng pagkilala dahil sa kanilang pagpapahalaga sa sarili. Gumawa si Kendall ng indicator na naaangkop din sa pag-aaral ng bahagyang ugnayan sa pagitan ng mga ranggo. modernong teorya rank correlation ay hindi maiisip kung wala ang M. Kendall's most fully iluminating research.

Kaya, sa simula ng ikadalawampu siglo, mathematical paraang istatistikal Ang mga sukat ng mga ugnayan at regression ay nabuo sa pangkalahatan sa isang medyo maayos kumpletong sistema, na kinabibilangan ng mga pamamaraan hindi parametric na istatistika at nonparametric rank method.

2 Nonparametric rank na pamamaraan

Ang mga pamamaraan ng nonparametric rank ay ligaw umuunlad na lugar mga istatistika ng matematika. Kasaysayan ng modernong nonparametric na pamamaraan batay sa mga ranggo ay medyo maikli - mga 40 taon lamang. Ang mga pamamaraan ng ranggo ay lumitaw bilang isang espesyal na lugar ng mga istatistika na hindi parametric hindi lamang dahil sa likas na katangian ng pinagmumulan ng materyal, kundi dahil din sa mga ideya ng karagdagang paggamit nito. Sa ngayon, nalulutas ng mga pamamaraang ito ang maraming problema sa pagsusuri ng data sa ekonomiya, istatistika, inhinyero, natural na agham, sosyolohikal, at medikal.

Ang pagraranggo ay isang pamamaraan para sa pag-order ng mga bagay ng pag-aaral, na ginagawa batay sa kagustuhan. Ang ranggo ay serial number mga katangiang halaga na nakaayos sa pataas o pababang pagkakasunud-sunod ng kanilang mga halaga. Tulad ng ipinakita ng mga pag-aaral sa istatistika na isinagawa sa nakalipas na 10-15 taon, ang mga pamamaraan ng ranggo ay higit na walang bilang ng mga pagkukulang para sa pagtatrabaho sa maliliit na sample, ang pamamahagi nito ay hindi alam. Tulad ng nalalaman, ang paglipat mula sa mga obserbasyon mismo sa kanilang mga ranggo ay sinamahan ng isang tiyak na pagkawala ng impormasyon. Gayunpaman, ang mga pagkalugi na ito ay hindi masyadong malaki. Sa kasamaang palad, may kakulangan pa rin espesyal na panitikan sa isyung ito.

AT kamakailang mga panahon sa pagtataya at sa paglutas ng maraming iba pang mga problema ay naging malawakang ginagamit mga opinyon ng eksperto. Ang mga pamamaraan ng ugnayan ng ranggo sa lugar na ito ay halos ang tanging paraan paglalahat ng mga pagtatasa ng eksperto.

Ang teorya ng ranggo ay unang lumitaw bilang isang sangay ng teorya ng mga prosesong stochastic. Sa paunang yugto, ang mga ranggo ay madalas na nakikita bilang simpleng isang maginhawang aparato, salamat sa kung saan posible na gawin nang hindi binabago ang ganap na halaga ng mga variable at sa gayon ay makatipid ng oras o pagsisikap. Salamat sa paggamit ng mga ranggo, ang mga paghihirap na nauugnay sa pagbuo ng isang layunin na sukat ng mga ganap na halaga ay maiiwasan. Nang maglaon, ang mga istatistika ng ranggo ay nakakuha ng pagkilala dahil sa kanilang sariling mga merito.

Ang pinakakaraniwang paraan ng pag-order ng mga bagay na pinag-aaralan ay isasaalang-alang sa ibaba:

Ang gawain ay maaaring bawasan lamang sa pag-aayos ng mga bagay ayon sa lugar na kanilang sinasakop sa espasyo o oras. Halimbawa, ang mga card ay inayos sa isang deck sa ilang pagkakasunud-sunod at pagkatapos ay binasa. Ang bagong pag-aayos ng mga card ay nailalarawan din ng isang tiyak na pagkakasunud-sunod, pagraranggo. Kung ikukumpara ito sa luma, makikita mo kung gaano kaingat ang pag-shuffle ng mga card. Sa problemang ito, ito ay kawili-wili lamang pangkalahatang kaayusan card sa isang deck, at hindi na kailangang ayusin ang mga bagay alinsunod sa "pagtaas" o "pagbaba" ng isa o iba pang tampok na likas sa lahat ng mga ito;

Posible rin na mag-order ng mga bagay ayon sa ilang kalidad, kung saan walang layunin na ganap na sukat ng pagbabago. Maaari mong, halimbawa, mag-rank ng mga sample mga bato sa tigas, batay sa sumusunod na simpleng pamantayan: Ang A ay mas mahirap kaysa sa B kung ang A ay nag-iiwan ng gasgas sa B kapag sila ay nakadikit. Kung ang A ay nag-iiwan ng gasgas sa B, at B sa C, ang A ay mag-iiwan ng gasgas sa C. Kaya, sa pamamagitan ng paggamit sa isang serye ng mga paghahambing, posibleng mag-order ng mga bagay na pinag-uusapan nang may sapat na katumpakan (maliban kung ang set ay may kasamang tulad dalawang bagay na may parehong tigas). Gayunpaman katulad na paraan hindi pinapayagang sukatin ang ganap na halaga ng katigasan ng bato. Laging maitatag na ang A ay mas mahirap kaysa sa B. Gayunpaman, hanggang sa mabuo ang isa o isa pang sukat ng pagsukat ganap na mga halaga, hindi maaaring sabihin ng isang tao na ang A ay, sabihin nating, dalawang beses na mas matigas kaysa sa B;

Ang pag-order ay maaaring isagawa alinsunod sa nasusukat (o theoretically kalkulado) na halaga ng ilang tampok. Halimbawa, maaari mong ayusin ang mga tao sa isang pagkakasunud-sunod o iba pa depende sa kanilang taas, at mga lungsod ayon sa populasyon. Kasabay nito, hindi palaging kinakailangan na gumamit ng proseso ng pagsukat mismo: posible na bumuo ng isang pangkat ng mga mag-aaral sa pamamagitan ng taas "sa pamamagitan ng mata"; gayunpaman, sa ganitong mga kaso, ang pamantayan sa pagraranggo ay dapat na payagan ang mga direktang paghahambing.

Posibleng mag-order ng mga bagay ayon sa ilang katangian, ang halaga nito, sa prinsipyo, ay maaaring masukat, ngunit sa pagsasagawa (o kahit na theoretically) hindi posible na gumamit ng naturang pagsukat para sa iba't ibang mga kadahilanan. Halimbawa, maaari mong ayusin ang isang serye ng mga mukha ayon sa kanilang mga kakayahan sa intelektwal, sa paniniwalang talagang umiiral ang ganoong kalidad at posibleng ilagay ang mga tao sa isang pagkakasunud-sunod o iba pa alinsunod sa intensity ng feature na ito.

AT praktikal na aplikasyon Ang mga pamamaraang nakabatay sa ranggo kung minsan ay nakakaharap ng mga kaso kung saan ang dalawa o higit pang mga bagay ay magkatulad na hindi posibleng magbigay ng kagustuhan sa isa sa mga ito. Kapag niraranggo ng isang dalubhasa ang isang bagay batay sa mga pansariling paghatol, pagkatapos ang pag-aari na ito (kakulangan ng mga kagustuhan) ay nauugnay sa katotohanan ng kanilang kawalan ng pagkakaiba o ang kawalan ng kakayahan ng mananaliksik na makahanap ng mga makabuluhang pagkakaiba. Sa kasong ito, ang naturang bagay ay sinasabing nakatali.

Halimbawa, ang mga mag-aaral ay niraranggo ayon sa kanilang merito o mga marka ng pagsusulit. Ang paraan na tinatanggap para sa pagrereseta mga numerong halaga Ang mga ranggo ng mga kaugnay na bagay ay ang pag-average ng mga ranggo na mayroon sila kung sila ay nakikilala. Halimbawa, kung ang ikatlo at ikaapat na bagay ay konektado, ang bawat isa ay itinalaga ng isang ranggo na katumbas ng 3.5, ngunit kung ang mga bagay mula sa pangalawa hanggang ikapito ay konektado, kung gayon ang resultang ranggo ay 4.5.

Ang pamamaraang ito ay minsang tinutukoy bilang "paraan ng average na ranggo". Kapag walang batayan para sa pagpili sa pagitan ng mga bagay, malinaw na sa kasong ito kinakailangan na ipatungkol sa lahat parehong ranggo. kalamangan ang pamamaraang ito ay ang kabuuan ng mga ranggo para sa lahat ng mga bagay ay nananatiling eksaktong kapareho ng kapag nagraranggo nang walang mga link.

Sa pagsusuri ng panlipunan pang-ekonomiyang phenomena madalas na kinakailangan na gumamit ng iba't ibang, may kundisyong pagtatantya gamit ang mga ranggo, at ang ugnayan sa pagitan ng mga indibidwal na tampok na susukatin gamit ang nonparametric coupling coefficients.

3 Kendall Rank Concordance Coefficient

Upang matukoy ang higpit ng ugnayan sa pagitan ng isang di-makatwirang bilang ng mga feature na niraranggo, maramihang salik mga ugnayan (coefficient of concordance).

Sa pagsasanay istatistikal na pag-aaral may mga kaso kapag ang isang hanay ng mga bagay ay nailalarawan hindi ng dalawa, ngunit sa pamamagitan ng ilang mga pagkakasunud-sunod ng mga ranggo, ito ay kinakailangan upang magtatag ng isang istatistikal na relasyon sa pagitan ng ilang mga variable. Bilang isang metro, ginagamit ang multiple correlation coefficient (concordance coefficient) ng mga ranggo ng Kendall, na tinutukoy ng sumusunod na formula:

saan W– koepisyent ng konkordans;

D– ang kabuuan ng mga parisukat na ranggo ay kinakalkula ng formula (2);

n– bilang ng mga bagay ng ranggo na tampok (bilang ng mga eksperto);

m ay ang bilang ng mga nasuri na ordinal variable.

Sa isang kahulugan, ang W ay nagsisilbing sukatan ng pangkalahatan.

, (2)

saan rij- nakaayos ang mga hanay ng mga paghatol ng isang pangkat ng mga eksperto;

n– bilang ng mga bagay (bilang ng mga eksperto).

Ang mga halaga ng concordance coefficients ay nakapaloob sa pagitan.

Ang pagtaas sa koepisyent mula 0 hanggang 1 ay nangangahulugan ng pagpapakita ng higit na pagkakapare-pareho ng mga paghatol. Kung ang lahat ng mga paghatol na ito ay nagtutugma, kung gayon W=1.

Ang pagsusulit ng kahalagahan ng koepisyent ay batay sa katotohanan na sa kaso ng bisa ng null hypothesis tungkol sa kawalan ugnayan para sa n>7 istatistika m(n-1)*W ay may humigit-kumulang – pamamahagi sa k=n-1 antas ng kalayaan. Samakatuwid, ang concordance coefficient ay makabuluhan sa antas =0.05 kung m(n-1)W> .

Mga Pangyayari C

eksperto j = 1

mga eksperto a ij

eksperto j = 2

eksperto j = 1

kahalagahan a ij

eksperto j = 2

Ang kabuuang ranggo ng kahalagahan a i

Ang average na halaga para sa kabuuang mga ranggo ng itinuturing na serye

Ang kabuuang square deviation S ng kabuuang mga kaganapan mula sa mean value a ay

tinatawag na concordance coefficient. Ang halaga ng W ay nag-iiba mula 0 hanggang 1. Sa W = 0, ganap na walang pagkakapare-pareho; walang koneksyon sa pagitan ng mga pagtatasa ng iba't ibang mga eksperto. Sa kabaligtaran, sa W = 1 ang kasunduan ng mga opinyon ng eksperto ay kumpleto.

Kung ang sequence (5.2) ay may mga pagkakapantay-pantay bilang karagdagan sa mga mahigpit na hindi pagkakapantay-pantay, ibig sabihin, mayroong isang pagkakataon ng mga ranggo, kung gayon ang formula para sa pagkalkula ng koepisyent ng concordance ay may anyo

Kapag ang mga ranggo ay paulit-ulit, upang makakuha ng isang normal na ranggo na may average na ranggo na katumbas ng

kinakailangang ipatungkol sa mga kaganapang may parehong ranggo ang isang ranggo na katumbas ng average na halaga ng mga lugar na hinati ng mga kaganapang ito sa kanilang mga sarili.

Halimbawa, ang sumusunod na ranggo ng mga kaganapan ay nakuha:

Mga ranggo a i

Ang mga kaganapan 2 at 5 ay nagbahagi ng ikalawa at ikatlong lugar. Kaya niranggo sila

Ang mga kaganapan 3, 4 at 6 ay nagbahagi ng ikaapat, ikalima, ikaanim na lugar, at sila ay itinalaga ng ranggo

Kaya, nakakakuha kami ng isang normal na ranggo:

Mga ranggo a" i

Halimbawa. Isaalang-alang ang pagraranggo ng m=10 kaganapan p=3 ng mga eksperto;N,Q,R. Ang mga resulta ng pagkalkula ay ipinakita sa Talahanayan. 5.3.

Para sa matinding halaga ng concordance coefficient, maaaring gawin ang mga sumusunod na pagpapalagay. Kung W= 0, pagkatapos ay walang pagkakapare-pareho sa mga pagtatantya, samakatuwid, upang makakuha ng maaasahang mga pagtatantya, kinakailangan upang linawin ang paunang data sa mga kaganapan at (o) baguhin ang komposisyon ng pangkat ng eksperto. Kapag W = 1, malayo mula sa laging posible na isaalang-alang ang nakuha na mga pagtatantya bilang layunin, dahil kung minsan lumalabas na ang lahat ng mga miyembro ng pangkat ng dalubhasa ay sumang-ayon nang maaga, na nagpoprotekta sa kanilang mga karaniwang interes.

Kinakailangan na ang nahanap na halaga ng W ay mas malaki kaysa sa tinukoy na halaga W 3 (W>W 3). Maaari mong kunin ang W 3 = 0.5, i.e. sa W > 0.5, ang mga aksyon ng mga eksperto ay mas coordinated kaysa hindi coordinated. Para kay W< 0,5 полученные оценки нельзя считать достоверными, и поэтому следует повторить опрос заново. Жесткость данного утверждения опреде­ляется важностью проводимого исследования и возможностью повторной экспертизы. Практика показывает, что очень часто этим требованием пренебрегают.

Ang pagkalkula ng koepisyent W, na isinasaalang-alang ang kakayahan ng mga eksperto, ay ibinibigay sa trabaho.

Medyo mahusay na tinatayang R. s. T, at ang pagkakaiba ay bale-wala kapag . Kung ang hypothesis H 0 ay totoo, ayon sa kung aling bahagi X 1 , ... , X n Ang random na vector X ay independyente mga random na variable, ang projection ni R. na may. Ang To ay tinutukoy ng formula

saan (tingnan).

Mayroong panloob na komunikasyon sa pagitan ng R. ng pahina. at . Tulad ng ipinapakita sa , kung ang hypothesis H 0 ay totoo, ang projection Ang koepisyent ng ugnayan ni Kendall sa pamilya ng linear R. s. hanggang sa pare-pareho ang kadahilanan tumutugma sa koepisyent ng ugnayan ng ranggo ng Spearman, ibig sabihin:


Ito ay sumusunod mula sa pagkakapantay-pantay na ang correlation coefficient corr sa pagitan ng at ay katumbas ng


ibig sabihin, para sa malaking nP. kasama. at asymptotically katumbas (tingnan).

Lit.: Gaek Ya., Shidak Z., Teorya ng pamantayan sa ranggo, trans. mula sa English, M., 1971; K e n d a l l M. G., Mga pamamaraan ng ugnayan sa ranggo, 4ed., L., 1970. M. S. Nikulin.


Mathematical Encyclopedia. - M.: Encyclopedia ng Sobyet. I. M. Vinogradov. 1977-1985.

Tingnan kung ano ang "RANK STATISTICS" sa ibang mga diksyunaryo:

    istatistika ng ranggo- - [A.S. Goldberg. English Russian Energy Dictionary. 2006] Mga paksang enerhiya sa pangkalahatan EN rank statistics … Handbook ng Teknikal na Tagasalin

    Ang terminong ito ay may iba pang kahulugan, tingnan ang Istatistika (mga kahulugan). mga istatistika (sa maliit na pagiisip) ay masusukat numeric function mula sa sample, independyente sa hindi kilalang mga parameter ng pamamahagi. AT malawak na kahulugan termino (matematika) ... ... Wikipedia

    - (mga istatistika) 1. Set ng data at mga pamamaraan sa matematika ginagamit upang pag-aralan ang mga relasyon sa pagitan ng iba't ibang mga variable. Kabilang dito ang mga pamamaraan tulad ng linear regression(linear regression) at rank correlation. 2. Mga halagang ginamit ... ... Diksyonaryo ng ekonomiya

    STATISTICS- 1. Isang uri ng aktibidad na naglalayong makakuha, magproseso at magsuri ng impormasyon na nagpapakilala sa dami ng mga pattern ng buhay sa isla sa lahat ng pagkakaiba-iba nito, na hindi mapaghihiwalay na nauugnay sa nilalaman nitong husay. Sa isang mas makitid na kahulugan ng salita ... ... Sociological encyclopedia ng Russia

    - (mga istatistikang hindi parametric) Istatistika pamamaraan, na hindi pinapayagan ang espesyal mga functional na anyo para sa mga relasyon sa pagitan ng mga variable. Ang rank correlation ng dalawang variable ay isang halimbawa nito. Ang paggamit ng naturang teknikal ...... Diksyonaryo ng ekonomiya- K. m., na nakatanggap ng kanilang pangalan. dahil sa ang katunayan na ang mga ito ay batay sa "co relation" ng mga variable, sila ay mga istatistikal na pamamaraan, ang simula nito ay inilatag sa mga gawa ni Karl Pearson sa paligid. huli XIX sa. Sila ay malapit na nauugnay sa... Sikolohikal na Encyclopedia

    Developer Digital Illusions CE Publisher ... Wikipedia

    Karl Pearson Karl (Carl) Pearson Petsa ng kapanganakan ... Wikipedia

Sa pagsusuri ng mga socio-economic phenomena, ang isa ay kadalasang kailangang gumamit ng iba't ibang kondisyonal na pagtatantya gamit ang mga ranggo, at ang ugnayan sa pagitan ng mga indibidwal na tampok ay sinusukat gamit ang non-parametric correlation coefficients.

Ranging ay isang pamamaraan para sa pag-order ng mga bagay ng pag-aaral, na ginagawa batay sa kagustuhan.

Ranggo- ito ang serial number ng mga value ng attribute, na nakaayos sa pataas o pababang pagkakasunod-sunod ng kanilang mga value. Kung ang mga katangiang halaga ay pareho quantification, kung gayon ang ranggo ng lahat ng mga halagang ito ay kinukuha na katumbas ng arithmetic mean ng mga kaukulang bilang ng mga lugar na kanilang tinukoy. Ang mga ranggo na ito ay tinatawag konektado.

Kabilang sa mga nonparametric na pamamaraan para sa pagtantya ng higpit ng relasyon pinakamataas na halaga mayroon mga koepisyent ng ranggo Ang mga ugnayan ni Spearman (p1?/) at Kendall (m^). Ang mga coefficient na ito ay maaaring gamitin upang matukoy ang lakas ng ugnayan sa pagitan ng parehong quantitative at mga katangian ng husay.

Ranggo ng koepisyent ng ugnayan(Spearman coefficient) ay kinakalkula ng formula

saan (11 - mga parisukat na pagkakaiba sa ranggo; P - bilang ng mga obserbasyon (bilang ng mga pares ng mga ranggo).

Ang koepisyent ng Spearman ay tumatagal ng anumang halaga sa hanay [-1; isa].

Halimbawa. 11sa data sa pagbili at pagbebenta ng mga mamamayan ng mga paksa ng Volga pederal na distrito RF pera sa pamamagitan ng mga organisasyon ng kredito sa 2010 matutukoy natin ang kaugnayan sa pagitan ng mga tampok na ito gamit ang koepisyent ng Spearman (Talahanayan 7.14).

Talahanayan 7.14. Pagkalkula ng koepisyent ng Spearman

Paksa

Pagbili ng pera X, mln kuskusin.

Pagbebenta ng pera y, mln kuskusin.

Ranggo

pop a ranggo

rank difference squared

$

Upang

Ry

1. Republika ng Bashkortostan

2. Republika ng Mari El

3. Republika ng Mordovia

4. Republika ng Tatarstan

5. Udmurt Republic

6. Chuvash

Republika

7. Rehiyon ng Perm

8. Rehiyon ng Kirov

9. Rehiyon ng Nizhny Novgorod

10. Rehiyon ng Orenburg

11. Rehiyon ng Penza

12. Rehiyon ng Samara

13. Rehiyon ng Saratov

14. rehiyon ng Ulyanovsk

Kalkulahin natin ang koepisyent ng ugnayan ng mga ranggo ni Spearman:

Bilang resulta ng pagkalkula, natukoy namin na ang relasyon sa pagitan ng pagbili at pagbebenta ng pera ng mga mamamayan ng mga paksa ng Volga Federal District ng Russian Federation sa pamamagitan ng mga institusyon ng kredito noong 2010 ay malakas, malapit sa functional.

Ang koepisyent ng ugnayan ng ranggo ni Kendall ginagamit din upang sukatin ang antas ng pagiging malapit at direksyon ng relasyon sa pagitan ng husay at dami ng mga tampok pagkilala sa mga homogenous na bagay at niraranggo ayon sa parehong prinsipyo. Ang pagkalkula ng koepisyent ng ranggo ng Kendall ay isinasagawa ayon sa formula

kung saan ang 5 ay ang kabuuan ng mga pagkakaiba sa pagitan ng bilang ng mga sequence at ang bilang ng mga inversion ayon sa pangalawang tampok; P - bilang ng mga obserbasyon.

Pagkalkula ibinigay na koepisyent isinagawa sa ganitong pagkakasunud-sunod.

  • 1. Mga pagpapahalaga X ay niraranggo sa pataas o pababang pagkakasunod-sunod.
  • 2. Mga pagpapahalaga sa nakaayos ayon sa mga halaga X.
  • 3. Para sa bawat ranggo sa ang bilang ng mga sumusunod na halaga ng mga ranggo na lumampas sa halaga nito ay tinutukoy. Kaya, sa pamamagitan ng pagdaragdag ng mga numero, ang halaga ay natutukoy R bilang sukatan ng pagsusulatan sa pagitan ng mga sequence ng mga ranggo fx at y, na isinasaalang-alang gamit ang "+" sign.
  • 4. Para sa bawat ranggo sa ang bilang ng mga sumusunod na halaga ng mga ranggo na mas mababa sa halaga nito ay tinutukoy. Ang kabuuang halaga ay tinutukoy ng (2 at naayos na may "-" sign.
  • 5. Natutukoy ang kabuuan ng mga puntos para sa lahat ng miyembro ng serye.

Ang ugnayan sa pagitan ng mga tampok ay itinuturing na makabuluhan sa istatistika kung ang mga koepisyent ng ugnayan ng ranggo ng Spearman at Kendall ay higit sa 0.5.

Ayon sa Talahanayan. 7.14 ang mga resulta na ipinakita sa tab. 7.15.

Kaya, ang koepisyent ng ugnayan ng ranggo ni Kendall ay magiging

Talahanayan 7.15.

na nagpapahiwatig din ng isang malakas na ugnayan sa pagitan ng pagbili at pagbebenta ng pera ng mga mamamayan ng mga paksa ng Volga Federal District ng Russian Federation sa pamamagitan ng mga institusyon ng kredito noong 2009.

Coefficient ng ugnayan ng maramihang ranggo (coefficient ng concordance) ginagamit upang matukoy ang higpit ng ugnayan sa pagitan ng arbitrary na bilang ng mga feature na niraranggo. Ito ay kinakalkula ng formula

kung saan 5 - paglihis ng kabuuan ng mga parisukat ng mga ranggo mula sa average ng mga parisukat ng mga ranggo; t - bilang ng mga kadahilanan; P - bilang ng mga obserbasyon.

Halimbawa. Alamin natin ang antas ng pagiging malapit ng ugnayan sa pagitan ng mga pangunahing tagapagpahiwatig ng kalakalan ng teknolohiya sa mga bansang CIS noong 2010 bilang ang bilang ng mga kasunduan sa pag-export, ang halaga ng paksa ng kasunduan at ang pagtanggap ng mga pondo (Talahanayan 7.16).

Talahanayan 7.16. Pagkalkula ng koepisyent ng concordance

Ang bansa

Bilang ng mga kasunduan

X

Ang halaga ng paksa ng kasunduan y, milyong dolyar

Pagtanggap ng mga pondo para sa taon d, mln USD

Upang

Kabuuan ng mga hilera

sum square

1. Azerbaijan

2. Armenia

3. Belarus

4. Kazakhstan

5. Kyrgyzstan

6. Republika ng Moldova

Ang koepisyent ng pagiging malapit ng ugnayan sa pagitan ng mga palatandaan, na isinasaalang-alang sa nakaraang seksyon, ay maaaring mailapat kung ang mga pinag-aralan na mga palatandaan ay dami. Sa kasong ito, ang pagkalkula ng mga pangunahing parameter ng pamamahagi (mga average, dispersion) ay ginagamit, i.e. parametric na pamamaraan.

Sa istatistikal na kasanayan sa pag-aaral ng mga phenomena at proseso ng socio-economic, kailangang harapin ang mga problema sa pagsukat ng ugnayan sa pagitan ng mga katangian ng husay, kung saan hindi naaangkop ang mga parametric na pamamaraan ng pagsusuri sa kanilang karaniwang anyo. Sa kasong ito, ang tinatawag na nonparametric na pamamaraan.

Sa pagsusuri ng socio-economic phenomena, rank correlation coefficients (rank correlation coefficients) ay malawakang ginagamit kapag hindi direktang mga halaga ng x at y, at kanilang mga ranggo, mga. ang mga bilang ng kanilang mga lugar na inookupahan sa bawat hilera ng mga halaga sa pataas o pababang pagkakasunud-sunod. Kabilang sa mga nonparametric coefficient na ito Mga koepisyent ng ranggo ng Spearman at Kendall.

Kung ang P ang bilang ng mga pagpipilian ay nakaayos alinsunod sa pataas o pababang tampok na x, pagkatapos ay sinasabi nila na ang mga bagay ay niraranggo ayon sa tampok na ito. Ranggo para sa x, - ay nagpapahiwatig ng lugar na sumasakop i-e halaga ng tampok bukod sa iba pa P mga halaga ng tampok na x (/ = 1,2,___, P).

Halimbawa, sa pananaliksik sa merkado, maaaring itakda ng isa upang malaman ang mga kagustuhan ng mga mamimili kapag pumipili ng isang produkto (kapag bumibili ng mga stock, ice cream, kotse, atbp.) upang ipamahagi nila ang produkto sa pataas (o pababang) pagkakasunud-sunod ng kanilang mga kagustuhan sa mga mamimili. Kung mayroong dalawang set ng ranggo na data, maaari mong itakda ang antas linear dependence sa pagitan nila.

Halimbawa 6.7. Ipagpalagay na mayroong 5 mga produkto (Talahanayan 6.7), na niraranggo sa pagkakasunud-sunod ng kagustuhan mula 1 hanggang 5 ayon sa dalawang katangian Ay W.

Paunang pagraranggo

Talahanayan 6.7

Kinakailangang siyasatin ang higpit ng istatistikal na relasyon sa pagitan ng mga katangian.

Desisyon. Ang paggamit ng koepisyent ng Pearson upang matukoy ang intensity ng ugnayan sa pagitan ng mga palatandaan ay magiging mali, dahil ang koepisyent na ito ay ginagamit para sa mga palatandaan na sinusukat sa dami. Kaya, halimbawa, kapag tinutukoy ang kaugnayan sa pagitan ng taas at timbang, sinusukat namin ang taas sa sentimetro, at timbang sa mga kilo, habang posible na tumpak na matukoy sa sukat ng pagsukat ang pagkakaiba sa mga halaga ng mga palatandaang ito para sa sinumang tao ( sa madaling salita, ang distansya sa pagitan ng mga ito sa sukat ng pagsukat). Kunin natin ang isang tampok na sinusukat sa isang rank scale - isang marka ng pagsusulit. Nangangahulugan ba na ang estudyanteng nakatanggap ng deuce ay may kalahating kaalaman kaysa sa nakatanggap ng apat? O ang dalawang mag-aaral na nakatanggap ng triple ay may eksaktong parehong antas ng kaalaman? Ang sagot ay hindi, inaayos ng guro ang kanilang antas ng kaalaman tiyak na pagkakasunod-sunod, alinsunod sa pamantayan para sa pagtatasa ng kaalaman sa tiyak na paksa, ngunit ang distansya sa pagitan ng mga halaga ng tampok sa naturang sukat ay hindi mahigpit na naayos.

Upang matukoy ang pagkakaroon ng isang relasyon sa pagitan ng mga pagtatantya ng ranggo, ginagamit ito Koepisyent ng ugnayan ng ranggo ng Spearman. Ang pagkalkula nito ay batay sa mga pagkakaiba sa pagitan ng mga ranggo.

Tukuyin natin ang pagkakaiba ng mga ranggo d= ranggo Ah~ ranggo AT.

Koepisyent ng Spearman

saan P- bilang ng mga pares ng ranggo na mga obserbasyon.

AT halimbawa, mayroon kaming limang pares ng mga ranggo, samakatuwid, P- 5. Sum ct ay katumbas ng

Pagkatapos ay ang Spearman coefficient

Ang koepisyent ng Spearman ay nag-iiba sa hanay [-1; 1] at binibigyang-kahulugan sa parehong paraan tulad ng koepisyent ng Pearson. Ang pagkakaiba ay na ito ay kinakalkula para sa ranggo na data.

Ang halaga ng 0.6 ay nagbibigay-daan sa amin upang tapusin na mayroong isang kapansin-pansin linear na koneksyon sa pagitan ng dalawang katangian ng mga kalakal.

Ang kahalagahan ng Spearman coefficient ay nasubok sa batayan ng t Kriterya ng mag-aaral ayon sa pormula

Ang halaga ng koepisyent ay itinuturing na makabuluhan kung t kinakalkula > > 6 fit; a (u - 2) para sa isang naibigay na antas ng kahalagahan a.

Ang koepisyent ng ugnayan ng mga ranggo (sa kondisyon na ang mga ranggo ay hindi umuulit) ay maaari ding kalkulahin gamit ang formula na iminungkahi ng English statistician M. Kendall:


saan S- aktwal na pagkakaiba sa ranggo; ~n(n - l) - maximum na kabuuan ng mga ranggo.

Ang koepisyent na ito ay nag-iiba sa hanay mula sa [-1; 1] at binibigyang-kahulugan sa parehong paraan tulad ng koepisyent ng Pearson, ngunit nagbibigay ng mas mahigpit na

pagtatantya ng relasyon kaysa sa koepisyent ng Spearman, at p \u003d - m. Nasisiyahan ang kaugnayang ito kapag malalaking numero mga obserbasyon (n > 30), at mahina o katamtamang malapit na relasyon.

Kapag kinakalkula ang koepisyent ng Kendall, ang sumusunod na pagkakasunud-sunod ng mga aksyon ay sinusunod:

  • 1. Ang mga halaga ng x ay niraranggo sa pataas na pagkakasunud-sunod.
  • 2. Mga pagpapahalaga sa nakaayos ayon sa mga halaga X.
  • 3. Para sa bawat ranggo y, tinutukoy ang bilang ng mga sumusunod na halaga ng mga ranggo na lumalampas sa halaga nito. Ang resulta ay nakasulat sa column na "+".
  • 4. Para sa bawat ranggo sa ang bilang ng mga halaga ng mas mababang ranggo kasunod nito ay tinutukoy. Ang resulta ay nakasulat sa column na "-".
  • 5. Ang halaga ay nasa column na “+” at nakasaad R, sa column na "-" at may denotasyon Q. Determinado S=P-Q.

Ang kahalagahan ng koepisyent ng ugnayan ng mga ranggo ng Kendall ay sinusuri ng formula


saan w_ a / 2 (p- 2) - quantile na tinutukoy mula sa talahanayan ng normal na distribusyon para sa napiling antas ng kahalagahan a at ibinigay P.

Halimbawa 6.8. Kalkulahin ang koepisyent ng Kendall batay sa data sa Halimbawa 6.7.

Desisyon. Gastos tayo mga kinakailangang kalkulasyon sa mesa. 6.8.

Sa katunayan, kung ang nakuha na halaga ng m ay pinarami ng 1.5, makakakuha tayo ng 0.6 - ang halaga ng koepisyent ng Spearman na kinakalkula sa Halimbawa 6.7.

Talahanayan ng pagkalkula

Isaalang-alang ang ugnayan ng mga alternatibong tampok, ibig sabihin, mga tampok na tumatagal ng dalawa lamang posibleng mga halaga. Ang pag-aaral ng kanilang ugnayan ay batay sa mga tagapagpahiwatig na binuo sa apat na cell na mga talahanayan, kung saan ang bilang ng mga yunit para sa setpoints palatandaan:

Desisyon. Upang masukat ang higpit ng relasyon ng mga palatandaan, ang pagkalkula ng contingency coefficient ay isinasagawa ayon sa formula

Ang contingency coefficient ay kumukuha ng mga halaga sa pagitan [-1; isa ]. Ang interpretasyon ay katulad ng koepisyent ng ugnayan. Mayroon kaming mahinang negatibong koneksyon.

Ang isa pang paraan para sa pagsukat ng asosasyon ay batay sa pagkalkula ng koepisyent ng asosasyon:

„ l 30x5-20x15 l „

Nakukuha namin: Q =-= -0,33

Ang minus sign sa harap ng coefficient ay nagpapahiwatig na ang mas maraming mga mag-aaral ay nabakunahan laban sa trangkaso, mas mababa ang saklaw.

Ang contingency factor ay palaging mas mababa sa coefficient asosasyon at nagbibigay ng mas tamang pagtatantya ng higpit ng relasyon.

Upang masuri ang lapit ng ugnayan sa pagitan ng mga feature na kumukuha ng anumang bilang ng mga opsyon sa halaga (pangkategorya, nominal na mga feature), ginagamit ang mutual contingency coefficient ng Pearson. Ang batayan para sa pag-aaral ng kaugnayan sa pagitan ng mga tampok na kategorya ay ang talahanayan ng contingency - bivariate distribution mga yunit ng populasyon ayon sa mga katangian. Ang lahat ng impormasyon tungkol sa pagkakaroon o kawalan ng isang koneksyon ay nakapaloob sa magkasanib na mga frequency ng mga kumbinasyon ng tampok.

Ang impormasyon para sa pagsusuri ng koneksyon na ito ay pinagsama-sama sa anyo ng isang talahanayan (halimbawa, para sa tatlong halaga ng unang katangian at dalawang halaga ng pangalawa), Talahanayan. 6.10.

Talahanayan 6.10

Halimbawa ng cross table

tanda

Kabuuan

gpc

bgpc

Mga pagtatalaga: na- dalas ng magkaparehong kumbinasyon ng dalawang katangiang palatandaan; P = YLmy- bilang ng mga obserbasyon.

Tinutukoy ng formula ang mutual conjugation coefficient ng Pearson

kung saan ang cp ay ang mean square conjugacy index:

Ang mutual conjugacy coefficient ay kumukuha ng mga halaga sa pagitan at binibigyang-kahulugan nang katulad ng coefficient ng pares linear na ugnayan Pearson.

Halimbawa 6.10. Upang pag-aralan ang impluwensya ng mga kondisyon sa pagtatrabaho sa mga relasyon sa koponan, ang isang sample na survey ng 250 empleyado ng negosyo ay isinagawa, ang mga sagot kung saan ay ibinahagi, tulad ng ipinapakita sa Talahanayan. 6.11.

Talahanayan 6.11

Paunang data sa mga kondisyon sa pagtatrabaho at mga relasyon sa koponan

Kinakailangang tukuyin ang kaugnayan sa pagitan ng mga pinag-aralan na indicator gamit ang mutual contingency coefficient ng Pearson.

Desisyon.

Ang nakuhang halaga ng contingency coefficient ay nagpapahiwatig na ang relasyon sa pagitan ng mga kondisyon sa pagtatrabaho at mga relasyon sa koponan ay katamtaman.