Stanovenie významnosti regresnej rovnice. Posúdenie štatistickej významnosti regresnej rovnice jej parametrov

Pre koeficienty regresnej rovnice sa kontroluje ich hladina významnosti podľa t -Študentské kritérium a podľa kritéria F Fisher. Nižšie uvažujeme o hodnotení spoľahlivosti regresných ukazovateľov len pre lineárne rovnice (12.1) a (12.2).

Y=a 0+ a 1 X(12.1)

X = b 0+b 1 Y(12.2)

Pre tento typ rovníc sa vyhodnocujú podľa t-Kritériom študenta sú iba hodnoty koeficientov a 1i b 1 pomocou výpočtu hodnoty tf podľa nasledujúcich vzorcov:

Kde r yx korelačný koeficient a hodnotu a 1 možno vypočítať pomocou vzorcov 12.5 alebo 12.7.

Na výpočet množstva sa používa vzorec (12.27). tf, a 1 regresných rovníc Y na X.

hodnota b 1 možno vypočítať pomocou vzorcov (12.6) alebo (12.8).

Na výpočet množstva sa používa vzorec (12.29). tf,čo umožňuje odhadnúť úroveň významnosti koeficientu b 1 regresných rovníc X na Y

Príklad. Odhadnime úroveň významnosti regresných koeficientov a 1i b 1 rovnice (12.17), a (12.18) získané pri riešení úlohy 12.1. Využime na to vzorce (12.27), (12.28), (12.29) a (12.30).

Pripomeňme si tvar získaných regresných rovníc:

Y x = 3 + 0,06 X(12.17)

Xy = 9+ 1 Y(12.19)

Hodnota a 1 v rovnici (12.17) sa rovná 0,06. Preto na výpočet podľa vzorca (12.27) musíte vypočítať hodnotu Sb y x. Podľa stavu problému, množstva P= 8. Korelačný koeficient sme tiež vypočítali pomocou vzorca 12.9: rxy = √ 0,06 0,997 = 0,244 .

Zostáva vypočítať množstvá Σ (na v- r) 2 a Σ (X ι -X) 2 , ktoré sme nevypočítali. Najlepšie je vykonať tieto výpočty v tabuľke 12.2:

Tabuľka 12.2

Počet skúšaných p / p x ι i x ι –x (x ι –x) 2 na v- r (na v- r) 2
-4,75 22,56 - 1,75 3,06
-4,75 22,56 -0,75 0,56
-2,75 7,56 0,25 0,06
-2,75 7,56 1,25 15,62
1,25 1,56 1,25 15,62
3,25 10,56 0,25 0,06
5,25 27,56 -0,75 0,56
5,25 27,56 0,25 0,06
Sumy 127,48 35,6
Stredná 12,75 3,75

Získané hodnoty dosadíme do vzorca (12.28), dostaneme:

Teraz vypočítajme hodnotu tf podľa vzorca (12.27):

Hodnota tf sa kontroluje na hladinu významnosti podľa tabuľky 16 Prílohy 1 pre t-Študentské kritérium. Počet stupňov voľnosti sa v tomto prípade bude rovnať 8-2 = 6, takže kritické hodnoty sú rovnaké pre P ≤ 0,05 t cr= 2,45 a pre Р≤ 0,01 t cr= 3,71. V prijatej forme to vyzerá takto:

Budujeme „os významnosti“:

Prijatá hodnota tf aleže hodnota regresného koeficientu rovnice (12.17) je na nerozoznanie od nuly. Inými slovami, výsledná regresná rovnica je neadekvátna pôvodným experimentálnym údajom.



Vypočítajme teraz hladinu významnosti koeficientu b 1. Na to je potrebné vypočítať hodnotu Sbxy podľa vzorca (12.30), pre ktorý už boli vypočítané všetky potrebné množstvá:

Teraz vypočítajme hodnotu tf podľa vzorca (12.27):

Okamžite môžeme vytvoriť „os významnosti“, pretože všetky predbežné operácie boli vykonané vyššie:

Prijatá hodnota tf spadol do zóny bezvýznamnosti, preto musíme hypotézu prijať H o tom, že hodnota regresného koeficientu rovnice (12.19) je na nerozoznanie od nuly. Inými slovami, výsledná regresná rovnica je neadekvátna pôvodným experimentálnym údajom.

Nelineárna regresia

Výsledok získaný v predchádzajúcej časti je trochu skľučujúci: zistili sme, že obe regresné rovnice (12.15) a (12.17) nie sú adekvátne experimentálnym údajom. K tomu poslednému došlo, pretože obe tieto rovnice charakterizujú lineárny vzťah medzi znakmi a v časti 11.9 sme ukázali, že medzi premennými X a Y existuje výrazná krivková závislosť. Inými slovami, medzi premennými X a Y v tomto probléme je potrebné hľadať nie lineárne, ale krivočiare spojenia. Urobíme to pomocou balíka „Stage 6.0“ (vyvinutý A.P. Kulaichevom, registračné číslo 1205).

Úloha 12.2. Psychológ chce zvoliť regresný model, ktorý je adekvátny experimentálnym údajom získaným v úlohe 11.9.

rozhodnutie. Tento problém je vyriešený jednoduchým výpočtom krivkových regresných modelov ponúkaných v štatistickom balíku Stadiya. Balík je organizovaný tak, že experimentálne údaje sa vkladajú do tabuľky, ktorá je zdrojom pre ďalšiu prácu, vo forme prvého stĺpca pre premennú X a druhý stĺpec pre premennú Y. Následne sa v hlavnom menu vyberie sekcia Štatistika, v nej podsekcia - regresná analýza, v tejto podsekcii opäť podsekcia - krivočiara regresia. Posledná ponuka obsahuje vzorce (modely) rôznych typov krivočiarej regresie, podľa ktorých môžete vypočítať zodpovedajúce regresné koeficienty a okamžite ich skontrolovať na významnosť. Nižšie uvažujeme len o niekoľkých príkladoch práce s hotovými modelmi (vzorcami) krivočiarej regresie.



1. Prvý model - vystavovateľ . Jeho vzorec je:

Pri výpočte pomocou balíka stat dostaneme a 0 = 1 a a 1 = 0,022.

Výpočet hladiny významnosti pre a dal hodnotu R= 0,535. Je zrejmé, že získaná hodnota je zanedbateľná. Preto je tento regresný model neadekvátny experimentálnym údajom.

2. Druhý model - moc . Jeho vzorec je:

Pri počítaní a o = - 5,29, a, = 7,02 a a 1 = 0,0987.

Úroveň významnosti pre a 1 - R= 7,02 a pre a 2 - P = 0,991. Je zrejmé, že žiadny z koeficientov nie je významný.

3. Tretí model - polynóm . Jeho vzorec je:

Y= a 0 + a 1 X + a 2 x 2+ a 3 X 3

Pri počítaní 0= - 29,8, a 1 = 7,28, a 2 = - 0,488 a a 3 = 0,0103. Úroveň významnosti pre a, - P = 0,143 za 2 - P = 0,2 a za a, - P= 0,272

Záver - tento model nie je adekvátny experimentálnym údajom.

4. Štvrtý model - parabola .

Jeho vzorec je: Y \u003d a o + a l - X 1 + a 2 X 2

Pri počítaní a 0 \u003d - 9,88, a, \u003d 2,24 a a 1 = - 0,0839 Úroveň významnosti pre a 1 - P = 0,0186, pre a 2 - P = 0,0201. Oba regresné koeficienty boli významné. Preto je problém vyriešený - odhalili sme podobu krivočiareho vzťahu medzi úspešnosťou riešenia tretieho Vekslerovho subtestu a úrovňou vedomostí z algebry - ide o závislosť parabolického typu. Tento výsledok potvrdzuje záver získaný pri riešení úlohy 11.9 o prítomnosti krivočiareho vzťahu medzi premennými. Zdôrazňujeme, že práve pomocou krivočiarej regresie bola získaná presná podoba vzťahu medzi skúmanými premennými.


Kapitola 13 ANALÝZA FAKTOROV

Základné pojmy faktorovej analýzy

Faktorová analýza je štatistická metóda, ktorá sa používa pri spracovaní veľkého množstva experimentálnych údajov. Úlohy faktorovej analýzy sú: zníženie počtu premenných (redukcia údajov) a určenie štruktúry vzťahov medzi premennými, t.j. klasifikácia premenných, preto sa faktorová analýza používa ako metóda redukcie údajov alebo ako metóda štrukturálnej klasifikácie.

Dôležitým rozdielom medzi faktorovou analýzou a všetkými vyššie opísanými metódami je to, že ju nemožno použiť na spracovanie primárnych, alebo, ako sa hovorí, „surových“ experimentálnych údajov, t. získané priamo zo skúšky predmetov. Materiálom pre faktorovú analýzu sú korelácie, alebo skôr Pearsonove korelačné koeficienty, ktoré sú vypočítané medzi premennými (t. j. psychologickými charakteristikami) zahrnutými v prieskume. Inými slovami, korelačné matice alebo, ako sa inak nazývajú, interkorelačné matice, sú podrobené faktorovej analýze. Názvy stĺpcov a riadkov v týchto maticiach sú rovnaké, pretože predstavujú zoznam premenných zahrnutých do analýzy. Z tohto dôvodu sú interkorelačné matice vždy štvorcové, t.j. počet riadkov v nich sa rovná počtu stĺpcov a symetrický, t.j. symetrické miesta vzhľadom na hlavnú uhlopriečku majú rovnaké korelačné koeficienty.

Je potrebné zdôrazniť, že pôvodná dátová tabuľka, z ktorej sa korelačná matica získava, nemusí byť štvorcová. Psychologička napríklad merala tri ukazovatele inteligencie (verbálnu, neverbálnu a všeobecnú) a školské známky v troch akademických predmetoch (literatúra, matematika, fyzika) v 100 predmetoch – žiakom deviateho ročníka. Pôvodná dátová matica bude 100 x 6 a interkorelačná matica bude 6 x 6, pretože má iba 6 premenných. Pri toľkých premenných bude interkorelačná matica obsahovať 15 koeficientov a nebude ťažké ju analyzovať.

Predstavte si však, čo sa stane, ak psychológ z každého predmetu dostane nie 6, ale 100 ukazovateľov. V tomto prípade bude musieť analyzovať 4950 korelačných koeficientov. Počet koeficientov v matici sa vypočíta podľa vzorca n (n + 1) / 2 av našom prípade sa rovná (100 × 99) / 2 = 4950.

Je zrejmé, že vykonať vizuálnu analýzu takejto matice je náročná úloha. Namiesto toho môže psychológ vykonať matematický postup faktorovej analýzy korelačnej matice 100 × 100 (100 subjektov a 100 premenných) a týmto spôsobom získať jednoduchší materiál na interpretáciu experimentálnych výsledkov.

Hlavným konceptom faktorovej analýzy je faktor. Ide o umelý štatistický ukazovateľ, ktorý je výsledkom špeciálnych transformácií tabuľky korelačných koeficientov medzi skúmanými psychologickými charakteristikami, prípadne maticou interkorelácií. Postup extrakcie faktorov z interkorelačnej matice sa nazýva faktorizácia matice. V dôsledku faktorizácie možno z korelačnej matice extrahovať rôzny počet faktorov až do počtu, ktorý sa rovná počtu pôvodných premenných. Faktory identifikované ako výsledok faktorizácie však spravidla nemajú rovnakú hodnotu.

Prvky faktorovej matice sa nazývajú alebo váhy"; a sú to korelačné koeficienty daného faktora so všetkými ukazovateľmi použitými v štúdii. Faktorová matica je veľmi dôležitá, pretože ukazuje, ako súvisia študované ukazovatele s každým vybraným faktorom. Faktorová váha zároveň demonštruje mieru alebo blízkosť tohto spojenia.

Keďže každý stĺpec faktorovej matice (faktor) je akousi premennou, môžu spolu korelovať aj samotné faktory. Sú tu možné dva prípady: korelácia medzi faktormi je rovná nule, v tomto prípade sú faktory nezávislé (ortogonálne). Ak je korelácia medzi faktormi väčšia ako nula, potom sa v tomto prípade faktory považujú za závislé (zrejmé). Zdôrazňujeme, že ortogonálne faktory na rozdiel od šikmých dávajú jednoduchšie varianty interakcií v rámci faktorovej matice.

Ako ilustrácia ortogonálnych faktorov sa často uvádza problém L. Thurstonea, ktorý po zobratí množstva krabíc rôznych veľkostí a tvarov nameral v každom z nich viac ako 20 rôznych ukazovateľov a vypočítal medzi nimi korelácie. Faktorizáciou získanej matice interkorelácií získal tri faktory, medzi ktorými sa korelácia rovnala nule. Týmito faktormi boli „dĺžka“, „šírka“ a „výška“.

Aby sme lepšie pochopili podstatu faktorovej analýzy, podrobnejšie rozoberieme nasledujúci príklad.

Predpokladajme, že psychológ dostane nasledujúce údaje od náhodnej vzorky študentov:

V 1- telesná hmotnosť (v kg);

V 2 - počet účasti na prednáškach a seminároch k danej problematike;

V 3- dĺžka nohy (v cm);

V 4- počet prečítaných kníh na túto tému;

V 5- dĺžka ramena (v cm);

V 6 - známka zo skúšky z predmetu ( V- z anglického slova variable - premenlivý).

Pri analýze týchto funkcií nie je nerozumné predpokladať, že premenné V1, K 3 a V 5- budú vzájomne prepojené, pretože čím je človek väčší, tým viac váži a má dlhšie končatiny. To znamená, že medzi týmito premennými by mali byť štatisticky významné korelačné koeficienty, keďže tieto tri premenné merajú niektoré základné vlastnosti jednotlivcov vo vzorke, a to ich veľkosť. Podobne je pravdepodobné, že pri výpočte korelácií medzi V2, V4 a V 6 získajú sa aj dostatočne vysoké korelačné koeficienty, keďže návšteva prednášok a samoštúdium prispeje k dosiahnutiu vyšších známok zo študovaného predmetu.

Teda z celého možného poľa koeficientov, ktoré sa získa spočítaním párov korelovaných znakov V 1 a V 2, V t a V 3 atď., pravdepodobne vyniknú dva bloky štatisticky významných korelácií. Je nepravdepodobné, že by ostatné korelácie – medzi znakmi zahrnutými v rôznych blokoch, mali štatisticky významné koeficienty, pretože vzťahy medzi takými znakmi, ako je veľkosť končatín a akademický výkon, sú s najväčšou pravdepodobnosťou náhodného charakteru. Zmysluplná analýza našich 6 premenných teda ukazuje, že v skutočnosti merajú iba dve zovšeobecnené charakteristiky, a to: veľkosť tela a stupeň pripravenosti subjektu.

K výslednej matici interkorelácií, t.j. párovo vypočítané korelačné koeficienty medzi všetkými šiestimi premennými V 1 – V 6, je prípustné použiť faktorovú analýzu. Dá sa to realizovať aj ručne, pomocou kalkulačky, ale postup takéhoto štatistického spracovania je veľmi prácny. Z tohto dôvodu sa faktorová analýza v súčasnosti vykonáva na počítačoch, zvyčajne pomocou štandardných štatistických balíkov. Všetky moderné štatistické balíky majú programy na koreláciu a faktorovú analýzu. Počítačový program faktorovej analýzy sa v podstate pokúša „vysvetliť“ korelácie medzi premennými v podmienkach malého počtu faktorov (v našom príklade dvoch).

Predpokladajme, že sme pomocou počítačového programu získali maticu interkorelácií všetkých šiestich premenných a podrobili ju faktorovej analýze. Ako výsledok faktorovej analýzy sa získala tabuľka 13.1, ktorá sa nazýva „faktorová matica“ alebo „faktorová štrukturálna matica“.

Tabuľka 13.1

Variabilné Faktor 1 Faktor 2
V 1 0,91 0,01
V 2 0,20 0,96
V 3 0,94 -0,15
V 4 0,11 0,85
V 5 0,89 0,07
V 6 -0,13 0,93

Tradične sú faktory v tabuľke reprezentované ako stĺpce a premenné ako riadky. Záhlavia stĺpcov tabuľky 13.1 zodpovedajú číslam vybraných faktorov, ale presnejšie by bolo pre faktor 1 ich nazvať „faktorové zaťaženia“ alebo „váhy“, to isté pre faktor 2. Ako je uvedené vyššie, faktorové zaťaženia alebo váhy sú korelácie medzi príslušnou premennou a daným faktorom. Napríklad prvé číslo 0,91 v prvom faktore znamená, že korelácia medzi prvým faktorom a premennou V 1 rovná sa 0,91. Čím vyššie je zaťaženie faktora v absolútnej hodnote, tým väčší je jeho vzťah s faktorom.

Tabuľka 13.1 ukazuje, že premenné V 1 V 3 a V 5 majú veľké korelácie s faktorom 1 (v skutočnosti má premenná 3 koreláciu blízkou 1 s faktorom 1). Zároveň premenné V 2 ,V 3 a 5 majú korelácie blízke 0 s faktorom 2. Podobne faktor 2 vysoko koreluje s premennými V2, V4 a V 6 a v skutočnosti nekoreluje s premennými V 1,V 3 a V 5

V tomto príklade je zrejmé, že existujú dve korelačné štruktúry, a preto všetky informácie v tabuľke 13.1 určujú dva faktory. Teraz začína posledná fáza práce - interpretácia získaných údajov. Pri analýze faktorovej matice je veľmi dôležité brať do úvahy znaky faktorových zaťažení v každom faktore. Ak sa zaťaženia s opačnými znamienkami vyskytujú v rovnakom faktore, znamená to, že medzi premennými s opačnými znamienkami existuje nepriamo úmerný vzťah.

Všimnite si, že pri interpretácii faktora je pre pohodlie možné obrátiť znamienka všetkých zaťažení pre tento faktor.

Faktorová matica tiež ukazuje, ktoré premenné tvoria jednotlivé faktory. Je to spôsobené predovšetkým úrovňou významnosti faktora váhy. Tradične sa minimálna úroveň významnosti korelačných koeficientov vo faktorovej analýze berie ako 0,4 alebo dokonca 0,3 (v absolútnej hodnote), pretože neexistujú žiadne špeciálne tabuľky, pomocou ktorých by sa dali určiť kritické hodnoty pre úroveň významnosti vo faktorovej matici. . Preto najjednoduchším spôsobom, ako zistiť, ktoré premenné „patria“ k faktoru, je označiť tie, ktoré majú zaťaženie väčšie ako 0,4 (alebo menšie ako -0,4). Upozorňujeme, že v počítačových balíkoch niekedy úroveň významnosti faktorovej váhy určuje samotný program a je nastavená na vyššiu úroveň, napríklad 0,7.

Z tabuľky 13.1 teda vyplýva, že faktor 1 je kombináciou premenných V 1 K 3 a V 5(ale nie V1, K 4 a V 6 , pretože ich faktor zaťaženia modulo je menší ako 0,4). Rovnako faktor 2 je kombináciou premenných V2, V4 a V6.

Faktor vybraný ako výsledok faktorizácie je súbor tých premenných zahrnutých do analýzy, ktoré majú významné zaťaženie. Často sa však stáva, že faktor obsahuje iba jednu premennú s významnou váhou faktora, zatiaľ čo zvyšok má nevýznamné zaťaženie faktorom. V tomto prípade bude faktor určený názvom jedinej významnej premennej.

Faktor možno v podstate považovať za umelú „jednotku“ zoskupovania premenných (vlastností) na základe väzieb medzi nimi. Táto jednotka je podmienená, pretože zmenou určitých podmienok postupu faktorizácie interkorelačnej matice môžete získať inú faktorovú maticu (štruktúru). V novej matici sa distribúcia premenných podľa faktorov a ich faktorové zaťaženie môže ukázať ako odlišné.

V tejto súvislosti existuje vo faktorovej analýze pojem „jednoduchá štruktúra“. Jednoduchá je štruktúra faktorovej matice, v ktorej má každá premenná významné zaťaženie len v jednom z faktorov a samotné faktory sú ortogonálne, t.j. nezávisia na sebe. V našom príklade sú dva spoločné faktory nezávislé. Faktorová matica s jednoduchou štruktúrou vám umožňuje interpretovať výsledok a pomenovať každý faktor. V našom prípade je prvým faktorom „veľkosť tela“, druhým faktorom je „úroveň kondície“.

Uvedené nevyčerpáva zmysluplné možnosti faktorovej matice. Z neho možno extrahovať ďalšie charakteristiky, ktoré umožňujú podrobnejšie štúdium vzťahov medzi premennými a faktormi. Tieto charakteristiky sa nazývajú „spoločnosť“ a „vlastná hodnota“ faktora.

Pred uvedením ich popisu však poukážeme na jednu zásadne dôležitú vlastnosť korelačného koeficientu, vďaka ktorej sa tieto charakteristiky získavajú. Korelačný koeficient, umocnený na druhú (t. j. vynásobený sebou samým), ukazuje, do akej miery je rozptyl (variant) znaku spoločný pre dve premenné, alebo, jednoduchšie povedané, do akej miery sa tieto premenné prekrývajú. Takže napríklad dve premenné s koreláciou 0,9 sa prekrývajú s mocninou 0,9 x 0,9 = 0,81. To znamená, že 81 % rozptylu oboch premenných je spoločných, t.j. zápas. Pripomeňme si, že faktorové zaťaženia vo faktorovej matici sú korelačné koeficienty medzi faktormi a premennými, preto štvorcové faktorové zaťaženie charakterizuje stupeň zhody (alebo prekrývania) rozptylov danej premennej a daného faktora.

Ak získané faktory na sebe nezávisia („ortogonálne“ riešenie), je možné z váh faktorovej matice určiť, aká časť rozptylu je pre premennú a faktor spoločná. Ak chcete vypočítať, aká veľká časť rozptylu každej premennej sa zhoduje s rozptylom faktorov, môžete jednoducho sčítať druhé mocniny zaťažení faktorov nad všetkými faktormi. Z tabuľky 13.1 napríklad vyplýva, že 0,91 × 0,91 + + 0,01 × 0,01 = 0,8282, t.j. asi 82 ​​% variability prvej premennej je „vysvetlených“ prvými dvoma faktormi. Výsledná hodnota je tzv spoločná premenná, v tomto prípade premenná V 1

Premenné môžu mať rôzne stupne zhody s faktormi. Premenná s väčšou všeobecnosťou má významný stupeň prekrytia (veľká časť rozptylu) s jedným alebo viacerými faktormi. Nízka všeobecnosť znamená, že všetky korelácie medzi premennými a faktormi sú malé. To znamená, že žiadny z faktorov nemá prekrývajúci sa podiel rozptylu s touto premennou. Nízka všeobecnosť môže naznačovať, že premenná meria niečo kvalitatívne odlišné od ostatných premenných zahrnutých do analýzy. Napríklad jedna premenná spojená s hodnotením motivácie medzi úlohami, ktoré hodnotia schopnosti, bude mať takmer nulovú zhodu s faktormi schopností.

Nízka všeobecnosť môže tiež znamenať, že konkrétna položka je silne ovplyvnená chybou merania alebo je pre subjekt mimoriadne náročná. Je tiež možné, naopak, že úloha je taká jednoduchá, že každý subjekt na ňu dá správnu odpoveď, alebo je úloha obsahovo taká vágna, že subjekt nerozumie podstate otázky. Nízka všeobecnosť teda znamená, že táto premenná sa nezhoduje s faktormi z jedného z nasledujúcich dôvodov: buď premenná meria iný koncept, alebo má premenná veľkú chybu merania, alebo existujú rozdiely medzi subjektmi v možnostiach odozvy. položka, ktorá skresľuje rozptyl funkcie.

Nakoniec, pomocou takej charakteristiky, akou je vlastná hodnota faktora, je možné určiť relatívnu dôležitosť každého z vybraných faktorov. Aby ste to dosiahli, musíte vypočítať, akú veľkú časť rozptylu (variancie) jednotlivé faktory vysvetľujú. Faktor, ktorý vysvetľuje 45 % rozptylu (prekrývania) medzi premennými v pôvodnej korelačnej matici, je zjavne významnejší ako faktor, ktorý vysvetľuje iba 25 % rozptylu. Tieto argumenty sú však prípustné, ak sú faktory ortogonálne, inými slovami, nezávisia na sebe.

Aby ste mohli vypočítať vlastnú hodnotu faktora, musíte odmocniť zaťaženia faktorov a pridať ich do stĺpca. Pomocou údajov v tabuľke 13.1 môžeme overiť, že vlastná hodnota faktora 1 je (0,91 × 0,91 + 0,20 × 0,20 + 0,94 × 0,94 + 0,11 × 0,11 + 0,84 × 0,84 + (- 0,13) ×

x (-0,13)) = 2,4863. Ak sa vlastná hodnota faktora vydelí počtom premenných (v našom príklade 6), potom výsledné číslo ukáže, aký podiel rozptylu vysvetľuje tento faktor. V našom prípade dostaneme 2,4863∙100 %/6 = 41,4 %. Inými slovami, faktor 1 vysvetľuje asi 41 % informácií (rozptyl) v pôvodnej korelačnej matici. Podobný výpočet pre druhý faktor poskytne 41,5 %. Celkovo to bude 82,9 %.

Dva spoločné faktory teda pri kombinácii vysvetľujú len 82,9 % rozptylu v ukazovateľoch pôvodnej korelačnej matice. Čo sa stalo so „zvyšnými“ 17,1 %? Faktom je, že vzhľadom na korelácie medzi 6 premennými sme zistili, že korelácie spadajú do dvoch samostatných blokov, a preto sme sa rozhodli, že je logické analyzovať materiál z hľadiska dvoch faktorov, a nie 6, ako aj počtu počiatočné premenné. Inými slovami, počet konštruktov potrebných na opis údajov sa znížil zo 6 (počet premenných) na 2 (počet spoločných faktorov). V dôsledku faktorizácie bola časť informácií v pôvodnej korelačnej matici obetovaná konštrukcii dvojfaktorového modelu. Jedinou podmienkou, pri ktorej sa nestratia informácie, by bolo zvážiť šesťfaktorový model.

Záverečné testy z ekonometrie

1. Hodnotenie významnosti parametrov regresnej rovnice sa vykonáva na základe:

A) t - Študentovo kritérium;

b) F-kritérium Fisher - Snedekor;

c) stredná kvadratická chyba;

d) priemerná chyba aproximácie.

2. Regresný koeficient v rovnici charakterizujúcej vzťah medzi objemom tržieb (mil. rubľov) a ziskom podnikov v automobilovom priemysle za rok (mil. rubľov) znamená, že pri zvýšení objemu tržieb o r. 1 miliónov rubľov zisk sa zvyšuje o:

d) 0,5 milióna trieť.;

c) 500 tis. trieť.;

D) 1,5 milióna rubľov

3. Korelačný pomer (korelačný index) meria mieru blízkosti vzťahu medzi X aY:

a) len s nelineárnou formou závislosti;

B) s akoukoľvek formou závislosti;

c) len s lineárnym vzťahom.

4. V smere komunikácie sú:

a) mierny;

B) rovné;

c) priamočiary.

5. Na základe 17 pozorovaní bola zostavená regresná rovnica:
.
Aby sme skontrolovali význam rovnice, vypočítali smepozorovaná hodnotat- štatistika: 3.9. záver:

A) Rovnica je významná pre a = 0,05;

b) Rovnica je nevýznamná pri a = 0,01;

c) Rovnica nie je významná pri a = 0,05.

6. Aké sú dôsledky porušenia predpokladu OLS „očakávanie regresných zvyškov je nulové“?

A) Skreslené odhady regresných koeficientov;

b) efektívne, ale nekonzistentné odhady regresných koeficientov;

c) Neefektívne odhady regresných koeficientov;

d) Nekonzistentné odhady regresných koeficientov.

7. Ktoré z nasledujúcich tvrdení je pravdivé v prípade heteroskedasticity rezíduí?

A) Závery o štatistike t a F sú nespoľahlivé;

d) Odhady parametrov regresnej rovnice sú skreslené.

8. Na čom je založený Spearmanov test korelácie hodnotenia?

A) o používaní t - štatistiky;

c) Pri používaní ;

9. Na čom je založený White test?

b) o používaní F-štatistiky;

B) v používaní ;

d) O grafickej analýze zvyškov.

10. Akú metódu možno použiť na odstránenie autokorelácie?

11. Ako sa nazýva porušenie predpokladu nemennosti rozptylu rezíduí?

a) multikolinearita;

b) autokorelácia;

B) heteroskedasticita;

d) homoskedasticita.

12. Falošné premenné sa zavádzajú do:

a) len v lineárnych modeloch;

b) len pri viacnásobnej nelineárnej regresii;

c) len v nelineárnych modeloch;

D) lineárne aj nelineárne modely redukované na lineárnu formu.

13. Ak v matici párových korelačných koeficientov sú
, potom to ukazuje:

A) O prítomnosti multikolinearity;

b) o absencii multikolinearity;

c) o prítomnosti autokorelácie;

d) O absencii heteroskedasticity.

14. Aké opatrenie je nemožné zbaviť sa multikolinearity?

a) Zväčšenie veľkosti vzorky;

D) Transformácia náhodnej zložky.

15. Ak
a poradie matice A je menšie ako (K-1), potom platí rovnica:

a) nadmerne identifikované;

B) neidentifikované;

c) presne identifikované.

16. Regresná rovnica vyzerá takto:

ALE)
;

b)
;

v)
.

17. Aký je problém identifikácie modelu?

A) získanie jednoznačne definovaných parametrov modelu daných sústavou simultánnych rovníc;

b) výber a implementácia metód štatistického odhadu neznámych parametrov modelu podľa počiatočných štatistických údajov;

c) kontrola primeranosti modelu.

18. Aká metóda sa používa na odhad parametrov nadmerne identifikovanej rovnice?

C) DMNK, KMNK;

19. Ak kvalitatívna premenná mákalternatívne hodnoty, potom simulácia používa:

A) (k-1) fiktívna premenná;

b) kdummy premenné;

c) (k+1) fiktívna premenná.

20. Analýza blízkosti a smeru väzieb dvoch označení sa vykonáva na základe:

A) párový korelačný koeficient;

b) koeficient determinácie;

c) viacnásobný korelačný koeficient.

21. V lineárnej rovnici X = a 0 +a 1 x regresný koeficient ukazuje:

a) blízkosť spojenia;

b) podiel rozptylu "Y" v závislosti od "X";

C) o koľko sa v priemere zmení "Y", keď sa "X" zmení o jednu jednotku;

d) chyba korelačného koeficientu.

22. Aký ukazovateľ sa používa na určenie časti odchýlky v dôsledku zmeny hodnoty skúmaného faktora?

a) variačný koeficient;

b) korelačný koeficient;

C) koeficient determinácie;

d) koeficient pružnosti.

23. Koeficient pružnosti ukazuje:

A) o koľko % sa zmení hodnota y, keď sa x zmení o 1 %;

b) o koľko jednotiek jeho merania sa zmení hodnota y, keď sa x zmení o 1 %;

c) o koľko % sa zmení hodnota y, keď sa x zmení o jednotku. vaše meranie.

24. Aké metódy možno použiť na zistenie heteroskedasticity?

A) Golfeld-Quandt test;

B) Spearmanov test hodnostnej korelácie;

c) Durbin-Watsonov test.

25. Čo je základom Golfeld-Quandtovho testu

a) o používaní t-štatistiky;

B) O používaní F - štatistiky;

c) Pri používaní ;

d) O grafickej analýze zvyškov.

26. Aké metódy nemožno použiť na odstránenie autokorelácie rezíduí?

a) Zovšeobecnená metóda najmenších štvorcov;

B) metóda vážených najmenších štvorcov;

C) metóda maximálnej pravdepodobnosti;

D) Dvojkroková metóda najmenších štvorcov.

27. Ako sa nazýva porušenie predpokladu nezávislosti rezíduí?

a) multikolinearita;

B) autokorelácia;

c) heteroskedasticita;

d) homoskedasticita.

28. Akú metódu možno použiť na odstránenie heteroskedasticity?

A) Zovšeobecnená metóda najmenších štvorcov;

b) metóda vážených najmenších štvorcov;

c) metóda maximálnej pravdepodobnosti;

d) Dvojkroková metóda najmenších štvorcov.

30. Ak dot-kritérium, väčšina regresných koeficientov je štatisticky významná a model ako celokF- kritérium je bezvýznamné, potom to môže znamenať:

a) multikolinearita;

B) O autokorelácii rezíduí;

c) o heteroskedasticite zvyškov;

d) Táto možnosť nie je možná.

31. Je možné zbaviť sa multikolinearity transformáciou premenných?

a) Toto opatrenie je účinné len vtedy, keď sa zväčší veľkosť vzorky;

32. Akou metódou možno nájsť odhady parametra rovnice lineárnej regresie:

A) metóda najmenších štvorcov;

b) korelačná a regresná analýza;

c) analýza rozptylu.

33. Zostrojí sa rovnica viacnásobnej lineárnej regresie s fiktívnymi premennými. Na kontrolu významnosti jednotlivých koeficientov používame distribúcia:

a) normálne;

b) študent;

c) Pearson;

d) Fischer-Snedekor.

34. Ak
a poradie matice A je väčšie ako (K-1), potom platí rovnica:

A) nadmerne identifikované;

b) neidentifikované;

c) presne identifikované.

35. Na odhad parametrov presne identifikovateľnej sústavy rovníc sa používa:

a) DMNK, KMNK;

b) DMNK, MNK, KMNK;

36. Chowovo kritérium je založené na použití:

A) F - štatistika;

b) t - štatistika;

c) Durbin-Watsonove kritériá.

37. Falošné premenné môžu nadobúdať nasledujúce hodnoty:

d) akékoľvek hodnoty.

39. Na základe 20 pozorovaní bola zostavená regresná rovnica:
.
Na kontrolu významnosti rovnice sa vypočíta hodnota štatistiky:4.2. Zistenia:

a) Rovnica je významná pri a=0,05;

b) Rovnica nie je významná pri a=0,05;

c) Rovnica nie je významná pri a=0,01.

40. Ktoré z nasledujúcich tvrdení nie je pravdivé, ak sú zvyšky heteroskedastické?

a) Závery o štatistike t a F sú nespoľahlivé;

b) Heteroskedasticita sa prejavuje nízkou hodnotou štatistiky Durbin-Watson;

c) Pri heteroskedasticite zostávajú odhady účinné;

d) Odhady sú skreslené.

41. Chow test je založený na porovnaní:

A) disperzie;

b) koeficienty determinácie;

c) matematické očakávania;

d) stredná.

42. Ak v teste Chow
potom sa uvažuje:

A) že rozdelenie na podintervaly je užitočné z hľadiska zlepšenia kvality modelu;

b) model je štatisticky nevýznamný;

c) model je štatisticky významný;

d) že nemá zmysel deliť vzorku na časti.

43. Falošné premenné sú premenné:

kvalita;

b) náhodné;

B) kvantitatívne;

d) logické.

44. Ktorú z nasledujúcich metód nemožno použiť na zistenie autokorelácie?

a) Sériová metóda;

b) Durbin-Watsonov test;

c) Spearmanov test hodnostnej korelácie;

D) Whiteov test.

45. Najjednoduchšia štrukturálna forma modelu je:

ALE)

b)

v)

G)
.

46. ​​​​Aké opatrenia možno prijať, aby sme sa zbavili multikolinearity?

a) Zväčšenie veľkosti vzorky;

b) Vylúčenie premenných vysoko korelovaných so zvyškom;

c) zmena špecifikácie modelu;

d) Transformácia náhodnej zložky.

47. Ak
a poradie matice A je (K-1), potom rovnica:

a) nadmerne identifikované;

b) neidentifikované;

B) presne identifikované;

48. Model sa považuje za identifikovaný, ak:

a) medzi rovnicami modelu je aspoň jedna normálna;

B) každá rovnica systému je identifikovateľná;

c) medzi modelovými rovnicami je aspoň jedna neidentifikovaná;

d) medzi rovnicami modelu je aspoň jedna preidentifikovaná.

49. Aká metóda sa používa na odhad parametrov neidentifikovanej rovnice?

a) DMNK, KMNK;

b) DMNC, MNC;

C) parametre takejto rovnice sa nedajú odhadnúť.

50. Na križovatke akých oblastí poznania vznikla ekonometria:

A) ekonomická teória; ekonomická a matematická štatistika;

b) ekonomická teória, matematická štatistika a teória pravdepodobnosti;

c) ekonomická a matematická štatistika, teória pravdepodobnosti.

51. V rovnici viacnásobnej lineárnej regresie sú intervaly spoľahlivosti zostavené pre regresné koeficienty pomocou rozdelenia:

a) normálne;

B) študent;

c) Pearson;

d) Fischer-Snedekor.

52. Na základe 16 pozorovaní bola zostrojená párová lineárna regresná rovnica. Prekontrola významnosti regresného koeficientu vypočítanát za 6l =2.5.

a) Koeficient je nevýznamný pri a=0,05;

b) Koeficient je významný pri a=0,05;

c) Koeficient je významný pri a=0,01.

53. Je známe, že medzi kvantXaYexistujúpozitívne spojenie. Do akej mieryje párový korelačný koeficient?

a) od -1 do 0;

b) od 0 do 1;

C) od -1 do 1.

54. Koeficient viacnásobnej korelácie je 0,9. Aké percentorozptyl výsledného atribútu sa vysvetľuje vplyvom všetfaktorové vlastnosti?

55. Ktorú z nasledujúcich metód nemožno použiť na zistenie heteroskedasticity?

A) Golfeld-Quandt test;

b) Spearmanov test hodnostnej korelácie;

c) sériová metóda.

56. Daná forma modelu je:

a) systém nelineárnych funkcií exogénnych premenných od endogénnych;

B) systém lineárnych funkcií endogénnych premenných od exogénnych;

c) sústava lineárnych funkcií exogénnych premenných od endogénnych;

d) sústava normálnych rovníc.

57. V akých medziach sa mení parciálny korelačný koeficient vypočítaný rekurzívnymi vzorcami?

a) od - na + ;

b) od 0 do 1;

c) od 0 do + ;

D) od -1 do +1.

58. V akých medziach sa mení koeficient parciálnej korelácie vypočítaný prostredníctvom koeficientu determinácie?

a) od - na + ;

B) od 0 do 1;

c) od 0 do + ;

d) od –1 do +1.

59. Exogénne premenné:

a) závislé premenné;

B) nezávislé premenné;

61. Pri pridávaní ďalšieho vysvetľujúceho faktora do regresnej rovnice koeficient viacnásobnej korelácie:

a) sa zníži

b) zvýši sa;

c) zachovať svoju hodnotu.

62. Bola zostavená hyperbolická regresná rovnica:Y= a+ b/ X. PreTest významnosti rovnice používa rozdelenie:

a) normálne;

B) študent;

c) Pearson;

d) Fischer-Snedekor.

63. Pre aké typy systémov možno zistiť parametre jednotlivých ekonometrických rovníc pomocou tradičnej metódy najmenších štvorcov?

a) sústava normálnych rovníc;

B) sústava nezávislých rovníc;

C) sústava rekurzívnych rovníc;

D) sústava vzájomne závislých rovníc.

64. Endogénne premenné:

A) závislé premenné;

b) nezávislé premenné;

c) z predchádzajúcich bodov.

65. V akých medziach sa mení koeficient determinácie?

a) od 0 do + ;

b) od - na + ;

C) od 0 do +1;

d) od -l do +1.

66. Bola zostavená rovnica viacnásobnej lineárnej regresie. Na kontrolu významnosti jednotlivých koeficientov používame distribúcia:

a) normálne;

b) študent;

c) Pearson;

D) Fischer-Snedekor.

67. Pri doplnení ďalšieho vysvetľujúceho faktora do regresnej rovnice koeficient determinácie:

a) sa zníži

B) sa zvýši;

c) zachovať si svoju hodnotu;

d) nebude klesať.

68. Podstatou metódy najmenších štvorcov je, že:

A) odhad sa určí z podmienky minimalizácie súčtu kvadrátov odchýlok vzorových údajov od určeného odhadu;

b) odhad sa určí z podmienky minimalizácie súčtu odchýlok výberových údajov od zisteného odhadu;

c) odhad je určený z podmienky minimalizácie súčtu druhých mocnín odchýlok výberového priemeru od výberového rozptylu.

69. Do ktorej triedy nelineárnych regresií patrí parabola:

73. Do ktorej triedy nelineárnych regresií patrí exponenciálna krivka:

74. Do ktorej triedy nelineárnych regresií patrí funkcia tvaru ŷ
:

A) regresie, ktoré sú nelineárne vzhľadom na premenné zahrnuté v analýze, ale lineárne vzhľadom na odhadované parametre;

b) nelineárne regresie na odhadovaných parametroch.

78. Do ktorej triedy nelineárnych regresií patrí funkcia tvaru ŷ
:

a) regresie, ktoré sú nelineárne vzhľadom na premenné zahrnuté v analýze, ale lineárne vzhľadom na odhadované parametre;

B) nelineárne regresie na odhadovaných parametroch.

79. V regresnej rovnici v tvare hyperboly ŷ
ak je hodnota
b >0 , potom:

A) so zvýšením faktora X hodnotu výsledného atribútu pri pomaly klesať a x→∞ priemerná hodnota pri sa bude rovnať a;

b) hodnota efektívneho znaku pri sa zvyšuje s pomalým rastom so zvýšením faktora X, a o x→∞

81. Koeficient pružnosti je určený vzorcom

A) Lineárna funkcia;

b) paraboly;

c) hyperboly;

d) exponenciálna krivka;

e) Výkon.

82. Koeficient pružnosti je určený vzorcom
pre regresný model v tvare:

a) lineárna funkcia;

B) paraboly;

c) hyperboly;

d) exponenciálna krivka;

e) Výkon.

86. Rovnica
s názvom:

A) lineárny trend

b) parabolický trend;

c) hyperbolický trend;

d) exponenciálny trend.

89. Rovnica
s názvom:

a) lineárny trend;

b) parabolický trend;

c) hyperbolický trend;

D) exponenciálny trend.

90. Systémové pohľady s názvom:

A) sústava nezávislých rovníc;

b) sústava rekurzívnych rovníc;

c) sústava vzájomne závislých (simultánnych, simultánnych) rovníc.

93. Ekonometria môže byť definovaná ako:

A) je to samostatná vedná disciplína, ktorá spája súbor teoretických výsledkov, techník, metód a modelov navrhnutých tak, aby na základe ekonomickej teórie, ekonomickej štatistiky a matematicko-štatistických nástrojov konkrétne kvantitatívne vyjadrili všeobecné (kvalitatívne) vzorce kvôli ekonomickej teórii;

B) veda o ekonomických meraniach;

C) štatistická analýza ekonomických údajov.

94. Medzi úlohy ekonometrie patrí:

A) prognóza ekonomických a sociálno-ekonomických ukazovateľov charakterizujúcich stav a vývoj analyzovaného systému;

B) simulácia možných scenárov sociálno-ekonomického vývoja systému s cieľom identifikovať, ako plánované zmeny určitých zvládnuteľných parametrov ovplyvnia výstupné charakteristiky;

c) testovanie hypotéz podľa štatistických údajov.

95. Vzťahy sa vyznačujú svojou povahou:

A) funkčné a korelačné;

b) funkčné, krivočiare a priamočiare;

c) korelačné a inverzné;

d) štatistické a priame.

96. S priamym spojením so zvýšením faktora:

a) efektívny znak klesá;

b) efektívny atribút sa nemení;

C) ukazovateľ výkonnosti sa zvyšuje.

97. Aké metódy sa používajú na identifikáciu prítomnosti, povahy a smeru asociácie v štatistike?

a) priemerné hodnoty;

B) porovnanie rovnobežných radov;

C) analytická metóda zoskupovania;

d) relatívne hodnoty;

D) grafická metóda.

98. Aká metóda sa používa na identifikáciu foriem vplyvu niektorých faktorov na iné?

a) korelačná analýza;

B) regresná analýza;

c) indexová analýza;

d) analýza rozptylu.

99. Aká metóda sa používa na kvantifikáciu sily vplyvu niektorých faktorov na iné:

A) korelačná analýza;

b) regresná analýza;

c) metóda priemerov;

d) analýza rozptylu.

100. Aké ukazovatele v ich veľkosti existujú v rozsahu od mínus po plus jeden:

a) koeficient determinácie;

b) korelačný pomer;

C) koeficient lineárnej korelácie.

101. Regresný koeficient pre jednofaktorový model ukazuje:

A) o koľko jednotiek sa funkcia zmení, keď sa argument zmení o jednu jednotku;

b) o koľko percent sa funkcia zmení na jednotku zmeny v argumente.

102. Koeficient pružnosti ukazuje:

a) o koľko percent sa zmení funkcia pri zmene argumentu o jednu jednotku jej merania;

B) o koľko percent sa funkcia zmení pri zmene argumentu o 1%;

c) o koľko jednotiek svojej merania sa funkcia zmení pri zmene argumentu o 1 %.

105. Hodnota korelačného indexu rovná 0,087 znamená:

A) o ich slabej závislosti;

b) silný vzťah;

c) chyby vo výpočtoch.

107. Hodnota párového korelačného koeficientu rovná 1,12 udáva:

a) o ich slabej závislosti;

b) silný vzťah;

C) o chybách vo výpočtoch.

109. Ktoré z uvedených čísel môžu byť hodnoty párového korelačného koeficientu:

111. Ktoré z uvedených čísel môžu byť hodnoty viacnásobného korelačného koeficientu:

115. Označte správny tvar rovnice lineárnej regresie:

a) s
;

b) ŷ
;

c) ŷ
;

D Y
.

Po vyhodnotení parametrov a a b, dostali sme regresnú rovnicu, pomocou ktorej môžeme odhadnúť hodnoty r podľa nastavených hodnôt X. Je prirodzené predpokladať, že vypočítané hodnoty závislej premennej sa nebudú zhodovať so skutočnými hodnotami, pretože regresná čiara vo všeobecnosti opisuje vzťah iba v priemere. Okolo nej sú roztrúsené samostatné významy. Spoľahlivosť vypočítaných hodnôt získaných z regresnej rovnice je teda do značnej miery určená rozptylom pozorovaných hodnôt okolo regresnej čiary. V praxi je rozptyl chyby spravidla neznámy a odhaduje sa z pozorovaní súčasne s regresnými parametrami. a a b. Je celkom logické predpokladať, že odhad súvisí so súčtom druhých mocnín regresných zvyškov. Veličina je vzorový odhad rozptylu porúch obsiahnutých v teoretickom modeli . Dá sa ukázať, že pre párový regresný model

kde je odchýlka skutočnej hodnoty závislej premennej od jej vypočítanej hodnoty.

Ak , potom pre všetky pozorovania sa skutočné hodnoty závislej premennej zhodujú s vypočítanými (teoretickými) hodnotami . Graficky to znamená, že teoretická regresná priamka (priamka zostrojená z funkcie ) prechádza všetkými bodmi korelačného poľa, čo je možné len pri striktne funkčnom spojení. Preto efektívne znamenie priúplne v dôsledku vplyvu faktora X.

Zvyčajne v praxi dochádza k určitému rozptylu bodov korelačného poľa voči teoretickej regresnej priamke, teda k odchýlkam empirických údajov od teoretických. Tento rozptyl je spôsobený jednak vplyvom faktora X, t.j. regresia r na X, (takýto rozptyl sa nazýva vysvetlený, pretože ho vysvetľuje regresná rovnica) a pôsobenie iných príčin (nevysvetlená variácia, náhodná). Veľkosť týchto odchýlok je základom výpočtu ukazovateľov kvality rovnice.

Podľa základného princípu analýzy rozptylu celkový súčet kvadrátov odchýlok závislej premennej r od strednej hodnoty možno rozložiť na dve zložky: vysvetlené regresnou rovnicou a nevysvetlené:

,

kde - hodnoty r, vypočítané podľa rovnice .

Nájdite pomer súčtu štvorcových odchýlok vysvetlených regresnou rovnicou k celkovému súčtu štvorcov:

, kde

. (7.6)

Pomer časti rozptylu vysvetlenej regresnou rovnicou k celkovému rozptylu výsledného znaku sa nazýva koeficient determinácie. Hodnota nemôže presiahnuť jednu a táto maximálna hodnota bude dosiahnutá len pri , t.j. keď je každá odchýlka nulová a preto všetky body bodového grafu ležia presne na priamke.

Koeficient determinácie charakterizuje podiel rozptylu vysvetleného regresiou na celkovej hodnote rozptylu závislej premennej . Hodnota teda charakterizuje podiel variácie (rozptyl) y, nevysvetliteľné regresnou rovnicou, a teda spôsobené vplyvom iných faktorov, ktoré sa v modeli nezohľadňujú. Čím bližšie k jednej, tým je model kvalitnejší.



Pri párovej lineárnej regresii sa koeficient determinácie rovná štvorcu párového lineárneho korelačného koeficientu: .

Koreňom tohto koeficientu determinácie je koeficient (index) viacnásobnej korelácie alebo teoretický korelačný pomer.

Aby sme zistili, či hodnota koeficientu determinácie získaná pri hodnotení regresie skutočne odráža skutočný vzťah medzi r a X skontrolujte význam zostrojenej rovnice ako celku a jednotlivých parametrov. Testovanie významnosti regresnej rovnice umožňuje zistiť, či je regresná rovnica vhodná na praktické použitie, napríklad na prognózovanie alebo nie.

Zároveň je predložená hlavná hypotéza o nevýznamnosti rovnice ako celku, ktorá sa formálne redukuje na hypotézu, že regresné parametre sa rovnajú nule, alebo, čo je rovnaké, že koeficient determinácie je rovnaký. na nulu: . Alternatívnou hypotézou o významnosti rovnice je hypotéza, že regresné parametre sa nerovnajú nule alebo že koeficient determinácie sa nerovná nule: .

Na testovanie významnosti regresného modelu použite F- Fisherovo kritérium vypočítané ako pomer súčtu štvorcov (na jednu nezávislú premennú) k reziduálnemu súčtu štvorcov (na jeden stupeň voľnosti):

, (7.7)

kde k je počet nezávislých premenných.

Po vydelení čitateľa a menovateľa vzťahu (7.7) celkovým súčtom kvadrátov odchýlok závislej premennej, F- Kritérium možno ekvivalentne vyjadriť pomocou koeficientu:

.

Ak je nulová hypotéza pravdivá, potom sa rozptyl vysvetlený regresnou rovnicou a nevysvetlený (reziduálny) rozptyl navzájom nelíšia.

Odhadovaná hodnota F- kritérium sa porovnáva s kritickou hodnotou, ktorá závisí od počtu nezávislých premenných k a na počte stupňov voľnosti (n-k-1). Tabuľková (kritická) hodnota F- kritérium - ide o maximálnu hodnotu pomeru rozptylov, ktoré môžu nastať, ak sa náhodne rozchádzajú pre danú úroveň pravdepodobnosti prítomnosti nulovej hypotézy. Ak vypočítaná hodnota F- kritérium je na danej hladine významnosti väčšie ako tabuľkové, potom sa zamietne nulová hypotéza o absencii súvislosti a urobí sa záver o významnosti tejto súvislosti, t.j. model sa považuje za významný.

Pre párový regresný model

.

Pri lineárnej regresii sa zvyčajne odhaduje význam nielen rovnice ako celku, ale aj jej jednotlivých koeficientov. Na tento účel sa určí štandardná chyba každého z parametrov. Štandardné chyby regresných koeficientov parametrov sú určené vzorcami:

, (7.8)

(7.9)

Smerodajné chyby regresných koeficientov alebo smerodajné odchýlky vypočítané vzorcami (7.8,7.9) sú spravidla uvedené vo výsledkoch výpočtu regresného modelu v štatistických balíkoch.

Na základe štandardných chýb regresných koeficientov sa kontroluje významnosť týchto koeficientov pomocou bežnej schémy na testovanie štatistických hypotéz.

Ako hlavná hypotéza je predložená hypotéza o nevýznamnom rozdiele od nuly „skutočného“ regresného koeficientu. Alternatívnou hypotézou je v tomto prípade reverzná hypotéza, t. j. o nerovnosti „skutočného“ regresného parametra k nule. Táto hypotéza je testovaná pomocou t-štatistiky, ktoré majú t- Rozdelenie pre študentov:

Potom vypočítané hodnoty t-štatistiky sa porovnávajú s kritickými hodnotami t-štatistiky určené zo Študentových distribučných tabuliek. Kritická hodnota sa určuje v závislosti od úrovne významnosti α a počet stupňov voľnosti, čo je (n-k-1), n ​​​​- počet pozorovaní k- počet nezávislých premenných. V prípade lineárnej párovej regresie je počet stupňov voľnosti (P- 2). Kritická hodnota sa dá vypočítať aj na počítači pomocou vstavanej funkcie STUDISP v Exceli.

Ak vypočítaná hodnota t-štatistika je väčšia ako kritická, potom je hlavná hypotéza zamietnutá a predpokladá sa, že s pravdepodobnosťou (1-α)„Skutočný“ regresný koeficient sa výrazne líši od nuly, čo je štatistickým potvrdením existencie lineárneho vzťahu medzi zodpovedajúcimi premennými.

Ak vypočítaná hodnota t-štatistika je menej ako kritická, potom nie je dôvod zamietnuť hlavnú hypotézu, t. j. „skutočný“ regresný koeficient sa na hladine významnosti výrazne nelíši od nuly α . V tomto prípade by mal byť faktor zodpovedajúci tomuto koeficientu z modelu vylúčený.

Význam regresného koeficientu možno stanoviť zostrojením intervalu spoľahlivosti. Interval spoľahlivosti pre regresné parametre a a b definované takto:

,

,

kde sa určuje zo študentskej distribučnej tabuľky pre hladinu významnosti α a počet stupňov voľnosti (P- 2) pre párovú regresiu.

Keďže regresné koeficienty v ekonometrických štúdiách majú jasnú ekonomickú interpretáciu, intervaly spoľahlivosti by nemali obsahovať nulu. Skutočná hodnota regresného koeficientu nemôže súčasne obsahovať kladné a záporné hodnoty vrátane nuly, inak dostaneme protichodné výsledky v ekonomickej interpretácii koeficientov, ktoré nemôžu byť. Koeficient je teda významný, ak získaný interval spoľahlivosti nepokrýva nulu.

Príklad 7.4. Podľa príkladu 7.1:

a) Zostavte párový lineárny regresný model závislosti zisku z predaja od predajnej ceny pomocou softvéru na spracovanie údajov.

b) Posúdiť významnosť regresnej rovnice ako celku pomocou F- Fisherovo kritérium v a = 0,05.

c) Posúďte významnosť koeficientov regresného modelu pomocou t-Študentské kritérium pre a = 0,05 a a = 0,1.

Na regresnú analýzu používame štandardný kancelársky program EXCEL. Zostavíme regresný model pomocou nástroja REGRESIA v nastaveniach ANALÝZOVÉHO BALÍKA (obr. 7.5), ktorý sa spustí nasledovne:

ServiceData AnalysisREGRESSIONOK.

Obr.7.5. Pomocou nástroja REGRESIA

V dialógovom okne REGRESIA do poľa Vstupný interval Y zadajte adresu rozsahu buniek obsahujúcich závislú premennú. Do poľa Vstupný interval X zadajte adresy jedného alebo viacerých rozsahov obsahujúcich hodnoty nezávislých premenných. Ak sú vybraté aj hlavičky stĺpcov, začiarkavacie políčko Štítky v prvom riadku je aktívne. Na obr. 7.6. je zobrazená obrazovka výpočtu regresného modelu pomocou nástroja REGRESIA.

Ryža. 7.6. Vytvorenie párového regresného modelu pomocou

nástroj REGRESIA

Výsledkom práce nástroja REGRESIA je vytvorenie nasledujúceho protokolu regresnej analýzy (obr. 7.7).

Ryža. 7.7. Protokol regresnej analýzy

Rovnica pre závislosť zisku z predaja od predajnej ceny má tvar:

Významnosť regresnej rovnice odhadneme pomocou F- Fisherovo kritérium. Význam F- Fisherovo kritérium je prevzaté z tabuľky „Analýza odchýlky“ protokolu EXCEL (obr. 7.7.). Odhadovaná hodnota F- kritérium 53,372. Tabuľková hodnota F- kritérium na úrovni významnosti a = 0,05 a počet stupňov voľnosti je 4,964. Ako , potom sa rovnica považuje za významnú.

Odhadované hodnoty t-Študentské kritériá pre koeficienty regresnej rovnice sú uvedené vo výslednej tabuľke (obr. 7.7). Tabuľková hodnota t-Test žiaka na hladine významnosti a = 0,05 a 10 stupňov voľnosti je 2,228. Pre regresný koeficient a, teda koeficient a nie významné. Pre regresný koeficient b, teda koeficient b významný.

Odhad významnosti parametrov regresnej rovnice

Významnosť parametrov lineárnej regresnej rovnice sa odhaduje pomocou Studentovho t-testu:

ak t calc. > t cr, potom je hlavná hypotéza prijatá ( Ho), čo naznačuje štatistickú významnosť regresných parametrov;

ak t calc.< t cr, potom je prijatá alternatívna hypotéza ( H1), čo naznačuje štatistickú nevýznamnosť regresných parametrov.

kde m a , m b sú štandardné chyby parametrov a a b:

(2.19)

(2.20)

Kritická (tabuľková) hodnota kritéria sa zistí pomocou štatistických tabuliek rozdelenia študentov (príloha B) alebo podľa tabuliek excel(časť sprievodcu funkciou "Štatistika"):

t cr = STEUDRASP( a = 1-P; k=n-2), (2.21)

kde k=n-2 tiež predstavuje počet stupňov voľnosti .

Odhad štatistickej významnosti možno aplikovať aj na lineárny korelačný koeficient

kde Pán je štandardná chyba určenia hodnôt korelačného koeficientu r yx

(2.23)

Nižšie sú uvedené možnosti úloh pre praktickú a laboratórnu prácu na témy druhej časti.

Otázky na samovyšetrenie v časti 2

1. Špecifikujte hlavné zložky ekonometrického modelu a ich podstatu.

2. Hlavná náplň etáp ekonometrického výskumu.

3. Podstata prístupov na určenie parametrov lineárnej regresie.

4. Podstata a osobitosť aplikácie metódy najmenších štvorcov pri určovaní parametrov regresnej rovnice.

5. Aké ukazovatele sa používajú na hodnotenie blízkosti vzťahu skúmaných faktorov?

6. Podstata lineárneho korelačného koeficientu.

7. Podstata koeficientu determinácie.

8. Podstata a hlavné znaky postupov hodnotenia primeranosti (štatistickej významnosti) regresných modelov.

9. Posúdenie primeranosti lineárnych regresných modelov pomocou aproximačného koeficientu.

10. Podstata prístupu hodnotenia primeranosti regresných modelov podľa Fisherovho kritéria. Stanovenie empirických a kritických hodnôt kritéria.

11. Podstata konceptu „disperznej analýzy“ vo vzťahu k ekonometrickým štúdiám.

12. Podstata a hlavné znaky postupu hodnotenia významnosti parametrov rovnice lineárnej regresie.

13. Vlastnosti aplikácie Studentovho rozdelenia pri posudzovaní významnosti parametrov lineárnej regresnej rovnice.

14. Čo je úlohou prognózovania jednotlivých hodnôt skúmaného sociálno-ekonomického javu?

1. Zostavte korelačné pole a sformulujte predpoklad o tvare rovnice vzťahu študovaných faktorov;

2. Napíšte základné rovnice metódy najmenších štvorcov, urobte potrebné transformácie, zostavte tabuľku pre medzivýpočty a určte parametre lineárnej regresnej rovnice;

3. Overte správnosť vykonaných výpočtov štandardnými postupmi a funkciami excelovských tabuliek.

4. Analyzujte výsledky, formulujte závery a odporúčania.

1. Výpočet hodnoty koeficientu lineárnej korelácie;

2. Konštrukcia tabuľky disperznej analýzy;

3. Posúdenie koeficientu determinácie;

4. Overte správnosť vykonaných výpočtov štandardnými postupmi a funkciami excelovských tabuliek.

5. Analyzujte výsledky, formulujte závery a odporúčania.

4. Vykonajte všeobecné posúdenie primeranosti vybranej regresnej rovnice;

1. Posúdenie primeranosti rovnice hodnotami aproximačného koeficientu;

2. Posúdenie primeranosti rovnice hodnotami koeficientu determinácie;

3. Posúdenie primeranosti rovnice podľa Fisherovho kritéria;

4. Vykonajte všeobecné posúdenie primeranosti parametrov regresnej rovnice;

5. Overte správnosť vykonaných výpočtov štandardnými postupmi a funkciami excelovských tabuliek.

6. Analyzujte výsledky, formulujte závery a odporúčania.

1. Pomocou štandardných postupov Sprievodcu funkciou tabuľkového procesora Excel (z časti „Matematické“ a „Štatistické“);

2. Príprava dát a vlastnosti používania funkcie "LINEST";

3. Príprava dát a vlastnosti používania funkcie „PREDICTION“.

1. Používanie štandardných postupov balíka na analýzu údajov v tabuľkovom procesore Excel;

2. Príprava údajov a vlastností aplikácie postupu „REGRESIA“;

3. Interpretácia a zovšeobecnenie údajov z tabuľky regresnej analýzy;

4. Interpretácia a zovšeobecnenie údajov tabuľky disperznej analýzy;

5. Interpretácia a zovšeobecnenie údajov tabuľky na posúdenie významnosti parametrov regresnej rovnice;

Pri vykonávaní laboratórnych prác podľa jednej z možností je potrebné vykonať tieto konkrétne úlohy:

1. Urobte výber tvaru rovnice vzťahu študovaných faktorov;

2. Určite parametre regresnej rovnice;

3. Posúdiť tesnosť vzťahu študovaných faktorov;

4. Posúdiť primeranosť vybranej regresnej rovnice;

5. Vyhodnoťte štatistickú významnosť parametrov regresnej rovnice.

6. Overte správnosť vykonaných výpočtov štandardnými postupmi a funkciami excelovských tabuliek.

7. Analyzujte výsledky, formulujte závery a odporúčania.

Úlohy na praktickú a laboratórnu prácu na tému "Párová lineárna regresia a korelácia v ekonometrických štúdiách."

možnosť 1 Možnosť 2 Možnosť 3 Možnosť 4 Možnosť 5
X r X r X r X r X r
Možnosť 6 Možnosť 7 Možnosť 8 Možnosť 9 Možnosť 10
X r X r X r X r X r

Párová regresia je regresia medzi dvoma premennými

-y a x, t.j. zobraziť model + E

Kde pri- efektívny znak, teda závislá premenná; X- znakový faktor.

Lineárna regresia sa redukuje na nájdenie rovnice tvaru resp

Rovnica tvaru umožňuje, aby dané hodnoty faktora x mali teoretické hodnoty efektívneho znaku, pričom sa do nich nahrádzajú skutočné hodnoty faktora x.

Konštrukcia lineárnej regresie sa redukuje na odhad jej parametrov a a b.

Odhady parametrov lineárnej regresie možno nájsť rôznymi metódami.

1.

2.

Parameter b volal regresný koeficient. Ukazuje sa jeho hodnota

priemerná zmena výsledku so zmenou faktora o jednu jednotku.

Formálne a- význam pri pri x = 0. Ak je znakový faktor

nemá a nemôže mať nulovú hodnotu, potom vyššie uvedené

výklad voľného termínu, a nedáva zmysel. parameter, a možno

nemajú ekonomický obsah. Pokusy ekonomicky

interpretovať parameter, a môže viesť k absurdnosti, najmä keď a < 0.

Interpretovať možno iba znamienko parametra a. Ak a > 0,

potom je relatívna zmena výsledku pomalšia ako zmena

kontrola kvality zistených parametrov a celého modelu ako celku:

-Posúdenie významnosti regresného koeficientu (b) a korelačného koeficientu

-Posúdenie významu celej regresnej rovnice. Koeficient determinácie

Regresná rovnica je vždy doplnená o indikátor tesnosti vzťahu. o

pomocou lineárnej regresie ako takého ukazovateľa

lineárny korelačný koeficient r xy . Existujú rôzne

úpravy vzorca lineárneho korelačného koeficientu.

Lineárny korelačný koeficient je v medziach: -1≤ .rxy

≤ 1. Navyše, čím bližšie r k 0 tým je korelácia slabšia a naopak

čím bližšie je r k 1 alebo -1, tým silnejšia je korelácia, t.j. závislosť x a y je blízko

lineárne. Ak r presne =1 alebo -1 všetky body ležia na rovnakej priamke.

Ak koeficient regresia b>0 potom 0 ≤. rxy≤ 1 a

naopak pre b<0 -1≤.rxy≤0. Coef.

korelácia odráža stupeň lineárnej závislosti hodnôt m / y v prítomnosti

výrazná závislosť od iného druhu.

Ak chcete posúdiť kvalitu výberu lineárnej funkcie, druhá mocnina lineárnej

korelačný koeficient

Volaný determinačný koeficient. Koeficient determinácie

charakterizuje podiel rozptylu výsledného znaku y, vysvetleného tým

regresia. Zodpovedajúca hodnota

charakterizuje podiel rozptylu y, spôsobené vplyvom iných nezvestných

vo faktorovom modeli.

OLS umožňuje získať takéto odhady parametrov a a b, ktorý

súčet štvorcových odchýlok skutočných hodnôt výsledného atribútu

(y) z vypočítaného (teoretického)

minimum:

Inými slovami, od

z celej množiny čiar sa regresná čiara na grafe zvolí tak, že súčet

štvorce vertikálnej vzdialenosti medzi bodmi a touto čiarou by boli

minimálne.

Sústava normálnych rovníc je vyriešená

ODHAD VÝZNAMU PARAMETROV LINEÁRNEJ REGRESIE.

Hodnotenie významnosti regresnej rovnice ako celku je dané pomocou F-kritéria

Fisher. V tomto prípade je predložená nulová hypotéza, že regresný koeficient sa rovná

nula, t.j. b= 0, a teda faktor X neposkytuje

vplyv na výsledok r.

Priamemu výpočtu F-kritéria predchádza analýza rozptylu.

Ústredným prvkom je rozšírenie celkového súčtu štvorcových odchýlok

premenlivý pri z priemernej hodnoty pri na dve časti -

"vysvetlené" a "nevysvetlené":

Celkový súčet štvorcových odchýlok

Súčet štvorcov

odchýlky vysvetlené regresiou

Zvyškový súčet druhej mocniny odchýlky.

Akýkoľvek súčet štvorcových odchýlok súvisí s počtom stupňov voľnosti , t.

s počtom voľnosti nezávislej variácie znaku. Počet stupňov voľnosti súvisí s počtom jednotiek populácie n a počtom konštánt z neho určených. Pokiaľ ide o skúmaný problém, počet stupňov voľnosti by mal ukazovať od koľkých nezávislých odchýlok P možné potrebné pre

vytvorenie daného súčtu štvorcov.

Rozptyl na stupeň voľnosti D.

F-pomery (F-kritérium):

Ak je nulová hypotéza pravdivá, potom faktor a reziduálne rozptyly nie sú

sa navzájom líšia. Pre H 0 je potrebné vyvrátenie, aby

rozptyl faktorov niekoľkonásobne prevýšil zvyškový. Angličtina

štatistik Snedecor vyvinul tabuľky kritických hodnôt F-pomerov

na rôznych úrovniach významnosti nulovej hypotézy a rôznom počte stupňov

slobody. Tabuľková hodnota F-testu je maximálna hodnota pomeru

rozptyly, ktoré môžu nastať v prípade ich náhodnej divergencie pre danú

úroveň pravdepodobnosti prítomnosti nulovej hypotézy. Vypočítaná hodnota F-pomeru

sa považuje za spoľahlivé, ak o je väčšie ako tabuľková hodnota. V tomto prípade nula

hypotéza o absencii vzťahu znakov sa zamieta a robí sa záver

význam tohto vzťahu: F fakt > F tabuľka H 0

sa odmieta.

Ak je hodnota menšia ako tabuľková F fakt ‹, F stôl

Potom je pravdepodobnosť nulovej hypotézy nad danou úrovňou a nemôže byť

odmietnuté bez vážneho rizika zavádzania spojenia. AT

V tomto prípade sa regresná rovnica považuje za štatisticky nevýznamnú. ale

sa neodmieta.


Podobné informácie.