Pagsusuri ng pagkalkula ng pagkakaiba-iba ng pagkakasunud-sunod ng paksa ng panahon ng gamot. Warping ng magarbong sinulid na may roving effect

Ang pagsusuri ng pagkakaiba ay isang istatistikal na pamamaraan na idinisenyo upang masuri ang impluwensya ng iba't ibang mga salik sa resulta ng isang eksperimento, gayundin para sa kasunod na pagpaplano ng mga katulad na eksperimento.

Sa una (1918), ang pagsusuri ng pagkakaiba ay binuo ng English mathematician at statistician na si R.A. Fisher upang iproseso ang mga resulta ng agronomic na mga eksperimento upang matukoy ang mga kondisyon para sa pagkuha ng pinakamataas na ani ng iba't ibang uri ng mga pananim.

Kapag nagse-set up ng eksperimento, dapat matugunan ang mga sumusunod na kundisyon:

    Ang bawat variant ng eksperimento ay dapat isagawa sa ilang unit ng pagmamasid (mga pangkat ng mga hayop, mga seksyon ng field, atbp.)

    Ang pamamahagi ng mga yunit ng pagmamasid sa pagitan ng mga variant ng karanasan ay dapat na random, hindi sinasadya.

Ang pagsusuri ng mga gamit ng pagkakaiba F-pamantayan(R.A. Fisher's criterion), na kumakatawan sa ratio ng dalawang variances:

kung saan ang d ay isang katotohanan, ang d ay ang factorial (intergroup) at natitirang (intragroup) dispersion sa bawat isang antas ng kalayaan, ayon sa pagkakabanggit.

Ang factorial at residual variances ay mga pagtatantya ng pagkakaiba-iba ng populasyon, na kinakalkula mula sa sample na data, na isinasaalang-alang ang bilang ng mga degree ng kalayaan ng variation.

Ang pagkakaiba-iba ng salik (intergroup) ay nagpapaliwanag ng pagkakaiba-iba ng nagresultang katangian sa ilalim ng impluwensya ng pinag-aralan na salik.

Ang natitirang (intragroup) na pagkakaiba-iba ay nagpapaliwanag ng pagkakaiba-iba ng epektibong katangian dahil sa impluwensya ng iba pang mga kadahilanan (maliban sa impluwensya ng pinag-aralan na kadahilanan).

Sa kabuuan, ang kadahilanan at natitirang mga pagkakaiba ay nagbibigay ng kabuuang pagkakaiba, na nagpapahayag ng impluwensya ng lahat ng mga katangian ng salik sa epektibong isa.

Ang pamamaraan para sa pagsasagawa ng pagsusuri ng pagkakaiba-iba:

1. Ang pang-eksperimentong data ay ipinasok sa talahanayan ng pagkalkula at ang mga kabuuan at average na halaga sa bawat pangkat ng pinag-aralan na populasyon, pati na rin ang kabuuang halaga at average na halaga para sa buong populasyon ay tinutukoy (Talahanayan 1).

Talahanayan 1

Ang halaga ng nagresultang katangian para sa i-th unit

sa j-th group, x ij

Bilang ng mga obserbasyon, f j

Average (pangkat at kabuuan), x j

x 11, x 12, ..., x 1 n

x 21, x 22, ..., x 2 n

x m 1 , x m 2 , …, x mn

Kabuuang bilang ng mga obserbasyon n kinakalkula bilang kabuuan ng bilang ng mga obserbasyon f j sa bawat pangkat:

Kung ang bilang ng mga elemento sa lahat ng mga pangkat ay pareho, ang kabuuang average ay matatagpuan mula sa grupo ay nangangahulugan bilang isang simpleng arithmetic mean:

Kung ang bilang ng mga elemento sa mga pangkat ay iba, ang kabuuang average kinakalkula ng formula ng arithmetic weighted average:

2. Natutukoy ang kabuuang pagkakaiba D karaniwan bilang kabuuan ng mga squared deviations ng mga indibidwal na halaga ng nagresultang katangian mula sa kabuuang average :

3. Kinakalkula ang factorial (sa pagitan ng pangkat). D katotohanan bilang ang kabuuan ng squared deviations ng pangkat ay nangangahulugan mula sa kabuuang average pinarami ng bilang ng mga obserbasyon:

4. Natutukoy ang halaga ng natitirang (intragroup) dispersion D ost bilang pagkakaiba sa pagitan ng kabuuan D karaniwan at factorial D katotohanan pagpapakalat:

5. Ang bilang ng mga antas ng kalayaan ng factorial
pagkakaiba bilang pagkakaiba sa pagitan ng bilang ng mga pangkat m at unit:

6. Natutukoy ang bilang ng mga antas ng kalayaan para sa natitirang pagpapakalat
bilang pagkakaiba sa pagitan ng bilang ng mga indibidwal na halaga ng tampok n at ang bilang ng mga pangkat m:

7. Kinakalkula ang halaga ng factor dispersion bawat isang antas ng kalayaan d katotohanan bilang ratio ng pagkakaiba-iba ng kadahilanan D katotohanan sa bilang ng mga antas ng kalayaan ng factorial variance
:

8. Natutukoy ang halaga ng natitirang pagpapakalat sa bawat isang antas ng kalayaan d ost bilang isang ratio ng natitirang pagkakaiba D ost sa bilang ng mga antas ng kalayaan ng natitirang pagpapakalat
:

9. Natutukoy ang kinakalkula na halaga ng F-criterion F-calc bilang ratio ng factorial variance sa bawat antas ng kalayaan d katotohanan sa natitirang pagpapakalat sa bawat isang antas ng kalayaan d ost :

10. Ayon sa talahanayan ng Fisher's F-criterion, na isinasaalang-alang ang antas ng kahalagahan na pinagtibay sa pag-aaral, pati na rin ang pagsasaalang-alang sa mga antas ng kalayaan para sa factorial at natitirang mga pagkakaiba, ang teoretikal na halaga ay matatagpuan F mesa .

Ang 5% na antas ng kahalagahan ay tumutugma sa 95% na antas ng posibilidad, 1% - hanggang 99% na antas ng posibilidad. Sa karamihan ng mga kaso, ginagamit ang 5% na antas ng kahalagahan.

teoretikal na halaga F mesa sa isang naibigay na antas ng kahalagahan, ang mga ito ay tinutukoy mula sa mga talahanayan sa intersection ng isang hilera at isang haligi na tumutugma sa dalawang antas ng kalayaan ng mga pagkakaiba-iba:

sa linya - nalalabi;

ayon sa hanay - factorial.

11. Ang mga resulta ng mga kalkulasyon ay iginuhit sa isang talahanayan (Talahanayan 2).

Pagsusuri ng pagkakaiba-iba

Coursework sa disiplina: "System Analysis"

Mag-aaral na performer gr. 99 ISE-2 Zhbanov V.V.

Orenburg State University

Faculty of Information Technology

Kagawaran ng Applied Informatics

Orenburg-2003

Panimula

Ang layunin ng gawain: upang maging pamilyar sa tulad ng isang istatistikal na pamamaraan bilang pagsusuri ng pagkakaiba-iba.

Ang pagsusuri ng pagkakaiba-iba (mula sa Latin na Dispersio - dispersion) ay isang istatistikal na pamamaraan na nagbibigay-daan sa iyo upang pag-aralan ang impluwensya ng iba't ibang mga kadahilanan sa variable na pinag-aaralan. Ang pamamaraan ay binuo ng biologist na si R. Fisher noong 1925 at orihinal na ginamit upang suriin ang mga eksperimento sa produksyon ng pananim. Nang maglaon, naging malinaw ang pangkalahatang pang-agham na kahalagahan ng pagsusuri sa pagpapakalat para sa mga eksperimento sa sikolohiya, pedagogy, gamot, atbp.

Ang layunin ng pagsusuri ng pagkakaiba ay upang subukan ang kahalagahan ng pagkakaiba sa pagitan ng mga paraan sa pamamagitan ng paghahambing ng mga pagkakaiba. Ang pagkakaiba-iba ng nasusukat na katangian ay nabubulok sa mga independiyenteng termino, na ang bawat isa ay nagpapakilala sa impluwensya ng isang partikular na salik o kanilang pakikipag-ugnayan. Ang kasunod na paghahambing ng mga naturang termino ay nagpapahintulot sa amin na suriin ang kahalagahan ng bawat salik na pinag-aaralan, pati na rin ang kanilang kumbinasyon /1/.

Kung totoo ang null hypothesis (tungkol sa pagkakapantay-pantay ng mga paraan sa ilang grupo ng mga obserbasyon na pinili mula sa pangkalahatang populasyon), ang pagtatantya ng pagkakaiba-iba na nauugnay sa pagkakaiba-iba ng intragroup ay dapat na malapit sa pagtatantya ng pagkakaiba-iba ng intergroup.

Kapag nagsasagawa ng pananaliksik sa merkado, ang tanong ng pagiging maihahambing ng mga resulta ay madalas na lumitaw. Halimbawa, kapag nagsasagawa ng mga survey sa pagkonsumo ng isang partikular na produkto sa iba't ibang rehiyon ng bansa, kinakailangan na gumawa ng mga konklusyon kung paano naiiba o hindi naiiba ang data ng survey sa bawat isa. Hindi makatuwiran na ihambing ang mga indibidwal na tagapagpahiwatig, at samakatuwid ang pamamaraan para sa paghahambing at kasunod na pagtatasa ay isinasagawa ayon sa ilang mga average na halaga at mga paglihis mula sa average na pagtatasa na ito. Ang pagkakaiba-iba ng katangian ay pinag-aaralan. Maaaring kunin ang pagkakaiba-iba bilang sukatan ng pagkakaiba-iba. Ang dispersion σ 2 ay isang sukatan ng variation, na tinukoy bilang ang average ng mga deviations ng isang feature na squared.

Sa pagsasagawa, ang mga gawain ng isang mas pangkalahatang kalikasan ay madalas na lumitaw - ang mga gawain ng pagsuri sa kahalagahan ng mga pagkakaiba sa mga average ng ilang mga sample na sample. Halimbawa, kinakailangang suriin ang epekto ng iba't ibang hilaw na materyales sa kalidad ng mga produkto, upang malutas ang problema ng epekto ng dami ng mga pataba sa ani ng mga produktong agrikultura.

Minsan ginagamit ang pagsusuri ng pagkakaiba-iba upang itatag ang homogeneity ng ilang populasyon (ang mga pagkakaiba-iba ng mga populasyon na ito ay pareho sa pamamagitan ng pagpapalagay; kung ang pagsusuri ng pagkakaiba ay nagpapakita na ang mga inaasahan sa matematika ay pareho, kung gayon ang mga populasyon ay homogenous sa ganitong kahulugan). Ang mga homogenous na populasyon ay maaaring pagsamahin sa isa at sa gayon ay makakuha ng mas kumpletong impormasyon tungkol dito, at samakatuwid ay mas maaasahang mga konklusyon /2/.

1 Pagsusuri ng pagkakaiba

1.1 Pangunahing konsepto ng pagsusuri ng pagkakaiba

Sa proseso ng pagmamasid sa bagay na pinag-aaralan, ang mga salik ng husay ay nagbabago nang arbitraryo o sa isang paunang natukoy na paraan. Ang tiyak na pagpapatupad ng isang kadahilanan (halimbawa, isang tiyak na rehimen ng temperatura, napiling kagamitan o materyal) ay tinatawag na antas ng kadahilanan o pamamaraan ng pagproseso. Ang isang modelo ng ANOVA na may mga nakapirming antas ng mga kadahilanan ay tinatawag na modelo I, isang modelo na may mga random na kadahilanan ay tinatawag na modelo ng II. Sa pamamagitan ng pag-iiba-iba ng kadahilanan, masisiyasat ng isa ang epekto nito sa laki ng tugon. Sa kasalukuyan, ang pangkalahatang teorya ng pagsusuri ng pagkakaiba-iba ay binuo para sa mga modelo I.

Depende sa bilang ng mga salik na tumutukoy sa pagkakaiba-iba ng nagresultang tampok, ang pagsusuri ng pagkakaiba ay nahahati sa single-factor at multi-factor.

Ang mga pangunahing scheme para sa pag-aayos ng paunang data na may dalawa o higit pang mga kadahilanan ay:

Cross-classification, katangian ng mga modelo I, kung saan ang bawat antas ng isang kadahilanan ay pinagsama sa bawat gradasyon ng isa pang kadahilanan kapag nagpaplano ng isang eksperimento;

Hierarchical (nested) na pag-uuri, katangian ng modelo II, kung saan ang bawat random na napiling halaga ng isang kadahilanan ay tumutugma sa sarili nitong subset ng mga halaga ng pangalawang kadahilanan.

Kung ang dependence ng tugon sa qualitative at quantitative factor ay sabay na sinisiyasat, i.e. mga kadahilanan ng halo-halong kalikasan, pagkatapos ay ginagamit ang pagsusuri ng covariance /3/.

Kaya, ang mga modelong ito ay naiiba sa isa't isa sa paraan ng pagpili ng mga antas ng salik, na, malinaw naman, ay pangunahing nakakaapekto sa posibilidad ng pag-generalize ng mga eksperimentong resulta na nakuha. Para sa pagsusuri ng pagkakaiba-iba sa mga eksperimento na nag-iisang salik, ang pagkakaiba sa pagitan ng dalawang modelong ito ay hindi gaanong kapansin-pansin, ngunit sa multivariate na pagsusuri ng pagkakaiba maaari itong maging napakahalaga.

Kapag nagsasagawa ng pagsusuri ng pagkakaiba, ang mga sumusunod na istatistikal na pagpapalagay ay dapat matugunan: anuman ang antas ng kadahilanan, ang mga halaga ng tugon ay may normal (Gaussian) na batas sa pamamahagi at parehong pagkakaiba. Ang pagkakapantay-pantay ng mga pagpapakalat ay tinatawag na homogeneity. Kaya, ang pagbabago ng paraan ng pagpoproseso ay nakakaapekto lamang sa posisyon ng random na variable ng tugon, na kung saan ay nailalarawan sa pamamagitan ng mean na halaga o median. Samakatuwid, ang lahat ng mga obserbasyon sa pagtugon ay nabibilang sa shift family ng mga normal na distribusyon.

Ang ANOVA technique daw ay "robust". Ang terminong ito, na ginamit ng mga istatistika, ay nangangahulugan na ang mga pagpapalagay na ito ay maaaring lumabag sa ilang lawak, ngunit sa kabila nito, ang pamamaraan ay maaaring gamitin.

Kapag ang batas ng pamamahagi ng mga halaga ng tugon ay hindi alam, ang mga nonparametric (madalas na ranggo) na mga pamamaraan ng pagsusuri ay ginagamit.

Ang pagsusuri ng pagkakaiba ay batay sa paghahati ng pagkakaiba sa mga bahagi o bahagi. Ang pagkakaiba-iba dahil sa impluwensya ng salik na pinagbabatayan ng pagpapangkat ay nailalarawan sa pamamagitan ng intergroup dispersion σ 2 . Ito ay isang sukatan ng pagkakaiba-iba ng bahagyang paraan para sa mga pangkat sa paligid ng karaniwang ibig sabihin at tinutukoy ng formula:

,

kung saan ang k ay ang bilang ng mga pangkat;

n j ay ang bilang ng mga yunit sa j-th na pangkat;

Pribadong average para sa j-th group;

Ang pangkalahatang average sa populasyon ng mga yunit.

Ang pagkakaiba-iba dahil sa impluwensya ng iba pang mga salik ay nailalarawan sa bawat pangkat ng intragroup dispersion σ j 2 .

.

May kaugnayan sa pagitan ng kabuuang pagkakaiba σ 0 2 , pagkakaiba-iba ng intragroup σ 2 at pagkakaiba-iba ng intergroup:

σ 0 2 = + σ 2 .

Ipinapaliwanag ng pagkakaiba-iba ng intragroup ang impluwensya ng mga salik na hindi isinasaalang-alang kapag nagpapangkat, at ipinapaliwanag ng pagkakaiba-iba ng intergroup ang impluwensya ng mga salik sa pagpapangkat sa average ng pangkat /2/.

1.2 Isang paraan na pagsusuri ng pagkakaiba

Ang one-factor dispersion model ay may anyo:

x ij = μ + F j + ε ij , (1)

kung saan ang х ij ay ang halaga ng pinag-aralan na variable na nakuha sa i-th level ng factor (i=1,2,...,т) na may j-th serial number (j=1,2,... ,n);

Ang F i ay ang epekto dahil sa impluwensya ng i-th na antas ng salik;

Ang ε ij ay isang random na bahagi, o isang kaguluhan na dulot ng impluwensya ng hindi nakokontrol na mga salik, i.e. pagkakaiba-iba sa loob ng isang antas.

Mga pangunahing kinakailangan para sa pagsusuri ng pagkakaiba-iba:

Ang mathematical expectation ng perturbation ε ij ay katumbas ng zero para sa anumang i, i.e.

M(ε ij) = 0; (2)

Ang mga perturbation ε ij ay kapwa independyente;

Ang pagkakaiba ng variable na x ij (o perturbation ε ij) ay pare-pareho para sa

anumang i, j, i.e.

D(ε ij) = σ 2 ; (3)

Ang variable na x ij (o perturbation ε ij) ay may normal na batas

mga distribusyon N(0;σ 2).

Ang impluwensya ng mga antas ng kadahilanan ay maaaring maging maayos o sistematiko (Modelo I) o random (Modelo II).

Hayaan, halimbawa, ito ay kinakailangan upang malaman kung may mga makabuluhang pagkakaiba sa pagitan ng mga batch ng mga produkto sa mga tuntunin ng ilang tagapagpahiwatig ng kalidad, i.e. suriin ang epekto sa kalidad ng isang kadahilanan - isang batch ng mga produkto. Kung ang lahat ng mga batch ng hilaw na materyales ay kasama sa pag-aaral, kung gayon ang impluwensya ng antas ng naturang kadahilanan ay sistematiko (modelo I), at ang mga natuklasan ay naaangkop lamang sa mga indibidwal na batch na kasangkot sa pag-aaral. Kung isasama lamang namin ang isang random na napiling bahagi ng mga partido, kung gayon ang impluwensya ng kadahilanan ay random (modelo II). Sa mga multifactorial complex, posible ang isang mixed model III, kung saan ang ilang mga kadahilanan ay may mga random na antas, habang ang iba ay naayos.

Magkaroon ng m batch ng mga produkto. Mula sa bawat batch, ayon sa pagkakabanggit, n 1 , n 2 , ..., n m mga produkto ang napili (para sa pagiging simple, ipinapalagay na n 1 =n 2 =...=n m =n). Ang mga halaga ng tagapagpahiwatig ng kalidad ng mga produktong ito ay ipinakita sa matrix ng pagmamasid:

x 11 x 12 … x 1n

x 21 x 22 … x 2n

………………… = (x ij), (i = 1.2, …, m; j = 1.2, …, n).

x m 1 x m 2 … x mn

Kinakailangang suriin ang kahalagahan ng impluwensya ng mga batch ng mga produkto sa kanilang kalidad.

Kung ipagpalagay natin na ang mga elemento ng mga hilera ng observation matrix ay ang mga numerical na halaga ng mga random na variable X 1 ,X 2 ,...,X m , na nagpapahayag ng kalidad ng mga produkto at pagkakaroon ng isang normal na batas sa pamamahagi na may mga inaasahan sa matematika, ayon sa pagkakabanggit a 1 ,a 2 ,...,a m at magkaparehong pagkakaiba-iba σ 2 , pagkatapos ang problemang ito ay binabawasan sa pagsubok ng null hypothesis H 0: a 1 =a 2 =...= a m , na isinagawa sa pagsusuri ng pagkakaiba-iba.

Ang pag-average sa ilang index ay ipinapahiwatig ng isang asterisk (o isang tuldok) sa halip na isang index, pagkatapos ay ang average na tagapagpahiwatig ng kalidad ng mga produkto ng i-th batch, o ang average ng grupo para sa i-th na antas ng factor, ay kukuha ng anyo:

kung saan ang i * ay ang average na halaga sa mga column;

Ang Ij ay isang elemento ng observation matrix;

n ay ang sample size.

At ang pangkalahatang average:

. (5)

Ang kabuuan ng mga squared deviations ng mga obserbasyon x ij mula sa kabuuang mean ** ay ganito ang hitsura:

2 = 2 + 2 +

2 2 . (6)

Q \u003d Q 1 + Q 2 + Q 3.

Ang huling termino ay zero

dahil ang kabuuan ng mga paglihis ng mga halaga ng variable mula sa average nito ay katumbas ng zero, i.e.

2 =0.

Ang unang termino ay maaaring isulat bilang:

Ang resulta ay isang pagkakakilanlan:

Q = Q 1 + Q 2 , (8)

saan - kabuuan, o kabuuan, kabuuan ng mga squared deviations;

- ang kabuuan ng mga squared deviations ng pangkat ay nangangahulugang mula sa kabuuang average, o ang intergroup (factorial) na kabuuan ng squared deviations;

- kabuuan ng mga squared deviations ng mga obserbasyon mula sa group means, o intragroup (residual) sum ng squared deviations.

Ang pagpapalawak (8) ay naglalaman ng pangunahing ideya ng pagsusuri ng pagkakaiba-iba. Kaugnay ng problemang isinasaalang-alang, ang pagkakapantay-pantay (8) ay nagpapakita na ang pangkalahatang pagkakaiba-iba ng tagapagpahiwatig ng kalidad, na sinusukat ng kabuuan Q, ay binubuo ng dalawang bahagi - Q 1 at Q 2, na nagpapakilala sa pagkakaiba-iba ng tagapagpahiwatig na ito sa pagitan ng mga batch (Q 1 ) at pagkakaiba-iba sa loob ng mga batch (Q 2), na naglalarawan ng parehong pagkakaiba-iba para sa lahat ng mga batch sa ilalim ng impluwensya ng hindi natukoy na mga kadahilanan.

Sa pagsusuri ng pagkakaiba-iba, hindi ang mga kabuuan ng mga parisukat ng mga paglihis ang sinusuri, ngunit ang tinatawag na mga parisukat na ibig sabihin, na walang pinapanigan na mga pagtatantya ng mga kaukulang pagkakaiba, na nakukuha sa pamamagitan ng paghahati ng mga kabuuan ng mga parisukat ng mga paglihis sa katumbas na bilang ng mga antas ng kalayaan.

Ang bilang ng mga antas ng kalayaan ay tinukoy bilang ang kabuuang bilang ng mga obserbasyon na binawasan ang bilang ng mga equation na nauugnay sa kanila. Samakatuwid, para sa mean square s 1 2 , na isang walang pinapanigan na pagtatantya ng pagkakaiba-iba ng intergroup, ang bilang ng mga degree ng kalayaan k 1 =m-1, dahil ang ibig sabihin ng m group ay magkakaugnay ng isang equation (5) sa pagkalkula nito. At para sa mean square s22, na isang walang pinapanigan na pagtatantya ng pagkakaiba-iba ng intragroup, ang bilang ng mga antas ng kalayaan ay k2=mn-m, dahil ito ay kinakalkula gamit ang lahat ng mn obserbasyon na magkakaugnay ng m equation (4).

Sa ganitong paraan:

Kung nahanap natin ang mga inaasahan sa matematika ng mga mean na parisukat at , palitan ang expression xij (1) sa kanilang mga formula sa pamamagitan ng mga parameter ng modelo, makukuha natin:

(9)

kasi isinasaalang-alang ang mga katangian ng inaasahan sa matematika

a

(10)

Para sa modelong I na may mga nakapirming antas ng factor F i (i=1,2,...,m) ay mga hindi random na halaga, samakatuwid

M(S) = 2 /(m-1) +σ 2 .

Ang hypothesis H 0 ay tumatagal sa anyo F i = F * (i = 1,2,...,m), i.e. ang impluwensya ng lahat ng antas ng salik ay pareho. Kung totoo ang hypothesis na ito

M(S)= M(S)= σ 2 .

Para sa random na modelo II, ang terminong F i sa expression (1) ay isang random na halaga. Tinutukoy ito sa pamamagitan ng pagkakaiba-iba

nakukuha namin mula sa (9)

(11)

at, tulad ng sa modelo I

Ang talahanayan 1.1 ay nagpapakita ng pangkalahatang pagtingin sa pagkalkula ng mga halaga gamit ang pagsusuri ng pagkakaiba.

Talahanayan 1.1 - Pangunahing talahanayan ng pagsusuri ng pagkakaiba

Mga bahagi ng pagkakaiba-iba

Kabuuan ng mga parisukat

Bilang ng antas ng kalayaan

Katamtamang parisukat

Mean square expectation

Intergroup

Intragroup

Ang hypothesis H 0 ay kukuha ng anyong σ F 2 =0. Kung totoo ang hypothesis na ito

M(S)= M(S)= σ 2 .

Sa kaso ng one-factor complex para sa parehong modelo I at modelo II, ang ibig sabihin ng mga parisukat na S 2 at S 2 ay walang pinapanigan at independiyenteng mga pagtatantya ng parehong pagkakaiba σ 2 .

Dahil dito, ang pagsubok sa null hypothesis H 0 ay nabawasan upang masuri ang kahalagahan ng pagkakaiba sa pagitan ng walang pinapanigan na mga pagtatantya ng sample na S at S ng variance σ 2 .

Ang hypothesis H 0 ay tinanggihan kung ang aktwal na kinakalkula na halaga ng mga istatistika F = S/S ay mas malaki kaysa sa kritikal na halaga F α: K 1: K 2 , na tinutukoy sa antas ng kahalagahan α na may bilang ng mga antas ng kalayaan k 1 = m-1 at k 2 =mn-m, at tinanggap kung F< F α: K 1: K 2 .

Ang pamamahagi ng Fisher F (para sa x > 0) ay may sumusunod na function ng density (para sa = 1, 2, ...; = 1, 2, ...):

kung saan - antas ng kalayaan;

G - gamma function.

Kaugnay ng problemang ito, ang pagpapabulaanan ng hypothesis H 0 ay nangangahulugan ng pagkakaroon ng mga makabuluhang pagkakaiba sa kalidad ng mga produkto ng iba't ibang mga batch sa antas ng kahalagahan na isinasaalang-alang.

Upang kalkulahin ang mga kabuuan ng mga parisukat Q 1 , Q 2 , Q kadalasang madaling gamitin ang mga sumusunod na formula:

(12)

(13)

(14)

mga. sa pangkalahatan ay hindi kinakailangan na hanapin ang mga average sa kanilang sarili.

Kaya, ang pamamaraan para sa one-way na pagsusuri ng variance ay binubuo sa pagsubok sa hypothesis H 0 na mayroong isang pangkat ng homogenous na eksperimentong data laban sa alternatibo na mayroong higit sa isang pangkat. Ang homogenity ay tumutukoy sa pagkakapareho ng mga paraan at pagkakaiba sa anumang subset ng data. Sa kasong ito, ang mga pagkakaiba ay maaaring parehong kilala at hindi alam nang maaga. Kung may dahilan upang maniwala na ang kilala o hindi alam na pagkakaiba-iba ng mga sukat ay pareho sa buong set ng data, kung gayon ang gawain ng one-way na pagsusuri ng pagkakaiba-iba ay binabawasan sa pag-aaral ng kahalagahan ng pagkakaiba sa mga paraan sa mga pangkat ng data / 1/.

1.3 Multivariate dispersion pagsusuri

Dapat pansinin kaagad na walang pangunahing pagkakaiba sa pagitan ng multivariate at single-factor analysis ng variance. Ang pagsusuri ng multivariate ay hindi nagbabago sa pangkalahatang lohika ng pagsusuri ng pagkakaiba-iba, ngunit medyo kumplikado lamang ito, dahil, bilang karagdagan sa pagsasaalang-alang sa impluwensya ng bawat isa sa mga kadahilanan sa dependent variable, ang kanilang pinagsamang epekto ay dapat ding tasahin. Kaya, ang bagong bagay na dinadala ng multivariate analysis ng variance sa pagsusuri ng data ay higit sa lahat ay ang kakayahang masuri ang interfactorial na interaksyon. Gayunpaman, posible pa ring suriin ang impluwensya ng bawat salik nang hiwalay. Sa ganitong kahulugan, ang pamamaraan ng multivariate analysis ng pagkakaiba-iba (sa variant ng paggamit nito sa computer) ay walang alinlangan na mas matipid, dahil sa isang pagtakbo lamang ay malulutas nito ang dalawang problema nang sabay-sabay: ang impluwensya ng bawat isa sa mga kadahilanan at ang kanilang pakikipag-ugnayan ay tinatantya / 3/.

Ang pangkalahatang pamamaraan ng isang dalawang-factor na eksperimento, ang data kung saan ay pinoproseso sa pamamagitan ng pagsusuri ng pagkakaiba-iba, ay ang mga sumusunod:



Figure 1.1 - Scheme ng isang two-factor experiment

Ang data na sumasailalim sa multivariate analysis ng variance ay kadalasang nilagyan ng label ayon sa bilang ng mga salik at kanilang mga antas.

Ipagpalagay na sa isinasaalang-alang na problema ng kalidad ng iba't ibang m batch, ang mga produkto ay ginawa sa iba't ibang t machine at kinakailangan upang malaman kung may mga makabuluhang pagkakaiba sa kalidad ng mga produkto para sa bawat kadahilanan:

A - isang batch ng mga produkto;

B - makina.

Ang resulta ay isang paglipat sa problema ng two-factor analysis ng variance.

Ang lahat ng data ay ipinakita sa Talahanayan 1.2, kung saan ang mga hilera - mga antas A i ng kadahilanan A, ang mga haligi - mga antas B j ng kadahilanan B, at sa kaukulang mga cell ng talahanayan ay ang mga halaga ng tagapagpahiwatig ng kalidad ng produkto x ijk (i = 1.2, ... ,m; j=1,2,...,l; k=1,2,...,n).

Talahanayan 1.2 - Mga tagapagpahiwatig ng kalidad ng produkto

x 11l ,…,x 11k

x 12l ,…,x 12k

x 1jl ,…,x 1jk

x 1ll ,…,x 1lk

x 2 1l ,…,x 2 1k

x 22l ,…,x 22k

x 2jl ,…,x 2jk

x 2ll ,…,x 2lk

x i1l ,…,x i1k

x i2l ,…,x i2k

xijl ,…,xijk

xjll ,…,xjlk

x m1l ,…,x m1k

x m2l ,…,x m2k

xmjl ,…,xmjk

x mll ,…,x mlk

Ang two-factor dispersion model ay may anyo:

x ijk =μ+F i +G j +I ij +ε ijk , (15)

kung saan ang x ijk ay ang halaga ng obserbasyon sa cell ij na may numerong k;

μ - pangkalahatang average;

F i - epekto dahil sa impluwensya ng i-th na antas ng kadahilanan A;

G j - epekto dahil sa impluwensya ng j-th na antas ng kadahilanan B;

I ij - epekto dahil sa pakikipag-ugnayan ng dalawang salik, i.e. paglihis mula sa average para sa mga obserbasyon sa cell ij mula sa kabuuan ng unang tatlong termino sa modelo (15);

ε ijk - perturbation dahil sa pagkakaiba-iba ng variable sa loob ng iisang cell.

Ipinapalagay na ang ε ijk ay may normal na distribusyon N(0; с 2), at lahat ng mga inaasahan sa matematika F * , G * , I i * , I * j ay katumbas ng zero.

Ang mga average ng pangkat ay matatagpuan sa pamamagitan ng mga formula:

Sa cell:

sa pamamagitan ng linya:

ayon sa hanay:

pangkalahatang average:

Ang talahanayan 1.3 ay nagpapakita ng isang pangkalahatang view ng pagkalkula ng mga halaga gamit ang pagsusuri ng pagkakaiba-iba.

Talahanayan 1.3 - Pangunahing talahanayan ng pagsusuri ng pagkakaiba

Mga bahagi ng pagkakaiba-iba

Kabuuan ng mga parisukat

Bilang ng antas ng kalayaan

Mga gitnang parisukat

Intergroup (factor A)

Intergroup (factor B)

Pakikipag-ugnayan

Nalalabi

Ang pagsuri sa mga null hypotheses HA, HB, HAB tungkol sa kawalan ng impluwensya sa itinuturing na variable ng mga kadahilanan A, B at ang kanilang pakikipag-ugnayan AB ay isinasagawa sa pamamagitan ng paghahambing ng mga ratios , , (para sa modelo I na may mga nakapirming antas ng mga kadahilanan) o ang mga ratios , , (para sa isang random na modelo II) na may katumbas na mga halaga ng tabular F - Fisher-Snedecor criterion. Para sa halo-halong modelo III, ang pagsubok ng mga hypotheses tungkol sa mga salik na may mga nakapirming antas ay isinasagawa sa parehong paraan tulad ng sa modelo II, at para sa mga salik na may mga random na antas, tulad ng sa modelo I.

Kung n=1, ibig sabihin. na may isang obserbasyon sa cell, kung gayon hindi lahat ng mga null hypotheses ay maaaring masuri, dahil ang bahagi ng Q3 ay bumagsak sa kabuuang kabuuan ng mga squared deviations, at kasama nito ang ibig sabihin ng parisukat, dahil sa kasong ito ay walang tanong tungkol sa pakikipag-ugnayan ng mga kadahilanan.

Mula sa punto ng view ng computational technique, upang mahanap ang mga kabuuan ng mga parisukat Q 1, Q 2, Q 3, Q 4, Q, mas kapaki-pakinabang na gamitin ang mga formula:

Q 3 \u003d Q - Q 1 - Q 2 - Q 4.

Ang paglihis mula sa mga pangunahing kinakailangan ng pagsusuri ng pagkakaiba-iba - ang normalidad ng distribusyon ng variable sa ilalim ng pag-aaral at ang pagkakapantay-pantay ng mga pagkakaiba-iba sa mga cell (kung hindi ito labis) - ay hindi makabuluhang nakakaapekto sa mga resulta ng pagsusuri ng pagkakaiba-iba sa isang pantay na bilang ng mga obserbasyon sa mga cell, ngunit maaaring maging napakasensitibo kung ang kanilang bilang ay hindi pantay. Bilang karagdagan, na may hindi pantay na bilang ng mga obserbasyon sa mga cell, ang pagiging kumplikado ng aparato para sa pagsusuri ng pagkakaiba-iba ay tumataas nang husto. Samakatuwid, inirerekumenda na magdisenyo ng isang scheme na may pantay na bilang ng mga obserbasyon sa mga cell, at kung may nawawalang data, pagkatapos ay mabayaran ang mga ito ng mga average na halaga ng iba pang mga obserbasyon sa mga cell. Sa kasong ito, gayunpaman, ang artipisyal na ipinakilala na nawawalang data ay hindi dapat isaalang-alang kapag kinakalkula ang bilang ng mga antas ng kalayaan /1/.

2 Paglalapat ng ANOVA sa iba't ibang proseso at pag-aaral

2.1 Paggamit ng pagsusuri ng pagkakaiba sa pag-aaral ng mga proseso ng migrasyon

Ang migrasyon ay isang kumplikadong panlipunang kababalaghan na higit na tumutukoy sa mga aspetong pang-ekonomiya at pampulitika ng lipunan. Ang pag-aaral ng mga proseso ng paglipat ay nauugnay sa pagkilala sa mga kadahilanan ng interes, kasiyahan sa mga kondisyon sa pagtatrabaho, at isang pagtatasa ng impluwensya ng mga nakuha na mga kadahilanan sa paggalaw ng intergroup ng populasyon.

λ ij = c i q ij a j ,

kung saan ang λ ij ay ang intensity ng mga transisyon mula sa orihinal na pangkat i (output) patungo sa bagong pangkat na j (input);

c i – posibilidad at kakayahang umalis sa grupo i (c i ≥0);

q ij – pagiging kaakit-akit ng bagong grupo kumpara sa orihinal (0≤q ij ≤1);

a j – pagkakaroon ng pangkat j (a j ≥0).

ν ij ≈ n i λ ij =n i c i q ij a j . (16)

Sa pagsasagawa, para sa isang indibidwal, ang posibilidad p ng paglipat sa isa pang grupo ay maliit, at ang laki ng pangkat n na isinasaalang-alang ay malaki. Sa kasong ito, nalalapat ang batas ng mga bihirang kaganapan, iyon ay, ang limitasyon ν ij ay ang Poisson distribution na may parameter na μ=np:

.

Habang tumataas ang μ, lumalapit sa normal ang distribusyon. Ang binagong halaga na √ν ij ay maituturing na normal na ipinamamahagi.

Kung kukunin natin ang logarithm ng expression (16) at gagawin ang mga kinakailangang pagbabago ng mga variable, pagkatapos ay makakakuha tayo ng pagsusuri ng variance model:

ln√ν ij =½lnν ij =½(lnn i +lnc i +lnq ij +lna j)+ε ij ,

X i,j =2ln√ν ij -lnn i -lnq ij ,

Xi,j =Ci +Aj +ε.

Ginagawang posible ng mga halaga ng C i at A j na makakuha ng two-way na modelo ng ANOVA na may isang obserbasyon bawat cell. Ang inverse transformation mula sa C i at A j ay kinakalkula ang mga coefficient c i at a j .

Kapag nagsasagawa ng pagsusuri ng pagkakaiba-iba, ang mga sumusunod na halaga ay dapat kunin bilang mga halaga ng epektibong tampok na Y:

X \u003d (X 1.1 + X 1.2 +: + X mi, mj) / mimj,

kung saan ang mimj ay ang pagtatantya ng inaasahan sa matematika X i,j ;

X mi at X mj - ayon sa pagkakabanggit, ang bilang ng mga exit at entry na grupo.

Ang mga antas ng Factor I ay magiging mga mi exit group, ang mga antas ng factor J ay magiging mga pangkat ng entry na mj. Ipinapalagay ang Mi=mj=m. Ang problema ay lumitaw sa pagsubok ng mga hypotheses H I at H J tungkol sa pagkakapantay-pantay ng matematikal na mga inaasahan ng halaga Y sa mga antas I i at sa mga antas J j , i,j=1,…,m. Ang pagsusuri sa hypothesis H I ay batay sa paghahambing ng mga halaga ng walang pinapanigan na mga pagtatantya ng pagkakaiba s I 2 at s o 2 . Kung tama ang hypothesis H I, kung gayon ang value F (I) = s I 2 /s o 2 ay mayroong Fisher distribution na may bilang ng mga degree ng kalayaan k 1 =m-1 at k 2 =(m-1)(m- 1). Para sa isang naibigay na antas ng kahalagahan α, ang kanang kamay na kritikal na punto x pr, α cr ay matatagpuan. Kung ang numerical value F (I) ng quantity ay nasa pagitan (x pr, α kr, +∞), kung gayon ang hypothesis H I ay tinatanggihan at pinaniniwalaan na ang factor I ay nakakaapekto sa epektibong feature. Ang antas ng impluwensyang ito, batay sa mga resulta ng mga obserbasyon, ay sinusukat sa pamamagitan ng sampling coefficient of determination, na nagpapakita kung anong proporsyon ng pagkakaiba-iba ng resultang tampok sa sample ay dahil sa impluwensya ng factor I dito. Kung F ( I) bilang

2.2 Mga prinsipyo ng mathematical at statistical analysis ng biomedical na data ng pananaliksik

Depende sa gawain, ang dami at likas na katangian ng materyal, ang uri ng data at ang kanilang mga relasyon, mayroong isang pagpipilian ng mga pamamaraan ng pagproseso ng matematika sa mga yugto ng parehong paunang (upang masuri ang likas na katangian ng pamamahagi sa sample ng pag-aaral) at panghuling pagsusuri alinsunod sa mga layunin ng pag-aaral. Ang isang napakahalagang aspeto ay ang pag-verify ng homogeneity ng mga napiling grupo ng pagmamasid, kabilang ang mga kontrol, na maaaring isagawa ng alinman sa isang eksperto, o sa pamamagitan ng mga multivariate na pamamaraan ng istatistika (halimbawa, gamit ang pagsusuri ng cluster). Ngunit ang unang hakbang ay ang pag-compile ng isang palatanungan na nagbibigay para sa isang standardized na paglalarawan ng mga katangian. Lalo na kapag nagsasagawa ng epidemiological na pag-aaral, kung saan kailangan ang pagkakaisa sa pag-unawa at paglalarawan ng parehong mga sintomas ng iba't ibang mga doktor, kabilang ang pagsasaalang-alang sa mga saklaw ng kanilang mga pagbabago (kalubhaan). Kung may mga makabuluhang pagkakaiba sa pagpaparehistro ng paunang data (subjective assessment ng likas na katangian ng pathological manifestations ng iba't ibang mga espesyalista) at imposibleng dalhin ang mga ito sa isang solong form sa yugto ng pagkolekta ng impormasyon, pagkatapos ay ang tinatawag na covariant correction. maaaring isagawa, na kinabibilangan ng normalisasyon ng mga variable, i.e. pag-aalis ng mga abnormalidad ng mga tagapagpahiwatig sa data matrix. Ang "koordinasyon ng mga opinyon" ay isinasagawa na isinasaalang-alang ang espesyalidad at karanasan ng mga doktor, na ginagawang posible na ihambing ang mga resulta ng pagsusuri na nakuha nila sa bawat isa. Para dito, maaaring gamitin ang multivariate analysis ng variance at regression analysis.

Ang mga palatandaan ay maaaring pareho sa parehong uri, na bihira, o iba't ibang uri. Ang terminong ito ay tumutukoy sa kanilang iba't ibang metrological na pagsusuri. Ang mga quantitative o numerical na mga palatandaan ay ang mga sinusukat sa isang tiyak na sukat at sa mga kaliskis ng mga pagitan at ratios (I pangkat ng mga palatandaan). Ang kwalitatibo, pagraranggo o pagmamarka ay ginagamit upang ipahayag ang mga medikal na termino at konsepto na walang mga numerical na halaga (halimbawa, ang kalubhaan ng kondisyon) at sinusukat sa isang sukat ng pagkakasunud-sunod (pangkat II ng mga palatandaan). Pag-uuri o nominal (halimbawa, propesyon, uri ng dugo) - ang mga ito ay sinusukat sa sukat ng mga pangalan (pangkat III ng mga palatandaan).

Sa maraming mga kaso, ang isang pagtatangka ay ginawa upang pag-aralan ang isang napakalaking bilang ng mga tampok, na dapat makatulong upang madagdagan ang nilalaman ng impormasyon ng ipinakita na sample. Gayunpaman, ang pagpili ng kapaki-pakinabang na impormasyon, iyon ay, ang pagpili ng mga tampok, ay isang ganap na kinakailangang operasyon, dahil upang malutas ang anumang problema sa pag-uuri, dapat piliin ang impormasyon na nagdadala ng impormasyon na kapaki-pakinabang para sa gawaing ito. Kung sakaling sa ilang kadahilanan ay hindi ito isinasagawa ng mananaliksik sa kanyang sarili o walang sapat na napatunayang pamantayan para sa pagbabawas ng dimensyon ng tampok na espasyo para sa makabuluhang mga kadahilanan, ang paglaban sa kalabisan ng impormasyon ay isinasagawa na sa pamamagitan ng mga pormal na pamamaraan ng pagtatasa ng nilalaman ng impormasyon.

Ang pagsusuri ng pagkakaiba-iba ay nagbibigay-daan sa iyo upang matukoy ang impluwensya ng iba't ibang mga kadahilanan (kondisyon) sa katangian (kababalaghan) sa ilalim ng pag-aaral, na nakakamit sa pamamagitan ng pag-decomposing ng kabuuang pagkakaiba-iba (dispersion na ipinahayag bilang ang kabuuan ng mga squared deviations mula sa pangkalahatang average) sa mga indibidwal na bahagi na sanhi sa pamamagitan ng impluwensya ng iba't ibang pinagmumulan ng pagkakaiba-iba.

Sa tulong ng pagsusuri ng pagkakaiba-iba, ang mga banta ng sakit ay sinusuri sa pagkakaroon ng mga kadahilanan ng panganib. Isinasaalang-alang ng konsepto ng relatibong panganib ang kaugnayan sa pagitan ng mga pasyenteng may partikular na sakit at ng mga wala nito. Ginagawang posible ng relatibong halaga ng panganib na matukoy kung gaano karaming beses tumataas ang posibilidad na magkasakit sa presensya nito, na maaaring tantiyahin gamit ang sumusunod na pinasimpleng formula:

kung saan ang a ay ang pagkakaroon ng isang katangian sa pangkat ng pag-aaral;

b - ang kawalan ng isang katangian sa pangkat ng pag-aaral;

c - ang pagkakaroon ng isang palatandaan sa pangkat ng paghahambing (kontrol);

d - kawalan ng isang palatandaan sa pangkat ng paghahambing (kontrol).

Ang attribute risk score (rA) ay ginagamit para masuri ang proporsyon ng morbidity na nauugnay sa isang partikular na risk factor:

,

kung saan ang Q ay ang dalas ng katangiang nagmamarka ng panganib sa populasyon;

r" - kamag-anak na panganib.

Pagkilala sa mga kadahilanan na nag-aambag sa paglitaw (pagpapakita) ng sakit, i.e. Ang mga kadahilanan ng peligro ay maaaring isagawa sa iba't ibang paraan, halimbawa, sa pamamagitan ng pagtatasa ng pagiging impormasyon na may kasunod na pagraranggo ng mga palatandaan, na, gayunpaman, ay hindi nagpapahiwatig ng pinagsama-samang epekto ng mga napiling mga parameter, sa kaibahan sa paggamit ng regression, mga pagsusuri sa kadahilanan, mga pamamaraan. ng pattern recognition theory, na ginagawang posible na makakuha ng "symptomatic complexes" ng risk-factor. Bilang karagdagan, ginagawang posible ng mga mas sopistikadong pamamaraan na pag-aralan ang mga hindi direktang ugnayan sa pagitan ng mga kadahilanan ng panganib at mga sakit /5/.

2.3 Bioassay ng lupa

Ang magkakaibang mga pollutant, na nakapasok sa agrocenosis, ay maaaring sumailalim sa iba't ibang mga pagbabago sa loob nito, habang pinapataas ang kanilang nakakalason na epekto. Para sa kadahilanang ito, ang mga pamamaraan para sa integral na pagtatasa ng kalidad ng mga bahagi ng agrocenosis ay naging kinakailangan. Ang mga pag-aaral ay isinagawa batay sa isang multivariate na pagsusuri ng pagkakaiba-iba sa isang 11-field grain-grass-rowed crop rotation. Sa eksperimento, pinag-aralan ang impluwensya ng mga sumusunod na salik: pagkamayabong ng lupa (A), sistema ng pataba (B), sistema ng proteksyon ng halaman (C). Ang pagkamayabong ng lupa, sistema ng pataba at sistema ng proteksyon ng halaman ay pinag-aralan sa mga dosis na 0, 1, 2 at 3. Ang mga pangunahing opsyon ay kinakatawan ng mga sumusunod na kumbinasyon:

000 - ang paunang antas ng pagkamayabong, nang walang paggamit ng mga pataba at mga produkto ng proteksyon ng halaman mula sa mga peste, sakit at mga damo;

111 - ang average na antas ng pagkamayabong ng lupa, ang pinakamababang dosis ng pataba, ang biological na proteksyon ng mga halaman mula sa mga peste at sakit;

222 - ang paunang antas ng pagkamayabong ng lupa, ang average na dosis ng mga pataba, proteksyon ng kemikal ng mga halaman mula sa mga damo;

333 - isang mataas na antas ng pagkamayabong ng lupa, isang mataas na dosis ng mga pataba, proteksyon ng kemikal ng mga halaman mula sa mga peste at sakit.

Pinag-aralan namin ang mga opsyon kung saan isang salik lang ang naroroon:

200 - pagkamayabong:

020 - mga pataba;

002 - mga produkto ng proteksyon ng halaman.

Pati na rin ang mga opsyon na may ibang kumbinasyon ng mga salik - 111, 131, 133, 022, 220, 202, 331, 313, 311.

Ang layunin ng pag-aaral ay pag-aralan ang pagsugpo ng mga chloroplast at ang koepisyent ng agarang paglaki, bilang mga tagapagpahiwatig ng polusyon sa lupa, sa iba't ibang variant ng isang multifactorial na eksperimento.

Ang pagsugpo ng phototaxis ng duckweed chloroplasts ay pinag-aralan sa iba't ibang horizon ng lupa: 0-20, 20-40 cm. Ang bahagi sa kabuuang pagpapakalat ng pagkamayabong ng lupa ay 39.7%, mga sistema ng pataba - 30.7%, mga sistema ng proteksyon ng halaman - 30.7%.

Upang pag-aralan ang pinagsamang epekto ng mga kadahilanan sa pagsugpo ng chloroplast phototaxis, ginamit ang iba't ibang mga kumbinasyon ng mga pang-eksperimentong variant: sa unang kaso - 000, 002, 022, 222, 220, 200, 202, 020, sa pangalawang kaso - 111, 333, 331, 313, 133, 311, 131.

Ang mga resulta ng isang two-way analysis ng pagkakaiba-iba ay nagpapahiwatig ng isang makabuluhang epekto ng nakikipag-ugnay na pataba at mga sistema ng proteksyon ng halaman sa mga pagkakaiba sa phototaxis para sa unang kaso (ang bahagi sa kabuuang pagkakaiba ay 10.3%). Para sa pangalawang kaso, natagpuan ang isang makabuluhang impluwensya ng nakikipag-ugnay na pagkamayabong ng lupa at sistema ng pataba (53.2%).

Ang tatlong-paraan na pagsusuri ng pagkakaiba-iba ay nagpakita sa unang kaso ng isang makabuluhang impluwensya ng pakikipag-ugnayan ng lahat ng tatlong mga kadahilanan. Ang bahagi sa kabuuang pagpapakalat ay 47.9%.

Ang instantaneous growth coefficient ay pinag-aralan sa iba't ibang variant ng eksperimento 000, 111, 222, 333, 002, 200, 220. Ang unang yugto ng pagsubok ay bago ang paglalapat ng mga herbicide sa mga pananim ng trigo sa taglamig (Abril), ang pangalawang yugto - pagkatapos ang application ng herbicides (Mayo) at ang huling - sa panahon ng pag-aani (Hulyo). Forerunners - mirasol at mais para sa butil.

Ang hitsura ng mga bagong fronds ay naobserbahan pagkatapos ng isang maikling yugto ng lag na may isang panahon ng kabuuang pagdoble ng sariwang timbang ng 2-4 na araw.

Sa kontrol at sa bawat variant, batay sa nakuha na mga resulta, ang koepisyent ng agarang paglaki ng populasyon r ay kinakalkula, at pagkatapos ay ang oras ng pagdodoble ng bilang ng mga fronds (t pagdodoble) ay kinakalkula.

t nagdodoble \u003d ln2 / r.

Ang pagkalkula ng mga tagapagpahiwatig na ito ay isinagawa sa dinamika sa pagsusuri ng mga sample ng lupa. Ang pagsusuri sa datos ay nagpakita na ang pagdodoble ng populasyon ng duckweed bago ang pagbubungkal ay ang pinakamaikling kumpara sa datos pagkatapos ng pagbubungkal at sa panahon ng pag-aani. Sa dinamika ng mga obserbasyon, ang pagtugon ng lupa pagkatapos ng paggamit ng herbicide at sa panahon ng pag-aani ay higit na interesado. Una sa lahat, ang pakikipag-ugnayan sa mga pataba at ang antas ng pagkamayabong.

Minsan ang pagkuha ng isang direktang tugon sa aplikasyon ng mga paghahanda ng kemikal ay maaaring kumplikado sa pamamagitan ng pakikipag-ugnayan ng paghahanda sa mga pataba, parehong organiko at mineral. Ang data na nakuha ay naging posible upang masubaybayan ang dynamics ng tugon ng mga inilapat na paghahanda, sa lahat ng mga variant na may kemikal na paraan ng proteksyon, kung saan ang paglago ng tagapagpahiwatig ay itinigil.

Ang data ng one-way analysis ng variance ay nagpakita ng makabuluhang epekto ng bawat indicator sa growth rate ng duckweed sa unang yugto. Sa ikalawang yugto, ang epekto ng mga pagkakaiba sa pagkamayabong ng lupa ay 65.0%, sa sistema ng pataba at sistema ng proteksyon ng halaman - 65.0% bawat isa. Ang mga kadahilanan ay nagpakita ng makabuluhang pagkakaiba sa pagitan ng average sa mga tuntunin ng instantaneous growth coefficient ng opsyon 222 at mga opsyon 000, 111, 333. Sa ikatlong yugto, ang bahagi sa kabuuang dispersion ng pagkamayabong ng lupa ay 42.9%, mga sistema ng pataba at mga sistema ng proteksyon ng halaman - 42.9% bawat isa. Ang isang makabuluhang pagkakaiba ay nabanggit sa average na mga halaga ng mga pagpipilian 000 at 111, mga pagpipilian 333 at 222.

Ang pinag-aralan na mga sample ng lupa mula sa mga opsyon sa pagsubaybay sa field ay naiiba sa bawat isa sa mga tuntunin ng pagsugpo sa phototaxis. Ang impluwensya ng mga kadahilanan ng pagkamayabong ay nabanggit, ang sistema ng pataba at mga produkto ng proteksyon ng halaman na may pagbabahagi ng 30.7 at 39.7% sa isang solong-factor na pagsusuri, sa dalawang-factor at tatlong-factor na pagsusuri, ang magkasanib na impluwensya ng mga kadahilanan ay nakarehistro.

Ang isang pagsusuri ng mga pang-eksperimentong resulta ay nagpakita ng mga hindi gaanong pagkakaiba sa pagitan ng mga abot-tanaw ng lupa sa mga tuntunin ng tagapagpahiwatig ng pagsugpo sa phototaxis. Ang mga pagkakaiba ay minarkahan ng mga average na halaga.

Sa lahat ng mga variant kung saan mayroong mga produkto ng proteksyon ng halaman, ang mga pagbabago sa posisyon ng mga chloroplast at pag-aresto sa paglaki ng duckweed ay mas kaunti ay sinusunod /6/.

2.4 Ang trangkaso ay nagdudulot ng pagtaas ng produksyon ng histamine

Ang mga mananaliksik sa Children's Hospital sa Pittsburgh (USA) ay nakatanggap ng unang katibayan na ang mga antas ng histamine ay tumataas na may acute respiratory viral infections. Sa kabila ng katotohanan na ang histamine ay dati nang iminungkahi na maglaro ng isang papel sa pagsisimula ng mga sintomas ng acute respiratory infection ng upper respiratory tract.

Interesado ang mga siyentipiko kung bakit maraming tao ang gumagamit ng antihistamines, na sa maraming bansa ay kasama sa kategoryang OTC, para sa self-treatment ng "mga sipon" at ang karaniwang sipon. magagamit nang walang reseta ng doktor.

Ang layunin ng pag-aaral na ito ay upang matukoy kung ang produksyon ng histamine ay tumaas sa panahon ng pang-eksperimentong impeksyon sa virus ng trangkaso A.

15 malulusog na boluntaryo ay na-injected sa intranasally ng influenza A virus at pagkatapos ay naobserbahan para sa pagbuo ng impeksyon. Araw-araw sa panahon ng sakit, ang bahagi ng umaga ng ihi ay nakolekta mula sa mga boluntaryo, at pagkatapos ay tinutukoy ang histamine at ang mga metabolite nito, at ang kabuuang halaga ng histamine at ang mga metabolite nito na pinalabas bawat araw ay kinakalkula.

Ang sakit ay nabuo sa lahat ng 15 boluntaryo. Ang pagsusuri ng pagkakaiba-iba ay nagkumpirma ng isang makabuluhang mas mataas na antas ng histamine sa ihi sa mga araw na 2-5 ng impeksyon sa viral (p<0,02) - период, когда симптомы «простуды» наиболее выражены. Парный анализ показал, что наиболее значительно уровень гистамина повышается на 2 день заболевания. Кроме этого, оказалось, что суточное количество гистамина и его метаболитов в моче при гриппе примерно такое же, как и при обострении аллергического заболевания.

Ang mga resulta ng pag-aaral na ito ay nagbibigay ng unang direktang katibayan na ang mga antas ng histamine ay nakataas sa mga talamak na impeksyon sa paghinga /7/.

Pagsusuri ng pagkakaiba-iba sa kimika

Ang dispersion analysis ay isang hanay ng mga pamamaraan para sa pagtukoy ng dispersion, ibig sabihin, mga katangian ng mga laki ng particle sa mga disperse system. Kasama sa pagtatasa ng dispersion ang iba't ibang mga pamamaraan para sa pagtukoy ng laki ng mga libreng particle sa likido at gas na media, ang laki ng mga butas ng butas sa mga pinong porous na katawan (sa kasong ito, ang katumbas na konsepto ng porosity ay ginagamit sa halip na ang konsepto ng dispersion), pati na rin ang ang tiyak na lugar sa ibabaw. Ang ilan sa mga pamamaraan ng dispersion analysis ay ginagawang posible na makakuha ng kumpletong larawan ng pamamahagi ng mga particle ayon sa laki (volume), habang ang iba ay nagbibigay lamang ng average na katangian ng dispersion (porosity).

Kasama sa unang grupo, halimbawa, ang mga pamamaraan para sa pagtukoy ng laki ng mga indibidwal na particle sa pamamagitan ng direktang pagsukat (sieve analysis, optical at electron microscopy) o sa pamamagitan ng hindi direktang data: ang settling rate ng mga particle sa isang malapot na medium (sedimentation analysis sa isang gravitational field at sa centrifuges), ang magnitude ng electric current pulses, na nagmumula sa pagpasa ng mga particle sa pamamagitan ng isang butas sa isang non-conductive partition (conductometric method).

Ang pangalawang pangkat ng mga pamamaraan ay pinagsasama ang pagtatantya ng average na laki ng mga libreng particle at ang pagpapasiya ng tiyak na lugar sa ibabaw ng mga pulbos at porous na katawan. Ang average na laki ng butil ay matatagpuan sa pamamagitan ng intensity ng nakakalat na liwanag (nephelometry), gamit ang isang ultramicroscope, mga pamamaraan ng pagsasabog, atbp., Ang tiyak na lugar sa ibabaw ay tinutukoy ng adsorption ng mga gas (vapors) o dissolved substance, sa pamamagitan ng gas permeability, dissolution rate , at iba pang mga pamamaraan. Nasa ibaba ang mga limitasyon ng kakayahang magamit ng iba't ibang paraan ng pagsusuri ng pagkakaiba (mga laki ng particle sa metro):

Pagsusuri ng salaan - 10 -2 -10 -4

Pagsusuri ng sedimentation sa isang gravitational field - 10 -4 -10 -6

Paraan ng conductometric - 10 -4 -10 -6

Microscopy - 10 -4 -10 -7

Paraan ng pagsasala - 10 -5 -10 -7

Centrifugation - 10 -6 -10 -8

Ultracentrifugation - 10 -7 -10 -9

Ultramicroscopy - 10 -7 -10 -9

Nephelometry - 10 -7 -10 -9

Electron microscopy - 10 -7 -10 -9

Paraan ng pagsasabog - 10 -7 -10 -10

Ang dispersion analysis ay malawakang ginagamit sa iba't ibang larangan ng agham at industriyal na produksyon upang masuri ang pagpapakalat ng mga system (suspension, emulsion, sols, powders, adsorbents, atbp.) na may mga laki ng particle mula sa ilang millimeters (10 -3 m) hanggang ilang nanometer (10). -9 m) /8/.

2.6 Ang paggamit ng direktang intensyonal na mungkahi sa estado ng paggising sa paraan ng edukasyon ng mga pisikal na katangian

Ang pisikal na pagsasanay ay ang pangunahing bahagi ng pagsasanay sa palakasan, dahil, sa isang mas malaking lawak kaysa sa iba pang mga aspeto ng pagsasanay, ito ay nailalarawan sa pamamagitan ng mga pisikal na pagkarga na nakakaapekto sa morphological at functional na mga katangian ng katawan. Ang tagumpay ng teknikal na pagsasanay, ang nilalaman ng mga taktika ng isang atleta, ang pagsasakatuparan ng mga personal na katangian sa proseso ng pagsasanay at kumpetisyon ay nakasalalay sa antas ng pisikal na fitness.

Ang isa sa mga pangunahing gawain ng pisikal na pagsasanay ay ang edukasyon ng mga pisikal na katangian. Sa pagsasaalang-alang na ito, may pangangailangan na bumuo ng mga tool at pamamaraan ng pedagogical na nagbibigay-daan sa pagsasaalang-alang sa mga katangian ng edad ng mga batang atleta na nagpapanatili ng kanilang kalusugan, hindi nangangailangan ng karagdagang oras at sa parehong oras ay nagpapasigla sa paglaki ng mga pisikal na katangian at, bilang isang resulta, sportsmanship. Ang paggamit ng verbal heteroinfluence sa proseso ng pagsasanay sa mga pangunahing grupo ng pagsasanay ay isa sa mga promising area ng pananaliksik sa isyung ito.

Ang isang pagsusuri sa teorya at kasanayan ng pagpapatupad ng nakasisiglang verbal na hetero-impluwensya ay nagsiwalat ng mga pangunahing kontradiksyon:

Katibayan ng epektibong paggamit ng mga tiyak na pamamaraan ng verbal heteroinfluence sa proseso ng pagsasanay at ang praktikal na imposibilidad ng paggamit ng mga ito ng isang coach;

Ang pagkilala sa direktang intensyonal na mungkahi (mula dito ay tinutukoy bilang DSP) sa estado ng paggising bilang isa sa mga pangunahing pamamaraan ng verbal hetero-impluwensya sa aktibidad ng pedagogical ng isang coach at ang kakulangan ng isang teoretikal na katwiran para sa mga metodolohikal na tampok ng paggamit nito sa sports pagsasanay, at lalo na sa proseso ng pagtuturo ng mga pisikal na katangian.

Kaugnay ng natukoy na mga kontradiksyon at hindi sapat na pag-unlad, ang problema sa paggamit ng sistema ng mga pamamaraan ng verbal heteroinfluence sa proseso ng pagtuturo ng mga pisikal na katangian ng mga atleta ay paunang natukoy ang layunin ng pag-aaral - upang bumuo ng makatuwirang naka-target na mga pamamaraan ng PPV sa estado ng paggising, nag-aambag sa pagpapabuti ng proseso ng pagtuturo ng mga pisikal na katangian batay sa pagtatasa ng estado ng pag-iisip, pagpapakita at dinamika ng mga pisikal na katangian ng mga judoist ng elementarya na mga grupo ng pagsasanay.

Upang masubukan at matukoy ang pagiging epektibo ng mga eksperimentong pamamaraan ng PPV sa pagbuo ng mga pisikal na katangian ng judo wrestlers, isang paghahambing na eksperimento sa pedagogical ang isinagawa, kung saan apat na grupo ang nakibahagi - tatlong eksperimentong at isang kontrol. Sa unang pang-eksperimentong grupo (EG) ginamit ang PPV M1 technique, sa pangalawa - ang PPV M2 technique, sa pangatlo - ang PPV M3 technique. Sa control group (CG), hindi ginamit ang mga pamamaraan ng PPV.

Upang matukoy ang pagiging epektibo ng epekto ng pedagogical ng mga pamamaraan ng PPV sa proseso ng pagtuturo ng mga pisikal na katangian sa mga judoka, isang isang-factor na pagsusuri ng pagkakaiba-iba ang isinagawa.

Ang antas ng impluwensya ng pamamaraan ng PPV M1 sa proseso ng edukasyon:

Pagtitiis:

a) pagkatapos ng ikatlong buwan ay 11.1%;

Mga kakayahan sa bilis:

a) pagkatapos ng unang buwan - 16.4%;

b) pagkatapos ng pangalawa - 26.5%;

c) pagkatapos ng pangatlo - 34.8%;

a) pagkatapos ng ikalawang buwan - 26.7%;

b) pagkatapos ng pangatlo - 35.3%;

Flexibility:

a) pagkatapos ng ikatlong buwan - 20.8%;

a) pagkatapos ng ikalawang buwan ng pangunahing eksperimentong pedagogical, ang antas ng impluwensya ng pamamaraan ay 6.4%;

b) pagkatapos ng pangatlo - 10.2%.

Dahil dito, ang mga makabuluhang pagbabago sa mga tagapagpahiwatig ng antas ng pag-unlad ng mga pisikal na katangian gamit ang PPV M1 na pamamaraan ay natagpuan sa bilis ng mga kakayahan at lakas, ang antas ng impluwensya ng pamamaraan sa kasong ito ay ang pinakadakila. Ang pinakamababang antas ng impluwensya ng pamamaraan ay natagpuan sa proseso ng pagtuturo ng pagtitiis, kakayahang umangkop, at mga kakayahan sa koordinasyon, na nagbibigay ng mga batayan upang magsalita tungkol sa hindi sapat na pagiging epektibo ng paggamit ng pamamaraan ng PPV M1 sa pagtuturo ng mga katangiang ito.

Ang antas ng impluwensya ng pamamaraan ng PPV M2 sa proseso ng edukasyon:

Pagtitiis

a) pagkatapos ng unang buwan ng eksperimento - 12.6%;

b) pagkatapos ng pangalawa - 17.8%;

c) pagkatapos ng pangatlo - 20.3%.

Mga kakayahan sa bilis:

a) pagkatapos ng ikatlong buwan ng mga sesyon ng pagsasanay - 28%.

a) pagkatapos ng ikalawang buwan - 27.9%;

b) pagkatapos ng pangatlo - 35.9%.

Flexibility:

a) pagkatapos ng ikatlong buwan ng mga sesyon ng pagsasanay - 14.9%;

Mga kakayahan sa koordinasyon - 13.1%.

Ang nakuha na resulta ng single-factor analysis ng variance ng EG na ito ay nagpapahintulot sa amin na tapusin na ang PPV M2 na pamamaraan ay ang pinaka-epektibo sa pagbuo ng tibay at lakas. Ito ay hindi gaanong epektibo sa proseso ng pagbuo ng kakayahang umangkop, bilis at mga kakayahan sa koordinasyon.

Ang antas ng impluwensya ng pamamaraan ng PPV M3 sa proseso ng edukasyon:

Pagtitiis:

a) pagkatapos ng unang buwan ng eksperimento 16.8%;

b) pagkatapos ng pangalawa - 29.5%;

c) pagkatapos ng pangatlo - 37.6%.

Mga kakayahan sa bilis:

a) pagkatapos ng unang buwan - 26.3%;

b) pagkatapos ng pangalawa - 31.3%;

c) pagkatapos ng pangatlo - 40.9%.

a) pagkatapos ng unang buwan - 18.7%;

b) pagkatapos ng pangalawa - 26.7%;

c) pagkatapos ng pangatlo - 32.3%.

Flexibility:

a) pagkatapos ng una - walang mga pagbabago;

b) pagkatapos ng pangalawa - 16.9%;

c) pagkatapos ng pangatlo - 23.5%.

Mga kakayahan sa koordinasyon:

a) walang mga pagbabago pagkatapos ng unang buwan;

b) pagkatapos ng pangalawa - 23.8%;

c) pagkatapos ng pangatlo - 91%.

Kaya, ang isang-factor na pagsusuri ng pagkakaiba-iba ay nagpakita na ang paggamit ng pamamaraan ng PPV M3 sa panahon ng paghahanda ay pinaka-epektibo sa proseso ng pagtuturo ng mga pisikal na katangian, dahil mayroong pagtaas sa antas ng impluwensya nito pagkatapos ng bawat buwan ng eksperimentong pedagogical. /9/.

2.7 Pag-alis ng talamak na psychotic na sintomas sa mga pasyenteng may schizophrenia na may hindi tipikal na antipsychotic

Ang layunin ng pag-aaral ay pag-aralan ang posibilidad ng paggamit ng rispolept para sa kaluwagan ng acute psychosis sa mga pasyente na na-diagnose na may schizophrenia (paranoid type ayon sa ICD-10) at schizoaffective disorder. Kasabay nito, ang tagapagpahiwatig ng tagal ng pagtitiyaga ng mga sintomas ng psychotic sa ilalim ng pharmacotherapy na may rispolept (pangunahing grupo) at mga klasikal na antipsychotics ay ginamit bilang pangunahing criterion sa ilalim ng pag-aaral.

Ang mga pangunahing layunin ng pag-aaral ay upang matukoy ang tagapagpahiwatig ng tagal ng psychosis (ang tinatawag na net psychosis), na nauunawaan bilang pangangalaga ng mga produktibong sintomas ng psychotic mula sa simula ng paggamit ng antipsychotics, na ipinahayag sa mga araw. Ang tagapagpahiwatig na ito ay kinakalkula nang hiwalay para sa risperidone group at hiwalay para sa klasikal na antipsychotic group.

Kasama nito, ang gawain ay itinakda upang matukoy ang proporsyon ng pagbawas ng mga produktibong sintomas sa ilalim ng impluwensya ng risperidone kumpara sa mga klasikal na antipsychotics sa iba't ibang mga panahon ng therapy.

Isang kabuuan ng 89 na pasyente (42 lalaki at 47 babae) na may talamak na psychotic na sintomas sa loob ng paranoid na anyo ng schizophrenia (49 na pasyente) at schizoaffective disorder (40 pasyente) ay pinag-aralan.

Ang unang yugto at tagal ng sakit hanggang 1 taon ay nakarehistro sa 43 mga pasyente, habang sa ibang mga kaso sa oras ng pag-aaral, ang mga kasunod na yugto ng schizophrenia ay nabanggit na may tagal ng sakit na higit sa 1 taon.

Ang Rispoleptom therapy ay natanggap ng 29 katao, kung saan mayroong 15 mga pasyente na may tinatawag na unang yugto. Ang Therapy na may klasikal na neuroleptics ay natanggap ng 60 katao, kung saan mayroong 28 katao na may unang yugto. Ang dosis ng rispolept ay nag-iiba sa hanay mula 1 hanggang 6 mg bawat araw at may average na 4±0.4 mg/araw. Ang Risperidone ay kinuha ng eksklusibo sa bibig pagkatapos kumain isang beses sa isang araw sa gabi.

Kasama sa therapy na may klasikal na antipsychotics ang paggamit ng trifluoperazine (triftazine) sa pang-araw-araw na dosis na hanggang 30 mg intramuscularly, haloperidol sa pang-araw-araw na dosis na hanggang 20 mg intramuscularly, triperidol sa pang-araw-araw na dosis na hanggang 10 mg pasalita. Ang karamihan sa mga pasyente ay kumuha ng mga klasikal na antipsychotics bilang monotherapy sa unang dalawang linggo, pagkatapos ay lumipat sila, kung kinakailangan (habang pinapanatili ang delusional, hallucinator o iba pang mga produktibong sintomas), sa isang kumbinasyon ng ilang mga klasikal na antipsychotics. Kasabay nito, ang isang neuroleptic na may binibigkas na elective na anti-delusional at anti-hallucinatory affect (halimbawa, haloperidol o triftazin) ay nanatili bilang pangunahing gamot, isang gamot na may natatanging hypnosedative effect (chlorpromazine, tizercin, chlorprothixen sa mga dosis hanggang sa 50-100 mg / araw) ay idinagdag dito sa gabi.

Sa pangkat na kumukuha ng mga klasikal na antipsychotics, binalak na kumuha ng mga anticholinergic correctors (Parkopan, Cyclodol) sa mga dosis hanggang sa 10-12 mg / araw. Ang mga corrector ay inireseta sa kaganapan ng paglitaw ng mga natatanging extrapyramidal side effect sa anyo ng acute dystonia, drug-induced parkinsonism at akathisia.

Ang talahanayan 2.1 ay nagpapakita ng data sa tagal ng psychosis sa paggamot ng rispolept at classical na antipsychotics.

Talahanayan 2.1 - Tagal ng psychosis ("net psychosis") sa paggamot ng rispolept at classical na antipsychotics

Tulad ng sumusunod mula sa data sa talahanayan, kapag inihambing ang tagal ng psychosis sa panahon ng therapy na may mga klasikal na antipsychotics at risperidone, mayroong halos dalawang beses na pagbawas sa tagal ng mga sintomas ng psychotic sa ilalim ng impluwensya ng rispolept. Mahalaga na ang alinman sa mga kadahilanan ng serial number ng mga seizure o ang likas na katangian ng larawan ng nangungunang sindrom ay hindi nakaimpluwensya sa halagang ito ng tagal ng psychosis. Sa madaling salita, ang tagal ng psychosis ay tinutukoy lamang ng kadahilanan ng therapy, i.e. depende sa uri ng gamot na ginamit, anuman ang serial number ng pag-atake, ang tagal ng sakit at ang likas na katangian ng nangungunang psychopathological syndrome.

Upang kumpirmahin ang nakuha na mga regularidad, isang dalawang-factor na pagsusuri ng pagkakaiba-iba ang isinagawa. Kasabay nito, ang pakikipag-ugnayan ng kadahilanan ng therapy at ang serial number ng pag-atake (yugto 1) at ang pakikipag-ugnayan ng kadahilanan ng therapy at ang likas na katangian ng nangungunang sindrom (yugto 2) ay isinasaalang-alang naman. Ang mga resulta ng pagsusuri ng pagkakaiba-iba ay nakumpirma ang impluwensya ng therapy factor sa tagal ng psychosis (F=18.8) sa kawalan ng impluwensya ng attack number factor (F=2.5) at ang psychopathological syndrome type factor (F=1.7). ). Mahalaga na ang magkasanib na impluwensya ng kadahilanan ng therapy at ang bilang ng pag-atake sa tagal ng psychosis ay wala din, pati na rin ang magkasanib na impluwensya ng kadahilanan ng therapy at ang kadahilanan ng psychopathological syndrome.

Kaya, ang mga resulta ng pagsusuri ng pagkakaiba-iba ay nakumpirma ang impluwensya lamang ng kadahilanan ng inilapat na antipsychotic. Ang Rispolept ay malinaw na humantong sa isang pagbawas sa tagal ng mga sintomas ng psychotic kumpara sa mga tradisyonal na antipsychotics ng humigit-kumulang 2 beses. Mahalaga na ang epekto na ito ay nakamit sa kabila ng oral na pangangasiwa ng rispolept, habang ang mga klasikal na antipsychotics ay ginamit nang parenteral sa karamihan ng mga pasyente /10/.

2.8 Pag-warping ng mga magagarang sinulid na may epektong roving

Ang Kostroma State Technological University ay bumuo ng isang bagong hugis na istraktura ng thread na may mga variable na geometric na parameter. Kaugnay nito, may problema sa pagproseso ng magarbong sinulid sa paghahanda ng produksyon. Ang pag-aaral na ito ay nakatuon sa proseso ng warping sa mga isyu: ang pagpili ng uri ng tensioner, na nagbibigay ng pinakamababang pagkalat ng tensyon at ang pagkakahanay ng tensyon, mga thread ng iba't ibang linear density sa kahabaan ng lapad ng warping shaft.

Ang object ng pananaliksik ay isang linen na hugis na thread ng apat na variant ng linear density mula 140 hanggang 205 tex. Ang gawain ng mga tension device ng tatlong uri ay pinag-aralan: porcelain washer, two-zone NS-1P at single-zone NS-1P. Ang isang pang-eksperimentong pag-aaral ng pag-igting ng mga warping thread ay isinagawa sa isang warping machine SP-140-3L. Ang bilis ng warping, ang bigat ng mga disc ng preno ay tumutugma sa mga teknolohikal na parameter ng warping ng sinulid.

Upang pag-aralan ang pag-asa ng pag-igting ng hugis na thread sa mga geometric na parameter sa panahon ng warping, ang isang pagsusuri ay isinasagawa para sa dalawang mga kadahilanan: X 1 - ang diameter ng epekto, X 2 - ang haba ng epekto. Ang mga parameter ng output ay tension Y 1 at tension fluctuation Y 2 .

Ang mga resultang equation ng regression ay sapat sa pang-eksperimentong data sa antas ng kahalagahan na 0.95, dahil ang kalkuladong pamantayan ng Fisher para sa lahat ng mga equation ay mas mababa kaysa sa tabular.

Upang matukoy ang antas ng impluwensya ng mga kadahilanan X 1 at X 2 sa mga parameter Y 1 at Y 2, isang pagsusuri ng pagkakaiba-iba ang isinagawa, na nagpakita na ang diameter ng epekto ay may mas malaking impluwensya sa antas at pagbabagu-bago ng pag-igting .

Ang isang paghahambing na pagsusuri ng mga nakuha na tensograms ay nagpakita na ang pinakamababang pagkalat ng tensyon sa panahon ng warping ng sinulid na ito ay ibinibigay ng isang two-zone tension device na NS-1P.

Ito ay itinatag na sa isang pagtaas sa linear density mula 105 hanggang 205 tex, ang NS-1P device ay nagbibigay ng pagtaas sa antas ng pag-igting ng 23% lamang, habang ang porcelain washer - ng 37%, single-zone NS-1P - ng 53%.

Kapag bumubuo ng mga warping shaft, kabilang ang mga hugis at "makinis" na mga thread, kinakailangan na isa-isa na ayusin ang tensioner gamit ang tradisyonal na pamamaraan /11/.

2.9 Kasabay na patolohiya na may kumpletong pagkawala ng ngipin sa mga matatanda at senile na tao

Ang epidemiologically kumpletong pagkawala ng mga ngipin at magkakatulad na patolohiya ng mga matatandang populasyon na naninirahan sa mga nursing home sa teritoryo ng Chuvashia ay pinag-aralan. Ang pagsusuri ay isinagawa sa pamamagitan ng pagsusuri sa ngipin at pagpuno ng mga statistical card ng 784 katao. Ang mga resulta ng pagsusuri ay nagpakita ng isang mataas na porsyento ng kumpletong pagkawala ng mga ngipin, na pinalala ng pangkalahatang patolohiya ng katawan. Tinutukoy nito ang sinuri na kategorya ng populasyon bilang isang pangkat ng mas mataas na panganib sa ngipin at nangangailangan ng rebisyon ng buong sistema ng kanilang pangangalaga sa ngipin.

Sa mga matatanda, ang rate ng insidente ay dalawang beses, at sa katandaan ay anim na beses na mas mataas kumpara sa rate ng insidente sa mga nakababata.

Ang mga pangunahing sakit ng mga matatanda at senile ay mga sakit ng circulatory system, nervous system at sensory organ, respiratory organs, digestive organs, buto at organo ng paggalaw, neoplasms at pinsala.

Ang layunin ng pag-aaral ay bumuo at makakuha ng impormasyon tungkol sa mga magkakatulad na sakit, ang bisa ng prosthetics at ang pangangailangan para sa orthopedic treatment ng mga matatanda at senile na may kumpletong pagkawala ng ngipin.

May kabuuang 784 katao na may edad 45 hanggang 90 ang sinuri. Ang ratio ng babae at lalaki ay 2.8:1.

Ang pagsusuri ng ugnayang istatistika gamit ang koepisyent ng ugnayan ng mga ranggo ni Pearson ay naging posible upang maitatag ang magkaparehong impluwensya ng mga nawawalang ngipin sa magkakatulad na morbidity na may antas ng pagiging maaasahan na p=0.0005. Ang mga matatandang pasyente na may kumpletong pagkawala ng mga ngipin ay dumaranas ng mga sakit na katangian ng katandaan, lalo na, ang cerebral atherosclerosis at hypertension.

Ang pagsusuri ng pagkakaiba ay nagpakita na ang pagtitiyak ng sakit ay gumaganap ng isang mapagpasyang papel sa ilalim ng mga kondisyon sa ilalim ng pag-aaral. Ang papel na ginagampanan ng mga nosological form sa iba't ibang yugto ng edad ay mula 52-60%. Ang pinakamalaking epekto sa istatistika sa kawalan ng ngipin ay sanhi ng mga sakit ng digestive system at diabetes mellitus.

Sa pangkalahatan, ang pangkat ng mga pasyente na may edad na 75-89 taon ay nailalarawan sa pamamagitan ng isang malaking bilang ng mga pathological na sakit.

Sa pag-aaral na ito, isinagawa ang isang paghahambing na pag-aaral ng saklaw ng komorbididad sa mga pasyenteng may kumpletong pagkawala ng ngipin ng mga matatanda at senile na edad na naninirahan sa mga nursing home. Ang isang mataas na porsyento ng mga nawawalang ngipin sa mga tao sa pangkat ng edad na ito ay ipinahayag. Sa mga pasyente na may kumpletong adentia, ang mga komorbididad na katangian ng edad na ito ay sinusunod. Ang Atherosclerosis at hypertension ang pinakakaraniwan sa mga nasuri na tao. Ang makabuluhang epekto sa istatistika sa estado ng oral cavity ng mga sakit tulad ng mga sakit ng gastrointestinal tract at diabetes mellitus, ang proporsyon ng iba pang mga nosological form ay nasa hanay na 52-60%. Ang paggamit ng pagsusuri ng pagkakaiba-iba ay hindi nakumpirma ang makabuluhang papel ng kasarian at lugar ng paninirahan sa mga tagapagpahiwatig ng estado ng oral cavity.

Kaya, sa konklusyon, dapat tandaan na ang pagsusuri ng pamamahagi ng mga magkakatulad na sakit sa mga taong may kumpletong kawalan ng ngipin sa mga matatanda at senile age ay nagpakita na ang kategoryang ito ng mga mamamayan ay kabilang sa isang espesyal na grupo ng populasyon na dapat makatanggap ng sapat na dental. pangangalaga sa loob ng balangkas ng mga umiiral na dental system /12/ .

3 Pagsusuri ng pagkakaiba sa konteksto ng mga pamamaraang istatistika

Ang mga istatistikal na pamamaraan ng pagsusuri ay isang pamamaraan para sa pagsukat ng mga resulta ng aktibidad ng tao, iyon ay, ang pag-convert ng mga katangian ng husay sa mga quantitative.

Ang mga pangunahing hakbang sa pagsusuri sa istatistika:

Pagguhit ng isang plano para sa pagkolekta ng paunang data - ang mga halaga ng mga variable ng input (X 1 ,...,X p), ang bilang ng mga obserbasyon n. Isinasagawa ang hakbang na ito kapag aktibong binalak ang eksperimento.

Pagkuha ng paunang data at pagpasok ng mga ito sa isang computer. Sa yugtong ito, nabubuo ang mga arrays ng mga numero (x 1i ,..., x pi ; y 1i ,..., y qi), i=1,..., n, kung saan n ang sample size.

Pangunahing istatistikal na pagproseso ng data. Sa yugtong ito, nabuo ang isang istatistikal na paglalarawan ng mga isinasaalang-alang na mga parameter:

a) pagbuo at pagsusuri ng mga dependency sa istatistika;

b) ang pagsusuri ng ugnayan ay idinisenyo upang suriin ang kahalagahan ng impluwensya ng mga salik (X 1 ,...,X p) sa tugon Y;

c) ang pagsusuri ng pagkakaiba ay ginagamit upang suriin ang impluwensya ng di-quantitative na mga salik (X 1 ,...,X p) sa tugon Y upang mapili ang pinakamahalaga sa kanila;

d) ang pagsusuri ng regression ay idinisenyo upang matukoy ang analytical dependence ng tugon Y sa quantitative factor X;

Interpretasyon ng mga resulta sa mga tuntunin ng task set /13/.

Ang talahanayan 3.1 ay nagpapakita ng mga istatistikal na pamamaraan kung saan ang mga analytical na problema ay nalulutas. Ang kaukulang mga cell ng talahanayan ay naglalaman ng mga frequency ng paglalapat ng mga istatistikal na pamamaraan:

Label "-" - hindi inilapat ang pamamaraan;

Label "+" - inilapat ang pamamaraan;

Label "++" - ang paraan ay malawakang ginagamit;

Label "+++" - ang aplikasyon ng pamamaraan ay partikular na interes /14/.

Ang pagsusuri ng pagkakaiba, tulad ng t-test ng Mag-aaral, ay nagbibigay-daan sa iyong suriin ang mga pagkakaiba sa pagitan ng sample na paraan; gayunpaman, hindi tulad ng t-test, wala itong mga paghihigpit sa bilang ng mga paraan na inihambing. Kaya, sa halip na tanungin kung magkaiba ang dalawang sample na ibig sabihin, masusuri ng isa kung magkaiba ang ibig sabihin ng dalawa, tatlo, apat, lima, o k.

Binibigyang-daan ka ng ANOVA na harapin ang dalawa o higit pang mga independiyenteng variable (mga tampok, mga kadahilanan) sa parehong oras, na sinusuri hindi lamang ang epekto ng bawat isa sa kanila nang hiwalay, kundi pati na rin ang mga epekto ng pakikipag-ugnayan sa pagitan ng mga ito /15/.


Talahanayan 3.1 - Paglalapat ng mga istatistikal na pamamaraan sa paglutas ng mga problemang analitikal

Mga gawaing analitikal na nagmumula sa larangan ng negosyo, pananalapi at pamamahala

Mga pamamaraan ng deskriptibong istatistika

Mga pamamaraan para sa pagpapatunay ng mga istatistikal na hypotheses

Mga pamamaraan ng pagsusuri ng regression

Mga pamamaraan ng pagsusuri sa pagpapakalat

Mga paraan ng pagsusuri ng multivariate

Mga Paraan ng Pagsusuri ng Diskriminasyon

cluster-nogo

Mga Paraan ng Pagsusuri

kaligtasan ng buhay

Mga Paraan ng Pagsusuri

at pagtataya

serye ng oras

Mga gawain ng pahalang (temporal) na pagsusuri

Mga gawain ng patayong (structural) na pagsusuri

Mga gawain ng pagsusuri at pagtataya ng trend

Mga gawain ng pagsusuri ng mga kamag-anak na tagapagpahiwatig

Mga gawain ng comparative (spatial) analysis

Mga gawain ng pagsusuri ng kadahilanan

Para sa karamihan ng mga kumplikadong sistema, ang prinsipyo ng Pareto ay nalalapat, ayon sa kung saan 20% ng mga kadahilanan ang tumutukoy sa mga katangian ng system sa pamamagitan ng 80%. Samakatuwid, ang pangunahing gawain ng mananaliksik ng modelo ng simulation ay upang alisin ang hindi gaanong mahalagang mga kadahilanan, na nagbibigay-daan upang mabawasan ang sukat ng problema sa pag-optimize ng modelo.

Sinusuri ng pagsusuri ng pagkakaiba-iba ang paglihis ng mga obserbasyon mula sa pangkalahatang mean. Pagkatapos ang pagkakaiba-iba ay pinaghiwa-hiwalay sa mga bahagi, na ang bawat isa ay may sariling dahilan. Ang natitirang bahagi ng variation, na hindi maaaring nauugnay sa mga kundisyon ng eksperimento, ay itinuturing na random error nito. Upang kumpirmahin ang kahalagahan, ginagamit ang isang espesyal na pagsubok - F-statistics.

Tinutukoy ng pagsusuri ng pagkakaiba kung may epekto. Pinapayagan ka ng pagsusuri ng regression na mahulaan ang tugon (ang halaga ng layunin ng function) sa ilang punto sa espasyo ng parameter. Ang agarang gawain ng pagsusuri ng regression ay upang tantyahin ang mga coefficient ng regression /16/.

Ang sobrang laki ng sample ay nagpapahirap sa mga pagsusuri sa istatistika, kaya makatuwirang bawasan ang laki ng sample.

Sa pamamagitan ng paglalapat ng pagsusuri ng pagkakaiba, posibleng matukoy ang kahalagahan ng impluwensya ng iba't ibang salik sa baryabol na pinag-aaralan. Kung ang impluwensya ng isang kadahilanan ay lumabas na hindi gaanong mahalaga, kung gayon ang kadahilanan na ito ay maaaring hindi kasama sa karagdagang pagproseso.

Dapat kayang lutasin ng mga macroeconometrician ang apat na lohikal na natatanging mga problema:

Paglalarawan ng data;

Macroeconomic forecast;

Structural inference;

Pagsusuri ng patakaran.

Ang paglalarawan ng data ay nangangahulugan ng paglalarawan ng mga katangian ng isa o higit pang serye ng panahon at pakikipag-usap sa mga katangiang ito sa isang malawak na hanay ng mga ekonomista. Ang macroeconomic forecasting ay nangangahulugan ng paghula sa takbo ng ekonomiya, kadalasang dalawa hanggang tatlong taon o mas kaunti (pangunahin dahil napakahirap hulaan sa mas mahabang abot-tanaw). Ang istrukturang hinuha ay nangangahulugan ng pagsuri kung ang macroeconomic data ay pare-pareho sa isang partikular na teoryang pang-ekonomiya. Ang pagsusuri sa patakaran ng macroeconometric ay nagpapatuloy sa maraming linya: sa isang banda, ang epekto sa ekonomiya ng isang hypothetical na pagbabago sa mga instrumento ng patakaran (halimbawa, isang rate ng buwis o panandaliang rate ng interes) ay tinatasa, sa kabilang banda, ang epekto ng isang pagbabago sa mga patakaran ng patakaran (halimbawa, isang paglipat sa isang bagong rehimen ng patakaran sa pananalapi) ay tinasa. Ang isang empirical macroeconomic research project ay maaaring magsama ng isa o higit pa sa apat na gawaing ito. Ang bawat problema ay dapat malutas sa paraang ang mga ugnayan sa pagitan ng mga serye ng oras ay isinasaalang-alang.

Noong 1970s, ang mga problemang ito ay nalutas gamit ang iba't ibang mga pamamaraan, na, kung susuriin mula sa mga modernong posisyon, ay hindi sapat para sa ilang mga kadahilanan. Upang ilarawan ang dynamics ng isang indibidwal na serye, sapat na ang paggamit lamang ng mga one-dimensional na modelo ng time series, at upang ilarawan ang magkasanib na dinamika ng dalawang serye, sapat na ang paggamit ng spectral analysis. Gayunpaman, walang karaniwang wika na angkop para sa sistematikong paglalarawan ng magkasanib na dynamic na katangian ng ilang serye ng panahon. Ginawa ang mga pang-ekonomiyang pagtataya gamit ang pinasimpleng autoregressive-moving average (ARMA) na mga modelo o gamit ang malalaking structural econometric na modelo na sikat sa panahong iyon. Ang inference sa istruktura ay batay sa alinman sa maliliit na single-equation na modelo o sa malalaking modelo na ang pagkakakilanlan ay nakamit sa pamamagitan ng hindi wastong mga paghihigpit sa pagbubukod at na karaniwang hindi kasama ang mga inaasahan. Ang pagsusuri sa patakaran ng modelong istruktura ay nakadepende sa mga nagpapakilalang pagpapalagay na ito.

Sa wakas, ang pagtaas ng mga presyo noong 1970s ay nakita ng marami bilang isang malaking pag-urong para sa malalaking modelo na ginagamit upang gumawa ng mga rekomendasyon sa patakaran noong panahong iyon. Ibig sabihin, ito na ang tamang panahon para sa paglitaw ng isang bagong macroeconometric construct na maaaring malutas ang maraming problemang ito.

Noong 1980, nilikha ang naturang konstruksiyon - vector autoregressions (VAR). Sa unang sulyap, ang VAR ay hindi hihigit sa isang generalization ng univariate autoregression sa multivariate case, at ang bawat equation sa VAR ay hindi hihigit sa isang simpleng least squares regression ng isang variable sa mga lagged value ng sarili nito at iba pang variable sa VAR. Ngunit ang tila simpleng tool na ito ay naging posible upang sistematiko at panloob na tuluy-tuloy na makuha ang mayamang dinamika ng multivariate na serye ng oras, at ang toolkit ng istatistika na kasama ng VAR ay napatunayang maginhawa at, napakahalaga, madaling bigyang-kahulugan.

Mayroong tatlong magkakaibang modelo ng VAR:

Pinababang VAR form;

Recursive VAR;

Structural VAR.

Ang tatlo ay mga dynamic na linear na modelo na nag-uugnay sa kasalukuyan at nakaraang mga halaga ng Y t vector ng isang n-dimensional na serye ng oras. Ang pinababang anyo at mga recursive na VAR ay mga istatistikal na modelo na hindi gumagamit ng anumang pang-ekonomiyang pagsasaalang-alang maliban sa pagpili ng mga variable. Ang mga VAR na ito ay ginagamit upang ilarawan ang data at hula. Kasama sa Structural VAR ang mga hadlang na nagmula sa macroeconomic theory at ang VAR na ito ay ginagamit para sa structural inference at policy analysis.

Ang nasa itaas na anyo ng VAR ay nagpapahayag ng Y t bilang isang ibinahagi na nakaraang lag kasama ang isang seryeng hindi nauugnay na termino ng error, iyon ay, ito ay nagsa-generalize ng univariate na autoregression sa kaso ng mga vectors. Ang mathematically reduced form ng VAR model ay isang sistema ng n equation na maaaring isulat sa matrix form gaya ng sumusunod:

kung saan ang  ay n l vector ng mga constants;

A 1 , A 2 , ..., A p ay n n coefficient matrices;

Ang  t , ay isang nl vector ng mga serially uncorrelated na error, na ipinapalagay na may mean na zero at isang covariance matrix .

Ang mga error  t , sa (17) ay hindi inaasahang dinamika sa Y t , na natitira pagkatapos isaalang-alang ang linear distributed lag ng mga nakaraang value.

Madali ang pagtantya sa mga parameter ng pinababang VAR form. Ang bawat isa sa mga equation ay naglalaman ng parehong mga regressor (Y t–1 ,...,Y t–p), at walang magkaparehong paghihigpit sa pagitan ng mga equation. Kaya, ang epektibong pagtatantya (pinakamalaking paraan ng posibilidad na may buong impormasyon) ay pinasimple sa karaniwang hindi bababa sa mga parisukat na inilapat sa bawat isa sa mga equation. Ang error covariance matrix ay maaaring makatwirang matantya ng sample na covariance matrix na nakuha mula sa mga nalalabi sa LSM.

Ang tanging subtlety ay upang matukoy ang lag length p, ngunit ito ay maaaring gawin gamit ang isang criterion ng impormasyon tulad ng AIC o BIC.

Sa antas ng matrix equation, pareho ang hitsura ng recursive at structural VAR. Ang dalawang modelo ng VAR na ito ay tahasang isinasaalang-alang ang sabay-sabay na pakikipag-ugnayan sa pagitan ng mga elemento ng Y t , na katumbas ng pagdaragdag ng sabay-sabay na termino sa kanang bahagi ng equation (17). Alinsunod dito, ang recursive at structural VAR ay parehong kinakatawan sa sumusunod na pangkalahatang anyo:

kung saan  - vector ng mga constants;

B 0 ,..., B p - matrice;

 t - mga pagkakamali.

Ang pagkakaroon ng matrix B 0 sa equation ay nangangahulugan ng posibilidad ng sabay-sabay na pakikipag-ugnayan sa pagitan ng n variable; ibig sabihin, binibigyang-daan ka ng B 0 na gawin ang mga variable na ito na nauugnay sa parehong punto sa oras, ay tinukoy nang magkasama.

Ang recursive VAR ay maaaring tantyahin sa dalawang paraan. Ang recursive structure ay nagbibigay ng isang set ng recursive equation na maaaring tantyahin gamit ang least squares method. Ang isang katumbas na paraan ng pagtatantya ay ang mga equation ng pinababang anyo (17), na itinuturing bilang isang sistema, ay pinarami mula sa kaliwa ng mas mababang triangular na matrix.

Ang paraan ng pagtatantya ng istrukturang VAR ay depende sa kung paano eksaktong natukoy ang B 0. Ang diskarte sa bahagyang impormasyon ay nangangailangan ng paggamit ng mga pamamaraan ng pagtatantya ng solong equation tulad ng dalawang-hakbang na hindi bababa sa mga parisukat. Ang kumpletong diskarte sa impormasyon ay nangangailangan ng paggamit ng mga multi-equation na pamamaraan ng pagtatantya tulad ng tatlong-hakbang na hindi bababa sa mga parisukat.

Magkaroon ng kamalayan sa maraming iba't ibang uri ng VAR. Ang pinababang anyo ng VAR ay natatangi. Ang pagkakasunud-sunod ng mga variable sa Y t ay tumutugma sa isang solong recursive VAR, ngunit mayroong n! mga ganitong order, i.e. n! iba't ibang recursive VAR. Ang bilang ng mga istrukturang VAR - iyon ay, mga hanay ng mga pagpapalagay na tumutukoy sa sabay-sabay na mga ugnayan sa pagitan ng mga variable - ay limitado lamang sa pamamagitan ng katalinuhan ng mananaliksik.

Dahil ang mga matrice ng tinantyang VAR coefficient ay mahirap direktang bigyang-kahulugan, ang mga resulta ng pagtatantya ng VAR ay karaniwang kinakatawan ng ilang function ng mga matrice na ito. Sa ganitong mga istatistika decomposition ng mga error sa pagtataya.

Ang mga pagpapalawak ng pagkakaiba-iba ng error sa pagtataya ay pangunahing kinakalkula para sa recursive o structural system. Ang decomposition na ito ng variance ay nagpapakita kung gaano kahalaga ang error sa jth equation upang ipaliwanag ang mga hindi inaasahang pagbabago sa ith variable. Kapag ang mga error sa VAR ay equationally uncorrelated, ang pagkakaiba ng forecast error para sa h mga susunod na panahon ay maaaring isulat bilang kabuuan ng mga bahagi na nagreresulta mula sa bawat isa sa mga error na ito /17/.

3.2 Pagsusuri ng salik

Sa modernong istatistika, ang pagsusuri ng kadahilanan ay nauunawaan bilang isang hanay ng mga pamamaraan na, batay sa totoong buhay na mga relasyon ng mga tampok (o mga bagay), ay ginagawang posible upang matukoy ang mga nakatagong pangkalahatang katangian ng istraktura ng organisasyon at mekanismo ng pag-unlad ng mga phenomena at mga prosesong pinag-aaralan.

Ang konsepto ng latency sa kahulugan ay susi. Nangangahulugan ito ng implicitness ng mga katangiang isiniwalat gamit ang mga pamamaraan ng factor analysis. Una, nakikitungo kami sa isang hanay ng mga elementarya na tampok X j , ipinapalagay ng kanilang pakikipag-ugnayan ang pagkakaroon ng ilang mga dahilan, mga espesyal na kundisyon, i.e. pagkakaroon ng ilang mga nakatagong salik. Ang huli ay itinatag bilang isang resulta ng generalization ng elementarya na mga tampok at nagsisilbing pinagsamang mga katangian, o mga tampok, ngunit ng isang mas mataas na antas. Naturally, hindi lamang ang mga trivial na feature na X j ang maaaring mag-ugnay, kundi pati na rin ang mga naobserbahang bagay N i mismo, kaya ang paghahanap para sa mga nakatagong kadahilanan ay theoretically posible kapwa sa pamamagitan ng feature at object data.

Kung ang mga bagay ay nailalarawan sa pamamagitan ng isang sapat na malaking bilang ng mga elementarya na tampok (m> 3), kung gayon ang isa pang pagpapalagay ay lohikal din - tungkol sa pagkakaroon ng mga siksik na kumpol ng mga puntos (mga tampok) sa espasyo ng n mga bagay. Kasabay nito, ang mga bagong axes ay hindi nagsa-generalize ng mga tampok ng X j , ngunit ang mga bagay n i , ayon sa pagkakabanggit, at ang mga nakatagong salik na F r ay makikilala ng komposisyon ng mga naobserbahang bagay:

F r = c 1 n 1 + c 2 n 2 + ... + c N n N ,

kung saan ang c i ay ang bigat ng bagay n i sa salik na F r .

Depende sa kung alin sa mga uri ng ugnayan na isinasaalang-alang sa itaas - mga elemento ng elementarya o mga naobserbahang bagay - ay pinag-aralan sa pagsusuri ng kadahilanan, ang R at Q ay nakikilala - mga teknikal na pamamaraan ng pagproseso ng data.

Ang pangalan ng R-technique ay volumetric data analysis sa pamamagitan ng m feature, bilang resulta kung saan ang r linear na kumbinasyon (mga grupo) ng mga feature ay nakuha: F r =f(X j), (r=1..m). Ang pagsusuri ayon sa kalapitan (koneksyon) ng n naobserbahang mga bagay ay tinatawag na Q-technique at nagbibigay-daan sa iyo upang matukoy ang mga r linear na kumbinasyon (mga grupo) ng mga bagay: F=f(n i), (i = l .. N).

Sa kasalukuyan, sa pagsasagawa, higit sa 90% ng mga problema ay nalutas gamit ang R-techniques.

Ang hanay ng mga pamamaraan ng pagsusuri ng kadahilanan ay kasalukuyang napakalaki, kabilang dito ang dose-dosenang iba't ibang mga diskarte at mga diskarte sa pagproseso ng data. Upang makapag-focus sa tamang pagpili ng mga pamamaraan sa pananaliksik, ito ay kinakailangan upang ipakita ang kanilang mga tampok. Hinahati namin ang lahat ng mga pamamaraan ng pagsusuri ng kadahilanan sa ilang mga pangkat ng pag-uuri:

Paraan ng pangunahing bahagi. Sa mahigpit na pagsasalita, hindi ito inuri bilang pagsusuri sa kadahilanan, bagama't marami itong pagkakatulad dito. Ang partikular ay, una, na sa kurso ng mga pamamaraan ng pagkalkula ang lahat ng mga pangunahing bahagi ay sabay-sabay na nakuha at ang kanilang bilang ay una ay katumbas ng bilang ng mga elementarya na tampok. Pangalawa, ang posibilidad ng isang kumpletong agnas ng pagpapakalat ng mga elementarya ay nai-postulate, sa madaling salita, ang kumpletong paliwanag nito sa pamamagitan ng mga nakatagong kadahilanan (mga pangkalahatang tampok).

Mga pamamaraan ng pagsusuri sa kadahilanan. Ang pagkakaiba-iba ng mga tampok na elementarya ay hindi ganap na ipinaliwanag dito, kinikilala na ang bahagi ng pagkakaiba ay nananatiling hindi nakikilala bilang isang katangian. Ang mga salik ay karaniwang pinag-iisa nang sunud-sunod: ang una, na nagpapaliwanag ng pinakamalaking bahagi ng pagkakaiba-iba sa mga tampok na elementarya, pagkatapos ay ang pangalawa, na nagpapaliwanag sa mas maliit na bahagi ng pagkakaiba, ang pangalawa pagkatapos ng unang nakatago na kadahilanan, ang pangatlo, atbp. Ang proseso ng pagkuha ng mga salik ay maaaring maantala sa anumang hakbang kung ang isang desisyon ay ginawa sa kasapatan ng proporsyon ng ipinaliwanag na pagkakaiba-iba ng mga elementong tampok o isinasaalang-alang ang interpretability ng mga nakatagong salik.

Maipapayo na higit pang hatiin ang mga pamamaraan ng pagsusuri ng kadahilanan sa dalawang klase: pinasimple at modernong mga pamamaraan ng pagtatantya.

Ang mga simpleng paraan ng pagsusuri sa kadahilanan ay pangunahing nauugnay sa mga paunang teoretikal na pag-unlad. Mayroon silang limitadong mga kakayahan sa pagtukoy ng mga nakatagong kadahilanan at pagtatantya ng mga solusyon sa factorial. Kabilang dito ang:

Isang modelo ng kadahilanan. Pinapayagan ka nitong pumili lamang ng isang pangkalahatang tago at isang katangian na mga kadahilanan. Para sa posibleng umiiral na iba pang mga nakatagong salik, ang isang pagpapalagay ay ginawa tungkol sa kanilang kawalang-halaga;

modelong bifactorial. Nagbibigay-daan para sa impluwensya sa pagkakaiba-iba ng mga elementarya na katangian ng hindi isa, ngunit ilang mga nakatagong salik (karaniwan ay dalawa) at isang salik na katangian;

paraan ng sentroid. Sa loob nito, ang mga ugnayan sa pagitan ng mga variable ay itinuturing bilang isang grupo ng mga vector, at ang latent factor ay geometrical na kinakatawan bilang isang balancing vector na dumadaan sa gitna ng grupong ito. : Ang pamamaraan ay nagbibigay-daan sa iyo upang makilala ang ilang mga nakatago at katangian na mga kadahilanan, sa unang pagkakataon ay posible na iugnay ang factorial na solusyon sa orihinal na data, i.e. lutasin ang problema sa pagtatantya sa pinakasimpleng anyo.

Ang mga modernong pamamaraan ng pagtatantya ay madalas na ipinapalagay na ang una, tinatayang solusyon ay natagpuan na ng ilan sa mga pamamaraan, at ang solusyon na ito ay na-optimize sa pamamagitan ng mga kasunod na hakbang. Ang mga pamamaraan ay naiiba sa pagiging kumplikado ng mga kalkulasyon. Kasama sa mga pamamaraang ito ang:

paraan ng pangkat. Ang solusyon ay batay sa mga pangkat ng elementarya na mga tampok na paunang napili sa ilang paraan;

Paraan ng mga pangunahing kadahilanan. Ito ay pinakamalapit sa paraan ng mga pangunahing bahagi, ang pagkakaiba ay nakasalalay sa pagpapalagay ng pagkakaroon ng mga tampok;

Pinakamataas na posibilidad, pinakamababang nalalabi, a-factor analysis, canonical factor analysis, lahat ng pag-optimize.

Ginagawang posible ng mga paraang ito na patuloy na mapabuti ang mga dati nang nahanap na solusyon batay sa paggamit ng mga diskarte sa istatistika para sa pagtatantya ng random na variable o pamantayang istatistika, at nangangailangan ng malaking halaga ng mga kalkulasyon na nakakaubos ng oras. Ang pinaka-promising at maginhawa para sa trabaho sa pangkat na ito ay ang maximum na paraan ng posibilidad.

Ang pangunahing gawain, na nalutas sa pamamagitan ng iba't ibang mga pamamaraan ng pagsusuri ng kadahilanan, kabilang ang pamamaraan ng mga pangunahing sangkap, ay ang pag-compress ng impormasyon, ang paglipat mula sa hanay ng mga halaga ayon sa m elementarya na mga tampok na may dami ng impormasyon n x m sa isang limitadong set ng mga elemento ng factor mapping matrix (m x r) o ang matrix ng latent values ​​factor para sa bawat naobserbahang object ng dimensyon n x r, at karaniwang r< m.

Ginagawa rin ng mga pamamaraan ng pagsusuri sa kadahilanan na mailarawan ang istruktura ng mga phenomena at prosesong pinag-aaralan, na nangangahulugang pagtukoy sa kanilang estado at paghula sa kanilang pag-unlad. Sa wakas, ang data ng pagsusuri ng kadahilanan ay nagbibigay ng mga batayan para sa pagkilala sa bagay, i.e. paglutas ng problema sa pagkilala sa imahe.

Ang mga pamamaraan ng pagsusuri sa kadahilanan ay may mga katangian na talagang kaakit-akit para sa kanilang paggamit bilang bahagi ng iba pang mga pamamaraan ng istatistika, kadalasan sa pagsusuri ng ugnayan-regression, pagsusuri ng cluster, multivariate scaling, atbp. /18/.

3.3 Pares regression. Probabilistic na katangian ng mga modelo ng regression.

Kung isasaalang-alang natin ang problema sa pagsusuri ng mga gastos sa pagkain sa mga pangkat na may parehong kita, halimbawa $10,000(x), kung gayon ito ay isang tiyak na halaga. Ngunit Y - ang bahagi ng perang ito na ginastos sa pagkain - ay random at maaaring magbago taon-taon. Samakatuwid, para sa bawat i-th na indibidwal:

kung saan ε i - random na error;

Ang α at β ay mga constants (theoretically), kahit na maaaring mag-iba ang mga ito sa bawat modelo.

Mga kinakailangan para sa pairwise regression:

Ang X at Y ay magkaugnay na magkaugnay;

Ang X ay isang hindi random na variable na may mga nakapirming halaga;

- ε - ang mga error ay karaniwang ipinamamahagi N(0,σ 2);

- .

Ipinapakita ng Figure 3.1 ang isang pairwise regression model.

Figure 3.1 - Pares na modelo ng regression

Inilalarawan ng mga pagpapalagay na ito ang klasikal na linear regression na modelo.

Kung ang error ay may non-zero mean, ang orihinal na modelo ay magiging katumbas ng bagong modelo at iba pang intercept, ngunit may zero mean para sa error.

Kung ang mga kinakailangan ay natugunan, kung gayon ang pinakamaliit na mga parisukat na pagtatantya at mga mahusay na linear na walang pinapanigan na mga pagtatantya

Kung itinalaga natin:

ang katotohanan na ang mathematical na inaasahan at dispersion ng mga coefficient ay ang mga sumusunod:

Covariance ng coefficients:

Kung ang pagkatapos ay karaniwang ipinamamahagi din sila:

Mula dito ay sumusunod na:

Ang variation β ay ganap na tinutukoy ng variation ε;

Kung mas mataas ang pagkakaiba ng X, mas mahusay ang pagtatantya ng β.

Ang kabuuang pagpapakalat ay tinutukoy ng formula:

Ang pagkakaiba-iba ng mga deviations sa form na ito ay isang walang pinapanigan na pagtatantya at tinatawag na karaniwang error ng regression. N-2 - maaaring bigyang-kahulugan bilang ang bilang ng mga antas ng kalayaan.

Ang pagsusuri ng mga paglihis mula sa linya ng regression ay maaaring magbigay ng isang kapaki-pakinabang na sukatan kung gaano kahusay na ipinapakita ng tinantyang regression ang totoong data. Ang isang magandang regression ay isa na nagpapaliwanag ng isang makabuluhang proporsyon ng pagkakaiba sa Y, at vice versa, ang isang masamang regression ay hindi sinusubaybayan ang karamihan sa mga pagbabago sa orihinal na data. Ito ay intuitively malinaw na ang anumang karagdagang impormasyon ay mapabuti ang modelo, iyon ay, bawasan ang hindi maipaliwanag na bahagi ng variation Y. Upang pag-aralan ang regression model, ang pagkakaiba ay decomposed sa mga bahagi, at ang koepisyent ng determinasyon R 2 ay tinutukoy.

Ang ratio ng dalawang variances ay ibinahagi ayon sa F-distribution, ibig sabihin, kung susuriin natin ang statistical significance ng pagkakaiba sa pagitan ng variance ng modelo at ang variance ng mga residual, maaari nating tapusin na ang R 2 ay makabuluhan.

Pagsubok sa hypothesis tungkol sa pagkakapantay-pantay ng mga pagkakaiba-iba ng dalawang sample na ito:

Kung totoo ang hypothesis H 0 (pagkakapantay-pantay ng mga pagkakaiba-iba ng ilang sample), ang t ay may F-distribution na may (m 1 ,m 2)=(n 1 -1,n 2 -1) na antas ng kalayaan.

Ang pagkakaroon ng pagkalkula ng F-ratio bilang ratio ng dalawang dispersion at paghahambing nito sa halaga ng talahanayan, maaari nating tapusin na ang R 2 /2/, /19/ ay makabuluhan sa istatistika.

Konklusyon

Ang mga modernong aplikasyon ng pagsusuri ng pagkakaiba-iba ay sumasaklaw sa isang malawak na hanay ng mga problema sa ekonomiya, biyolohiya, at teknolohiya at kadalasang binibigyang-kahulugan sa mga tuntunin ng istatistikal na teorya ng pagbubunyag ng mga sistematikong pagkakaiba sa pagitan ng mga resulta ng mga direktang pagsukat na isinagawa sa ilalim ng ilang pagbabago ng mga kondisyon.

Salamat sa automation ng pagsusuri ng pagkakaiba-iba, ang isang mananaliksik ay maaaring magsagawa ng iba't ibang istatistikal na pag-aaral gamit ang mga computer, habang gumugugol ng mas kaunting oras at pagsisikap sa mga kalkulasyon ng data. Sa kasalukuyan, maraming software packages na nagpapatupad ng dispersion analysis apparatus. Ang pinakakaraniwang mga produkto ng software ay:

Karamihan sa mga pamamaraan ng istatistika ay ipinapatupad sa mga modernong produkto ng software ng istatistika. Sa pagbuo ng mga algorithmic programming language, naging posible na lumikha ng karagdagang mga bloke para sa pagproseso ng data ng istatistika.

Ang ANOVA ay isang makapangyarihang modernong istatistikal na paraan para sa pagproseso at pagsusuri ng mga eksperimentong data sa sikolohiya, biology, medisina at iba pang mga agham. Ito ay napakalapit na nauugnay sa tiyak na pamamaraan para sa pagpaplano at pagsasagawa ng mga eksperimentong pag-aaral.

Ang pagsusuri ng pagkakaiba ay ginagamit sa lahat ng mga lugar ng siyentipikong pananaliksik, kung saan kinakailangan upang pag-aralan ang impluwensya ng iba't ibang mga kadahilanan sa variable na pinag-aaralan.

Bibliograpiya

1 Kremer N.Sh. Probability theory at mathematical statistics. M.: Pagkakaisa - Dana, 2002.-343s.

2 Gmurman V.E. Teorya ng Probability at Mathematical Statistics. - M .: Higher School, 2003.-523s.

4 www.conf.mitme.ru

5 www.pedklin.ru

6 www.webcenter.ru

7 www.infections.ru

8 www.encycl.yandex.ru

9 www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 Gusev A.N. Pagsusuri ng pagpapakalat sa pang-eksperimentong sikolohiya. - M .: Pang-edukasyon at metodolohikal na kolektor "Psychology", 2000.-136s.

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru

Sa pagsasagawa ng mga manggagamot kapag nagsasagawa ng biomedical, sosyolohikal at eksperimentong pag-aaral, kinakailangan upang maitaguyod ang impluwensya ng mga kadahilanan sa mga resulta ng pag-aaral ng estado ng kalusugan ng populasyon, kapag tinatasa ang propesyonal na aktibidad, at ang pagiging epektibo ng mga pagbabago.

Mayroong isang bilang ng mga istatistikal na pamamaraan na nagbibigay-daan sa iyo upang matukoy ang lakas, direksyon, mga pattern ng impluwensya ng mga kadahilanan sa resulta sa pangkalahatan o sample na populasyon (pagkalkula ng criterion I, pagsusuri ng ugnayan, regression, Χ 2 - (Pamantayan ng kasunduan ni Pearson, atbp.). Ang pagsusuri ng pagkakaiba ay binuo at iminungkahi ng Ingles na siyentipiko, matematiko at geneticist na si Ronald Fisher noong 1920s.

Ang pagsusuri ng pagkakaiba ay mas madalas na ginagamit sa siyentipiko at praktikal na pag-aaral ng pampublikong kalusugan at pangangalagang pangkalusugan upang pag-aralan ang impluwensya ng isa o higit pang mga salik sa nagresultang katangian. Ito ay batay sa prinsipyo ng "pagpapakita ng pagkakaiba-iba ng mga halaga ng (mga) kadahilanan sa pagkakaiba-iba ng mga halaga ng resultang katangian" at nagtatatag ng lakas ng impluwensya ng (mga) kadahilanan sa mga sample na populasyon .

Ang kakanyahan ng paraan ng pagsusuri ng pagkakaiba-iba ay upang sukatin ang mga indibidwal na pagkakaiba-iba (kabuuan, factorial, residual), at higit pang matukoy ang lakas (bahagi) ng impluwensya ng mga kadahilanan na pinag-aaralan (pagtatasa ng papel ng bawat isa sa mga kadahilanan, o kanilang magkasanib na impluwensya) sa resultang (mga) katangian.

Pagsusuri ng pagkakaiba-iba- ito ay isang istatistikal na pamamaraan para sa pagtatasa ng kaugnayan sa pagitan ng kadahilanan at mga katangian ng pagganap sa iba't ibang mga grupo, pinili nang sapalaran, batay sa pagpapasiya ng mga pagkakaiba (pagkakaiba-iba) sa mga halaga ng mga katangian. Ang pagsusuri ng pagkakaiba ay batay sa pagsusuri ng mga paglihis ng lahat ng yunit ng pinag-aralan na populasyon mula sa arithmetic mean. Bilang isang sukatan ng mga deviations, ang dispersion (B) ay kinuha - ang average na parisukat ng deviations. Ang mga deviation na dulot ng impluwensya ng isang factor attribute (factor) ay inihahambing sa magnitude ng deviations na dulot ng random na mga pangyayari. Kung ang mga deviations na dulot ng factor attribute ay mas makabuluhan kaysa sa random deviations, kung gayon ang factor ay itinuturing na may malaking epekto sa resultang attribute.

Upang makalkula ang pagkakaiba-iba ng halaga ng paglihis ng bawat opsyon (bawat nakarehistrong numerical value ng attribute) mula sa arithmetic mean, squared. Aalisin nito ang mga negatibong palatandaan. Pagkatapos ang mga paglihis na ito (mga pagkakaiba) ay summed up at hinati sa bilang ng mga obserbasyon, i.e. average out deviations. Kaya, ang mga halaga ng pagpapakalat ay nakuha.

Ang isang mahalagang metodolohikal na halaga para sa aplikasyon ng pagsusuri ng pagkakaiba ay ang tamang pagbuo ng sample. Depende sa layunin at layunin, ang mga piling grupo ay maaaring random na mabuo nang nakapag-iisa sa isa't isa (kontrol at mga eksperimentong grupo upang pag-aralan ang ilang tagapagpahiwatig, halimbawa, ang epekto ng mataas na presyon ng dugo sa pag-unlad ng stroke). Ang ganitong mga sample ay tinatawag na independyente.

Kadalasan, ang mga resulta ng pagkakalantad sa mga kadahilanan ay pinag-aralan sa parehong sample na grupo (halimbawa, sa parehong mga pasyente) bago at pagkatapos ng pagkakalantad (paggamot, pag-iwas, mga hakbang sa rehabilitasyon), ang mga naturang sample ay tinatawag na dependent.

Ang pagsusuri ng pagkakaiba, kung saan sinusuri ang impluwensya ng isang salik, ay tinatawag na one-factor analysis (univariate analysis). Kapag pinag-aaralan ang impluwensya ng higit sa isang salik, ginagamit ang multivariate analysis ng variance (multivariate analysis).

Ang mga senyales ng salik ay ang mga palatandaan na nakakaapekto sa hindi pangkaraniwang bagay na pinag-aaralan.
Ang mga mabisang palatandaan ay ang mga palatandaang nagbabago sa ilalim ng impluwensya ng mga palatandaan ng kadahilanan.

Parehong qualitative (kasarian, propesyon) at quantitative na mga katangian (bilang ng mga iniksyon, mga pasyente sa ward, bilang ng mga araw ng kama) ay maaaring gamitin upang magsagawa ng pagsusuri ng pagkakaiba.

Mga pamamaraan ng pagsusuri sa pagpapakalat:

  1. Paraan ayon kay Fisher (Fisher) - criterion F (mga halaga ng F, tingnan ang Appendix No. 1);
    Ang pamamaraan ay ginagamit sa one-way na pagsusuri ng pagkakaiba-iba, kapag ang kabuuang pagkakaiba-iba ng lahat ng naobserbahang mga halaga ay nabulok sa pagkakaiba-iba sa loob ng mga indibidwal na grupo at ang pagkakaiba-iba sa pagitan ng mga grupo.
  2. Paraan ng "pangkalahatang linear na modelo".
    Ito ay batay sa ugnayan o regression analysis na ginamit sa multivariate analysis.

Karaniwan, isang-factor, maximum two-factor dispersion complexes lamang ang ginagamit sa biomedical na pananaliksik. Maaaring maimbestigahan ang mga multifactorial complex sa pamamagitan ng sunud-sunod na pagsusuri ng isa o dalawang-factor complex na nakahiwalay sa buong naobserbahang populasyon.

Mga kondisyon para sa paggamit ng pagsusuri ng pagkakaiba-iba:

  1. Ang gawain ng pag-aaral ay upang matukoy ang lakas ng impluwensya ng isa (hanggang 3) mga kadahilanan sa resulta o upang matukoy ang lakas ng pinagsamang impluwensya ng iba't ibang mga kadahilanan (kasarian at edad, pisikal na aktibidad at nutrisyon, atbp.).
  2. Ang pinag-aralan na mga kadahilanan ay dapat na independyente (walang kaugnayan) sa bawat isa. Halimbawa, hindi maaaring pag-aralan ang pinagsamang epekto ng karanasan sa trabaho at edad, taas at bigat ng mga bata, atbp. sa insidente ng populasyon.
  3. Ang pagpili ng mga grupo para sa pag-aaral ay isinasagawa nang sapalaran (random selection). Ang organisasyon ng isang dispersion complex na may pagpapatupad ng prinsipyo ng random na pagpili ng mga pagpipilian ay tinatawag na randomization (isinalin mula sa Ingles - random), i.e. pinili nang random.
  4. Maaaring gamitin ang parehong quantitative at qualitative (attributive) na mga feature.

Kapag nagsasagawa ng isang one-way na pagsusuri ng pagkakaiba-iba, inirerekomenda (kinakailangang kondisyon para sa aplikasyon):

  1. Ang normalidad ng distribusyon ng mga nasuri na pangkat o ang pagsusulatan ng mga sample na grupo sa pangkalahatang populasyon na may normal na distribusyon.
  2. Kasarinlan (non-connectedness) ng pamamahagi ng mga obserbasyon sa mga grupo.
  3. Pagkakaroon ng dalas (pag-ulit) ng mga obserbasyon.

Ang normalidad ng pamamahagi ay tinutukoy ng Gauss (De Mavour) curve, na maaaring ilarawan ng function y \u003d f (x), dahil ito ay isa sa mga batas sa pamamahagi na ginagamit upang tantiyahin ang paglalarawan ng mga phenomena na random, probabilistic sa kalikasan. Ang paksa ng biomedical na pananaliksik ay ang kababalaghan ng isang probabilistikong kalikasan, ang normal na pamamahagi sa naturang mga pag-aaral ay karaniwan.

Ang prinsipyo ng aplikasyon ng paraan ng pagsusuri ng pagkakaiba-iba

Una, ang isang null hypothesis ay nabuo, iyon ay, ipinapalagay na ang mga kadahilanan sa ilalim ng pag-aaral ay walang epekto sa mga halaga ng nagresultang katangian at ang mga nagresultang pagkakaiba ay random.

Pagkatapos ay tinutukoy namin kung ano ang posibilidad na makuha ang naobserbahan (o mas malakas) na mga pagkakaiba, sa kondisyon na ang null hypothesis ay totoo.

Kung maliit ang probabilidad na ito*, tinatanggihan namin ang null hypothesis at ipagpalagay na ang mga resulta ng pag-aaral ay makabuluhan ayon sa istatistika. Hindi pa ito nangangahulugan na ang epekto ng mga pinag-aralan na salik ay napatunayan na (pangunahin ito sa pagpaplano ng pananaliksik), ngunit hindi pa rin malamang na ang resulta ay dahil sa pagkakataon.
__________________________________
* Ang pinakamataas na katanggap-tanggap na posibilidad na tanggihan ang isang tunay na null hypothesis ay tinatawag na antas ng kahalagahan at tinutukoy ng α = 0.05.

Kapag ang lahat ng mga kundisyon para sa paglalapat ng pagsusuri ng pagkakaiba ay natugunan, ang agnas ng kabuuang pagkakaiba ay mathematically ganito ang hitsura:

D gen. = D katotohanan + D pahinga. ,

D gen. - ang kabuuang pagkakaiba-iba ng mga sinusunod na halaga (variant), na nailalarawan sa pamamagitan ng pagkalat ng variant mula sa kabuuang average. Sinusukat ang pagkakaiba-iba ng isang katangian sa buong populasyon sa ilalim ng impluwensya ng lahat ng mga salik na naging sanhi ng pagkakaiba-iba na ito. Ang pangkalahatang pagkakaiba-iba ay binubuo ng intergroup at intragroup;

D fact - factorial (intergroup) na pagkakaiba-iba, na nailalarawan sa pagkakaiba sa mga average sa bawat pangkat at nakasalalay sa impluwensya ng pinag-aralan na kadahilanan, kung saan ang bawat pangkat ay naiba. Halimbawa, sa mga grupo ng iba't ibang etiological na kadahilanan ng klinikal na kurso ng pulmonya, ang average na antas ng ginugol na bed-day ay hindi pareho - ang pagkakaiba-iba ng intergroup ay sinusunod.

D magpahinga. - residual (intragroup) variance, na nagpapakilala sa dispersion ng variant sa loob ng mga grupo. Sumasalamin sa random na pagkakaiba-iba, i.e. bahagi ng pagkakaiba-iba na nangyayari sa ilalim ng impluwensya ng hindi natukoy na mga salik at hindi nakadepende sa katangian - ang salik na pinagbabatayan ng pagpapangkat. Ang pagkakaiba-iba ng katangiang pinag-aaralan ay nakasalalay sa lakas ng impluwensya ng ilang hindi natukoy na random na mga kadahilanan, kapwa sa organisado (ibinigay ng mananaliksik) at random (hindi alam) na mga kadahilanan.

Samakatuwid, ang kabuuang variation (dispersion) ay binubuo ng variation na dulot ng organisado (given) na mga salik, na tinatawag na factorial variation at unorganized na mga salik, i.e. natitirang pagkakaiba-iba (random, hindi alam).

Ang klasikal na pagsusuri ng pagkakaiba-iba ay isinasagawa sa mga sumusunod na hakbang:

  1. Konstruksyon ng isang dispersion complex.
  2. Pagkalkula ng average na mga parisukat ng mga deviations.
  3. Pagkalkula ng pagkakaiba-iba.
  4. Paghahambing ng salik at natitirang pagkakaiba.
  5. Pagsusuri ng mga resulta gamit ang mga teoretikal na halaga ng pamamahagi ng Fisher-Snedekor (Appendix N 1).

ALGORITHM PARA SA PAGSASAGAWA NG ANOVANE ANALYSIS AYON SA ISANG SIMPLIFIED VARIANT

Ang algorithm para sa pagsasagawa ng pagsusuri ng pagkakaiba-iba gamit ang isang pinasimple na pamamaraan ay nagbibigay-daan sa iyo upang makakuha ng parehong mga resulta, ngunit ang mga kalkulasyon ay mas simple:

stage ako. Konstruksyon ng isang dispersion complex

Ang pagtatayo ng isang dispersion complex ay nangangahulugan ng pagtatayo ng isang talahanayan kung saan ang mga salik, ang mabisang tanda at ang pagpili ng mga obserbasyon (mga pasyente) sa bawat grupo ay malinaw na makikilala.

Ang one-factor complex ay binubuo ng ilang gradations ng isang factor (A). Ang mga gradasyon ay mga sample mula sa iba't ibang pangkalahatang populasyon (A1, A2, AZ).

Two-factor complex - binubuo ng ilang gradasyon ng dalawang salik na pinagsama sa isa't isa. Ang mga etiological na kadahilanan sa saklaw ng pneumonia ay pareho (A1, A2, AZ) kasama ang iba't ibang anyo ng klinikal na kurso ng pneumonia (H1 - talamak, H2 - talamak).

Tanda ng resulta (bilang ng mga araw ng kama sa karaniwan) Etiological na mga kadahilanan sa pag-unlad ng pneumonia
A1 A2 A3
H1 H2 H1 H2 H1 H2
M = 14 na araw

II yugto. Pagkalkula ng pangkalahatang average (M obsh)

Pagkalkula ng kabuuan ng mga opsyon para sa bawat gradasyon ng mga salik: Σ Vj = V 1 + V 2 + V 3

Pagkalkula ng kabuuang kabuuan ng variant (Σ V total) sa lahat ng gradations ng factor attribute: Σ V total = Σ Vj 1 + Σ Vj 2 + Σ Vj 3

Pagkalkula ng average na pangkat (M gr.) Factor sign: M gr. = Σ Vj / N,
kung saan ang N ay ang kabuuan ng bilang ng mga obserbasyon para sa lahat ng mga gradasyon ng tampok na kadahilanan I (Σn ayon sa mga pangkat).

III yugto. Pagkalkula ng mga pagkakaiba-iba:

Napapailalim sa lahat ng mga kondisyon para sa paglalapat ng pagsusuri ng pagkakaiba, ang mathematical formula ay ang mga sumusunod:

D gen. = D katotohanan + D pahinga.

D gen. - kabuuang pagkakaiba, na nailalarawan sa pamamagitan ng pagkalat ng variant (mga sinusunod na halaga) mula sa pangkalahatang average;
D katotohanan. - Ang pagkakaiba-iba ng factorial (intergroup) ay nagpapakilala sa pagkalat ng mga average ng grupo mula sa pangkalahatang average;
D magpahinga. - ang natitirang (intragroup) variance ay nagpapakilala sa dispersion ng variant sa loob ng mga grupo.

  1. Pagkalkula ng factorial variance (D fact.): D katotohanan. = Σh - H
  2. Ang pagkalkula h ay isinasagawa ayon sa pormula: h = (Σ Vj) / N
  3. Ang pagkalkula ng H ay isinasagawa ayon sa pormula: H = (Σ V) 2 / N
  4. Pagkalkula ng natitirang pagkakaiba: D magpahinga. = (Σ V) 2 - Σ h
  5. Kinakalkula ang kabuuang pagkakaiba: D gen. = (Σ V) 2 - Σ H

IV yugto. Pagkalkula ng pangunahing tagapagpahiwatig ng lakas ng impluwensya ng kadahilanan sa ilalim ng pag-aaral Ang indicator ng lakas ng impluwensya (η 2) ng isang factor attribute sa resulta ay tinutukoy ng bahagi ng factorial variance (D fact.) sa kabuuang variance (D general), η 2 (ito) - nagpapakita kung anong proporsyon ang Ang impluwensya ng kadahilanan sa ilalim ng pag-aaral ay sumasakop sa lahat ng iba pang mga kadahilanan at tinutukoy ng formula:

V yugto. Ang pagpapasiya ng pagiging maaasahan ng mga resulta ng pag-aaral sa pamamagitan ng pamamaraan ng Fisher ay isinasagawa ayon sa pormula:


F - pamantayan ni Fisher;
Fst. - talahanayan na halaga (tingnan ang Appendix 1).
σ 2 katotohanan, σ 2 pahinga. - factorial at residual deviations (mula sa lat. de - from, via - road) - deviation mula sa midline, na tinutukoy ng mga formula:


r ay ang bilang ng gradations ng factor attribute.

Ang paghahambing ng criterion ng Fisher (F) sa pamantayan (tabular) F ay isinasagawa ayon sa mga haligi ng talahanayan, na isinasaalang-alang ang mga antas ng kalayaan:

v 1 \u003d n - 1
v 2 \u003d N - 1

Pahalang, ang v 1 ay tinutukoy nang patayo - v 2, sa kanilang intersection, ang isang tabular na halaga F ay tinutukoy, kung saan ang itaas na halaga ng tabular na p ≥ 0.05, at ang mas mababang isa ay tumutugma sa p > 0.01, at inihambing sa kinakalkula na criterion F. Kung ang halaga ng kinakalkulang criterion F na katumbas o mas malaki kaysa sa tabular, kung gayon ang mga resulta ay maaasahan at ang H 0 ay hindi tinatanggihan.

Ang gawain:

Sa negosyo ni N., tumaas ang antas ng mga pinsala, na may kaugnayan sa kung saan ang doktor ay nagsagawa ng isang pag-aaral ng mga indibidwal na kadahilanan, kung saan pinag-aralan ang karanasan sa trabaho ng mga manggagawa sa mga tindahan. Ang mga sample ay kinuha sa N. enterprise mula sa 4 na tindahan na may katulad na mga kondisyon at ang likas na katangian ng trabaho. Ang mga rate ng pinsala ay kinakalkula sa bawat 100 empleyado sa nakaraang taon.

Sa pag-aaral ng salik sa karanasan sa trabaho, nakuha ang sumusunod na data:

Batay sa data ng pag-aaral, isang null hypothesis (H 0) ang iniharap tungkol sa epekto ng karanasan sa trabaho sa antas ng mga pinsala ng mga empleyado ng enterprise A.

Mag-ehersisyo
Kumpirmahin o pabulaanan ang null hypothesis gamit ang one-way analysis ng variance:

  1. matukoy ang lakas ng impluwensya;
  2. suriin ang pagiging maaasahan ng impluwensya ng salik.

Mga yugto ng paglalapat ng pagsusuri ng pagkakaiba
upang matukoy ang impluwensya ng isang kadahilanan (karanasan sa trabaho) sa resulta (rate ng pinsala)

Konklusyon. Sa sample complex, ipinahayag na ang impluwensya ng karanasan sa trabaho sa antas ng mga pinsala ay 80% sa kabuuang bilang ng iba pang mga kadahilanan. Para sa lahat ng workshop ng planta, masasabing may posibilidad na 99.7% (13.3 > 8.7) na ang karanasan sa trabaho ay nakakaapekto sa antas ng mga pinsala.

Kaya, ang null hypothesis (Н 0) ay hindi tinatanggihan at ang epekto ng karanasan sa trabaho sa antas ng mga pinsala sa mga workshop ng planta A ay itinuturing na napatunayan.

F value (Fisher test) na pamantayan sa p ≥ 0.05 (itaas na halaga) sa p ≥ 0.01 (mas mababang halaga)

1 2 3 4 5 6 7 8 9 10 11
6 6,0
13,4
5,1
10,9
4,8
9,8
4,5
9,2
4,4
8,8
4,3
8,5
4,2
8,3
4,1
8,1
4,1
8,0
4,1
7,9
4,0
7,8
7 5,6
12,3
4,7
9,6
4,4
8,5
4,1
7,9
4,0
7,5
3,9
7,2
3,8
7,0
3,7
6,8
3,7
6,7
3,6
6,6
3,6
6,5
8 5,3
11,3
4,6
8,7
4,1
7,6
3,8
7,0
3,7
6,6
3,6
6,4
3,5
6,2
3,4
6,0
3,4
5,9
3,3
5,8
3,1
5,7
9 5,1
10,6
4,3
8,0
3,6
7,0
3,6
6,4
3,5
6,1
3,4
5,8
3,3
5,6
3,2
5,5
3,2
5,4
3,1
5,3
3,1
5,2
10 5,0
10,0
4,1
7,9
3,7
6,6
3,5
6,0
3,3
5,6
3,2
5,4
3,1
5,2
3,1
5,1
3,0
5,0
2,9
4,5
2,9
4,8
11 4,8
9,7
4,0
7,2
3,6
6,2
3,6
5,7
3,2
5,3
3,1
5,1
3,0
4,9
3,0
4,7
2,9
4,6
2,9
4,5
2,8
4,5
12 4,8
9,3
3,9
6,9
3,5
6,0
3,3
5,4
3,1
5,1
3,0
4,7
2,9
4,7
2,9
4,5
2,8
4,4
2,8
4,3
2,7
4,2
13 4,7
9,1
3,8
6,7
3,4
5,7
3,2
5,2
3,0
4,9
2,9
4,6
2,8
4,4
2,8
4,3
2,7
4,2
2,7
4,1
2,6
4,0
14 4,6
8,9
3,7
6,5
3,3
5,6
3,1
5,0
3,0
4,7
2,9
4,5
2,8
4,3
2,7
4,1
2,7
4,0
2,6
3,9
2,6
3,9
15 4,5
8,7
3,7
6,4
3,3
5,4
3,1
4,9
2,9
4,6
2,8
4,3
2,7
4,1
2,6
4,0
2,6
3,9
2,5
3,8
2,5
3,7
16 4,5
8,5
3,6
6,2
3,2
5,3
3,0
4,8
2,9
4,4
2,7
4,2
2,7
4,0
2,6
3,9
2,5
3,8
2,5
3,7
2,5
3,6
17 4,5
8,4
3,6
6,1
3,2
5,2
3,0
4,7
2,8
4,3
2,7
4,1
2,6
3,9
2,6
3,8
2,5
3,8
2,5
3,6
2,4
3,5
18 4,4
8,3
3,5
6,0
3,2
5,1
2,9
4,6
2,8
4,2
2,7
4,0
2,6
3,8
2,5
3,7
2,7
3,6
2,4
3,6
3,4
3,5
19 4,4
8,2
3,5
5,9
3,1
5,0
2,9
4,5
2,7
4,2
2,6
3,9
2,5
3,8
2,5
3,6
2,4
3,5
2,4
3,4
2,3
3,4
20 4,3
8,1
3,5
5,8
3,1
4,9
2,9
4,4
2,7
4,1
2,6
3,9
2,5
3,7
2,4
3,6
2,4
3,4
2,3
3,4
2,3
3,3

  1. Vlasov V.V. Epidemiology. - M.: GEOTAR-MED, 2004. 464 p.
  2. Arkhipova G.L., Lavrova I.G., Troshina I.M. Ang ilang mga modernong pamamaraan ng istatistikal na pagsusuri sa medisina. - M.: Metrosnab, 1971. - 75 p.
  3. Zaitsev V.M., Liflyandsky V.G., Marinkin V.I. Inilapat na Medikal na Istatistika. - St. Petersburg: LLC "FOLIANT Publishing House", 2003. - 432 p.
  4. Platonov A.E. Pagsusuri ng istatistika sa medisina at biology: mga gawain, terminolohiya, lohika, mga pamamaraan ng computer. - M.: Publishing house ng Russian Academy of Medical Sciences, 2000. - 52 p.
  5. Plokhinsky N.A. Biometrics. - Publishing House ng Siberian Branch ng USSR Academy of Sciences Novosibirsk. - 1961. - 364 p.

Lahat ng tao ay likas na naghahanap ng kaalaman. (Aristotle. Metaphysics)

Pagsusuri ng pagkakaiba-iba

Panimulang pangkalahatang-ideya

Sa seksyong ito, susuriin natin ang mga pangunahing pamamaraan, pagpapalagay, at terminolohiya ng ANOVA.

Tandaan na sa panitikang Ingles, ang pagsusuri ng pagkakaiba-iba ay karaniwang tinatawag na pagsusuri ng pagkakaiba-iba. Samakatuwid, para sa kaiklian, sa ibaba minsan ay gagamitin natin ang termino ANOVA (An alysis o f va ugnayan) para sa kumbensyonal na ANOVA at ang termino MANOVA para sa multivariate analysis ng variance. Sa seksyong ito, sunud-sunod nating isasaalang-alang ang mga pangunahing ideya ng pagsusuri ng pagkakaiba-iba ( ANOVA), pagsusuri ng covariance ( ANCOVA), multivariate analysis ng variance ( MANOVA) at multivariate covariance analysis ( MANCOVA). Pagkatapos ng maikling talakayan ng mga merito ng contrast analysis at post hoc test, tingnan natin ang mga pagpapalagay kung saan nakabatay ang mga pamamaraan ng ANOVA. Sa pagtatapos ng seksyong ito, ang mga bentahe ng multivariate na diskarte para sa paulit-ulit na pagsusuri ng mga panukala ay ipinaliwanag sa tradisyonal na one-dimensional na diskarte.

Mga Pangunahing Ideya

Ang layunin ng pagsusuri ng pagkakaiba-iba. Ang pangunahing layunin ng pagsusuri ng pagkakaiba-iba ay pag-aralan ang kahalagahan ng pagkakaiba sa pagitan ng mga paraan. Kabanata (Kabanata 8) ay nagbibigay ng maikling panimula sa istatistikal na pagsusuri ng kahalagahan. Kung inihahambing mo lamang ang paraan ng dalawang sample, ang pagsusuri ng pagkakaiba ay magbibigay ng parehong resulta gaya ng normal na pagsusuri. t- criterion para sa mga independiyenteng sample (kung ang dalawang independiyenteng grupo ng mga bagay o obserbasyon ay inihambing), o t- criterion para sa mga umaasa na sample (kung ang dalawang variable ay inihambing sa parehong hanay ng mga bagay o obserbasyon). Kung hindi ka pamilyar sa mga pamantayang ito, inirerekomenda namin na sumangguni ka sa panimulang pangkalahatang-ideya ng kabanata (Kabanata 9).

Saan nagmula ang pangalan Pagsusuri ng pagkakaiba-iba? Maaaring mukhang kakaiba na ang pamamaraan para sa paghahambing ng mga paraan ay tinatawag na pagsusuri ng pagkakaiba. Sa katunayan, ito ay dahil sa katotohanan na kapag sinusuri natin ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan, aktwal na sinusuri natin ang mga pagkakaiba-iba.

Paghahati sa kabuuan ng mga parisukat

Para sa sample na laki ng n, ang sample na variance ay kinakalkula bilang ang kabuuan ng mga squared deviations mula sa sample mean na hinati ng n-1 (sample size minus one). Kaya, para sa isang nakapirming laki ng sample n, ang pagkakaiba ay isang function ng kabuuan ng mga parisukat (mga deviations), na tinutukoy, para sa kaiklian, SS(mula sa English Sum of Squares - Sum of Squares). Ang pagsusuri ng pagkakaiba ay batay sa paghahati (o paghahati) ng pagkakaiba sa mga bahagi. Isaalang-alang ang sumusunod na set ng data:

Ang paraan ng dalawang grupo ay makabuluhang naiiba (2 at 6, ayon sa pagkakabanggit). Kabuuan ng mga squared deviations loob ng bawat pangkat ay 2. Pagsasama-sama ng mga ito, makakakuha tayo ng 4. Kung uulitin natin ngayon ang mga kalkulasyong ito hindi kasama group membership, ibig sabihin, kung kalkulahin natin SS batay sa pinagsamang mean ng dalawang sample, makakakuha tayo ng 28. Sa madaling salita, ang pagkakaiba-iba (kabuuan ng mga parisukat) batay sa pagkakaiba-iba sa loob ng grupo ay nagreresulta sa mas maliit na mga halaga kaysa kapag kinakalkula batay sa kabuuang pagkakaiba-iba (na may kaugnayan sa pangkalahatang ibig sabihin). Ang dahilan nito ay malinaw na ang makabuluhang pagkakaiba sa pagitan ng mga paraan, at ang pagkakaiba sa pagitan ng mga paraan ay nagpapaliwanag ng umiiral na pagkakaiba sa pagitan ng mga kabuuan ng mga parisukat. Sa katunayan, kung gagamitin natin ang modyul Pagsusuri ng pagkakaiba-iba, ang mga sumusunod na resulta ay makukuha:

Tulad ng makikita mula sa talahanayan, ang kabuuang kabuuan ng mga parisukat SS=28 nahahati sa kabuuan ng mga parisukat dahil sa intragroup pagkakaiba-iba ( 2+2=4 ; tingnan ang pangalawang hilera ng talahanayan) at ang kabuuan ng mga parisukat dahil sa pagkakaiba sa mga halaga ng ibig sabihin. (28-(2+2)=24; tingnan ang unang linya ng talahanayan).

SS mga pagkakamali atSS epekto. Pagkakaiba-iba sa loob ng pangkat ( SS) ay karaniwang tinatawag na pagkakaiba mga pagkakamali. Nangangahulugan ito na kadalasan ay hindi ito mahulaan o maipaliwanag kapag isinasagawa ang isang eksperimento. Sa kabilang kamay, SS epekto(o pagkakaiba-iba ng intergroup) ay maaaring ipaliwanag sa pamamagitan ng pagkakaiba sa pagitan ng mga paraan sa mga pinag-aralan na grupo. Sa madaling salita, kabilang sa isang tiyak na grupo nagpapaliwanag pagkakaiba-iba ng intergroup, dahil alam natin na ang mga grupong ito ay may iba't ibang paraan.

Pagsusuri ng kahalagahan. Ang mga pangunahing ideya ng pagsubok para sa istatistikal na kahalagahan ay tinalakay sa kabanata Mga konsepto ng elementarya ng istatistika(Kabanata 8). Ipinapaliwanag ng parehong kabanata ang mga dahilan kung bakit ginagamit ng maraming pagsubok ang ratio ng ipinaliwanag at hindi maipaliwanag na pagkakaiba. Ang isang halimbawa ng paggamit na ito ay ang pagsusuri ng pagkakaiba mismo. Ang pagsusuri sa kahalagahan sa ANOVA ay batay sa paghahambing ng pagkakaiba dahil sa pagkakaiba-iba sa pagitan ng pangkat (tinatawag na ibig sabihin ng square effect o MSEpekto) at pagpapakalat dahil sa pagkalat sa loob ng grupo (tinatawag na ibig sabihin ng square error o MSpagkakamali). Kung ang null hypothesis ay totoo (pagkakapantay-pantay ng mga paraan sa dalawang populasyon), maaari nating asahan ang isang medyo maliit na pagkakaiba sa sample na paraan dahil sa random na pagkakaiba-iba. Samakatuwid, sa ilalim ng null hypothesis, ang pagkakaiba-iba ng intra-grupo ay halos magkakasabay sa kabuuang pagkakaiba na kinakalkula nang hindi isinasaalang-alang ang pagiging kasapi ng grupo. Ang mga nagreresultang pagkakaiba-iba sa loob ng pangkat ay maaaring ihambing gamit F- pagsubok na sumusuri kung ang ratio ng mga pagkakaiba ay higit na malaki kaysa sa 1. Sa halimbawa sa itaas, F- Ipinapakita ng pagsubok na ang pagkakaiba sa pagitan ng mga paraan ay makabuluhan sa istatistika.

Pangunahing lohika ng ANOVA. Summing up, maaari nating sabihin na ang layunin ng pagsusuri ng pagkakaiba-iba ay upang subukan ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan (para sa mga grupo o mga variable). Ang pagsusuring ito ay isinasagawa gamit ang pagsusuri ng pagkakaiba, i.e. sa pamamagitan ng paghahati sa kabuuang pagkakaiba (variation) sa mga bahagi, ang isa ay dahil sa random na error (i.e., intragroup variability), at ang pangalawa ay nauugnay sa pagkakaiba sa mean na mga halaga. Ang huling bahagi ng pagkakaiba ay pagkatapos ay ginagamit upang pag-aralan ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga paraan. Kung makabuluhan ang pagkakaibang ito, tatanggihan ang null hypothesis at tinatanggap ang alternatibong hypothesis na mayroong pagkakaiba sa pagitan ng mga paraan.

Dependent at independent variable. Ang mga variable na ang mga halaga ay natutukoy sa pamamagitan ng mga sukat sa panahon ng isang eksperimento (halimbawa, isang marka na nakapuntos sa isang pagsubok) ay tinatawag na umaasa mga variable. Ang mga variable na maaaring manipulahin sa isang eksperimento (halimbawa, mga pamamaraan ng pagsasanay o iba pang pamantayan na nagpapahintulot sa iyo na hatiin ang mga obserbasyon sa mga pangkat) ay tinatawag mga kadahilanan o malaya mga variable. Ang mga konseptong ito ay inilalarawan nang mas detalyado sa kabanata Mga konsepto ng elementarya ng istatistika(Kabanata 8).

Multivariate analysis ng variance

Sa simpleng halimbawa sa itaas, maaari mong agad na kalkulahin ang independent sample t-test gamit ang naaangkop na opsyon sa module Mga pangunahing istatistika at talahanayan. Ang mga resulta na nakuha, siyempre, ay nag-tutugma sa mga resulta ng pagsusuri ng pagkakaiba-iba. Gayunpaman, ang pagsusuri ng pagkakaiba ay naglalaman ng nababaluktot at makapangyarihang mga teknikal na tool na maaaring magamit para sa mas kumplikadong pag-aaral.

Maraming mga kadahilanan. Ang mundo ay likas na kumplikado at multidimensional. Ang mga sitwasyon kung saan ang ilang kababalaghan ay ganap na inilalarawan ng isang variable ay napakabihirang. Halimbawa, kung sinusubukan nating matutunan kung paano magtanim ng malalaking kamatis, dapat nating isaalang-alang ang mga salik na nauugnay sa genetic na istraktura ng mga halaman, uri ng lupa, liwanag, temperatura, atbp. Kaya, kapag nagsasagawa ng isang tipikal na eksperimento, kailangan mong harapin ang isang malaking bilang ng mga kadahilanan. Ang pangunahing dahilan kung bakit mas mainam ang paggamit ng ANOVA kaysa muling paghahambing ng dalawang sample sa magkaibang antas ng mga salik na gumagamit t- criterion ay ang pagsusuri ng pagkakaiba ay higit pa epektibo at, para sa maliliit na sample, mas nagbibigay-kaalaman.

Pamamahala ng salik. Ipagpalagay natin na sa halimbawa ng dalawang-sample na pagsusuri na tinalakay sa itaas, magdagdag tayo ng isa pang salik, halimbawa, Sahig- Kasarian. Hayaang ang bawat pangkat ay binubuo ng 3 lalaki at 3 babae. Ang disenyo ng eksperimentong ito ay maaaring ipakita sa anyo ng 2 by 2 table:

Eksperimento. Pangkat 1 Eksperimento. Pangkat 2
Lalaki2 6
3 7
1 5
Katamtaman2 6
Babae4 8
5 9
3 7
Katamtaman4 8

Bago gawin ang mga kalkulasyon, makikita mo na sa halimbawang ito ang kabuuang pagkakaiba ay may hindi bababa sa tatlong pinagmulan:

(1) random na error (sa loob ng pagkakaiba-iba ng grupo),

(2) pagkakaiba-iba na nauugnay sa pagiging kasapi sa eksperimentong grupo, at

(3) pagkakaiba-iba dahil sa kasarian ng mga naobserbahang bagay.

(Tandaan na may isa pang posibleng pinagmumulan ng pagkakaiba-iba - interaksyon ng mga salik, na tatalakayin natin mamaya). Ano ang mangyayari kung hindi namin isama sahigkasarian bilang salik sa pagsusuri at kalkulahin ang karaniwan t-pamantayan? Kung kalkulahin natin ang mga kabuuan ng mga parisukat, hindi papansinin sahig -kasarian(ibig sabihin, pagsasama-sama ng mga bagay ng iba't ibang kasarian sa isang pangkat kapag kinakalkula ang pagkakaiba-iba sa loob ng pangkat, habang kinukuha ang kabuuan ng mga parisukat para sa bawat pangkat na katumbas ng SS=10, at ang kabuuang kabuuan ng mga parisukat SS= 10+10 = 20), pagkatapos ay makakakuha tayo ng mas malaking halaga ng intragroup dispersion kaysa sa mas tumpak na pagsusuri na may karagdagang paghahati sa mga subgroup ayon sa semi- kasarian(sa kasong ito, ang ibig sabihin ng intragroup ay magiging katumbas ng 2, at ang kabuuang intragroup na kabuuan ng mga parisukat ay magiging katumbas ng SS = 2+2+2+2 = 8). Ang pagkakaibang ito ay dahil sa ang katunayan na ang ibig sabihin ng halaga para sa mga lalaki - mga lalaki mas mababa sa average para sa babae -babae, at ang pagkakaibang ito sa ibig sabihin ay nagpapataas ng kabuuang pagkakaiba-iba sa loob ng grupo kung hindi isasaalang-alang ang kasarian. Ang pagkontrol sa pagkakaiba-iba ng error ay nagpapataas ng sensitivity (kapangyarihan) ng pagsubok.

Ang halimbawang ito ay nagpapakita ng isa pang bentahe ng pagsusuri ng pagkakaiba sa kumbensyonal na pagsusuri. t-criterion para sa dalawang sample. Ang pagsusuri ng pagkakaiba-iba ay nagpapahintulot sa iyo na pag-aralan ang bawat kadahilanan sa pamamagitan ng pagkontrol sa mga halaga ng iba pang mga kadahilanan. Ito, sa katunayan, ang pangunahing dahilan para sa mas malaking istatistikal na kapangyarihan nito (ang mas maliliit na laki ng sample ay kinakailangan upang makakuha ng makabuluhang mga resulta). Para sa kadahilanang ito, ang pagsusuri ng pagkakaiba-iba, kahit na sa maliliit na sample, ay nagbibigay ng istatistika na mas makabuluhang mga resulta kaysa sa isang simple. t- pamantayan.

Mga epekto sa pakikipag-ugnayan

May isa pang bentahe ng paggamit ng ANOVA kaysa sa maginoo na pagsusuri. t- criterion: ang pagsusuri ng pagkakaiba ay nagbibigay-daan sa iyo na makita pakikipag-ugnayan sa pagitan ng mga kadahilanan at samakatuwid ay nagbibigay-daan sa mas kumplikadong mga modelo na pag-aralan. Upang ilarawan, isaalang-alang ang isa pang halimbawa.

Pangunahing epekto, pairwise (two-factor) na pakikipag-ugnayan. Ipagpalagay natin na mayroong dalawang grupo ng mga mag-aaral, at sa sikolohikal na paraan ang mga mag-aaral ng unang pangkat ay nakatutok sa pagtupad ng mga nakatalagang gawain at mas may layunin kaysa sa mga mag-aaral ng pangalawang pangkat, na binubuo ng mga mas tamad na mag-aaral. Hatiin natin ang bawat grupo nang sapalaran sa kalahati at mag-alok sa kalahati ng bawat grupo ng mahirap na gawain, at ang isa ay madali. Pagkatapos nito, sinusukat namin kung gaano kahirap ang mga mag-aaral sa mga gawaing ito. Ang mga average para sa pag-aaral na ito ay ipinapakita sa talahanayan:

Anong konklusyon ang maaaring makuha mula sa mga resultang ito? Posible bang mahinuha na: (1) ang mga mag-aaral ay nagsusumikap sa isang mahirap na gawain; (2) mas masipag ba ang mga motivated na estudyante kaysa sa mga tamad? Wala sa mga pahayag na ito ang sumasalamin sa kakanyahan ng sistematikong katangian ng mga average na ibinigay sa talahanayan. Kung pinag-aaralan ang mga resulta, mas tamang sabihin na ang mga motivated na mag-aaral lamang ang nagsusumikap sa mga kumplikadong gawain, habang ang mga tamad na mag-aaral lamang ang nagsusumikap sa mga madaling gawain. Sa madaling salita, ang katangian ng mga mag-aaral at ang pagiging kumplikado ng gawain nakikipag-ugnayan ang bawat isa ay nakakaapekto sa dami ng pagsisikap na kinakailangan. Iyan ay isang halimbawa interaksyon ng magkapares sa pagitan ng kalikasan ng mga mag-aaral at sa pagiging kumplikado ng gawain. Tandaan na inilalarawan ng mga pahayag 1 at 2 pangunahing epekto.

Mga pakikipag-ugnayan ng mas mataas na mga order. Bagama't medyo madaling ipaliwanag ang mga pairwise na pakikipag-ugnayan, mas mahirap ipaliwanag ang mga pakikipag-ugnayan sa mas mataas na pagkakasunud-sunod. Isipin natin na sa halimbawang isinasaalang-alang sa itaas, isa pang salik ang ipinakilala sahig -Kasarian at nakuha namin ang sumusunod na talahanayan ng mga average:

Anong mga konklusyon ang maaari na ngayong makuha mula sa mga resulta na nakuha? Pinapadali ng mga mean plot na bigyang-kahulugan ang mga kumplikadong epekto. Ang pagsusuri ng variance module ay nagbibigay-daan sa iyo na bumuo ng mga graph na ito sa halos isang click.

Ang larawan sa mga graph sa ibaba ay kumakatawan sa three-way na interaksyon na pinag-aaralan.

Sa pagtingin sa mga graph, masasabi natin na mayroong pakikipag-ugnayan sa pagitan ng kalikasan at kahirapan ng pagsusulit para sa mga kababaihan: ang mga motivated na kababaihan ay nagsusumikap sa isang mahirap na gawain kaysa sa isang madaling gawain. Sa mga lalaki, ang parehong pakikipag-ugnayan ay baligtad. Makikita na ang paglalarawan ng interaksyon sa pagitan ng mga salik ay nagiging mas nakalilito.

Pangkalahatang paraan ng paglalarawan ng mga pakikipag-ugnayan. Sa pangkalahatang kaso, ang pakikipag-ugnayan sa pagitan ng mga salik ay inilarawan bilang isang pagbabago sa isang epekto sa ilalim ng impluwensya ng isa pa. Sa halimbawang tinalakay sa itaas, ang dalawang-factor na interaksyon ay maaaring ilarawan bilang isang pagbabago sa pangunahing epekto ng salik na nagpapakilala sa pagiging kumplikado ng gawain, sa ilalim ng impluwensya ng salik na naglalarawan sa katangian ng mag-aaral. Para sa pakikipag-ugnayan ng tatlong salik mula sa nakaraang talata, masasabi nating ang pakikipag-ugnayan ng dalawang salik (ang pagiging kumplikado ng gawain at ang katangian ng mag-aaral) ay nagbabago sa ilalim ng impluwensya ng kasarianKasarian. Kung ang pakikipag-ugnayan ng apat na salik ay pinag-aralan, masasabi nating ang pakikipag-ugnayan ng tatlong salik ay nagbabago sa ilalim ng impluwensya ng ikaapat na salik, i.e. may iba't ibang uri ng interaksyon sa iba't ibang antas ng ikaapat na salik. Ito ay lumabas na sa maraming mga lugar ang pakikipag-ugnayan ng lima o higit pang mga kadahilanan ay hindi karaniwan.

Mga kumplikadong plano

Intergroup at intragroup na mga plano (mga plano sa pagsukat)

Kapag naghahambing ng dalawang magkaibang grupo, karaniwang ginagamit ng isa t- criterion para sa mga independiyenteng sample (mula sa module Mga pangunahing istatistika at talahanayan). Kapag ang dalawang variable ay inihambing sa parehong hanay ng mga bagay (obserbasyon), ito ay ginagamit t-criterion para sa mga umaasa na sample. Para sa pagsusuri ng pagkakaiba, mahalaga din kung ang mga sample ay nakasalalay o hindi. Kung may mga paulit-ulit na pagsukat ng parehong mga variable (sa ilalim ng magkakaibang kundisyon o sa iba't ibang oras) para sa parehong mga bagay, pagkatapos ay sinasabi nila tungkol sa presensya kadahilanan ng paulit-ulit na pagsukat(tinatawag din isang kadahilanan sa intragroup dahil ang kabuuan ng mga parisukat sa loob ng pangkat ay kinakalkula upang suriin ang kahalagahan nito). Kung ang iba't ibang grupo ng mga bagay ay inihambing (halimbawa, mga lalaki at babae, tatlong mga strain ng bakterya, atbp.), kung gayon ang pagkakaiba sa pagitan ng mga grupo ay inilarawan salik ng intergroup. Ang mga pamamaraan para sa pagkalkula ng pamantayan ng kahalagahan para sa dalawang uri ng mga salik na inilarawan ay magkaiba, ngunit ang kanilang pangkalahatang lohika at interpretasyon ay pareho.

Inter- at intra-grupo na mga plano. Sa maraming mga kaso, ang eksperimento ay nangangailangan ng pagsasama ng parehong salik sa pagitan ng pangkat at isang paulit-ulit na kadahilanan ng pagsukat sa disenyo. Halimbawa, ang mga kasanayan sa matematika ng mga mag-aaral na babae at lalaki ay sinusukat (kung saan sahig -Kasarian-intergroup factor) sa simula at sa pagtatapos ng semestre. Ang dalawang dimensyon ng mga kasanayan ng bawat mag-aaral ay bumubuo sa salik sa loob ng pangkat (paulit-ulit na salik sa pagsukat). Ang interpretasyon ng mga pangunahing epekto at pakikipag-ugnayan para sa mga salik sa pagitan ng pangkat at paulit-ulit na pagsukat ay pareho, at ang parehong mga uri ng mga kadahilanan ay malinaw na maaaring makipag-ugnayan sa isa't isa (halimbawa, ang mga kababaihan ay nakakakuha ng mga kasanayan sa panahon ng semestre, at ang mga lalaki ay nawawala ang mga ito).

Mga hindi kumpletong (nested) na plano

Sa maraming kaso, maaaring mapabayaan ang epekto ng pakikipag-ugnayan. Nangyayari ito alinman kapag alam na walang epekto sa pakikipag-ugnayan sa populasyon, o kapag ang pagpapatupad ng buo factorial imposible ang plano. Halimbawa, pinag-aaralan ang epekto ng apat na fuel additives sa pagkonsumo ng gasolina. Apat na kotse at apat na driver ang napili. Puno factorial ang eksperimento ay nangangailangan na ang bawat kumbinasyon: suplemento, driver, kotse, ay lilitaw nang hindi bababa sa isang beses. Nangangailangan ito ng hindi bababa sa 4 x 4 x 4 = 64 na pangkat ng pagsubok, na masyadong nakakaubos ng oras. Bilang karagdagan, halos walang anumang pakikipag-ugnayan sa pagitan ng driver at ng fuel additive. Sa pag-iisip na ito, maaari mong gamitin ang plano mga parisukat sa latin, na naglalaman lamang ng 16 na grupo ng mga pagsubok (apat na additives ang itinalaga ng mga titik A, B, C at D):

Ang mga parisukat sa Latin ay inilalarawan sa karamihan ng mga aklat na pang-eksperimentong disenyo (hal. Hays, 1988; Lindman, 1974; Milliken at Johnson, 1984; Winer, 1962) at hindi tatalakayin nang detalyado dito. Tandaan na ang mga parisukat sa Latin ay hindinpuno na mga plano na hindi kasama ang lahat ng kumbinasyon ng mga antas ng kadahilanan. Halimbawa, ang driver 1 ay nagmamaneho ng kotse 1 gamit ang additive A lamang, ang driver 3 ay nagmamaneho ng kotse 1 na may additive C lamang. Factor levels mga additives ( A, B, C at D) na naka-nest sa mga cell ng talahanayan sasakyan x driver - parang mga itlog sa pugad. Ang mnemonic rule na ito ay kapaki-pakinabang para sa pag-unawa sa kalikasan nested o nested mga plano. Module Pagsusuri ng pagkakaiba-iba nagbibigay ng mga simpleng paraan upang pag-aralan ang mga plano ng ganitong uri.

Pagsusuri ng Covariance

Pangunahing ideya

Sa kabanata Mga Pangunahing Ideya nagkaroon ng maikling talakayan tungkol sa ideya ng pagkontrol sa mga kadahilanan at kung paano ang pagsasama ng mga additive na kadahilanan ay maaaring mabawasan ang kabuuan ng mga squared error at mapataas ang istatistikal na kapangyarihan ng disenyo. Ang lahat ng ito ay maaaring palawakin sa mga variable na may tuluy-tuloy na hanay ng mga halaga. Kapag ang mga tuluy-tuloy na variable ay kasama bilang mga salik sa disenyo, ang mga ito ay tinatawag covariates.

Nakapirming covariates

Ipagpalagay na inihahambing natin ang mga kasanayan sa matematika ng dalawang grupo ng mga mag-aaral na itinuro mula sa dalawang magkaibang aklat-aralin. Ipagpalagay din natin na mayroon tayong intelligence quotient (IQ) data para sa bawat estudyante. Maaari naming ipagpalagay na ang IQ ay nauugnay sa mga kasanayan sa matematika at gamitin ang impormasyong ito. Para sa bawat isa sa dalawang grupo ng mga mag-aaral, ang koepisyent ng ugnayan sa pagitan ng IQ at mga kasanayan sa matematika ay maaaring kalkulahin. Gamit ang koepisyent ng ugnayan na ito, posible na makilala sa pagitan ng bahagi ng pagkakaiba-iba sa mga pangkat na ipinaliwanag sa pamamagitan ng impluwensya ng IQ at ang hindi maipaliwanag na bahagi ng pagkakaiba-iba (tingnan din ang Mga konsepto ng elementarya ng istatistika(kabanata 8) at Mga pangunahing istatistika at talahanayan(Kabanata 9)). Ang natitirang bahagi ng pagkakaiba ay ginagamit sa pagsusuri bilang pagkakaiba ng error. Kung mayroong isang ugnayan sa pagitan ng IQ at mga kasanayan sa matematika, kung gayon ang mga pagkakaiba-iba ng error ay maaaring makabuluhang bawasan. SS/(n-1) .

Epekto ng covariates saF- pamantayan. F- sinusuri ng criterion ang istatistikal na kahalagahan ng pagkakaiba sa pagitan ng mga mean na halaga sa mga pangkat, habang ang ratio ng pagkakaiba-iba ng intergroup ay kinakalkula ( MSepekto) sa pagkakaiba-iba ng error ( MSpagkakamali) . Kung ang MSpagkakamali bumababa, halimbawa, kapag isinasaalang-alang ang IQ factor, ang halaga F nadadagdagan.

Maraming covariates. Ang pangangatwiran na ginamit sa itaas para sa isang solong covariate (IQ) ay madaling umaabot sa maraming covariate. Halimbawa, bilang karagdagan sa IQ, maaari mong isama ang pagsukat ng motibasyon, spatial na pag-iisip, atbp. Sa halip na ang karaniwang koepisyent ng ugnayan, isang maramihang koepisyent ng ugnayan ang ginagamit.

Kapag ang halagaF -nababawasan ang pamantayan. Minsan ang pagpapakilala ng mga covariate sa disenyo ng eksperimento ay nagpapababa sa halaga F- pamantayan . Karaniwang ipinahihiwatig nito na ang mga covariate ay hindi lamang nauugnay sa dependent variable (tulad ng mga kasanayan sa matematika) kundi pati na rin sa mga salik (tulad ng iba't ibang mga aklat-aralin). Ipagpalagay na ang IQ ay sinusukat sa katapusan ng semestre, pagkatapos ng dalawang grupo ng mga mag-aaral na gumugol ng halos isang taon sa pag-aaral ng dalawang magkaibang aklat-aralin. Bagama't ang mga mag-aaral ay hinati sa mga grupo nang sapalaran, maaaring lumabas na ang pagkakaiba sa mga aklat-aralin ay napakalaki na ang parehong mga kasanayan sa IQ at matematika sa iba't ibang mga grupo ay mag-iiba nang malaki. Sa kasong ito, hindi lamang binabawasan ng mga covariates ang pagkakaiba-iba ng error, kundi pati na rin ang pagkakaiba-iba sa pagitan ng pangkat. Sa madaling salita, pagkatapos makontrol ang pagkakaiba sa IQ sa pagitan ng mga grupo, ang pagkakaiba sa mga kasanayan sa matematika ay hindi na magiging makabuluhan. Maaari itong sabihin kung hindi man. Matapos "alisin" ang impluwensya ng IQ, ang impluwensya ng aklat-aralin sa pagbuo ng mga kasanayan sa matematika ay hindi sinasadyang ibinukod.

Inayos ang mga average. Kapag naapektuhan ng covariate ang salik sa pagitan ng pangkat, dapat kalkulahin ng isa adjusted average, ibig sabihin. ganoong paraan, na nakukuha pagkatapos alisin ang lahat ng mga pagtatantya ng mga covariates.

Pakikipag-ugnayan sa pagitan ng mga covariates at mga kadahilanan. Tulad ng mga pakikipag-ugnayan sa pagitan ng mga kadahilanan ay ginalugad, ang mga pakikipag-ugnayan sa pagitan ng mga covariate at sa pagitan ng mga pangkat ng mga kadahilanan ay maaaring tuklasin. Ipagpalagay na ang isa sa mga aklat-aralin ay angkop lalo na para sa matatalinong estudyante. Ang pangalawang aklat-aralin ay nakakainip para sa matatalinong mag-aaral, at ang parehong aklat-aralin ay mahirap para sa hindi gaanong matalinong mga mag-aaral. Bilang resulta, mayroong positibong ugnayan sa pagitan ng IQ at mga resulta ng pagkatuto sa unang grupo (mas matalinong mga mag-aaral, mas mahusay na mga resulta) at zero o maliit na negatibong ugnayan sa pangalawang grupo (mas matalino ang mag-aaral, mas maliit ang posibilidad na makakuha ng mga kasanayan sa matematika. mula sa pangalawang aklat-aralin). Sa ilang mga pag-aaral, ang sitwasyong ito ay tinalakay bilang isang halimbawa ng paglabag sa mga pagpapalagay ng pagsusuri ng covariance. Gayunpaman, dahil ang module ng Analysis of Variance ay gumagamit ng mga pinakakaraniwang paraan ng pagsusuri ng covariance, posible, sa partikular, upang suriin ang istatistikal na kahalagahan ng interaksyon sa pagitan ng mga salik at covariates.

Variable covariates

Habang ang mga nakapirming covariate ay madalas na tinatalakay sa mga aklat-aralin, ang mga variable na covariate ay hindi gaanong madalas na binabanggit. Karaniwan, kapag nagsasagawa ng mga eksperimento na may paulit-ulit na mga sukat, kami ay interesado sa mga pagkakaiba sa mga sukat ng parehong dami sa iba't ibang mga punto ng oras. Ibig sabihin, interesado kami sa kahalagahan ng mga pagkakaibang ito. Kung ang isang covariate na pagsukat ay isinasagawa kasabay ng mga dependent variable measurements, ang ugnayan sa pagitan ng covariate at ng dependent variable ay maaaring kalkulahin.

Halimbawa, maaari kang mag-aral ng interes sa matematika at mga kasanayan sa matematika sa simula at sa katapusan ng semestre. Magiging kagiliw-giliw na suriin kung ang mga pagbabago sa interes sa matematika ay nauugnay sa mga pagbabago sa mga kasanayan sa matematika.

Module Pagsusuri ng pagkakaiba-iba sa STATISTICS awtomatikong tinatasa ang istatistikal na kahalagahan ng mga pagbabago sa mga covariates sa mga planong iyon, kung posible.

Mga Multivariate na Disenyo: Multivariate ANOVA at Covariance Analysis

Mga plano ng intergroup

Ang lahat ng mga halimbawang isinasaalang-alang nang mas maaga ay nagsasama lamang ng isang dependent variable. Kapag mayroong ilang mga umaasang variable sa parehong oras, ang pagiging kumplikado lamang ng mga kalkulasyon ay tumataas, at ang nilalaman at mga pangunahing prinsipyo ay hindi nagbabago.

Halimbawa, ang isang pag-aaral ay isinasagawa sa dalawang magkaibang mga aklat-aralin. Kasabay nito, pinag-aaralan ang tagumpay ng mga mag-aaral sa pag-aaral ng pisika at matematika. Sa kasong ito, mayroong dalawang umaasang variable at kailangan mong malaman kung paano nakakaapekto ang dalawang magkaibang aklat-aralin sa kanila nang sabay-sabay. Upang gawin ito, maaari mong gamitin ang multivariate analysis of variance (MANOVA). Sa halip na isang one-dimensional F criterion, multidimensional F pagsubok (Wilks l-test) batay sa paghahambing ng error covariance matrix at intergroup covariance matrix.

Kung ang mga umaasang variable ay magkakaugnay sa isa't isa, kung gayon ang ugnayang ito ay dapat isaalang-alang kapag kinakalkula ang pagsubok ng kahalagahan. Malinaw, kung ang parehong pagsukat ay paulit-ulit nang dalawang beses, kung gayon walang bago ang maaaring makuha sa kasong ito. Kung ang isang dimensyon na nauugnay dito ay idinagdag sa isang umiiral na dimensyon, kung gayon ang ilang bagong impormasyon ay makukuha, ngunit ang bagong variable ay naglalaman ng kalabisan na impormasyon, na makikita sa covariance sa pagitan ng mga variable.

Interpretasyon ng mga resulta. Kung ang pangkalahatang multivariate criterion ay makabuluhan, maaari nating tapusin na ang kaukulang epekto (hal. uri ng aklat-aralin) ay makabuluhan. Gayunpaman, lumitaw ang mga sumusunod na katanungan. Nakakaapekto ba ang uri ng aklat-aralin sa pagpapabuti ng mga kasanayan lamang sa matematika, mga pisikal na kasanayan lamang, o pareho ng mga ito. Sa katunayan, pagkatapos makakuha ng makabuluhang multivariate na pamantayan, para sa isang pangunahing epekto o pakikipag-ugnayan, isang-dimensional F pamantayan. Sa madaling salita, ang mga umaasang variable na nag-aambag sa kahalagahan ng multivariate na pagsubok ay hiwalay na sinusuri.

Mga plano na may paulit-ulit na mga sukat

Kung ang mga kasanayan sa matematika at pisikal ng mga mag-aaral ay sinusukat sa simula ng semestre at sa pagtatapos, kung gayon ang mga ito ay paulit-ulit na mga sukat. Ang pag-aaral ng criterion of significance sa naturang mga plano ay isang lohikal na pag-unlad ng one-dimensional na kaso. Tandaan na ang mga multivariate na pamamaraan ng ANOVA ay karaniwang ginagamit din upang siyasatin ang kahalagahan ng univariate na paulit-ulit na mga salik sa pagsukat na mayroong higit sa dalawang antas. Ang mga kaukulang aplikasyon ay tatalakayin mamaya sa bahaging ito.

Pagbubuo ng mga variable na halaga at multivariate na pagsusuri ng pagkakaiba-iba

Kahit na ang mga nakaranasang user ng univariate at multivariate ANOVA ay kadalasang nalilito sa pagkuha ng iba't ibang resulta kapag naglalapat ng multivariate ANOVA sa, halimbawa, tatlong variable, at kapag naglalapat ng univariate ANOVA sa kabuuan ng tatlong variable bilang isang variable.

Idea pagbubuod Ang mga variable ay ang bawat variable ay naglalaman ng ilang totoong variable, na sinisiyasat, pati na rin ang isang random na error sa pagsukat. Samakatuwid, kapag ina-average ang mga halaga ng mga variable, ang error sa pagsukat ay magiging mas malapit sa 0 para sa lahat ng mga sukat at ang mga average na halaga ay magiging mas maaasahan. Sa katunayan, sa kasong ito, ang paglalapat ng ANOVA sa kabuuan ng mga variable ay makatwiran at isang makapangyarihang pamamaraan. Gayunpaman, kung ang mga umaasang variable ay multivariate sa kalikasan, ang pagbubuod ng mga halaga ng mga variable ay hindi naaangkop.

Halimbawa, hayaan ang mga umaasang variable na binubuo ng apat na sukat tagumpay sa lipunan. Ang bawat tagapagpahiwatig ay nagpapakilala sa isang ganap na independiyenteng bahagi ng aktibidad ng tao (halimbawa, propesyonal na tagumpay, tagumpay sa negosyo, kagalingan ng pamilya, atbp.). Ang pagdaragdag ng mga variable na ito ay tulad ng pagdaragdag ng isang mansanas at isang orange. Ang kabuuan ng mga variable na ito ay hindi magiging isang angkop na univariate na sukat. Samakatuwid, ang naturang data ay dapat ituring bilang mga multidimensional na tagapagpahiwatig sa multivariate analysis ng variance.

Pagsusuri ng contrast at mga post hoc na pagsusulit

Bakit inihahambing ang mga indibidwal na hanay ng paraan?

Karaniwan ang mga hypotheses tungkol sa pang-eksperimentong data ay binuo hindi lamang sa mga tuntunin ng mga pangunahing epekto o pakikipag-ugnayan. Ang isang halimbawa ay ang sumusunod na hypothesis: ang isang partikular na aklat-aralin ay nagpapabuti ng mga kasanayan sa matematika sa mga lalaking mag-aaral lamang, habang ang isa pang aklat-aralin ay humigit-kumulang pantay na epektibo para sa parehong kasarian, ngunit hindi pa rin gaanong epektibo para sa mga lalaki. Mahuhulaan na ang pagganap ng aklat-aralin ay nakikipag-ugnayan sa kasarian ng mag-aaral. Gayunpaman, naaangkop din ang hulang ito kalikasan pakikipag-ugnayan. Ang isang makabuluhang pagkakaiba sa pagitan ng mga kasarian ay inaasahan para sa mga mag-aaral sa isang libro, at halos walang kasarian na mga resulta para sa mga mag-aaral sa kabilang libro. Ang ganitong uri ng hypothesis ay karaniwang ginalugad gamit ang contrast analysis.

Pagsusuri ng Contrast

Sa madaling sabi, ang pagsusuri ng kaibahan ay nagpapahintulot sa amin na suriin ang istatistikal na kahalagahan ng ilang mga linear na kumbinasyon ng mga kumplikadong epekto. Ang pagsusuri sa kaibahan ay ang pangunahing at kailangang-kailangan na elemento ng anumang kumplikadong plano ng ANOVA. Module Pagsusuri ng pagkakaiba-iba ay may iba't ibang mga kakayahan sa pagsusuri ng kaibahan na nagbibigay-daan sa iyong pumili at suriin ang anumang uri ng paghahambing ng mga average.

isang posterior paghahambing

Minsan, bilang isang resulta ng pagproseso ng isang eksperimento, isang hindi inaasahang epekto ang natuklasan. Bagama't sa karamihan ng mga kaso ay maipapaliwanag ng isang malikhaing mananaliksik ang anumang resulta, hindi ito nagbibigay ng mga pagkakataon para sa karagdagang pagsusuri at pagtatantya para sa hula. Ang problemang ito ay isa sa mga kung saan pamantayan sa post hoc, iyon ay, pamantayan na hindi ginagamit isang priori mga hypotheses. Upang ilarawan, isaalang-alang ang sumusunod na eksperimento. Ipagpalagay na ang 100 card ay naglalaman ng mga numero mula 1 hanggang 10. Ang pag-drop ng lahat ng mga card na ito sa header, random kaming pumili ng 20 beses 5 card, at kinakalkula ang average na halaga para sa bawat sample (ang average ng mga numerong nakasulat sa mga card). Maaari ba nating asahan na mayroong dalawang sample na ang ibig sabihin ay makabuluhang naiiba? Ito ay lubos na kapani-paniwala! Sa pamamagitan ng pagpili ng dalawang sample na may maximum at minimum na mean, makakakuha ang isa ng pagkakaiba sa mga paraan na ibang-iba sa pagkakaiba sa mga paraan, halimbawa, ng unang dalawang sample. Maaaring imbestigahan ang pagkakaibang ito, halimbawa, gamit ang contrast analysis. Nang walang pagpunta sa mga detalye, mayroong ilang mga tinatawag na isang posterior pamantayan na eksaktong nakabatay sa unang senaryo (kumukuha ng matinding katamtaman mula sa 20 sample), ibig sabihin, ang mga pamantayang ito ay nakabatay sa pagpili ng pinakaiba't ibang paraan upang ihambing ang lahat ng paraan sa disenyo. Ang mga pamantayang ito ay inilapat upang hindi makakuha ng isang artipisyal na epekto na nagkataon lamang, halimbawa, upang makahanap ng isang makabuluhang pagkakaiba sa pagitan ng mga paraan kapag wala. Module Pagsusuri ng pagkakaiba-iba nag-aalok ng malawak na hanay ng naturang pamantayan. Kapag ang mga hindi inaasahang resulta ay nakatagpo sa isang eksperimento na kinasasangkutan ng maraming grupo, ang isang posterior mga pamamaraan para sa pagsusuri sa istatistikal na kahalagahan ng mga resultang nakuha.

Kabuuan ng mga parisukat na uri I, II, III at IV

Multivariate regression at pagsusuri ng variance

Mayroong malapit na kaugnayan sa pagitan ng paraan ng multivariate regression at pagsusuri ng variance (pagsusuri ng mga pagkakaiba-iba). Sa parehong mga pamamaraan, pinag-aaralan ang isang linear na modelo. Sa madaling salita, halos lahat ng mga eksperimentong disenyo ay maaaring tuklasin gamit ang multivariate regression. Isaalang-alang ang sumusunod na simpleng cross-group 2 x 2 na plano.

DV A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Ang mga Column A at B ay naglalaman ng mga code na nagpapakilala sa mga antas ng mga salik A at B, ang column na AxB ay naglalaman ng produkto ng dalawang column A at B. Masusuri natin ang data na ito gamit ang multivariate regression. Variable DV tinukoy bilang isang dependent variable, mga variable mula sa A dati AxB bilang mga independiyenteng variable. Ang pag-aaral ng kahalagahan para sa mga coefficient ng regression ay magkakasabay sa mga kalkulasyon sa pagsusuri ng pagkakaiba-iba ng kahalagahan ng mga pangunahing epekto ng mga kadahilanan A at B at epekto ng interaksyon AxB.

Di-balanse at Balanseng mga Plano

Kapag kinakalkula ang correlation matrix para sa lahat ng mga variable, halimbawa, para sa data na inilalarawan sa itaas, makikita na ang mga pangunahing epekto ng mga kadahilanan A at B at epekto ng interaksyon AxB walang kaugnayan. Ang katangian ng mga epekto ay tinatawag ding orthogonality. Sinasabi nila na ang mga epekto A at B - orthogonal o malaya mula sa isa't isa. Kung ang lahat ng mga epekto sa plano ay orthogonal sa isa't isa, tulad ng sa halimbawa sa itaas, kung gayon ang plano ay sinasabing balanse.

Ang mga balanseng plano ay may "magandang ari-arian." Ang mga kalkulasyon sa pagsusuri ng naturang mga plano ay napaka-simple. Ang lahat ng mga kalkulasyon ay binabawasan sa pagkalkula ng ugnayan sa pagitan ng mga epekto at umaasa na mga variable. Dahil ang mga epekto ay orthogonal, bahagyang mga ugnayan (tulad ng buo multidimensional regressions) ay hindi kinakalkula. Gayunpaman, sa totoong buhay, ang mga plano ay hindi palaging balanse.

Isaalang-alang ang totoong data na may hindi pantay na bilang ng mga obserbasyon sa mga cell.

Salik A Salik B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Kung i-encode namin ang data na ito tulad ng nasa itaas at kalkulahin ang correlation matrix para sa lahat ng mga variable, pagkatapos ay lumalabas na ang mga kadahilanan ng disenyo ay nakakaugnay sa bawat isa. Ang mga kadahilanan sa plano ay hindi na orthogonal at ang mga ganitong plano ay tinatawag na hindi balanse. Tandaan na sa halimbawang ito, ang ugnayan sa pagitan ng mga salik ay ganap na nauugnay sa pagkakaiba sa mga frequency ng 1 at -1 sa mga column ng data matrix. Sa madaling salita, ang mga pang-eksperimentong disenyo na may hindi pantay na dami ng cell (mas tiyak, hindi katimbang na dami) ay magiging hindi balanse, na nangangahulugang maghahalo ang mga pangunahing epekto at pakikipag-ugnayan. Sa kasong ito, upang makalkula ang istatistikal na kahalagahan ng mga epekto, kailangan mong ganap na kalkulahin ang multivariate regression. Mayroong ilang mga diskarte dito.

Kabuuan ng mga parisukat na uri I, II, III at IV

Kabuuan ng uri ng mga parisukatakoatIII. Upang pag-aralan ang kahalagahan ng bawat kadahilanan sa isang multivariate na modelo, maaaring kalkulahin ng isa ang bahagyang ugnayan ng bawat kadahilanan, sa kondisyon na ang lahat ng iba pang mga kadahilanan ay isinasaalang-alang na sa modelo. Maaari ka ring magpasok ng mga salik sa modelo sa sunud-sunod na paraan, na inaayos ang lahat ng mga salik na naipasok na sa modelo at binabalewala ang lahat ng iba pang salik. Sa pangkalahatan, ito ang pagkakaiba sa pagitan uri III at uriako kabuuan ng mga parisukat (ang terminolohiyang ito ay ipinakilala sa SAS, tingnan halimbawa ang SAS, 1982; ang isang detalyadong talakayan ay matatagpuan din sa Searle, 1987, p. 461; Woodward, Bonett, at Brecht, 1990, p. 216; o Milliken at Johnson, 1984, p. 138).

Kabuuan ng uri ng mga parisukatII. Ang susunod na "intermediate" na diskarte sa pagbuo ng modelo ay: upang makontrol ang lahat ng mga pangunahing epekto sa pag-aaral ng kahalagahan ng isang solong pangunahing epekto; sa kontrol ng lahat ng pangunahing epekto at lahat ng magkapares na pakikipag-ugnayan, kapag ang kahalagahan ng isang solong pares na pakikipag-ugnayan ay napagmasdan; sa pagkontrol sa lahat ng pangunahing epekto ng lahat ng magkapares na pakikipag-ugnayan at lahat ng pakikipag-ugnayan ng tatlong salik; sa pag-aaral ng hiwalay na interaksyon ng tatlong salik, atbp. Ang mga kabuuan ng mga parisukat para sa mga epekto na kinakalkula sa ganitong paraan ay tinatawag uriII kabuuan ng mga parisukat. Kaya, uri ngII kinokontrol ng mga kabuuan ng mga parisukat ang lahat ng mga epekto ng parehong pagkakasunud-sunod at mas mababa, hindi pinapansin ang lahat ng mga epekto ng mas mataas na pagkakasunud-sunod.

Kabuuan ng uri ng mga parisukatIV. Sa wakas, para sa ilang mga espesyal na plano na may nawawalang mga cell (hindi kumpletong mga plano), posibleng kalkulahin ang tinatawag na uri IV kabuuan ng mga parisukat. Ang pamamaraang ito ay tatalakayin sa ibang pagkakataon kaugnay ng mga hindi kumpletong plano (mga planong may nawawalang mga cell).

Interpretasyon ng sum-of-squares na haka-haka ng mga uri I, II, at III

kabuuan ng mga parisukat uriIII pinakamadaling bigyang kahulugan. Alalahanin na ang mga kabuuan ng mga parisukat uriIII suriin ang mga epekto pagkatapos makontrol ang lahat ng iba pang mga epekto. Halimbawa, pagkatapos makahanap ng makabuluhang istatistika uriIII epekto para sa kadahilanan A sa modyul Pagsusuri ng pagkakaiba-iba, maaari nating sabihin na mayroong isang solong makabuluhang epekto ng kadahilanan A, pagkatapos ipakilala ang lahat ng iba pang epekto (mga salik) at bigyang-kahulugan ang epektong ito nang naaayon. Marahil sa 99% ng lahat ng aplikasyon ng pagsusuri ng pagkakaiba, ang ganitong uri ng pamantayan ay interesado sa mananaliksik. Ang ganitong uri ng kabuuan ng mga parisukat ay karaniwang kinukuwenta sa module Pagsusuri ng pagkakaiba-iba bilang default, hindi alintana kung napili ang opsyon Diskarte sa Pagbabalik o hindi (mga karaniwang diskarte na pinagtibay sa modyul Pagsusuri ng pagkakaiba-iba tinalakay sa ibaba).

Mga makabuluhang epekto na nakuha gamit ang mga kabuuan ng mga parisukat uri o uriII ang mga kabuuan ng mga parisukat ay hindi madaling bigyang-kahulugan. Ang mga ito ay pinakamahusay na binibigyang kahulugan sa konteksto ng stepwise multivariate regression. Kung gumagamit ng kabuuan ng mga parisukat uriako ang pangunahing epekto ng salik B ay natagpuang makabuluhan (pagkatapos isama ang salik A sa modelo, ngunit bago idagdag ang pakikipag-ugnayan sa pagitan ng A at B), maaari itong mapagpasyahan na mayroong isang makabuluhang pangunahing epekto ng salik B, sa kondisyon na mayroong walang interaksyon sa pagitan ng mga salik A at B. (Kung sa paggamit ng pamantayan uriIII, ang kadahilanan B ay naging makabuluhan din, pagkatapos ay maaari nating tapusin na mayroong isang makabuluhang pangunahing epekto ng kadahilanan B, pagkatapos na ipakilala ang lahat ng iba pang mga kadahilanan at ang kanilang mga pakikipag-ugnayan sa modelo).

Sa mga tuntunin ng marginal na paraan ng hypothesis uriako at uriII kadalasan ay walang simpleng interpretasyon. Sa mga kasong ito, sinasabing hindi mabibigyang-kahulugan ng isa ang kahalagahan ng mga epekto sa pamamagitan lamang ng pagsasaalang-alang sa marginal na paraan. sa halip iniharap p Ang ibig sabihin ng mga halaga ay nauugnay sa isang kumplikadong hypothesis na pinagsasama ang mga paraan at laki ng sample. Halimbawa, uri ngII ang mga hypotheses para sa factor A sa simpleng 2 x 2 na halimbawa ng disenyo na tinalakay kanina ay (tingnan ang Woodward, Bonett, at Brecht, 1990, p. 219):

nij- bilang ng mga obserbasyon sa isang cell

uij- average na halaga sa isang cell

n. j- marginal na average

Nang walang mga detalye (para sa higit pang mga detalye tingnan ang Milliken at Johnson, 1984, kabanata 10), malinaw na ang mga ito ay hindi simpleng hypotheses at sa karamihan ng mga kaso wala sa mga ito ang partikular na interes sa mananaliksik. Gayunpaman, may mga kaso kung saan ang mga hypotheses uriako maaaring may interes.

Ang default na computational approach sa module Pagsusuri ng pagkakaiba-iba

Default kung ang opsyon ay hindi naka-check Diskarte sa Pagbabalik, modyul Pagsusuri ng pagkakaiba-iba gamit modelo ng cell average. Ito ay katangian ng modelong ito na ang mga kabuuan ng mga parisukat para sa iba't ibang mga epekto ay kinakalkula para sa mga linear na kumbinasyon ng mga paraan ng cell. Sa isang buong factorial na eksperimento, nagreresulta ito sa mga kabuuan ng mga parisukat na kapareho ng mga kabuuan ng mga parisukat na tinalakay kanina bilang uri ng III. Gayunpaman, sa pagpipilian Naka-iskedyul na Paghahambing(sa bintana Pagsusuri ng mga resulta ng pagkakaiba), ang user ay maaaring mag-hypothesize tungkol sa anumang linear na kumbinasyon ng weighted o unweighted cell means. Kaya, ang gumagamit ay maaaring subukan hindi lamang hypotheses uriIII, ngunit ang mga hypotheses ng anumang uri (kabilang ang uri ngIV). Ang pangkalahatang diskarte na ito ay partikular na kapaki-pakinabang kapag sinusuri ang mga disenyo na may nawawalang mga cell (tinatawag na mga hindi kumpletong disenyo).

Para sa buong factorial na disenyo, ang diskarte na ito ay kapaki-pakinabang din kapag gusto ng isa na pag-aralan ang weighted marginal na paraan. Halimbawa, ipagpalagay na sa simpleng 2 x 2 na disenyo na isinasaalang-alang nang mas maaga, gusto naming ihambing ang timbang (sa mga tuntunin ng mga antas ng kadahilanan) B) marginal average para sa factor A. Ito ay kapaki-pakinabang kapag ang pamamahagi ng mga obserbasyon sa mga cell ay hindi inihanda ng eksperimento, ngunit binuo nang random, at ang randomness na ito ay makikita sa pamamahagi ng bilang ng mga obserbasyon ayon sa mga antas ng factor B sa pinagsama-samang .

Halimbawa, mayroong isang kadahilanan - ang edad ng mga balo. Ang isang posibleng sample ng mga sumasagot ay nahahati sa dalawang grupo: mas bata sa 40 at mas matanda sa 40 (factor B). Ang pangalawang salik (factor A) sa plano ay kung ang mga balo ay nakatanggap o hindi ng suportang panlipunan mula sa ilang ahensya (habang ang ilang mga balo ay random na pinili, ang iba ay nagsilbing mga kontrol). Sa kasong ito, ang distribusyon ng edad ng mga balo sa sample ay nagpapakita ng aktwal na distribusyon ng edad ng mga balo sa populasyon. Pagtatasa sa pagiging epektibo ng pangkat ng suportang panlipunan para sa mga balo lahat ng edad ay tumutugma sa weighted average para sa dalawang pangkat ng edad (na may mga timbang na tumutugma sa bilang ng mga obserbasyon sa grupo).

Naka-iskedyul na Paghahambing

Tandaan na ang kabuuan ng mga inilagay na contrast ratio ay hindi kinakailangang katumbas ng 0 (zero). Sa halip, ang programa ay awtomatikong gagawa ng mga pagsasaayos upang ang mga kaukulang hypotheses ay hindi maghalo sa pangkalahatang average.

Upang mailarawan ito, balikan natin ang simpleng 2 x 2 na plano na tinalakay kanina. Alalahanin na ang mga bilang ng cell ng hindi balanseng disenyo na ito ay -1, 2, 3, at 1. Sabihin nating gusto nating paghambingin ang mga weighted marginal average para sa factor A (natimbang sa dalas ng mga antas ng factor B). Maaari kang maglagay ng mga contrast ratio:

Tandaan na ang mga coefficient na ito ay hindi nagdaragdag ng hanggang 0. Itatakda ng programa ang mga coefficient upang magdagdag sila ng hanggang 0, habang pinapanatili ang kanilang mga kamag-anak na halaga, ibig sabihin.:

1/3 2/3 -3/4 -1/4

Ihahambing ng mga contrast na ito ang mga weighted average para sa factor A.

Hypotheses tungkol sa pangunahing ibig sabihin. Ang hypothesis na ang unweighted principal mean ay 0 ay maaaring tuklasin gamit ang mga coefficient:

Ang hypothesis na ang weighted principal mean ay 0 ay nasubok sa:

Sa anumang kaso ay itinatama ng programa ang mga contrast ratio.

Pagsusuri ng mga plano na may nawawalang mga cell (mga hindi kumpletong plano)

Ang mga factorial na disenyo na naglalaman ng mga walang laman na cell (pagproseso ng mga kumbinasyon ng mga cell kung saan walang mga obserbasyon) ay tinatawag na hindi kumpleto. Sa ganitong mga disenyo, ang ilang mga kadahilanan ay karaniwang hindi orthogonal at ang ilang mga pakikipag-ugnayan ay hindi maaaring kalkulahin. Sa pangkalahatan, walang mas mahusay na paraan para sa pagsusuri ng mga naturang plano.

Diskarte sa Pagbabalik

Sa ilang mas lumang mga programa na nakabatay sa pagsusuri ng mga disenyo ng ANOVA gamit ang multivariate regression, ang mga salik sa mga hindi kumpletong disenyo ay itinakda bilang default sa karaniwang paraan (na parang kumpleto ang plano). Ang isang multivariate na pagsusuri ng regression ay isinasagawa para sa mga dummy-coded na salik na ito. Sa kasamaang palad, ang pamamaraang ito ay humahantong sa mga resulta na napakahirap, kung hindi imposible, upang bigyang-kahulugan dahil hindi malinaw kung paano nag-aambag ang bawat epekto sa linear na kumbinasyon ng mga paraan. Isaalang-alang ang sumusunod na simpleng halimbawa.

Salik A Salik B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Nakaligtaan

Kung multivariate regression ng form Dependent variable = Constant + Factor A + Factor B, pagkatapos ay ang hypothesis tungkol sa kahalagahan ng mga kadahilanan A at B sa mga tuntunin ng mga linear na kumbinasyon ng mga paraan ay ganito ang hitsura:

Factor A: Cell A1,B1 = Cell A2,B1

Factor B: Cell A1,B1 = Cell A1,B2

Ang kasong ito ay simple. Sa mas kumplikadong mga plano, imposibleng aktwal na matukoy kung ano ang eksaktong susuriin.

Ang ibig sabihin ng mga cell, pagsusuri ng diskarte sa pagkakaiba-iba , type IV hypotheses

Ang isang diskarte na inirerekomenda sa literatura at tila mas kanais-nais ay ang pag-aaral ng makabuluhan (sa mga tuntunin ng mga gawain sa pananaliksik) isang priori hypotheses tungkol sa mga paraan na naobserbahan sa mga cell ng plano. Ang isang detalyadong talakayan ng pamamaraang ito ay matatagpuan sa Dodge (1985), Heiberger (1989), Milliken at Johnson (1984), Searle (1987), o Woodward, Bonett, at Brecht (1990). Ang mga kabuuan ng mga parisukat na nauugnay sa mga hypotheses tungkol sa isang linear na kumbinasyon ng mga paraan sa mga hindi kumpletong disenyo, na nagsisiyasat sa mga pagtatantya ng bahagi ng mga epekto, ay tinatawag ding mga kabuuan ng mga parisukat. IV.

Awtomatikong pagbuo ng mga uri ng hypothesesIV. Kapag ang mga multivariate na disenyo ay may isang kumplikadong nawawalang pattern ng cell, ito ay kanais-nais na tukuyin ang mga orthogonal (independiyenteng) hypotheses na ang pagsisiyasat ay katumbas ng pagsisiyasat ng mga pangunahing epekto o pakikipag-ugnayan. Ang mga diskarte sa algorithm (computational) (batay sa pseudo-inverse design matrix) ay binuo upang makabuo ng naaangkop na mga timbang para sa mga naturang paghahambing. Sa kasamaang palad, ang mga huling hypotheses ay hindi natatanging tinutukoy. Siyempre, nakasalalay ang mga ito sa pagkakasunud-sunod kung saan tinukoy ang mga epekto at bihirang madaling bigyang-kahulugan. Samakatuwid, inirerekumenda na maingat na pag-aralan ang likas na katangian ng nawawalang mga cell, pagkatapos ay bumalangkas ng mga hypotheses uriIV, na pinaka-kaugnay sa mga layunin ng pag-aaral. Pagkatapos ay galugarin ang mga hypotheses na ito gamit ang opsyon Naka-iskedyul na Paghahambing sa bintana resulta. Ang pinakamadaling paraan upang tukuyin ang mga paghahambing sa kasong ito ay upang mangailangan ng pagpapakilala ng isang vector ng mga contrast para sa lahat ng mga kadahilanan magkasama sa bintana Mga naka-iskedyul na paghahambing. Pagkatapos tawagan ang dialog box Naka-iskedyul na Paghahambing lahat ng grupo ng kasalukuyang plano ay ipapakita at ang mga tinanggal ay mamarkahan.

Nilaktawan ang mga Cell at Tiyak na Pagsusuri ng Epekto

Mayroong ilang mga uri ng mga plano kung saan ang lokasyon ng nawawalang mga cell ay hindi random, ngunit maingat na binalak, na nagbibigay-daan sa isang simpleng pagsusuri ng mga pangunahing epekto nang hindi naaapektuhan ang iba pang mga epekto. Halimbawa, kapag hindi available ang kinakailangang bilang ng mga cell sa isang plano, madalas na ginagamit ang mga plano. mga parisukat na latin upang tantyahin ang mga pangunahing epekto ng ilang mga kadahilanan na may malaking bilang ng mga antas. Halimbawa, ang 4 x 4 x 4 x 4 factorial na disenyo ay nangangailangan ng 256 na mga cell. Sa parehong oras, maaari mong gamitin Griyego-Latin square upang tantiyahin ang mga pangunahing epekto, na mayroong 16 na selula lamang sa plano (chap. Pagpaplano ng eksperimento, Volume IV, ay naglalaman ng isang detalyadong paglalarawan ng naturang mga plano). Ang mga hindi kumpletong disenyo kung saan ang mga pangunahing epekto (at ilang mga pakikipag-ugnayan) ay maaaring matantya gamit ang mga simpleng linear na kumbinasyon ng mga paraan ay tinatawag balanseng hindi kumpletong mga plano.

Sa mga balanseng disenyo, ang karaniwang (default) na paraan ng pagbuo ng mga contrast (mga timbang) para sa mga pangunahing epekto at pakikipag-ugnayan ay gagawa ng isang pagsusuri sa talahanayan ng pagkakaiba-iba kung saan ang mga kabuuan ng mga parisukat para sa kani-kanilang mga epekto ay hindi maghahalo sa isa't isa. Pagpipilian Mga Tukoy na Epekto bintana resulta bubuo ng mga nawawalang contrast sa pamamagitan ng pagsusulat ng zero sa mga nawawalang cell ng plano. Kaagad pagkatapos na hiniling ang opsyon Mga Tukoy na Epekto para sa isang user na nag-aaral ng ilang hypothesis, lumilitaw ang isang talaan ng mga resulta kasama ang mga aktwal na timbang. Tandaan na sa isang balanseng disenyo, ang mga kabuuan ng mga parisukat ng kani-kanilang mga epekto ay kinukuwenta lamang kung ang mga epektong iyon ay orthogonal (independyente) sa lahat ng iba pang pangunahing epekto at pakikipag-ugnayan. Kung hindi, gamitin ang opsyon Naka-iskedyul na Paghahambing upang tuklasin ang makabuluhang paghahambing sa pagitan ng mga paraan.

Mga Nawawalang Cell at Pinagsamang Error Effects/Miyembro

Kung opsyon Diskarte ng regression sa launch panel ng module Pagsusuri ng pagkakaiba-iba ay hindi napili, ang modelo ng mga average ng cell ay gagamitin kapag kinakalkula ang kabuuan ng mga parisukat para sa mga epekto (default na setting). Kung ang disenyo ay hindi balanse, pagkatapos ay kapag pinagsasama ang mga di-orthogonal na epekto (tingnan ang talakayan sa itaas ng pagpipilian Nawawalang mga cell at tiyak na epekto) ang isa ay maaaring makakuha ng kabuuan ng mga parisukat na binubuo ng mga di-orthogonal (o magkakapatong) na bahagi. Ang mga resulta na nakuha sa paraang ito ay karaniwang hindi nabibigyang-kahulugan. Samakatuwid, ang isa ay dapat maging maingat kapag pumipili at nagpapatupad ng mga kumplikadong hindi kumpletong eksperimentong disenyo.

Maraming mga libro na may mga detalyadong talakayan ng iba't ibang uri ng mga plano. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken at Johnson, 1984; Searle, 1987; Woodward at Bonett, 1990), ngunit ang ganitong uri ng impormasyon ay nasa labas ng saklaw ng aklat na ito. Gayunpaman, ang pagsusuri ng iba't ibang uri ng mga plano ay ipapakita sa ibang pagkakataon sa seksyong ito.

Mga Epekto ng Paglabag sa Mga Assumption at Assumption

Paglihis mula sa pagpapalagay ng mga normal na distribusyon

Ipagpalagay na ang dependent variable ay sinusukat sa isang numerical scale. Ipagpalagay din natin na ang dependent variable ay may normal na distribusyon sa loob ng bawat pangkat. Pagsusuri ng pagkakaiba-iba naglalaman ng malawak na hanay ng mga graph at istatistika upang patunayan ang pagpapalagay na ito.

Mga epekto ng paglabag. Sa pangkalahatan F ang criterion ay lubhang lumalaban sa paglihis mula sa normalidad (tingnan ang Lindman, 1974 para sa mga detalyadong resulta). Kung ang kurtosis ay mas malaki sa 0, kung gayon ang halaga ng istatistika F maaaring maging napakaliit. Ang null hypothesis ay tinatanggap, bagaman maaaring hindi ito totoo. Ang sitwasyon ay nababaligtad kapag ang kurtosis ay mas mababa sa 0. Ang skewness ng distribusyon ay karaniwang may maliit na epekto sa F mga istatistika. Kung ang bilang ng mga obserbasyon sa isang cell ay sapat na malaki, kung gayon ang paglihis mula sa normalidad ay hindi mahalaga dahil sa Central limit theorem, ayon sa kung saan, ang distribusyon ng average na halaga ay malapit sa normal, anuman ang paunang distribusyon. Detalyadong talakayan ng pagpapanatili F ang mga istatistika ay matatagpuan sa Box at Anderson (1955), o Lindman (1974).

Pagkakapantay-pantay ng pagpapakalat

Mga pagpapalagay. Ipinapalagay na ang mga pagkakaiba-iba ng iba't ibang grupo ng plano ay pareho. Ang pagpapalagay na ito ay tinatawag na pagpapalagay pagkakalat ng homogeneity. Alalahanin na sa simula ng seksyong ito, kapag inilalarawan ang pagkalkula ng kabuuan ng mga squared error, nagsagawa kami ng pagsusuma sa loob ng bawat pangkat. Kung ang mga pagkakaiba-iba sa dalawang pangkat ay naiiba sa isa't isa, ang pagdaragdag sa kanila ay hindi masyadong natural at hindi nagbibigay ng pagtatantya ng kabuuang pagkakaiba-iba sa loob ng pangkat (dahil sa kasong ito, walang pangkalahatang pagkakaiba-iba). Module Pagsusuri ng pagpapakalat -ANOVA/MANOVA naglalaman ng isang malaking hanay ng mga istatistikal na pamantayan para sa pagtukoy ng paglihis mula sa mga pagpapalagay ng homogeneity ng pagkakaiba.

Mga epekto ng paglabag. Lindman (1974, p. 33) ay nagpapakita na F ang criterion ay medyo matatag na may paggalang sa paglabag sa mga pagpapalagay ng homogeneity ng pagkakaiba-iba ( heterogeneity pagpapakalat, tingnan din ang Box, 1954a, 1954b; Hsu, 1938).

Espesyal na kaso: ugnayan ng mga paraan at pagkakaiba. May mga pagkakataon na F ang mga istatistika ay maaari iligaw. Nangyayari ito kapag ang ibig sabihin ng mga halaga sa mga cell ng disenyo ay nauugnay sa pagkakaiba-iba. Module Pagsusuri ng pagkakaiba-iba ay nagbibigay-daan sa iyo na magplano ng pagkakaiba-iba o mga karaniwang paglihis na scatterplots laban sa mga paraan upang matukoy ang gayong ugnayan. Ang dahilan kung bakit mapanganib ang naturang ugnayan ay ang mga sumusunod. Isipin natin na mayroong 8 mga cell sa plano, 7 sa mga ito ay may halos parehong average, at sa isang cell ang average ay mas malaki kaysa sa iba. Pagkatapos F ang pagsubok ay maaaring makakita ng makabuluhang epekto sa istatistika. Ngunit ipagpalagay na sa isang cell na may malaking mean na halaga at ang pagkakaiba ay mas malaki kaysa sa iba, i.e. nakadepende ang mean at variance sa mga cell (mas malaki ang mean, mas malaki ang variance). Sa kasong ito, hindi mapagkakatiwalaan ang malaking mean, dahil maaaring sanhi ito ng malaking pagkakaiba sa data. Gayunpaman F mga istatistika batay sa nagkakaisa Ang pagkakaiba-iba sa loob ng mga cell ay kukuha ng malaking mean, bagama't ang pamantayan batay sa pagkakaiba-iba sa bawat cell ay hindi isasaalang-alang ang lahat ng mga pagkakaiba sa mga paraan upang maging makabuluhan.

Ang katangiang ito ng data (malaking mean at malaking pagkakaiba) ay kadalasang nakikita kapag may mga outlier na obserbasyon. Ang isa o dalawang outlier na obserbasyon ay malakas na nagbabago ng mean at lubos na nagpapataas ng pagkakaiba.

Homogeneity ng variance at covariance

Mga pagpapalagay. Sa mga multivariate na disenyo, na may mga multivariate dependent measures, ang homogeneity ng variance assumptions na inilarawan kanina ay nalalapat din. Gayunpaman, dahil may mga multivariate dependent variable, kinakailangan din na ang kanilang mga cross-correlations (covariances) ay magkapareho sa lahat ng plan cells. Module Pagsusuri ng pagkakaiba-iba nag-aalok ng iba't ibang paraan upang subukan ang mga pagpapalagay na ito.

Mga epekto ng paglabag. Multidimensional na analog F- criterion - λ-test ng Wilks. Walang gaanong nalalaman tungkol sa katatagan (katatagan) ng Wilks λ-test na may kinalaman sa paglabag sa mga pagpapalagay sa itaas. Gayunpaman, dahil ang interpretasyon ng mga resulta ng module Pagsusuri ng pagkakaiba-iba ay karaniwang batay sa kahalagahan ng mga univariate na epekto (pagkatapos maitaguyod ang kahalagahan ng karaniwang pamantayan), ang pagtalakay sa katatagan ay pangunahin nang may kinalaman sa univariate analysis ng variance. Samakatuwid, ang kahalagahan ng isang-dimensional na epekto ay dapat na maingat na suriin.

Espesyal na kaso: pagsusuri ng covariance. Ang mga partikular na matinding paglabag sa homogeneity ng variance/covariance ay maaaring mangyari kapag ang mga covariate ay kasama sa disenyo. Sa partikular, kung ang ugnayan sa pagitan ng mga covariates at dependent na mga panukala ay naiiba sa iba't ibang mga cell ng disenyo, maaaring sundin ang maling interpretasyon ng mga resulta. Dapat alalahanin na sa pagsusuri ng covariance, sa esensya, ang isang pagsusuri ng regression ay isinasagawa sa loob ng bawat cell upang ihiwalay ang bahaging iyon ng pagkakaiba na tumutugma sa covariate. Ipinapalagay ng homogeneity ng variance/covariance assumption na ang pagsusuri ng regression na ito ay isinasagawa sa ilalim ng sumusunod na hadlang: lahat ng regression equation (slope) para sa lahat ng mga cell ay pareho. Kung hindi ito nilayon, maaaring mangyari ang malalaking error. Module Pagsusuri ng pagkakaiba-iba ay may ilang espesyal na pamantayan upang subukan ang pagpapalagay na ito. Maaaring ipinapayong gamitin ang mga pamantayang ito upang matiyak na ang mga equation ng regression para sa iba't ibang mga cell ay halos pareho.

Sphericity at complex symmetry: mga dahilan para sa paggamit ng multivariate repeated measures approach sa pagsusuri ng variance

Sa mga disenyong naglalaman ng paulit-ulit na mga salik sa pagsukat na may higit sa dalawang antas, ang aplikasyon ng univariate na pagsusuri ng pagkakaiba ay nangangailangan ng mga karagdagang pagpapalagay: mga kumplikadong pagpapalagay ng simetrya at mga pagpapalagay ng sphericity. Ang mga pagpapalagay na ito ay bihirang matugunan (tingnan sa ibaba). Samakatuwid, sa mga nakaraang taon, ang multivariate analysis ng variance ay nakakuha ng katanyagan sa naturang mga plano (ang parehong mga diskarte ay pinagsama sa module Pagsusuri ng pagkakaiba-iba).

Kumplikadong symmetry assumption Ang kumplikadong symmetry assumption ay ang mga pagkakaiba-iba (kabuuan sa loob ng pangkat) at mga covariance (ayon sa pangkat) para sa iba't ibang paulit-ulit na mga panukala ay pare-pareho (pareho). Ito ay isang sapat na kundisyon para sa univariate F test para sa mga paulit-ulit na hakbang upang maging wasto (ibig sabihin, ang mga F-values ​​​​na iniulat ay, sa karaniwan, naaayon sa F-distribution). Gayunpaman, sa kasong ito ang kondisyong ito ay hindi kinakailangan.

Pagpapalagay ng sphericity. Ang pagpapalagay ng sphericity ay isang kinakailangan at sapat na kondisyon para mabigyang-katwiran ang F-criterion. Binubuo ito sa katotohanan na sa loob ng mga grupo ang lahat ng mga obserbasyon ay independyente at pantay na ipinamamahagi. Ang likas na katangian ng mga pagpapalagay na ito, pati na rin ang epekto ng kanilang mga paglabag, ay karaniwang hindi mahusay na inilarawan sa mga aklat sa pagsusuri ng pagkakaiba - ang isang ito ay ilalarawan sa mga sumusunod na talata. Ipapakita rin nito na ang mga resulta ng univariate na diskarte ay maaaring magkaiba sa mga resulta ng multivariate na diskarte at ipaliwanag kung ano ang ibig sabihin nito.

Ang pangangailangan para sa kalayaan ng mga hypotheses. Ang pangkalahatang paraan upang pag-aralan ang data sa pagsusuri ng pagkakaiba ay akma sa modelo. Kung, sa paggalang sa modelo na naaayon sa data, mayroong ilan isang priori hypotheses, pagkatapos ay hatiin ang pagkakaiba upang subukan ang mga hypotheses na ito (pamantayan para sa mga pangunahing epekto, mga pakikipag-ugnayan). Mula sa isang computational point of view, ang diskarte na ito ay bumubuo ng ilang hanay ng mga contrast (set ng mga paghahambing ng mga paraan sa disenyo). Gayunpaman, kung ang mga kaibahan ay hindi independyente sa isa't isa, ang paghahati ng mga pagkakaiba ay nagiging walang kabuluhan. Halimbawa, kung dalawang contrast A at B ay magkapareho at ang kaukulang bahagi ay pinili mula sa pagkakaiba, pagkatapos ang parehong bahagi ay pinili nang dalawang beses. Halimbawa, hangal at walang kabuluhan ang pag-iisa ng dalawang hypotheses: "ang mean sa cell 1 ay mas mataas kaysa sa mean sa cell 2" at "ang mean sa cell 1 ay mas mataas kaysa sa mean sa cell 2". Kaya ang mga hypotheses ay dapat na independyente o orthogonal.

Mga independiyenteng hypotheses sa paulit-ulit na mga sukat. Pangkalahatang algorithm na ipinatupad sa module Pagsusuri ng pagkakaiba-iba, ay susubukan na bumuo ng mga independiyenteng (orthogonal) na kaibahan para sa bawat epekto. Para sa paulit-ulit na kadahilanan ng pagsukat, ang mga kaibahang ito ay nagbubunga ng maraming hypotheses tungkol sa pagkakaiba sa pagitan ng mga antas ng itinuturing na salik. Gayunpaman, kung ang mga pagkakaibang ito ay magkakaugnay sa loob ng mga grupo, kung gayon ang mga resultang kaibahan ay hindi na independyente. Halimbawa, sa pagsasanay kung saan ang mga mag-aaral ay sinusukat ng tatlong beses sa isang semestre, maaaring mangyari na ang mga pagbabago sa pagitan ng 1st at 2nd dimensyon ay negatibong nauugnay sa pagbabago sa pagitan ng 2nd at 3rd dimensyon ng mga paksa. Ang mga nakabisado na ang karamihan sa materyal sa pagitan ng 1st at 2nd dimensyon ay nakakabisado ng mas maliit na bahagi sa panahon na lumipas sa pagitan ng 2nd at 3rd dimensyon. Sa katunayan, para sa karamihan ng mga kaso kung saan ginagamit ang pagsusuri ng pagkakaiba-iba sa mga paulit-ulit na pagsukat, maaaring ipagpalagay na ang mga pagbabago sa mga antas ay nakakaugnay sa mga paksa. Gayunpaman, kapag nangyari ito, ang mga kumplikadong symmetry at sphericity na mga pagpapalagay ay hindi natutugunan at ang mga independiyenteng kaibahan ay hindi maaaring kalkulahin.

Ang epekto ng mga paglabag at mga paraan upang maitama ang mga ito. Kapag hindi natugunan ang kumplikadong symmetry o sphericity na mga pagpapalagay, ang pagsusuri ng pagkakaiba ay maaaring magbunga ng mga maling resulta. Bago ang mga multivariate na pamamaraan ay sapat na binuo, ilang mga pagpapalagay ang ginawa upang mabayaran ang mga paglabag sa mga pagpapalagay na ito. (Tingnan, halimbawa, Greenhouse & Geisser, 1959 at Huynh & Feldt, 1970). Ang mga paraang ito ay malawak na ginagamit ngayon (kaya naman ang mga ito ay ipinakita sa modyul Pagsusuri ng pagkakaiba-iba).

Multivariate analysis ng variance approach sa paulit-ulit na mga panukala. Sa pangkalahatan, ang mga problema ng kumplikadong simetrya at sphericity ay tumutukoy sa katotohanan na ang mga hanay ng mga kaibahan na kasama sa pag-aaral ng mga epekto ng paulit-ulit na mga kadahilanan sa pagsukat (na may higit sa 2 antas) ay hindi independyente sa bawat isa. Gayunpaman, hindi nila kailangang maging independyente kung sila ay ginagamit. multidimensional isang criterion para sa sabay-sabay na pagsubok sa istatistikal na kahalagahan ng dalawa o higit pang mga paulit-ulit na pagsukat sa mga kaibahan ng kadahilanan. Ito ang dahilan kung bakit ang multivariate na pagsusuri ng mga paraan ng pagkakaiba-iba ay lalong ginagamit upang subukan ang kahalagahan ng mga univariate na paulit-ulit na mga kadahilanan sa pagsukat na may higit sa 2 antas. Ang diskarte na ito ay malawakang ginagamit dahil sa pangkalahatan ay hindi nangangailangan ng pagpapalagay ng kumplikadong simetrya at ang pagpapalagay ng sphericity.

Mga kaso kung saan hindi magagamit ang multivariate analysis ng variance approach. May mga halimbawa (mga plano) kapag hindi mailapat ang multivariate analysis ng variance approach. Ang mga ito ay karaniwang mga kaso kung saan mayroong isang maliit na bilang ng mga paksa sa disenyo at maraming mga antas sa paulit-ulit na kadahilanan ng pagsukat. Pagkatapos ay maaaring napakakaunting mga obserbasyon para magsagawa ng multivariate analysis. Halimbawa, kung mayroong 12 entity, p = 4 paulit-ulit na mga sukat na kadahilanan, at ang bawat kadahilanan ay may k = 3 mga antas. Pagkatapos ang pakikipag-ugnayan ng 4 na mga kadahilanan ay "gagastos" (k-1)P = 2 4 = 16 antas ng kalayaan. Gayunpaman, mayroon lamang 12 na paksa, kaya hindi maaaring gawin ang isang multivariate na pagsubok sa halimbawang ito. Module Pagsusuri ng pagkakaiba-iba ay independiyenteng tuklasin ang mga obserbasyon na ito at kakalkulahin lamang ang isang-dimensional na pamantayan.

Mga pagkakaiba sa univariate at multivariate na resulta. Kung ang pag-aaral ay may kasamang malaking bilang ng mga paulit-ulit na hakbang, maaaring may mga kaso kung saan ang univariate repeated measures approach ng ANOVA ay nagbubunga ng mga resulta na ibang-iba sa mga nakuha gamit ang multivariate approach. Nangangahulugan ito na ang mga pagkakaiba sa pagitan ng mga antas ng kani-kanilang mga paulit-ulit na pagsukat ay magkakaugnay sa mga paksa. Minsan ang katotohanang ito ay may ilang independiyenteng interes.

Multivariate analysis ng variance at structural modeling ng mga equation

Sa mga nakalipas na taon, naging popular ang structural equation modeling bilang alternatibo sa multivariate dispersion analysis (tingnan, halimbawa, Bagozzi at Yi, 1989; Bagozzi, Yi, at Singh, 1991; Cole, Maxwell, Arvey, at Salas, 1993). Ang diskarte na ito ay nagpapahintulot sa iyo na subukan ang mga hypotheses hindi lamang tungkol sa mga paraan sa iba't ibang mga grupo, kundi pati na rin tungkol sa mga matrice ng ugnayan ng mga umaasa na variable. Halimbawa, maaari mong i-relax ang mga pagpapalagay tungkol sa homogeneity ng variance at covariance at tahasang isama ang mga error sa modelo para sa bawat pangkat ng variance at covariance. Module STATISTICSPagmomodelo ng Structural Equation (SEPATH) (tingnan ang Volume III) ay nagbibigay-daan para sa naturang pagsusuri.

Ang mga pamamaraan sa itaas para sa pagsubok ng mga istatistikal na hypotheses tungkol sa kahalagahan ng mga pagkakaiba sa pagitan ng dalawang average sa pagsasanay ay limitado ang paggamit. Ito ay dahil sa ang katunayan na upang matukoy ang epekto ng lahat ng posibleng mga kondisyon at mga kadahilanan sa resultang katangian, ang mga eksperimento sa field at laboratoryo, bilang panuntunan, ay isinasagawa gamit ang hindi dalawa, ngunit isang mas malaking bilang ng mga sample (1220 o higit pa. ).

Kadalasan, inihahambing ng mga mananaliksik ang mga paraan ng ilang mga sample na pinagsama sa isang solong kumplikado. Halimbawa, kapag pinag-aaralan ang epekto ng iba't ibang uri at dosis ng mga pataba sa mga ani ng pananim, inuulit ang mga eksperimento sa iba't ibang bersyon. Sa mga kasong ito, ang mga pares na paghahambing ay nagiging mahirap, at ang istatistikal na pagsusuri ng buong complex ay nangangailangan ng paggamit ng isang espesyal na paraan. Ang pamamaraang ito, na binuo sa mga istatistika ng matematika, ay tinatawag na pagsusuri ng pagkakaiba. Ito ay unang ginamit ng English statistician na si R. Fisher noong pinoproseso ang mga resulta ng agronomic experiments (1938).

Pagsusuri ng pagkakaiba-iba- ito ay isang paraan ng pagtatasa ng istatistika ng pagiging maaasahan ng pagpapakita ng pag-asa ng epektibong tampok sa isa o higit pang mga kadahilanan. Gamit ang paraan ng pagsusuri ng pagkakaiba, sinusuri ang mga istatistikal na hypotheses tungkol sa mga average sa ilang pangkalahatang populasyon na may normal na distribusyon.

Ang pagsusuri ng pagkakaiba ay isa sa mga pangunahing pamamaraan ng istatistikal na pagsusuri ng mga resulta ng isang eksperimento. Lalo din itong ginagamit sa pagsusuri ng impormasyong pang-ekonomiya. Ginagawang posible ng pagsusuri ng pagkakaiba-iba upang maitaguyod kung paano sapat ang mga piling tagapagpahiwatig ng ugnayan sa pagitan ng epektibo at kadahilanan na mga palatandaan upang maipalaganap ang data na nakuha mula sa sample sa pangkalahatang populasyon. Ang bentahe ng pamamaraang ito ay nagbibigay ito ng medyo maaasahang mga konklusyon mula sa maliliit na sample.

Sa pamamagitan ng pagsusuri sa pagkakaiba-iba ng nagresultang katangian sa ilalim ng impluwensya ng isa o higit pang mga kadahilanan, gamit ang pagsusuri ng pagkakaiba-iba, ang isa ay makakakuha, bilang karagdagan sa mga pangkalahatang pagtatantya ng kahalagahan ng mga dependency, isang pagtatasa din ng mga pagkakaiba sa mga average na halaga na ay nabuo sa iba't ibang antas ng mga salik, at ang kahalagahan ng pakikipag-ugnayan ng mga salik. Ginagamit ang dispersion analysis upang pag-aralan ang mga dependence ng parehong quantitative at qualitative na mga katangian, pati na rin ang kumbinasyon ng mga ito.

Ang kakanyahan ng pamamaraang ito ay nakasalalay sa istatistikal na pag-aaral ng posibilidad ng impluwensya ng isa o higit pang mga kadahilanan, pati na rin ang kanilang pakikipag-ugnayan sa epektibong tampok. Alinsunod dito, sa tulong ng pagsusuri ng pagkakaiba, tatlong pangunahing gawain ang nalutas: 1) isang pangkalahatang pagtatasa ng kahalagahan ng mga pagkakaiba sa pagitan ng mga average ng grupo; 2) pagtatasa ng posibilidad ng pakikipag-ugnayan ng mga kadahilanan; 3) pagtatasa ng kahalagahan ng mga pagkakaiba sa pagitan ng mga pares ng paraan. Kadalasan, kailangang lutasin ng mga mananaliksik ang mga naturang problema kapag nagsasagawa ng mga eksperimento sa larangan at zootechnical, kapag pinag-aralan ang impluwensya ng ilang mga kadahilanan sa nagresultang katangian.

Kasama sa prinsipyong pamamaraan ng pagsusuri ng pagpapakalat ang pagtatatag ng mga pangunahing pinagmumulan ng pagkakaiba-iba ng epektibong tampok at ang pagpapasiya ng dami ng pagkakaiba-iba (mga kabuuan ng mga parisukat na paglihis) ng mga pinagmumulan ng pagbuo nito; pagpapasiya ng bilang ng mga antas ng kalayaan na naaayon sa mga bahagi ng kabuuang pagkakaiba-iba; pagkalkula ng mga pagkakaiba-iba bilang ratio ng kaukulang mga volume ng pagkakaiba-iba sa kanilang bilang ng mga antas ng kalayaan; pagsusuri ng ugnayan sa pagitan ng mga pagpapakalat; pagtatasa ng pagiging maaasahan ng pagkakaiba sa pagitan ng mga average at ang pagbabalangkas ng mga konklusyon.

Ang scheme na ito ay pinapanatili kapwa sa mga simpleng modelo ng ANOVA, kapag ang data ay pinagsama ayon sa isang katangian, at sa mga kumplikadong modelo, kapag ang data ay pinagsama ayon sa dalawa o higit pang mga katangian. Gayunpaman, sa isang pagtaas sa bilang ng mga katangian ng grupo, ang proseso ng agnas ng pangkalahatang pagkakaiba-iba ayon sa mga mapagkukunan ng pagbuo nito ay nagiging mas kumplikado.

Ayon sa diagram ng eskematiko, ang pagsusuri ng pagkakaiba ay maaaring katawanin bilang limang magkakasunod na yugto:

1) kahulugan at agnas ng variation;

2) pagpapasiya ng bilang ng mga antas ng kalayaan ng pagkakaiba-iba;

3) pagkalkula ng mga dispersion at kanilang mga ratio;

4) pagsusuri ng mga dispersion at ang kanilang mga ratio;

5) pagtatasa ng pagiging maaasahan ng pagkakaiba sa pagitan ng mga paraan at ang pagbabalangkas ng mga konklusyon sa pagsubok ng null hypothesis.

Ang pinakamatagal na bahagi ng pagsusuri ng pagkakaiba-iba ay ang unang yugto - ang kahulugan at pagkabulok ng pagkakaiba-iba ng mga mapagkukunan ng pagbuo nito. Ang pagkakasunud-sunod ng pagpapalawak ng kabuuang dami ng pagkakaiba-iba ay tinalakay nang detalyado sa Kabanata 5.

Ang batayan para sa paglutas ng mga problema ng pagsusuri ng pagpapakalat ay ang batas ng pagpapalawak (pagdaragdag) ng pagkakaiba-iba, ayon sa kung saan ang kabuuang pagkakaiba-iba (pagbabago) ng nagresultang katangian ay nahahati sa dalawa: ang pagkakaiba-iba dahil sa pagkilos ng pinag-aralan na kadahilanan (mga kadahilanan ), at ang pagkakaiba-iba na dulot ng pagkilos ng mga random na sanhi, iyon ay

Ipagpalagay na ang populasyon sa ilalim ng pag-aaral ay nahahati sa ilang mga grupo ayon sa isang kadahilanan na katangian, ang bawat isa ay nailalarawan sa pamamagitan ng average na halaga nito ng epektibong katangian. Kasabay nito, ang pagkakaiba-iba ng mga halagang ito ay maaaring ipaliwanag sa pamamagitan ng dalawang uri ng mga dahilan: yaong sistematikong kumikilos sa epektibong tampok at pumapayag sa pagsasaayos sa kurso ng eksperimento, at yaong hindi pumapayag sa pagsasaayos. Malinaw na ang pagkakaiba-iba ng intergroup (factorial o systematic) ay pangunahing nakasalalay sa pagkilos ng pinag-aralan na kadahilanan, at intragroup (nalalabi o random) - sa pagkilos ng mga random na kadahilanan.

Upang masuri ang kahalagahan ng mga pagkakaiba sa pagitan ng ibig sabihin ng grupo, kinakailangan upang matukoy ang mga pagkakaiba-iba ng intergroup at intragroup. Kung ang pagkakaiba-iba ng intergroup (factorial) ay makabuluhang lumampas sa intragroup (nalalabi) na pagkakaiba-iba, kung gayon ang kadahilanan ay nakaimpluwensya sa nagresultang katangian, na makabuluhang nagbabago sa mga halaga ng mga average ng grupo. Ngunit ang tanong ay lumitaw, ano ang ratio sa pagitan ng mga pagkakaiba-iba ng intergroup at intragroup ay maaaring ituring na sapat para sa konklusyon tungkol sa pagiging maaasahan (kabuluhan) ng mga pagkakaiba sa pagitan ng ibig sabihin ng grupo.

Upang masuri ang kahalagahan ng mga pagkakaiba sa pagitan ng mga paraan at magbalangkas ng mga konklusyon sa pagsubok sa null hypothesis (H0: x1 = x2 = ... = xn), ang pagsusuri ng pagkakaiba ay gumagamit ng isang uri ng pamantayan - ang G-criterion, ang batas ng pamamahagi ng na itinatag ni R. Fisher. Ang criterion na ito ay ang ratio ng dalawang variances: factorial, na nabuo sa pamamagitan ng pagkilos ng factor na pinag-aaralan, at nalalabi, dahil sa pagkilos ng mga random na dahilan:

Dispersion ratio r = t>u : £ * 2 ng American statistician na si Snedecor na iminungkahi na tukuyin ng letrang G bilang parangal sa imbentor ng pagsusuri ng variance R. Fisher.

Ang mga dispersion °2 io2 ay mga pagtatantya ng pagkakaiba-iba ng pangkalahatang populasyon. Kung ang mga sample na may mga pagkakaiba-iba ng °2 °2 ay ginawa mula sa parehong pangkalahatang populasyon, kung saan ang pagkakaiba-iba sa mga halaga ay random, kung gayon ang pagkakaiba sa mga halaga ng °2 °2 ay random din.

Kung susuriin ng eksperimento ang impluwensya ng ilang salik (A, B, C, atbp.) sa epektibong feature nang sabay-sabay, kung gayon ang dispersion dahil sa pagkilos ng bawat isa sa kanila ay dapat na maihahambing sa °e.gP, yan ay

Kung ang halaga ng pagkakaiba-iba ng kadahilanan ay makabuluhang mas malaki kaysa sa nalalabi, kung gayon ang kadahilanan ay makabuluhang nakaimpluwensya sa nagresultang katangian at kabaliktaran.

Sa mga multifactorial na eksperimento, bilang karagdagan sa pagkakaiba-iba dahil sa pagkilos ng bawat salik, halos palaging may pagkakaiba-iba dahil sa pakikipag-ugnayan ng mga salik ($av: ^ls ^ss $liіs). Ang kakanyahan ng pakikipag-ugnayan ay ang epekto ng isang kadahilanan ay makabuluhang nagbabago sa iba't ibang antas ng pangalawa (halimbawa, ang pagiging epektibo ng kalidad ng lupa sa iba't ibang dosis ng mga pataba).

Ang interaksyon ng mga salik ay dapat ding masuri sa pamamagitan ng paghahambing ng kani-kanilang mga pagkakaiba 3 ^w.gr:

Kapag kinakalkula ang aktwal na halaga ng B-criterion, ang pinakamalaking ng mga pagkakaiba ay kinuha sa numerator, samakatuwid B > 1. Malinaw, ang mas malaki ang B-criterion, mas malaki ang mga pagkakaiba sa pagitan ng mga pagkakaiba. Kung B = 1, kung gayon ang tanong ng pagtatasa ng kahalagahan ng mga pagkakaiba sa mga pagkakaiba ay aalisin.

Upang matukoy ang mga limitasyon ng mga random na pagbabagu-bago, ang ratio ng mga pagkakaiba-iba G. Fisher ay bumuo ng mga espesyal na talahanayan ng B-distribution (Appendix 4 at 5). Ang Criterion B ay gumaganang nauugnay sa posibilidad at depende sa bilang ng mga antas ng kalayaan ng pagkakaiba-iba k1 at k2 ng dalawang pinaghahambing na mga pagkakaiba. Ang dalawang talahanayan ay karaniwang ginagamit upang makagawa ng mga konklusyon tungkol sa pinakamataas na halaga ng pamantayan para sa mga antas ng kabuluhan na 0.05 at 0.01. Ang antas ng kabuluhan na 0.05 (o 5%) ay nangangahulugan na sa 5 kaso lamang sa 100 criterion B ay maaaring kumuha ng halagang katumbas o mas mataas kaysa sa nakasaad sa talahanayan. Ang pagbaba sa antas ng kahalagahan mula 0.05 hanggang 0.01 ay humahantong sa pagtaas ng halaga ng pamantayan B sa pagitan ng dalawang pagkakaiba-iba dahil sa pagkilos ng mga random na sanhi lamang.

Ang halaga ng criterion ay direktang nakasalalay din sa bilang ng mga antas ng kalayaan ng dalawang pinaghahambing na pagpapakalat. Kung ang bilang ng mga antas ng kalayaan ay may posibilidad na infinity (k-me), kung gayon ang ratio ng would para sa dalawang dispersion ay may gawi sa pagkakaisa.

Ang tabular na halaga ng criterion B ay nagpapakita ng isang posibleng random na halaga ng ratio ng dalawang variances sa isang partikular na antas ng kahalagahan at ang katumbas na bilang ng mga degree ng kalayaan para sa bawat isa sa mga pinaghambing na pagkakaiba. Sa mga talahanayang ito, ang halaga ng B ay ibinibigay para sa mga sample na ginawa mula sa parehong pangkalahatang populasyon, kung saan ang mga dahilan para sa pagbabago sa mga halaga ay random lamang.

Ang halaga ng G ay matatagpuan mula sa mga talahanayan (Appendix 4 at 5) sa intersection ng kaukulang column (ang bilang ng mga degree ng kalayaan para sa isang mas malaking dispersion - k1) at ang hilera (ang bilang ng mga degree ng kalayaan para sa isang mas maliit na dispersion - k2). Kaya, kung ang mas malaking variance (numerator G) k1 = 4, at ang mas maliit (denominator G) k2 = 9, ang Ga sa antas ng kahalagahan a = 0.05 ay magiging 3.63 (app. 4). Kaya, bilang isang resulta ng pagkilos ng mga random na sanhi, dahil ang mga sample ay maliit, ang pagkakaiba ng isang sample ay maaaring, sa isang 5% na antas ng kahalagahan, lumampas sa pagkakaiba para sa pangalawang sample ng 3.63 beses. Sa pagbaba sa antas ng kabuluhan mula 0.05 hanggang 0.01, ang halaga ng tabular ng criterion D, tulad ng nabanggit sa itaas, ay tataas. Kaya, sa parehong antas ng kalayaan k1 = 4 at k2 = 9 at a = 0.01, ang halaga ng tabular ng pamantayang G ay magiging 6.99 (app. 5).

Isaalang-alang ang pamamaraan para sa pagtukoy ng bilang ng mga antas ng kalayaan sa pagsusuri ng pagkakaiba. Ang bilang ng mga degree ng kalayaan, na tumutugma sa kabuuang kabuuan ng mga squared deviations, ay nabubulok sa mga katumbas na bahagi na katulad ng decomposition ng mga kabuuan ng squared deviations (k1) at intragroup (k2) na mga pagkakaiba-iba.

Kaya, kung ang isang sample na populasyon na binubuo ng N mga obserbasyon na hinati ng t pangkat (bilang ng mga opsyon sa eksperimento) at P mga subgroup (bilang ng mga pag-uulit), kung gayon ang bilang ng mga antas ng kalayaan k, ayon sa pagkakabanggit, ay magiging:

a) para sa kabuuang kabuuan ng mga squared deviations (dszar)

b) para sa intergroup na kabuuan ng mga squared deviations ^m.gP)

c) para sa intragroup na kabuuan ng mga squared deviations sa w.gr)

Ayon sa tuntunin ng pagdaragdag ng pagkakaiba-iba:

Halimbawa, kung apat na variant ng eksperimento ang nabuo sa eksperimento (m = 4) sa limang pag-uulit bawat isa (n = 5), at ang kabuuang bilang ng mga obserbasyon N = = t o p \u003d 4 * 5 \u003d 20, kung gayon ang bilang ng mga antas ng kalayaan, ayon sa pagkakabanggit, ay katumbas ng:

Dahil alam ang mga kabuuan ng mga squared deviation ng bilang ng mga degree ng kalayaan, posibleng matukoy ang walang pinapanigan (adjusted) na mga pagtatantya para sa tatlong variances:

Ang null hypothesis H0 sa pamamagitan ng criterion B ay sinusuri sa parehong paraan tulad ng sa u-test ng Mag-aaral. Upang makagawa ng desisyon sa pagsuri sa H0, kinakailangang kalkulahin ang aktwal na halaga ng pamantayan at ihambing ito sa halaga ng tabular na Ba para sa tinatanggap na antas ng kahalagahan a at ang bilang ng mga antas ng kalayaan k1 at k2 para sa dalawang dispersion.

Kung Bfakg > Ba, kung gayon, alinsunod sa tinatanggap na antas ng kahalagahan, maaari nating tapusin na ang mga pagkakaiba sa mga pagkakaiba-iba ng sample ay tinutukoy hindi lamang ng mga random na kadahilanan; sila ay makabuluhan. Sa kasong ito, ang null hypothesis ay tinanggihan at may dahilan upang maniwala na ang kadahilanan ay makabuluhang nakakaapekto sa resultang katangian. Kung< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Ang paggamit ng isa o ibang modelo ng ANOVA ay depende sa bilang ng mga salik na pinag-aralan at sa paraan ng sampling.

Depende sa bilang ng mga kadahilanan na tumutukoy sa pagkakaiba-iba ng epektibong tampok, ang mga sample ay maaaring mabuo ng isa, dalawa o higit pang mga kadahilanan. Ayon sa pagsusuri na ito ng pagkakaiba ay nahahati sa single-factor at multi-factor. Kung hindi, ito ay tinatawag ding single-factor at multi-factor dispersion complex.

Ang pamamaraan ng agnas ng pangkalahatang pagkakaiba-iba ay nakasalalay sa pagbuo ng mga grupo. Maaari itong maging random (ang mga obserbasyon ng isang pangkat ay hindi nauugnay sa mga obserbasyon ng pangalawang pangkat) at hindi random (ang mga obserbasyon ng dalawang sample ay magkakaugnay ng mga karaniwang kundisyon ng eksperimento). Alinsunod dito, ang mga independiyente at umaasa na mga sample ay nakuha. Ang mga independiyenteng sample ay maaaring mabuo na may parehong pantay at hindi pantay na mga numero. Ang pagbuo ng mga umaasa na sample ay ipinapalagay ang kanilang pantay na bilang.

Kung ang mga grupo ay nabuo sa isang hindi marahas na pagkakasunud-sunod, kung gayon ang kabuuang halaga ng pagkakaiba-iba ng nagresultang katangian ay kasama, kasama ang factorial (intergroup) at natitirang variation, ang pagkakaiba-iba ng mga pag-uulit, iyon ay

Sa pagsasagawa, sa karamihan ng mga kaso kinakailangan na isaalang-alang ang mga umaasa na sample kapag ang mga kondisyon para sa mga grupo at subgroup ay equalized. Kaya, sa eksperimento sa larangan, ang buong lugar ay nahahati sa mga bloke, na may pinakamainam na kondisyon. Kasabay nito, ang bawat variant ng eksperimento ay nakakakuha ng pantay na pagkakataon na maipakita sa lahat ng mga bloke, na nakakamit ng pagkakapantay-pantay ng mga kundisyon para sa lahat ng nasubok na opsyon, karanasan. Ang pamamaraang ito ng pagbuo ng karanasan ay tinatawag na paraan ng mga randomized na bloke. Ang mga eksperimento sa mga hayop ay isinasagawa nang katulad.

Kapag nagpoproseso ng socio-economic data sa pamamagitan ng paraan ng dispersion analysis, dapat tandaan na, dahil sa maraming mga kadahilanan at kanilang pagkakaugnay, mahirap, kahit na may pinakamaingat na pagkakahanay ng mga kondisyon, upang maitaguyod ang antas ng layunin na impluwensya ng bawat indibidwal na salik sa mabisang katangian. Samakatuwid, ang antas ng natitirang pagkakaiba-iba ay tinutukoy hindi lamang ng mga random na sanhi, kundi pati na rin ng mga makabuluhang kadahilanan na hindi isinasaalang-alang kapag nagtatayo ng modelo ng ANOVA. Bilang isang resulta, ang natitirang pagpapakalat bilang isang batayan para sa paghahambing kung minsan ay nagiging hindi sapat para sa layunin nito, ito ay malinaw na overestimated sa magnitude at hindi maaaring kumilos bilang isang criterion para sa kahalagahan ng impluwensya ng mga kadahilanan. Sa pagsasaalang-alang na ito, kapag nagtatayo ng mga modelo ng pagtatasa ng pagpapakalat, ang problema sa pagpili ng pinakamahalagang mga kadahilanan at pag-level ng mga kondisyon para sa pagpapakita ng pagkilos ng bawat isa sa kanila ay nagiging may kaugnayan. Bukod sa. ang paggamit ng pagsusuri ng pagkakaiba ay ipinapalagay na normal o malapit sa normal na distribusyon ng mga istatistikal na populasyon na pinag-aaralan. Kung ang kundisyong ito ay hindi natutugunan, ang mga pagtatantya na nakuha sa pagsusuri ng pagkakaiba-iba ay magiging labis.