Hypothesis tungkol sa pagkakapantay-pantay ng dalawang average na halaga. Pagsubok ng mga istatistikal na hypotheses tungkol sa pagkakapantay-pantay ng mga paraan

Isaalang-alang ang parehong problema tulad ng sa nakaraang talata 3.4, ngunit sa ilalim lamang ng kondisyon na ang mga sample na laki at maliit (mas mababa sa 30). Sa kasong ito, ang pagpapalit ng mga pangkalahatang pagkakaiba-iba at sa (3.15) ng naitama na mga pagkakaiba-iba ng sample at maaaring humantong sa isang malaking error sa halaga ng , at, dahil dito, sa isang malaking error sa pagtatatag ng lugar ng pagtanggap ng hypothesis H0. Gayunpaman, kung may kumpiyansa na ang hindi kilalang heneral at ay pareho(halimbawa, kung ang mga average na laki ng dalawang batch ng mga bahagi na ginawa sa parehong makina ay inihambing), pagkatapos ay posible, gamit ang pamamahagi ng Estudyante, sa kasong ito upang bumuo ng isang criterion para sa pagsubok ng hypothesis H0 X at Y. Upang gawin ito, magpakilala ng isang random na variable

, (3.16)

(3.17)

Ang average ng mga itinamang sample variances at , na nagsisilbing point estimate ng parehong magkaparehong hindi kilalang pangkalahatang variances at . Sa lumalabas (tingnan ang , p. 180), kung ang null hypothesis ay totoo, H0 random na halaga T ay may pamamahagi ng Mag-aaral na may antas ng kalayaan, anuman ang mga halaga at laki ng sample. Kung ang hypothesis H0 totoo, dapat maliit ang pagkakaiba. Iyon ay, ang pang-eksperimentong halaga T Exp. dami T dapat maliit. Ibig sabihin, ito ay dapat na nasa loob ng ilang mga hangganan. Kung lalampas ito sa mga limitasyong ito, ituturing namin itong isang pagpapabulaanan ng hypothesis H0, at papayagan namin ito na may posibilidad na katumbas ng ibinigay na antas ng kahalagahan α .

Kaya, ang lugar ng pagtanggap ng hypothesis H0 ay magiging ilang pagitan kung saan ang mga halaga ng random variable T dapat tamaan ng probabilidad 1- α :

Ang halaga na tinukoy ng pagkakapantay-pantay (3.18), para sa iba't ibang antas ng kahalagahan α at iba't ibang numero K antas ng kalayaan T ay matatagpuan sa talahanayan ng mga kritikal na punto ng pamamahagi ng Mag-aaral (Talahanayan 4 ng Apendise). Hahanapin nito ang pagitan para sa pagtanggap ng hypothesis H0. At kung ang pang-eksperimentong halaga T Exp na halaga T nahuhulog sa pagitan na ito - ang hypothesis H0 tanggapin. Hindi bumagsak - huwag tanggapin.

Tandaan 1. Kung walang dahilan upang isaalang-alang ang mga pangkalahatang pagkakaiba at dami na pantay X at Y, pagkatapos sa kasong ito, upang subukan ang hypothesis H0 tungkol sa pagkakapantay-pantay ng mga inaasahan sa matematika ng mga dami X at Y pinapayagan ang paggamit ng nabanggit na t-test ng Mag-aaral. Ngayon lang ang laki T numero K antas ng kalayaan ay dapat ituring na pantay hindi , ngunit pantay (tingnan )

(3.19)

Kung ang itinamang sample na mga pagkakaiba-iba at malaki ang pagkakaiba, kung gayon ang pangalawang termino sa huling bracket ng (3.19) ay maliit kumpara sa 0.5, kaya ang expression (3.19) kumpara sa expression binabawasan ang bilang ng mga antas ng kalayaan ng isang random na variable T halos doble. At ito ay humahantong sa isang makabuluhang pagpapalawak ng agwat para sa pagtanggap ng hypothesis H0 at, nang naaayon, sa isang makabuluhang pagpapaliit ng kritikal na lugar ng pagtanggi sa hypothesis na ito. At ito ay medyo patas, dahil ang antas ng scatter ng mga posibleng halaga ng pagkakaiba ay pangunahing matutukoy ng scatter ng mga halaga ng isa sa mga dami X at Y, na may malaking pagkakaiba. Iyon ay, ang impormasyon mula sa isang sample na may mas maliit na pagkakaiba-iba, kumbaga, ay nawawala, na humahantong sa higit na kawalan ng katiyakan sa mga konklusyon tungkol sa hypothesis H0 .

Halimbawa 4. Ayon sa datos sa talahanayan, ihambing ang average na ani ng gatas ng mga baka na pinapakain ng iba't ibang diyeta. Kapag sinusubukan ang null hypothesis H0 tungkol sa pagkakapantay-pantay ng average na ani ng gatas, tanggapin ang antas ng kahalagahan α =0,05.

Ang bilang ng mga baka na pinakain sa diyeta

(Mga layunin)

Average na pang-araw-araw na ani ng gatas sa mga tuntunin ng pangunahing nilalaman ng taba

(kg/ulo)

Standard deviation ng pang-araw-araw na produksyon ng gatas ng mga baka

(kg/ulo)

. Dahil ang ibinigay na data ng tabular ay nakuha batay sa maliliit na sample na may mga volume na =10 at =8, pagkatapos ay upang ihambing ang mga inaasahan sa matematika ng average na pang-araw-araw na ani ng gatas ng mga baka na nakatanggap ng isa at ang iba pang rasyon ng feed, dapat nating gamitin ang teoryang nakabalangkas. sa talatang ito. Upang gawin ito, una sa lahat, malalaman natin kung ang nahanap na naitama na mga variance ng sample =(3.8)2=14.44 at =(4.2)2=17.64 ay nagpapahintulot sa amin na isaalang-alang ang mga pangkalahatang pagkakaiba at katumbas. Upang gawin ito, ginagamit namin ang pamantayan ng Fisher-Snedekor (tingnan ang talata 3.3). Meron kami:

Ayon sa talahanayan ng mga kritikal na punto ng pamamahagi ng Fischer-Snedekor para sa α =0,05; K1 =8-1=7 at K2 =10-1=9 mahanap

At mula noon, wala tayong dahilan sa antas na ito ng kahalagahan α =0.05 tanggihan ang hypothesis H0 tungkol sa pagkakapantay-pantay ng mga pangkalahatang pagkakaiba at .

Ngayon, alinsunod sa (3.17) at (3.16), kinakalkula namin ang pang-eksperimentong halaga ng dami T:

Susunod, ayon sa formula hanapin ang numero K antas ng kalayaan T: K=10+8-2=16. Pagkatapos nito para sa n0+8-2=16. odes (3.16) kinakalkula namin ang pang-eksperimentong halaga ng T: α =0.05 at K\u003d 16 ayon sa talahanayan ng mga kritikal na punto ng pamamahagi ng Mag-aaral (Talahanayan 4 ng Appendix) ay makikita natin: \u003d 2.12. Kaya, ang pagitan para sa pagtanggap ng hypothesis H0 tungkol sa pagkakapantay-pantay ng average na ani ng gatas ng mga baka na tumatanggap ng mga diyeta No. 1 at No. 2 ay ang pagitan = (-2.12; 2.12). At dahil ang = - 0.79 ay nahuhulog sa pagitan na ito, wala kaming dahilan upang tanggihan ang hypothesis H0 . Ibig sabihin, may karapatan tayong ipalagay na ang pagkakaiba sa mga rasyon ng feed ay hindi nakakaapekto sa average na araw-araw na ani ng gatas ng mga baka.

Tandaan 2. Sa mga talata 3.4 at 3.5 na tinalakay sa itaas, ang null hypothesis ay isinasaalang-alang H0 tungkol sa pagkakapantay-pantay M(X)=M(Y) sa ilalim ng alternatibong hypothesis H1 tungkol sa kanilang hindi pagkakapantay-pantay: M(X)≠M(Y). Ngunit ang alternatibong hypothesis H1 maaaring mayroong iba, halimbawa, M(Y)>M(X). Sa pagsasagawa, ang kasong ito ay magaganap kapag ang ilang pagpapabuti (positibong kadahilanan) ay ipinakilala, na nagpapahintulot sa amin na umasa sa isang pagtaas sa mga average na halaga ng isang normal na ibinahagi na random na variable. Y kumpara sa mga halaga ng karaniwang ipinamamahagi na dami X. Halimbawa, ang isang bagong feed additive ay ipinakilala sa diyeta ng mga baka, na ginagawang posible na umasa sa isang pagtaas sa average na ani ng gatas ng mga baka; isang karagdagang top dressing ang ipinakilala sa ilalim ng pananim, na ginagawang posible na umasa sa pagtaas ng average na ani ng pananim, atbp. At gusto kong malaman kung ang ipinakilalang salik na ito ay makabuluhan (mahalaga) o hindi gaanong mahalaga. Pagkatapos sa kaso ng malalaking volume at Mga Sample (tingnan ang talata 3.4) bilang isang pamantayan para sa bisa ng hypothesis H0 isaalang-alang ang isang normally distributed random variable

Sa isang naibigay na antas ng kahalagahan α Hypothesis H0 tungkol sa pagkakapantay-pantay M(X) at M(Y) ay tatanggihan kung ang pang-eksperimentong halaga ng dami ay positibo at mas malaki, kung saan

Dahil, sa ilalim ng bisa ng hypothesis H0 M(Z)= 0, pagkatapos

Ang paghahambing ng mga average ng dalawang populasyon ay may malaking praktikal na kahalagahan. Sa pagsasagawa, madalas na mayroong isang kaso kapag ang average na resulta ng isang serye ng mga eksperimento ay naiiba sa average na resulta ng isa pang serye. Sa kasong ito, lumilitaw ang tanong kung ang naobserbahang pagkakaiba sa pagitan ng mga average ay maaaring ipaliwanag ng hindi maiiwasang random na mga error ng eksperimento, o kung ito ay sanhi ng ilang mga regularidad. Sa industriya, ang gawain ng paghahambing ng mga average ay madalas na lumitaw kapag nagsa-sample ng kalidad ng mga produkto na ginawa sa iba't ibang mga pag-install o sa ilalim ng iba't ibang mga teknolohikal na rehimen, sa pagsusuri sa pananalapi - kapag inihambing ang antas ng kakayahang kumita ng iba't ibang mga asset, atbp.

Bumuo tayo ng problema. Hayaang magkaroon ng dalawang populasyon na nailalarawan sa pamamagitan ng pangkalahatang paraan at at kilalang mga pagkakaiba-iba at. Kinakailangang subukan ang hypothesis tungkol sa pagkakapantay-pantay ng mga pangkalahatang average, i.e. :=. Upang subukan ang hypothesis, dalawang independiyenteng sample ng mga volume at kinuha mula sa mga populasyon na ito, kung saan ang ibig sabihin ng aritmetika at at sample na mga pagkakaiba ay natagpuan. Sa sapat na malalaking sukat ng sample, ang sample ay nangangahulugan at may humigit-kumulang na normal na batas sa pamamahagi, ayon sa pagkakabanggit, at Kung totoo ang hypothesis, ang pagkakaiba - ay may normal na batas sa pamamahagi na may mathematical na inaasahan at dispersion.

Samakatuwid, kapag ang hypothesis ay natupad, ang mga istatistika

ay may karaniwang normal na distribusyon N(0; 1).

Pagsubok ng mga hypotheses tungkol sa mga numerical na halaga ng mga parameter

Ang mga hypotheses tungkol sa mga numerical na halaga ay nangyayari sa iba't ibang mga problema. Hayaan ang mga halaga ng ilang parameter ng mga produktong ginawa ng awtomatikong line machine, at hayaan ang ibinigay na nominal na halaga ng parameter na ito. Ang bawat indibidwal na halaga ay maaaring, siyempre, kahit papaano ay lumihis mula sa ibinigay na halaga ng mukha. Malinaw, upang masuri ang tamang setting ng makinang ito, kailangan mong tiyakin na ang average na halaga ng parameter para sa mga produktong ginawa dito ay tumutugma sa nominal na halaga, i.e. subukan ang isang hypothesis laban sa isang alternatibo, o, o

Sa isang arbitrary na setting ng makina, maaaring kailanganin upang subukan ang hypothesis na ang katumpakan ng mga produkto ng pagmamanupaktura para sa isang ibinigay na parameter, na ibinigay ng dispersion, ay katumbas ng isang ibinigay na halaga, i.e. o, halimbawa, ang katotohanan na ang proporsyon ng mga may sira na produkto na ginawa ng makina ay katumbas ng ibinigay na halaga p 0, i.e. atbp.

Maaaring lumitaw ang mga katulad na problema, halimbawa, sa pagsusuri sa pananalapi, kapag, ayon sa sample na data, kinakailangan upang matukoy kung ang pagbabalik sa isang asset ng isang tiyak na uri o portfolio ng mga seguridad ay maaaring isaalang-alang, o ang panganib nito ay katumbas ng isang naibigay na numero; o, batay sa mga resulta ng isang piling pag-audit ng mga katulad na dokumento, kailangan mong tiyakin kung ang porsyento ng mga pagkakamaling nagawa ay maituturing na katumbas ng halaga ng mukha, atbp.

Sa pangkalahatang kaso, ang mga hypotheses ng ganitong uri ay may anyo, kung saan mayroong isang tiyak na parameter ng pamamahagi sa ilalim ng pag-aaral, at ang lugar ng mga tiyak na halaga nito, na binubuo sa isang partikular na kaso ng isang halaga.

Statistical Hypothesis Testing: Hypothesis of Equal Means para sa Dalawang Sample

Ang gawain ay pantulong sa kalikasan, ay dapat magsilbi bilang isang fragment ng iba pang gawain sa laboratoryo.

Walang kakayahang sosyolohikal na pananaliksik ang magagawa nang hindi naglalagay ng mga hypotheses. Sa pangkalahatan, masasabi ng isa na ang pangunahing layunin nito ay pabulaanan o kumpirmahin ang anumang palagay ng mananaliksik tungkol sa realidad sa lipunan batay sa empirikal na datos na kanyang nakolekta. Naglagay kami ng hypothesis, nangongolekta ng data at gumuhit ng konklusyon batay sa istatistikal na materyal. Ngunit itong hypothesis-data-conclusion chain na naglalaman ng maraming tanong na kinakaharap ng halos anumang baguhang mananaliksik. Ang pangunahin sa mga tanong na ito ay ang mga sumusunod: paano isasalin ang hypothesis na inihain namin sa wikang matematika upang ito ay maiugnay sa isang statistical array at, maproseso gamit ang mga pamamaraan ng matematikal na istatistika, mapabulaanan o makumpirma? Dito ay susubukan naming sagutin ang tanong na ito gamit ang halimbawa ng pagsubok ng mga hypotheses tungkol sa pagkakapantay-pantay ng mga paraan.

Pagsubok ng mga istatistikal na hypotheses tungkol sa pagkakapantay-pantay ng mga paraan

Ang isang istatistikal na hypothesis ay tumutukoy sa iba't ibang uri ng mga pagpapalagay tungkol sa kalikasan o mga parameter ng pamamahagi ng isang random na variable na maaaring masuri batay sa mga resulta sa isang random na sample.

Dapat isaisip na ang pagsubok sa isang istatistikal na hypothesis ay probabilistic sa kalikasan. Kung paanong hindi tayo kailanman magiging 100% sigurado na ang anumang sample na parameter ay tumutugma sa parameter ng populasyon, hindi natin ganap na masasabi kung totoo o mali ang hypothesis na ating iniharap.

Upang masubukan ang isang istatistikal na hypothesis, kailangan mo ang sumusunod:

1. I-convert ang makabuluhang hypothesis sa isang istatistikal: bumalangkas ng null at alternatibong statistical hypotheses.

2. Tukuyin ang mga dependencies o ang aming mga independiyenteng sample.

3. Tukuyin ang dami ng mga sample.

4. Pumili ng criterion.

5. Pumili ng antas ng kahalagahan na kumokontrol sa katanggap-tanggap na posibilidad ng isang Type I na error at tinutukoy ang hanay ng mga katanggap-tanggap na halaga.

7. Tanggihan o tanggapin ang null hypothesis.

Ngayon tingnan natin ang bawat isa sa anim na puntos nang mas detalyado.

Pahayag ng hypothesis

Sa mga problema sa istatistika, madalas na kinakailangan upang ihambing ang paraan ng dalawang magkaibang sample. . Halimbawa, maaaring interesado tayo sa pagkakaiba sa karaniwang suweldo ng mga lalaki at babae, ang karaniwang edad ng ilang grupo<А>at<В>atbp. O, sa pamamagitan ng pagbuo ng dalawang independiyenteng pang-eksperimentong grupo, maaari nating ihambing ang kanilang mga paraan upang makita kung gaano kaiba, halimbawa, ang mga epekto ng dalawang magkaibang gamot sa presyon ng dugo, o kung gaano kalaki ang epekto ng grupo sa mga marka ng mga mag-aaral. Minsan nangyayari na hinahati natin ang populasyon sa dalawang grupo nang pares, iyon ay, nakikipag-usap tayo sa kambal, mag-asawa o iisang tao bago at pagkatapos ng ilang eksperimento, atbp. Upang gawing mas malinaw, tingnan natin ang mga tipikal na halimbawa kung saan inilalapat ang iba't ibang pamantayan para sa pagkakapantay-pantay ng mga paraan.

Halimbawa #1. Ang kumpanya ay nakabuo ng dalawang magkaibang gamot na nagpapababa ng presyon ng dugo (tawagin natin silang mga gamot X at Y) at gustong malaman kung iba o hindi ang mga epekto ng mga gamot na ito sa mga pasyenteng may hypertension. Sa 50 katao na may kaukulang sakit, 20 ang random na pinili at ang 20 na ito ay sapalarang nahahati sa dalawang grupo ng 10 tao. Ang unang grupo ay gumagamit ng gamot sa loob ng isang linggo X, ang pangalawa - gamot Y. Pagkatapos ang presyon ng dugo ay sinusukat sa lahat ng mga pasyente. Substantive hypothesis na iniharap: Ang mga gamot na X at Y ay may iba't ibang epekto sa presyon ng dugo ng mga pasyente.

Halimbawa #2. Nais malaman ng mananaliksik kung paano nakakaapekto ang tagal ng panayam sa pagganap ng mag-aaral. Ipagpalagay na pinili niya ang sumusunod na landas: sa 200 estudyante, random siyang pumili ng 50 tao at sinusubaybayan ang kanilang pag-unlad sa loob ng isang buwan. Pagkatapos ay pinahaba niya ang mga lektura ng 10 minuto at sa susunod na buwan ay tiningnan niya ang progreso ng parehong 50 estudyante. Pagkatapos ay inihambing niya ang mga resulta ng bawat mag-aaral bago at pagkatapos ng pagtaas ng tagal ng panayam. Substantive hypothesis na iniharap: Ang tagal ng lecture ay nakakaapekto sa performance ng mag-aaral.

Halimbawa #3. Sa 200 estudyante, 80 tao ang random na napili, at ang 80 tao na ito ay hinati sa dalawang grupo ng 40. Isang grupo ang tinanong ng isang katanungan nang walang setting:<Сколько вы готовы заплатить за натуральный йогурт?>, at tinanong ang pangalawang pangkat tungkol sa pag-install:<Сколько вы готовы заплатить за натуральный йогурт, если известно, что люди, потребляющие йогуртовые культуры, страдают на 10-15% меньше от заболеваний желудка?>Ipinapalagay ng mananaliksik na ang positibong impormasyon tungkol sa produkto na nasa pangalawang tanong ay makakaimpluwensya sa respondent, at ang mga taong sasagot sa tanong na may pag-install ay handang magbayad ng mas malaki para sa yogurt kaysa sa mga tinanong nang walang pag-install. Substantive hypothesis na iniharap: ang pagbibigay ng tanong ay nakakaimpluwensya sa tugon ng respondent.

Sa harap natin ay tatlong halimbawa, ang bawat isa ay nagpapakita ng pagbabalangkas ng isang makabuluhang hypothesis. Ngayon, ibahin natin ang ating mga makabuluhang hypotheses sa mga istatistika, ngunit una, sabihin natin ng kaunti tungkol sa mga istatistikang hypotheses sa pangkalahatan.

Ang pinakakaraniwang diskarte sa pagbabalangkas ng mga istatistikal na hypotheses ay ang maglagay ng dalawa bilateral hypotheses:

Tulad ng makikita mula sa formula, ang null hypothesis ay nagsasabi na ang ilang sample na parameter o, sabihin nating, ang pagkakaiba sa pagitan ng mga parameter ng dalawang sample ay katumbas ng isang tiyak na numero. a. Ang alternatibong hypothesis ay nagsasaad ng kabaligtaran: ang parameter ng interes sa amin ay hindi katumbas ng a. Kaya, ang dalawang hypotheses na ito ay naglalaman ng lahat ng posibleng resulta.

Posible rin ang pagbabalangkas one-sided hypotheses:

Minsan nagiging mas makabuluhan ang mga ganitong hypotheses. Karaniwang nangyayari ang mga ito kapag ang posibilidad na ang aming parameter ay maaaring mas malaki (o mas kaunti) a ay zero, na nangangahulugang imposible.

Binubuo na namin ngayon ang null at alternatibong statistical hypotheses para sa aming tatlong halimbawa.

Numero ng talahanayan 1.

Halimbawa #1

Halimbawa #2

Halimbawa #3

Ang mga gamot na X at Y ay may iba't ibang epekto sa presyon ng dugo sa mga pasyente

Ang haba ng lecture ay nakakaapekto sa pagganap ng mag-aaral

Ang pagtatanong ay nakakaimpluwensya sa tugon ng respondent

Gawain ng mananaliksik

4. Hanapin ang arithmetic mean ng mga pagkakaiba para sa lahat ng mga mag-aaral, na may denotasyon

Null hypothesis

Ang kahulugan ng null hypothesis

at ang mga average ng pangkalahatang populasyon kung saan kinukuha ang mga sample na may mga average. Ang null hypothesis ay nagsasabi na ang epekto ng parehong mga gamot sa presyon ay hindi gaanong mahalaga sa karaniwan, at kahit na ang sample na paraan ay hindi pantay, ito ay dahil lamang sa sampling error o iba pang mga dahilan na hindi natin kontrolado.

Mean ng mga pagkakaiba para sa mga mag-aaral sa pangkalahatang populasyon. Sinasabi ng null hypothesis na sa katunayan ay walang pagkakaiba sa pagitan ng average na marka ng isang mag-aaral bago at pagkatapos ng pagtaas ng tagal ng lecture, at kahit na ang sample mean ng mga pagkakaiba ay iba sa zero, ito ay dahil lamang sa sampling pagkakamali o iba pang dahilan na hindi natin kontrolado

Dahil pareho ito sa halimbawa No. 1, makikita ang mga paliwanag sa unang column (tingnan ang halimbawa 1)

Alternatibong hypothesis

Konklusyon tungkol sa hypothesis ng nilalaman

Kung tinatanggap namin ang null hypothesis na ang mga gamot ay may parehong epekto (walang pagkakaiba sa pagitan ng mga paraan), tinatanggihan namin ang hypothesis ng nilalaman, kung hindi, tinatanggap namin ang hypothesis ng nilalaman

Kung tinatanggap namin ang null hypothesis na ang tagal ng lecture ay hindi nakakaapekto sa performance, pagkatapos ay tinatanggihan namin ang content hypothesis at vice versa

Kung tinatanggap namin ang null hypothesis - ang tanong ay hindi makakaapekto sa pagpili ng respondent, pagkatapos ay tinatanggihan namin ang content hypothesis at vice versa.

Isa sa mga pinakasimpleng kaso ng pagsubok sa isang istatistikal na hypothesis ay ang pagsubok para sa pagkakapantay-pantay sa pagitan ng ibig sabihin ng populasyon at ilang ibinigay na halaga. Ang ibinigay na halaga ay ilang nakapirming numerong µ 0 na nakuha hindi mula sa pumipili datos. Ang mga hypotheses ay ang mga sumusunod.

H 0: µ = µ 0 - ang null hypothesis ay nagsasaad na ang hindi kilalang populasyon na ibig sabihin ay µ ay eksaktong katumbas ng ibinigay na halaga µ 0 .

H 1: µ µ 0 - ang alternatibong hypothesis ay nagsasaad na ang hindi kilalang populasyon na ibig sabihin ay µ ay hindi katumbas ng ibinigay na halaga µ 0 .

Pansinin na mayroong talagang tatlong magkakaibang numero na kasangkot dito na may kinalaman sa mean:

§ µ ay ang hindi kilalang populasyon na ibig sabihin ay interesado ka;

§ µ 0 - binigay ang halaga kung saan sinusuri ang hypothesis;

§ - kilalang sample mean, na ginagamit upang gumawa ng desisyon sa pagtanggap ng hypothesis. Sa tatlong numerong ito, ang value na ito lamang ang random variable, dahil kinakalkula ito mula sa sample na data. pansinin mo yan ay isang pagtatantya at samakatuwid ay kumakatawan sa µ.

Ang pagsusuri sa hypothesis ay binubuo sa paghahambing ng dalawang kilalang halaga at µ 0 . Kung ang mga halagang ito ay naiiba nang higit sa inaasahan ng pagkakataon, ang null hypothesis µ = µ 0 ay tinatanggihan dahil nagbibigay ito ng impormasyon tungkol sa hindi kilalang mean µ. Kung ang mga halaga at µ 0 ay sapat na malapit, kung gayon ang null hypothesis µ = µ 0 ay tinatanggap. Ngunit ano ang ibig sabihin ng "malapit ang mga halaga"? Nasaan ang kinakailangang hangganan? Dapat matukoy ang kalapitan batay sa halaga, dahil tinutukoy ng karaniwang error na ito ang antas ng randomness. Kaya, kung µ 0 at pinaghihiwalay ng sapat na bilang ng mga karaniwang error, kung gayon ito ay nakakumbinsi na ebidensya na ang µ ay hindi katumbas ng µ 0 .

Umiiral dalawa iba't ibang pamamaraan para sa pagsubok ng hypothesis at pagkuha ng resulta. Una ang pamamaraan ay gumagamit ng mga pagitan ng kumpiyansa na tinalakay sa nakaraang kabanata. Ito ay isang mas madaling paraan dahil (a) alam mo na kung paano bumuo at mag-interpret ng isang confidence interval, at (b) ang confidence interval ay diretso upang bigyang-kahulugan dahil ito ay ipinahayag sa parehong mga yunit bilang ang data (hal., dolyar, bilang ng mga tao , ang bilang ng mga pagkasira). Pangalawa pamamaraan (batay sa t-istatistika) ay mas tradisyonal, ngunit hindi gaanong intuitive, dahil binubuo ito sa pagkalkula ng isang tagapagpahiwatig na hindi nasusukat sa parehong mga yunit ng data, paghahambing ng nagresultang halaga sa katumbas na mapanganib halaga mula sa t-table at pagkatapos ay gumuhit ng konklusyon.

Sinusuri kung ang average ay katumbas ng isang tiyak na halaga.

Ang mga sample ay nakuha mula sa isang populasyon na may normal na distribusyon, ang data ay independyente.

Ang halaga ng pamantayan ay kinakalkula ng formula:

kung saan ang N ay ang sample size;

S 2 - empirical sample variance;

A - ang tinantyang halaga ng average na halaga;

Ang X ay ang average na halaga.

Ang bilang ng mga antas ng kalayaan para sa t-test V = n-1.

Zero bagong hypothesis

H 0: X \u003d A kumpara sa H A: X≠A. Ang null hypothesis tungkol sa pagkakapantay-pantay ng mga paraan ay tinatanggihan kung ang absolute value ng criterion value ay mas malaki kaysa sa itaas na α/2% ng punto ng t-distribution na kinuha gamit ang V degrees of freedom, iyon ay, kapag │t│ > t vα/2 .

H 0: X< А против Н А: X >A. Ang null hypothesis ay tinatanggihan kung ang criterion value ay mas malaki kaysa sa itaas na α% point ng t-distribution na kinuha na may V degrees of freedom, iyon ay, kapag │t│> t vα .

H 0: X>A kumpara sa H A: X< А. Нулевая гипотеза отвергается, если критериальное значение меньше нижней α% точки t-распределения, взятого с V степенями свободы.

Ang criterion ay matatag para sa maliliit na paglihis mula sa normal na distribusyon.

Halimbawa

Isaalang-alang ang halimbawang ipinapakita sa Fig. 5.10. Sabihin nating kailangan nating subukan ang hypothesis na ang ibig sabihin ng sample (mga cell 123:130) ay katumbas ng 0.012.

Una, makikita natin ang sample mean (=AVERAGE(123:130) sa I31) at ang variance (=VAR(I23:I30) sa I32). Pagkatapos nito, kinakalkula namin ang mga halaga ng pamantayan (=(131-0.012)*ROOT(133)/132) at kritikal (=STEUDRASP(0.025;133-1). Dahil ang criterion value (24.64) ay mas malaki kaysa sa critical value (2.84), ang hypothesis tungkol sa pagkakapantay-pantay ng mean na 0.012 ay tinanggihan.

Figure 5.10 Paghahambing ng mean na halaga sa pare-pareho

1. pagsubok ng mga hypotheses tungkol sa mga paraan at pagkakaiba-iba gamit ang mga parametric na pagsusulit ni Fisher at Cochran (talahanayan 5.4);

2. subukan ang hypothesis tungkol sa pagkakapantay-pantay ng mga paraan na may hindi pantay na pagkakaiba-iba ng mga sample (upang gawin ito, alisin ang 1 o 2 mga halaga sa isa sa mga sample ng iyong bersyon) (talahanayan 5.4);

3. suriin ang hypothesis na ang average ay katumbas ng ibinigay na halaga A (talahanayan 5.5) at ang data mula sa 1st column para sa variant.

Talahanayan 5.4

Mga pagpipilian sa gawain

Data ng eksperimento
Pagpipilian
2,3 2,6 2,2 2,1 2,5 2,6
1,20 1,42 17,3 23,5 2,37 2,85 35,2 26,1 2,1 2,6
5,63 5,62 26,1 27,0 5,67 2,67 35,9 25,8 5,1 5,63
2,34 2,37 23,9 23,3 2,35 2,34 33,6 23,8 2,34 2,38
7,71 7,90 28,0 25,2 2,59 2,58 35,7 26,0 7,63 7,6,1
1,2 1,6 1,7 2,6 1,9 2,8
1,13 1,15 21,6 21,2 2,13 2,16 31,7 1,12 1,12
1,45 1,47 24,7 24,8 2,45 2,47 34,8 24,5 1,49 1,45
3,57 3,59 25,9 25,7 2,55 2,59 36,0 25,7 3,58 3,58
3,3 3,6 2,5 2,4 3,4 3,5
Data ng eksperimento
Pagpipilian
7,3 7,6 12,2 12,1 3,5 4,6
6,20 6,42 217,3 230,5 12,37 12,85 75,2 86,1 3,1 4,6
7,63 5,62 264,1 278,0 15,67 14,67 75,9 75,8 5,1 5,63
6,34 5,37 233,9 236,3 12,35 12,34 73,6 73,8 3,34 4,38
7,71 7,90 281,0 255,2 12,59 12,58 85,7 86,0 3,63 4,6,1
6,2 6,6 11,7 12,6 3,9 4,8
4,13 4,15 251,6 261,2 12,13 12,16 71,7 5,12 4,12
5,45 6,47 244,7 247,8 12,45 12,47 74,8 84,5 3,49 4,45
5,57 5,59 250,9 255,7 12,55 12,59 86,0 85,7 3,58 3,58
5,3 5,6 12,5 12,4 3,4 3,5

Talahanayan 5.5

Isang halaga

Mga pagpipilian
2,2 2,2 2,2 6,5 12,2 3,5

Maaari mong gamitin ang iyong pang-eksperimentong data bilang paunang data sa gawain.

Ang ulat ay dapat maglaman ng mga kalkulasyon ng mga istatistikal na katangian.

Mga tanong sa pagsubok:

1. Anong mga istatistikal na problema ang nalutas sa pag-aaral ng mga teknolohikal na proseso sa industriya ng pagkain?

2. Paano inihahambing ang mga istatistikal na katangian ng mga random na variable?

3. Antas ng kahalagahan at antas ng kumpiyansa na may pagiging maaasahan ng pagtatasa ng pang-eksperimentong data.

4. Paano sinusuri ang mga istatistikal na hypotheses gamit ang goodness-of-fit na mga pagsusulit?

5. Ano ang tumutukoy sa kapangyarihan ng goodness of fit criterion para sa pagsusuri ng mga eksperimentong sample?

6. Paano ang pagpili ng mga pamantayan para sa paglutas ng mga problema ng pagsusuri ng mga teknolohikal na proseso ng produksyon ng pagkain?

7. Paano isinasagawa ang pag-uuri ng pamantayan ng kasunduan para sa pagsusuri ng mga sample ng mga resulta ng mga pag-aaral ng mga teknolohikal na proseso ng paggawa ng pagkain?

8. Ano ang mga kinakailangan para sa sampling ng mga resulta ng pananaliksik sa mga teknolohikal na proseso para sa produksyon ng pagkain?