Bilis ng row. Average na linear deviation

Pag-asa at pagkakaiba sa matematika

Sukatin natin ang isang random na variable N beses, halimbawa, sinusukat namin ang bilis ng hangin nang sampung beses at gustong hanapin ang average na halaga. Paano nauugnay ang mean value sa distribution function?

Pagulungin namin ang dice nang maraming beses. Ang bilang ng mga puntos na mahuhulog sa die sa bawat paghagis ay isang random na variable at maaaring tumagal ng anumang natural na mga halaga mula 1 hanggang 6. N ito ay may posibilidad sa isang napaka-tiyak na numero - ang mathematical na inaasahan M x. Sa kasong ito M x = 3,5.

Paano nangyari ang halagang ito? Papasukin N Isang beses bumaba ang mga pagsusulit ng 1 puntos, isang beses - 2 puntos at iba pa. Pagkatapos N→ ∞ ang bilang ng mga kinalabasan kung saan nahulog ang isang punto, Katulad nito, Mula rito

Modelo 4.5. Dais

Ipagpalagay natin ngayon na alam natin ang batas ng pamamahagi ng random variable x, ibig sabihin, alam natin na ang random variable x maaaring kumuha ng mga halaga x 1 , x 2 , ..., x k may probabilidad p 1 , p 2 , ..., p k.

Inaasahang halaga M x random variable x katumbas ng:

Sagot. 2,8.

Ang inaasahan sa matematika ay hindi palaging isang makatwirang pagtatantya ng ilang random na variable. Kaya, upang tantiyahin ang average na sahod, mas makatwirang gamitin ang konsepto ng median, iyon ay, tulad ng isang halaga na ang bilang ng mga tao na tumatanggap ng mas mababa kaysa sa median na suweldo at higit pa, ay pareho.

Median ang isang random na variable ay tinatawag na isang numero x 1/2 ganyan p (x < x 1/2) = 1/2.

Sa madaling salita, ang posibilidad p 1 na ang random variable x magiging mas kaunti x 1/2 , at ang posibilidad p 2 na isang random na variable x magiging mas malaki x Ang 1/2 ay pareho at katumbas ng 1/2. Ang median ay hindi natatanging tinutukoy para sa lahat ng mga pamamahagi.

Bumalik sa random variable x, na maaaring kunin ang mga halaga x 1 , x 2 , ..., x k may probabilidad p 1 , p 2 , ..., p k.

pagpapakalat random variable x ay ang ibig sabihin ng halaga ng squared deviation ng isang random variable mula sa inaasahan ng matematika nito:

Halimbawa 2

Sa ilalim ng mga kundisyon ng nakaraang halimbawa, kalkulahin ang variance at standard deviation ng isang random variable x.

Sagot. 0,16, 0,4.

Modelo 4.6. target shooting

Halimbawa 3

Hanapin ang probability distribution ng bilang ng mga puntos na pinagsama sa die mula sa unang throw, ang median, ang mathematical expectation, ang variance at ang standard deviation.

Ang pag-drop ng anumang mukha ay pantay na posibilidad, kaya ang pamamahagi ay magiging ganito:

Standard deviation Makikita na napakalaki ng deviation ng value mula sa mean value.

Mga katangian ng inaasahan sa matematika:

  • Ang pag-asa sa matematika ng kabuuan ng mga independiyenteng random na variable ay katumbas ng kabuuan ng kanilang mga inaasahan sa matematika:

Halimbawa 4

Hanapin ang mathematical na inaasahan ng kabuuan at ang produkto ng mga puntos na pinagsama sa dalawang dice.

Sa halimbawa 3, nakita namin iyon para sa isang kubo M (x) = 3.5. Kaya para sa dalawang cubes

Mga katangian ng pagpapakalat:

  • Ang pagkakaiba ng kabuuan ng mga independiyenteng random na variable ay katumbas ng kabuuan ng mga pagkakaiba:

Dx + y = Dx + Dy.

Hayaan para sa N mga dice roll y puntos. Pagkatapos

Ang resultang ito ay hindi lamang totoo para sa mga dice roll. Sa maraming kaso, tinutukoy nito ang katumpakan ng pagsukat ng mathematical na inaasahan sa empirically. Ito ay makikita na may pagtaas sa bilang ng mga sukat N ang pagkalat ng mga halaga sa paligid ng mean, iyon ay, ang karaniwang paglihis, ay bumababa nang proporsyonal

Ang pagkakaiba-iba ng isang random na variable ay nauugnay sa mathematical na inaasahan ng parisukat ng random na variable na ito sa pamamagitan ng sumusunod na kaugnayan:

Hanapin natin ang mga inaasahan sa matematika ng parehong bahagi ng pagkakapantay-pantay na ito. A-priory,

Ang pag-asa sa matematika ng kanang bahagi ng pagkakapantay-pantay, ayon sa pag-aari ng mga inaasahan sa matematika, ay katumbas ng

Karaniwang lihis

karaniwang lihis katumbas ng square root ng variance:
Kapag tinutukoy ang standard deviation para sa isang sapat na malaking volume ng pinag-aralan na populasyon (n> 30), ang mga sumusunod na formula ay ginagamit:

Katulad na impormasyon.


Ayon sa sample na survey, ang mga depositor ay pinagsama ayon sa laki ng deposito sa Sberbank ng lungsod:

tukuyin:

1) saklaw ng pagkakaiba-iba;

2) average na halaga ng deposito;

3) average na linear deviation;

4) pagpapakalat;

5) karaniwang paglihis;

6) koepisyent ng pagkakaiba-iba ng mga kontribusyon.

Desisyon:

Ang serye ng pamamahagi na ito ay naglalaman ng mga bukas na agwat. Sa naturang serye, ang halaga ng pagitan ng unang pangkat ay karaniwang ipinapalagay na katumbas ng halaga ng pagitan ng susunod, at ang halaga ng pagitan ng huling pangkat ay katumbas ng halaga ng pagitan ng nakaraang isa.

Ang halaga ng pagitan ng pangalawang pangkat ay 200, samakatuwid, ang halaga ng unang pangkat ay 200 din. Ang halaga ng pagitan ng penultimate na pangkat ay 200, na nangangahulugan na ang huling pagitan ay magkakaroon din ng halaga na katumbas ng 200.

1) Tukuyin ang hanay ng variation bilang pagkakaiba sa pagitan ng pinakamalaki at pinakamaliit na halaga ng feature:

Ang saklaw ng pagkakaiba-iba sa laki ng kontribusyon ay 1000 rubles.

2) Ang average na laki ng kontribusyon ay tinutukoy ng formula ng arithmetic weighted average.

Paunang tukuyin natin ang discrete value ng attribute sa bawat interval. Upang gawin ito, gamit ang simpleng arithmetic mean formula, makikita natin ang mga midpoint ng mga pagitan.

Ang average na halaga ng unang pagitan ay magiging katumbas ng:

ang pangalawa - 500, atbp.

Ilagay natin ang mga resulta ng mga kalkulasyon sa talahanayan:

Halaga ng deposito, kuskusin.Bilang ng mga nag-aambag, fAng gitna ng pagitan, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Kabuuan 400 - 312000

Ang average na deposito sa Sberbank ng lungsod ay magiging 780 rubles:

3) Ang average na linear deviation ay ang arithmetic average ng absolute deviations ng mga indibidwal na halaga ng attribute mula sa kabuuang average:

Ang pamamaraan para sa pagkalkula ng average na linear deviation sa interval distribution series ay ang mga sumusunod:

1. Ang arithmetic weighted average ay kinakalkula, tulad ng ipinapakita sa talata 2).

2. Ang mga ganap na paglihis ng variant mula sa mean ay tinutukoy:

3. Ang mga nakuhang deviation ay pinarami ng mga frequency:

4. Ang kabuuan ng mga weighted deviations ay matatagpuan nang hindi isinasaalang-alang ang sign:

5. Ang kabuuan ng mga weighted deviations ay hinati sa kabuuan ng mga frequency:

Maginhawang gamitin ang talahanayan ng kinakalkula na data:

Halaga ng deposito, kuskusin.Bilang ng mga nag-aambag, fAng gitna ng pagitan, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Kabuuan 400 - - - 81280

Ang average na linear deviation ng laki ng deposito ng mga kliyente ng Sberbank ay 203.2 rubles.

4) Ang dispersion ay ang arithmetic mean ng mga squared deviations ng bawat feature value mula sa arithmetic mean.

Ang pagkalkula ng pagkakaiba-iba sa serye ng pamamahagi ng agwat ay isinasagawa ayon sa pormula:

Ang pamamaraan para sa pagkalkula ng pagkakaiba-iba sa kasong ito ay ang mga sumusunod:

1. Tukuyin ang arithmetic weighted average, tulad ng ipinapakita sa talata 2).

2. Maghanap ng mga paglihis mula sa mean:

3. Pag-squaring ng deviation ng bawat opsyon mula sa mean:

4. I-multiply ang mga squared deviation sa pamamagitan ng mga timbang (mga frequency):

5. Ibuod ang mga natanggap na gawa:

6. Ang resultang halaga ay hinati sa kabuuan ng mga timbang (mga frequency):

Ilagay natin ang mga kalkulasyon sa isang talahanayan:

Halaga ng deposito, kuskusin.Bilang ng mga nag-aambag, fAng gitna ng pagitan, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Kabuuan 400 - - - 23040000

Kapag ang istatistikal na pagsubok ng mga pagpapalagay, kapag sinusukat ang isang linear na relasyon sa pagitan ng mga random na variable.

Karaniwang lihis:

Karaniwang lihis(isang pagtatantya ng standard deviation ng random variable Floor, mga pader sa paligid natin at sa kisame, x kaugnay sa inaasahan sa matematika nito batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba nito):

kung saan - pagkakaiba-iba; - Ang sahig, ang mga dingding sa paligid natin at ang kisame, i-ika sample na elemento; - laki ng sample; - arithmetic mean ng sample:

Dapat tandaan na ang parehong mga pagtatantya ay may kinikilingan. Sa pangkalahatang kaso, imposibleng bumuo ng walang pinapanigan na pagtatantya. Gayunpaman, ang isang pagtatantya batay sa isang walang pinapanigan na pagtatantya ng pagkakaiba ay pare-pareho.

tatlong sigma na panuntunan

tatlong sigma na panuntunan() - halos lahat ng mga halaga ng isang normal na ibinahagi na random na variable ay nasa pagitan. Mas mahigpit - na may hindi bababa sa 99.7% na katiyakan, ang halaga ng isang normal na ibinabahagi na random na variable ay nasa tinukoy na agwat (sa kondisyon na ang halaga ay totoo, at hindi nakuha bilang resulta ng pagpoproseso ng sample).

Kung ang tunay na halaga ay hindi alam, kung gayon hindi mo dapat gamitin, ngunit ang sahig, ang mga dingding sa paligid natin at ang kisame, s. Kaya, ang panuntunan ng tatlong sigma ay isinalin sa panuntunan ng tatlong Palapag, mga pader sa paligid natin at sa kisame, s .

Interpretasyon ng halaga ng standard deviation

Ang isang malaking halaga ng karaniwang paglihis ay nagpapakita ng isang malaking pagkalat ng mga halaga sa ipinakita na hanay na may average na halaga ng hanay; ang isang maliit na halaga, ayon sa pagkakabanggit, ay nagpapahiwatig na ang mga halaga sa hanay ay pinagsama-sama sa average na halaga.

Halimbawa, mayroon kaming tatlong set ng numero: (0, 0, 14, 14), (0, 6, 8, 14) at (6, 6, 8, 8). Ang lahat ng tatlong set ay may mean values ​​na 7 at standard deviations na 7, 5, at 1, ayon sa pagkakabanggit. Ang huling set ay may maliit na standard deviation dahil ang mga value sa set ay clustered sa paligid ng mean; ang unang hanay ay may pinakamalaking halaga ng karaniwang paglihis - ang mga halaga sa loob ng hanay ay malakas na nag-iiba mula sa average na halaga.

Sa pangkalahatang kahulugan, ang karaniwang paglihis ay maaaring ituring na isang sukatan ng kawalan ng katiyakan. Halimbawa, sa physics, ang standard deviation ay ginagamit upang matukoy ang error ng isang serye ng sunud-sunod na mga sukat ng ilang dami. Ang halagang ito ay napakahalaga para sa pagtukoy ng katumpakan ng kababalaghan sa ilalim ng pag-aaral kumpara sa halaga na hinulaang ng teorya: kung ang ibig sabihin ng halaga ng mga sukat ay naiiba nang malaki sa mga halagang hinulaan ng teorya (malaking standard deviation), kung gayon ang ang mga nakuhang halaga o ang paraan ng pagkuha ng mga ito ay dapat suriin muli.

Praktikal na paggamit

Sa pagsasagawa, ang karaniwang paglihis ay nagbibigay-daan sa iyo upang matukoy kung magkano ang mga halaga sa hanay ay maaaring mag-iba mula sa average na halaga.

Klima

Ipagpalagay na mayroong dalawang lungsod na may parehong average na pang-araw-araw na maximum na temperatura, ngunit ang isa ay matatagpuan sa baybayin at ang isa ay nasa loob ng bansa. Ang mga lungsod sa baybayin ay kilala na mayroong maraming iba't ibang pang-araw-araw na pinakamataas na temperatura na mas mababa kaysa sa mga lungsod sa loob ng bansa. Samakatuwid, ang karaniwang paglihis ng maximum na pang-araw-araw na temperatura sa coastal city ay magiging mas mababa kaysa sa pangalawang lungsod, sa kabila ng katotohanan na ang average na halaga ng halagang ito ay pareho para sa kanila, na sa pagsasanay ay nangangahulugan na ang posibilidad na ang maximum na hangin temperatura ng bawat partikular na araw ng taon ay magiging mas malakas na naiiba mula sa average na halaga, mas mataas para sa isang lungsod na matatagpuan sa loob ng kontinente.

palakasan

Ipagpalagay natin na mayroong ilang mga koponan ng football na niraranggo ayon sa ilang hanay ng mga parameter, halimbawa, ang bilang ng mga layunin na naitala at natanggap, mga pagkakataong makapuntos, atbp. Malamang na ang pinakamahusay na koponan sa pangkat na ito ay magkakaroon ng pinakamahusay mga halaga sa higit pang mga parameter. Kung mas maliit ang standard deviation ng team para sa bawat isa sa mga ipinakitang parameter, mas predictable ang resulta ng team, balanse ang mga naturang team. Sa kabilang banda, ang isang koponan na may malaking standard deviation ay mahirap hulaan ang resulta, na kung saan ay ipinaliwanag ng isang kawalan ng timbang, halimbawa, isang malakas na depensa, ngunit isang mahinang pag-atake.

Ang paggamit ng karaniwang paglihis ng mga parameter ng koponan ay nagbibigay-daan sa isa na mahulaan ang resulta ng tugma sa pagitan ng dalawang koponan sa ilang lawak, sinusuri ang mga kalakasan at kahinaan ng mga koponan, at samakatuwid ang mga napiling paraan ng pakikibaka.

Teknikal na pagsusuri

Tingnan din

Panitikan

* Borovikov, V. STATISTICS. Ang sining ng pagtatasa ng data ng computer: Para sa mga propesyonal / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Pagpapakalat. Karaniwang lihis

Pagpapakalat ay ang arithmetic mean ng squared deviations ng bawat feature value mula sa kabuuang mean. Depende sa pinagmulan ng data, ang pagkakaiba ay maaaring hindi natimbang (simple) o natimbang.

Ang dispersion ay kinakalkula gamit ang mga sumusunod na formula:

para sa ungrouped data

para sa nakagrupong data

Ang pamamaraan para sa pagkalkula ng timbang na pagkakaiba:

1. tukuyin ang arithmetic weighted average

2. Natutukoy ang mga variant deviations mula sa mean

3. parisukat ang paglihis ng bawat opsyon mula sa mean

4. multiply squared deviations sa pamamagitan ng weights (frequencies)

5. ibuod ang mga natanggap na akda

6. ang resultang halaga ay hinati sa kabuuan ng mga timbang

Ang formula para sa pagtukoy ng pagkakaiba ay maaaring ma-convert sa sumusunod na formula:

- simple

Ang pamamaraan para sa pagkalkula ng pagkakaiba ay simple:

1. tukuyin ang arithmetic mean

2. parisukat ang arithmetic mean

3. parisukat ang bawat row na opsyon

4. hanapin ang kabuuan ng mga parisukat na opsyon

5. hatiin ang kabuuan ng mga parisukat ng opsyon sa kanilang numero, i.e. tukuyin ang ibig sabihin ng parisukat

6. tukuyin ang pagkakaiba sa pagitan ng mean square ng feature at square ng mean

Gayundin ang formula para sa pagtukoy ng weighted variance ay maaaring ma-convert sa sumusunod na formula:

mga. ang pagkakaiba ay katumbas ng pagkakaiba sa pagitan ng mean ng mga parisukat ng mga halaga ng tampok at ang parisukat ng arithmetic mean. Kapag ginagamit ang na-convert na formula, ang isang karagdagang pamamaraan para sa pagkalkula ng mga paglihis ng mga indibidwal na halaga ng katangian mula sa x ay hindi kasama at ang error sa pagkalkula na nauugnay sa pag-ikot ng mga paglihis ay hindi kasama.

Ang dispersion ay may ilang mga katangian, ang ilan sa mga ito ay nagpapadali sa pagkalkula:

1) ang pagpapakalat ng isang palaging halaga ay zero;

2) kung ang lahat ng mga variant ng mga halaga ng katangian ay nabawasan ng parehong numero, kung gayon ang pagkakaiba ay hindi bababa;

3) kung ang lahat ng mga variant ng mga halaga ng katangian ay nabawasan ng parehong bilang ng mga beses (beses), kung gayon ang pagkakaiba ay bababa ng isang kadahilanan ng

Standard deviations- ay ang square root ng variance:

Para sa hindi nakagrupong data:

;

Para sa isang serye ng variation:

Ang hanay ng variation, mean linear at mean square deviation ay pinangalanang dami. Ang mga ito ay may parehong mga yunit ng sukat bilang ang mga indibidwal na katangian ng mga halaga.

Ang dispersion at standard deviation ay ang pinakamalawak na ginagamit na mga sukat ng variation. Ito ay ipinaliwanag sa pamamagitan ng katotohanan na ang mga ito ay kasama sa karamihan ng mga theorems ng probability theory, na nagsisilbing pundasyon ng matematikal na istatistika. Bilang karagdagan, ang pagkakaiba ay maaaring mabulok sa mga bumubuo nitong elemento, na nagbibigay-daan upang masuri ang impluwensya ng iba't ibang mga kadahilanan na nagdudulot ng pagkakaiba-iba ng isang katangian.

Ang pagkalkula ng mga tagapagpahiwatig ng pagkakaiba-iba para sa mga bangko na naka-grupo ayon sa kita ay ipinapakita sa talahanayan.

Kita, milyong rubles Bilang ng mga bangko mga kalkuladong tagapagpahiwatig
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Kabuuan: 121,70 17,640 23,126

Ipinapakita ng mean linear at mean square deviations kung gaano nagbabago ang halaga ng attribute sa average para sa mga unit at populasyon na pinag-aaralan. Kaya, sa kasong ito, ang average na halaga ng pagbabagu-bago sa halaga ng kita ay: ayon sa average na linear deviation, 0.882 milyong rubles; ayon sa karaniwang paglihis - 1.075 milyong rubles. Ang standard deviation ay palaging mas malaki kaysa sa average na linear deviation. Kung ang distribusyon ng katangian ay malapit sa normal, may kaugnayan sa pagitan ng S at d: S=1.25d, o d=0.8S. Ipinapakita ng standard deviation kung paano matatagpuan ang bulto ng mga unit ng populasyon na may kaugnayan sa arithmetic mean. Anuman ang anyo ng pamamahagi, 75 na mga halaga ng katangian ang nahuhulog sa x 2S na pagitan, at hindi bababa sa 89 ng lahat ng mga halaga ay nahuhulog sa x 3S na pagitan (P.L. Chebyshev's theorem).

Sa artikulong ito, pag-uusapan ko paano hanapin ang standard deviation. Ang materyal na ito ay lubhang mahalaga para sa isang ganap na pag-unawa sa matematika, kaya ang isang math tutor ay dapat maglaan ng isang hiwalay na aralin o kahit na ilang sa pag-aaral nito. Sa artikulong ito, makakahanap ka ng link sa isang detalyado at nauunawaan na video tutorial na nagpapaliwanag kung ano ang karaniwang paglihis at kung paano ito mahahanap.

karaniwang lihis ginagawang posible na tantyahin ang pagkalat ng mga halaga na nakuha bilang isang resulta ng pagsukat ng isang tiyak na parameter. Ito ay tinutukoy ng isang simbolo (Griyegong titik na "sigma").

Ang formula para sa pagkalkula ay medyo simple. Upang mahanap ang standard deviation, kailangan mong kunin ang square root ng variance. Kaya ngayon kailangan mong itanong, "Ano ang pagkakaiba-iba?"

Ano ang dispersion

Ang kahulugan ng pagkakaiba-iba ay ang mga sumusunod. Ang dispersion ay ang arithmetic mean ng squared deviations ng mga value mula sa mean.

Upang mahanap ang pagkakaiba, gawin ang mga sumusunod na kalkulasyon nang sunud-sunod:

  • Tukuyin ang mean (simpleng arithmetic mean ng isang serye ng mga halaga).
  • Pagkatapos ay ibawas ang average mula sa bawat isa sa mga halaga at parisukat ang nagresultang pagkakaiba (nakuha namin pagkakaiba squared).
  • Ang susunod na hakbang ay upang kalkulahin ang arithmetic mean ng mga parisukat ng mga pagkakaiba na nakuha (Maaari mong malaman kung bakit eksakto ang mga parisukat sa ibaba).

Tingnan natin ang isang halimbawa. Sabihin nating ikaw at ang iyong mga kaibigan ay nagpasya na sukatin ang taas ng iyong mga aso (sa milimetro). Bilang resulta ng mga sukat, natanggap mo ang mga sumusunod na sukat ng taas (sa mga lanta): 600 mm, 470 mm, 170 mm, 430 mm at 300 mm.

Kalkulahin natin ang mean, variance at standard deviation.

Hanapin muna natin ang average. Tulad ng alam mo na, para dito kailangan mong idagdag ang lahat ng mga sinusukat na halaga at hatiin sa bilang ng mga sukat. Pag-unlad ng pagkalkula:

Average na mm.

Kaya, ang average (aritmetika mean) ay 394 mm.

Ngayon kailangan nating tukuyin paglihis ng taas ng bawat aso mula sa average:

Sa wakas, upang kalkulahin ang pagkakaiba, bawat isa sa mga nakuhang pagkakaiba ay parisukat, at pagkatapos ay makikita natin ang arithmetic mean ng mga resultang nakuha:

Dispersion mm 2 .

Kaya, ang dispersion ay 21704 mm 2 .

Paano mahahanap ang karaniwang paglihis

Kaya paano ngayon makalkula ang karaniwang paglihis, alam ang pagkakaiba? Bilang tandaan namin, kunin ang square root nito. Iyon ay, ang karaniwang paglihis ay:

mm (bilugan sa pinakamalapit na buong numero sa mm).

Gamit ang pamamaraang ito, nalaman namin na ang ilang mga aso (hal. Rottweiler) ay napakalalaking aso. Ngunit mayroon ding napakaliit na aso (halimbawa, mga dachshunds, ngunit hindi mo ito dapat sabihin sa kanila).

Ang pinaka-kagiliw-giliw na bagay ay ang karaniwang paglihis ay nagdadala ng kapaki-pakinabang na impormasyon. Ngayon ay maipapakita natin kung alin sa mga nakuhang resulta ng pagsukat ng paglago ang nasa loob ng pagitan na makukuha natin kung itatabi natin sa average (sa magkabilang panig nito) ang standard deviation.

Iyon ay, gamit ang standard deviation, nakakakuha kami ng isang "standard" na pamamaraan na nagbibigay-daan sa iyo upang malaman kung alin sa mga halaga ang normal (statistical average), at kung saan ay napakalaki o, sa kabaligtaran, maliit.

Ano ang Standard Deviation

Ngunit ... medyo mag-iiba ang mga bagay kung susuriin natin sampling datos. Sa aming halimbawa, isinasaalang-alang namin pangkalahatang populasyon. Ibig sabihin, ang aming 5 aso ay ang tanging aso sa mundo na interesado sa amin.

Ngunit kung ang data ay isang sample (mga halaga na pinili mula sa isang malaking populasyon), kung gayon ang mga kalkulasyon ay kailangang gawin nang iba.

Kung mayroong mga halaga, kung gayon:

Ang lahat ng iba pang mga kalkulasyon ay ginawa sa parehong paraan, kabilang ang pagpapasiya ng average.

Halimbawa, kung ang ating limang aso ay sample lamang ng populasyon ng mga aso (lahat ng aso sa planeta), dapat nating hatiin sa 4 sa halip na 5 ibig sabihin:

Sample na pagkakaiba = mm 2 .

Sa kasong ito, ang standard deviation para sa sample ay katumbas ng mm (bilugan sa pinakamalapit na buong numero).

Maaari naming sabihin na gumawa kami ng ilang "pagwawasto" sa kaso kapag ang aming mga halaga ay isang maliit na sample lamang.

Tandaan. Bakit eksakto ang mga parisukat ng mga pagkakaiba?

Ngunit bakit natin kinukuha ang mga parisukat ng mga pagkakaiba kapag kinakalkula ang pagkakaiba? Aminin natin sa pagsukat ng ilang parameter, natanggap mo ang sumusunod na hanay ng mga halaga: 4; 4; -4; -4. Kung idaragdag lang natin ang ganap na mga paglihis mula sa mean (pagkakaiba) sa bawat isa...negatibong mga halaga ay kanselahin sa mga positibo:

.

Ito ay lumalabas na ang pagpipiliang ito ay walang silbi. Kung gayon, marahil ay sulit na subukan ang mga ganap na halaga ng mga paglihis (iyon ay, ang mga module ng mga halagang ito)?

Sa unang sulyap, ito ay lumalabas na hindi masama (ang nagresultang halaga, sa pamamagitan ng paraan, ay tinatawag na mean absolute deviation), ngunit hindi sa lahat ng kaso. Subukan natin ang isa pang halimbawa. Hayaang magresulta ang pagsukat sa sumusunod na hanay ng mga halaga: 7; isa; -6; -2. Kung gayon ang ibig sabihin ng ganap na paglihis ay:

Blimey! Muli naming nakuha ang resulta 4, kahit na ang mga pagkakaiba ay may mas malaking spread.

Ngayon tingnan natin kung ano ang mangyayari kung parisukat natin ang mga pagkakaiba (at pagkatapos ay kunin ang square root ng kanilang kabuuan).

Para sa unang halimbawa, makakakuha ka ng:

.

Para sa pangalawang halimbawa, makakakuha ka ng:

Ngayon ito ay isang ganap na naiibang bagay! Ang root-mean-square deviation ay mas malaki, mas malaki ang pagkalat ng mga pagkakaiba ... na kung ano ang aming pinagsusumikapan.

Sa katunayan, ang pamamaraang ito ay gumagamit ng parehong ideya tulad ng kapag kinakalkula ang distansya sa pagitan ng mga punto, inilapat lamang sa ibang paraan.

At mula sa isang matematikal na punto ng view, ang paggamit ng mga parisukat at parisukat na mga ugat ay mas kapaki-pakinabang kaysa sa maaari nating makuha sa batayan ng mga ganap na halaga ng mga paglihis, dahil kung saan ang karaniwang paglihis ay naaangkop sa iba pang mga problema sa matematika.

Sinabi sa iyo ni Sergey Valerievich kung paano hanapin ang karaniwang paglihis