Keskihajonnan suhde keskiarvoon. Vakiopoikkeama

Dispersio. Vakiopoikkeama

Dispersio on aritmeettinen keskiarvo kunkin piirteen arvon neliöidyistä poikkeamista kokonaiskeskiarvosta. Lähdetiedoista riippuen varianssi voi olla painottamaton (yksinkertainen) tai painotettu.

Dispersio lasketaan seuraavilla kaavoilla:

ryhmittelemättömille tiedoille

ryhmitetyille tiedoille

Painotetun varianssin laskentamenetelmä:

1. määrittää aritmeettinen painotettu keskiarvo

2. Määritetään muunnelman poikkeamat keskiarvosta

3. neliötä kunkin vaihtoehdon poikkeama keskiarvosta

4. kerrotaan neliöity poikkeamat painoilla (taajuuksilla)

5. yhteenveto vastaanotetuista teoksista

6. saatu määrä jaetaan painojen summalla

Varianssin määrityskaava voidaan muuntaa seuraavaksi kaavaksi:

- yksinkertainen

Varianssin laskentamenetelmä on yksinkertainen:

1. määrittää aritmeettinen keskiarvo

2. neliöi aritmeettinen keskiarvo

3. neliöi jokainen rivivaihtoehto

4. Etsi neliöiden summa -vaihtoehto

5. jaa option neliöiden summa niiden lukumäärällä, ts. määrittää keskineliön

6. määritä piirteen keskineliön ja keskiarvon neliön välinen ero

Myös painotetun varianssin määrityskaava voidaan muuntaa seuraavaksi kaavaksi:

nuo. varianssi on yhtä suuri kuin piirrearvojen neliöiden keskiarvon ja aritmeettisen keskiarvon neliön välinen ero. Muunnettua kaavaa käytettäessä ylimääräinen menettely piirteen yksittäisten arvojen poikkeamien laskemiseksi x:stä suljetaan pois ja pyöristyspoikkeamiin liittyvä laskuvirhe suljetaan pois.

Dispersiolla on useita ominaisuuksia, joista osa helpottaa laskemista:

1) vakioarvon hajonta on nolla;

2) jos attribuuttiarvojen kaikkia muunnelmia vähennetään samalla numerolla, varianssi ei pienene;

3) jos attribuuttiarvojen kaikkia muunnelmia vähennetään saman verran (kertaa), niin varianssi pienenee kertoimella

Keskihajonta S- on varianssin neliöjuuri:

Ryhmittelemättömät tiedot:

;

Varianttisarjalle:

Vaihtelualue, keskimääräinen lineaarinen ja keskimääräinen neliöpoikkeama on nimetty suureiksi. Niillä on samat mittayksiköt kuin yksittäisillä ominaisarvoilla.

Dispersio ja keskihajonta ovat yleisimmin käytetyt vaihtelumitat. Tämä selittyy sillä, että ne sisältyvät useimpiin todennäköisyysteorian teoreemoihin, jotka toimivat matemaattisten tilastojen perustana. Lisäksi varianssi voidaan hajottaa sen osaelementeiksi, jolloin voidaan arvioida erilaisten tekijöiden vaikutusta, jotka aiheuttavat ominaisuuden vaihtelun.

Pankkien variaatioindikaattoreiden laskeminen tuloksen mukaan ryhmiteltynä on esitetty taulukossa.

Voitto, miljoonaa ruplaa Pankkien määrä laskettuja indikaattoreita
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Kaikki yhteensä: 121,70 17,640 23,126

Keskimääräinen lineaarinen ja keskimääräinen neliöpoikkeama osoittavat, kuinka paljon attribuutin arvo vaihtelee keskimäärin tutkittavana olevan yksikön ja populaation osalta. Joten tässä tapauksessa voiton määrän vaihtelun keskiarvo on: keskimääräisen lineaarisen poikkeaman mukaan 0,882 miljoonaa ruplaa; keskihajonnan mukaan - 1,075 miljoonaa ruplaa. Keskihajonta on aina suurempi kuin keskimääräinen lineaarinen poikkeama. Jos piirteen jakauma on lähellä normaalia, niin S:n ja d:n välillä on suhde: S=1,25d tai d=0,8S. Keskihajonta osoittaa, kuinka suurin osa perusjoukon yksiköistä sijaitsee suhteessa aritmeettiseen keskiarvoon. Jakaumamuodosta riippumatta 75 attribuuttiarvoa kuuluu x 2S -väliin ja vähintään 89 kaikista arvoista kuuluu x 3S -väliin (P.L. Chebyshev'n lause).

Geometrisen keskiarvon laskemiseksi yksinkertaiseksi käytetään kaavaa:

geometrisesti painotettu

Geometrisen painotetun keskiarvon määrittämiseksi käytetään kaavaa:

Pyörien, putkien ja neliöiden keskimääräiset sivut määritetään neliön keskiarvolla.

RMS-arvoja käytetään joidenkin indikaattoreiden laskemiseen, kuten variaatiokerroin, joka kuvaa tuotannon rytmiä. Tässä standardipoikkeama tietyn ajanjakson suunnitellusta tuotosta määritetään seuraavalla kaavalla:

Nämä arvot kuvaavat tarkasti taloudellisten indikaattoreiden muutosta verrattuna niiden perusarvoon sen keskiarvona otettuna.

Neliöllinen yksinkertainen

Keskineliö yksinkertainen lasketaan kaavalla:

Neliöpainotettu

Painotettu neliökeskiarvo on:

22. Absoluuttisia vaihtelumittareita ovat:

vaihteluväli

keskimääräinen lineaarinen poikkeama

dispersio

keskihajonta

Vaihteluväli (r)

Alueen vaihtelu on attribuutin enimmäis- ja vähimmäisarvojen välinen ero

Se näyttää rajat, joissa määritteen arvo muuttuu tutkittavassa populaatiossa.

Viiden hakijan työkokemus edellisestä työpaikasta on: 2,3,4,7 ja 9 vuotta. Ratkaisu: vaihteluväli = 9 - 2 = 7 vuotta.

Attribuutin arvojen erojen yleiselle ominaisuudelle lasketaan keskimääräiset vaihteluindikaattorit aritmeettisesta keskiarvosta poikkeamien huomioon ottamiseksi. Ero otetaan poikkeamana keskiarvosta.

Samaan aikaan, jotta ominaisuusvaihtoehtojen keskiarvosta poikkeamien summa (keskiarvon nolla-ominaisuus) ei muuttuisi nollaksi, on joko jätettävä huomiotta poikkeaman merkit, eli otettava tämä summa modulo , tai poikkeama-arvot neliöiksi

Keskimääräinen lineaarinen ja neliöpoikkeama

Keskimääräinen lineaarinen poikkeama on attribuutin yksittäisten arvojen absoluuttisten poikkeamien aritmeettinen keskiarvo keskiarvosta.

Keskimääräinen lineaarinen poikkeama on yksinkertainen:

Viiden hakijan työkokemus edellisestä työpaikasta on: 2,3,4,7 ja 9 vuotta.

Esimerkissämme: vuotta;

Vastaus: 2,4 vuotta.

Keskimääräinen lineaarinen poikkeama painotettu koskee ryhmiteltyjä tietoja:

Keskimääräistä lineaarista poikkeamaa, sen ehdollisuuden vuoksi, käytetään käytännössä suhteellisen harvoin (erityisesti luonnehtimaan sopimusvelvoitteiden täyttämistä toimitusten yhtenäisyyden kannalta; tuotteen laadun analysoinnissa tuotannon teknologiset ominaisuudet huomioon ottaen ).

Vakiopoikkeama

Täydellisin vaihtelun ominaisuus on standardipoikkeama, jota kutsutaan standardiksi (tai standardipoikkeamaksi). Vakiopoikkeama() on yhtä suuri kuin attribuutin yksittäisten arvojen aritmeettisesta keskiarvosta poikkeamien keskineliön neliöjuuri:

Keskihajonta on yksinkertainen:

Painotettua keskihajontaa sovelletaan ryhmiteltyihin tietoihin:

Keskineliön ja keskimääräisen lineaarisen poikkeaman välillä normaalijakauman olosuhteissa tapahtuu seuraava suhde: ~ 1.25.

Keskihajontaa, joka on tärkein absoluuttinen variaation mitta, käytetään normaalijakaumakäyrän ordinaattien arvojen määrittämisessä, näytteen havainnoinnin järjestämiseen ja näytteen ominaisuuksien tarkkuuden määrittämiseen liittyvissä laskelmissa sekä arvioida ominaisuuden vaihtelun rajoja homogeenisessa populaatiossa.

Keskihajonta on yksi niistä tilastollisista termeistä yritysmaailmassa, joka nostaa niiden ihmisten profiilia, jotka onnistuvat sotkemaan sen onnistuneesti keskustelussa tai esityksessä, ja jättää epämääräisen väärinkäsityksen niille, jotka eivät tiedä mitä se on, mutta häpeää kysyä. Itse asiassa useimmat johtajat eivät ymmärrä keskihajonnan käsitettä, ja jos olet yksi heistä, sinun on aika lopettaa valheen eläminen. Tämän päivän artikkelissa näytän sinulle, kuinka tämä aliarvioitu tilasto voi auttaa sinua ymmärtämään käsittelemääsi dataa paremmin.

Mitä keskihajonta mittaa?

Kuvittele, että olet kahden liikkeen omistaja. Ja tappioiden välttämiseksi on tärkeää, että varastosaldoa valvotaan selkeästi. Yrittääksesi selvittää, kuka on paras osakepäällikkö, päätät analysoida osakkeita viimeisen kuuden viikon ajalta. Molempien myymälöiden varaston keskimääräinen viikkohinta on suunnilleen sama ja on noin 32 tavanomaista yksikköä. Ensi silmäyksellä osakkeen keskiarvo osoittaa, että molemmat johtajat työskentelevät samalla tavalla.

Mutta jos tarkastelet tarkemmin toisen kaupan toimintaa, voit nähdä, että vaikka keskiarvo on oikea, varaston vaihtelu on erittäin korkea (10 - 58 USD). Siten voidaan päätellä, että keskiarvo ei aina arvioi dataa oikein. Tässä tulee standardipoikkeama.

Keskihajonta näyttää kuinka arvot jakautuvat suhteessa keskiarvoon. Toisin sanoen voit ymmärtää, kuinka suuri valuma on viikoittain.

Esimerkissämme käytimme Excel-funktiota STDEV laskeaksemme keskihajonnan keskiarvon kanssa.

Ensimmäisen esimiehen tapauksessa keskihajonta oli 2. Tämä kertoo meille, että jokainen otoksen arvo poikkeaa keskimäärin 2:lla keskiarvosta. Onko se hyvää? Tarkastellaan kysymystä eri näkökulmasta - keskihajonna 0 kertoo meille, että jokainen näytteen arvo on yhtä suuri kuin sen keskiarvo (tässä tapauksessa 32,2). Esimerkiksi 2:n keskihajonta ei eroa paljoa 0:sta, mikä osoittaa, että suurin osa arvoista on lähellä keskiarvoa. Mitä lähempänä keskihajonta on nollaa, sitä luotettavampi on keskiarvo. Lisäksi standardipoikkeama lähellä nollaa osoittaa vain vähän vaihtelua tiedoissa. Eli nieluarvo, jonka keskihajonna on 2, osoittaa ensimmäisen esimiehen uskomattoman johdonmukaisuuden.

Toisen myymälän tapauksessa keskihajonna oli 18,9. Eli valuman hinta poikkeaa viikoittain keskimäärin 18,9 % keskiarvosta. Hullu leviäminen! Mitä kauempana keskihajonta on 0:sta, sitä epätarkempi keskiarvo. Meidän tapauksessamme luku 18,9 osoittaa, että keskiarvoon (32,8 dollaria viikossa) ei yksinkertaisesti voi luottaa. Se kertoo myös, että viikoittainen valuma on erittäin vaihtelevaa.

Tämä on keskihajonnan käsite pähkinänkuoressa. Vaikka se ei anna käsitystä muista tärkeistä tilastollisista mittauksista (moodi, mediaani…), itse asiassa keskihajonnalla on ratkaiseva rooli useimmissa tilastollisissa laskelmissa. Keskihajonnan periaatteiden ymmärtäminen valaisee monien toimintasi prosessien ydintä.

Kuinka laskea keskihajonta?

Joten nyt tiedämme, mitä keskihajonnan luku sanoo. Katsotaan kuinka se lasketaan.

Tarkastellaan tietojoukkoa 10:stä 70:een 10:n välein. Kuten näet, olen jo laskenut niiden keskihajonnan käyttämällä STDEV-funktiota solussa H2 (oranssi).

Alla on vaiheet, joilla Excel saapuu 21.6.

Huomaa, että kaikki laskelmat on visualisoitu paremman ymmärtämisen vuoksi. Itse asiassa Excelissä laskenta on välitöntä, jolloin kaikki vaiheet jäävät kulissien taakse.

Excel löytää ensin otoksen keskiarvon. Meidän tapauksessamme keskiarvoksi muodostui 40, joka vähennetään kustakin näytearvosta seuraavassa vaiheessa. Jokainen tuloksena oleva ero neliötetään ja lasketaan yhteen. Saimme summan, joka on 2800, joka on jaettava näytealkioiden lukumäärällä miinus 1. Koska meillä on 7 alkiota, käy ilmi, että meidän on jaettava 2800 kuudella. Tuloksesta löydämme neliöjuuren, tämä luku on keskihajonta.

Niille, jotka eivät ole täysin selvillä periaatteessa keskihajonnan laskemisesta visualisoinnin avulla, annan matemaattisen tulkinnan tämän arvon löytämisestä.

Keskihajonnan laskentafunktiot Excelissä

Excelissä on useita erilaisia ​​keskihajontakaavoja. Sinun tarvitsee vain kirjoittaa =STDEV ja näet itse.

On syytä huomata, että funktiot STDEV.V ja STDEV.G (luettelon ensimmäinen ja toinen funktio) kopioivat funktiot STDEV ja STDEV (luettelon viides ja kuudes funktio), jotka säilytettiin yhteensopivuuden vuoksi aikaisempien kanssa. Excelin versiot.

Yleensä ero päätteissä In ja G -funktiot osoittavat otoksen tai perusjoukon keskihajonnan laskentaperiaatteen. Selitin jo näiden kahden taulukon eron edellisessä.

STDEV- ja STDEVPA-funktioiden (luettelon kolmas ja neljäs funktio) ominaisuus on, että taulukon keskihajonnan laskennassa otetaan huomioon loogiset ja tekstiarvot. Teksti ja oikeat loogiset arvot ovat 1 ja väärät loogiset arvot ovat 0. Minun on vaikea kuvitella tilannetta, jossa tarvitsisin näitä kahta funktiota, joten mielestäni ne voidaan jättää huomiotta.

Kokemuksesta saadut arvot sisältävät väistämättä virheitä useista syistä. Niistä tulisi erottaa systemaattiset ja satunnaiset virheet. Systemaattiset virheet johtuvat hyvin spesifisesti vaikuttavista syistä ja ne voidaan aina poistaa tai ottaa huomioon riittävällä tarkkuudella. Satunnaiset virheet johtuvat erittäin suuresta määrästä yksittäisiä syitä, joita ei voida ottaa tarkasti huomioon ja jotka toimivat eri tavalla jokaisessa yksittäisessä mittauksessa. Näitä virheitä ei voida täysin sulkea pois; ne voidaan ottaa huomioon vain keskimäärin, jolloin on tiedettävä lait, joihin satunnaiset virheet kohdistuvat.

Merkitään mitattu arvo A:lla ja satunnaisvirhe mittauksessa x. Koska virhe x voi saada minkä tahansa arvon, se on jatkuva satunnaismuuttuja, jolle on täysin ominaista oma jakautumislaki.

Yksinkertaisin ja tarkimmin todellisuutta heijastava (useimmissa tapauksissa) on ns normaali virheiden jakautuminen:

Tämä jakautumislaki voidaan saada erilaisista teoreettisista lähtökohdista, erityisesti vaatimuksesta, jonka mukaan tuntemattoman suuren todennäköisin arvo, jolle saadaan suoralla mittauksella saman tarkkuuden arvosarja, on aritmeettinen keskiarvo. näitä arvoja. Arvoa 2 kutsutaan dispersio tästä normaalista laista.

Keskiverto

Dispersion määritys kokeellisten tietojen perusteella. Jos jollekin suurelle A saadaan n arvot a i suoralla mittauksella samalla tarkkuudella ja jos suuren A virheet ovat normaalijakauman lain alaisia, niin A:n todennäköisin arvo on keskiverto:

a - aritmeettinen keskiarvo,

a i - mitattu arvo i:nnessä vaiheessa.

Havaitun arvon poikkeama (kunkin havainnon osalta) a i arvosta A aritmeettinen keskiarvo: a i - a.

Virheiden normaalijakauman hajaantumisen määrittämiseksi tässä tapauksessa käytä kaavaa:

2 - dispersio,
a - aritmeettinen keskiarvo,
n on parametrien mittausten lukumäärä,

keskihajonta

keskihajonta näyttää mitattujen arvojen absoluuttisen poikkeaman aritmeettinen keskiarvo. Lineaarisen yhdistelmän tarkkuusmittauksen kaavan mukaisesti juuren keskimääräinen neliövirhe aritmeettinen keskiarvo määritetään kaavalla:

, missä


a - aritmeettinen keskiarvo,
n on parametrien mittausten lukumäärä,
a i - mitattu arvo i:nnessä vaiheessa.

Variaatiokerroin

Variaatiokerroin luonnehtii mitattujen arvojen suhteellista poikkeaman astetta aritmeettinen keskiarvo:

, missä

V - variaatiokerroin,
- keskihajonta,
a - aritmeettinen keskiarvo.

Mitä suurempi arvo variaatiokerroin, mitä suhteellisesti suurempi hajonta ja sitä pienempi on tutkittujen arvojen tasaisuus. Jos variaatiokerroin alle 10 %, silloin vaihtelusarjan vaihtelua pidetään merkityksettömänä, 10 % - 20 % tarkoittaa keskiarvoa, yli 20 % ja alle 33 % merkitsevää, ja jos variaatiokerroin yli 33%, tämä osoittaa tiedon heterogeenisyyttä ja tarvetta jättää pois suurimmat ja pienimmät arvot.

Keskimääräinen lineaarinen poikkeama

Yksi vaihteluvälin ja intensiteetin indikaattoreista on keskimääräinen lineaarinen poikkeama(keskimääräinen poikkeamamoduuli) aritmeettisesta keskiarvosta. Keskimääräinen lineaarinen poikkeama lasketaan kaavalla:

, missä

_
a - keskimääräinen lineaarinen poikkeama,
a - aritmeettinen keskiarvo,
n on parametrien mittausten lukumäärä,
a i - mitattu arvo i:nnessä vaiheessa.

Tutkittujen arvojen yhteensopivuuden tarkistamiseksi normaalijakauman lain kanssa käytetään suhdetta epäsymmetriaindeksi hänen virheensä ja asenteensa vuoksi kurtosis-indikaattori hänen virheensä.

Epäsymmetriaindeksi

Epäsymmetriaindeksi(A) ja sen virhe (m a) lasketaan seuraavilla kaavoilla:

, missä

A - epäsymmetrian ilmaisin,
- keskihajonta,
a - aritmeettinen keskiarvo,
n on parametrien mittausten lukumäärä,
a i - mitattu arvo i:nnessä vaiheessa.

Kurtoosi-indikaattori

Kurtoosi-indikaattori(E) ja sen virhe (m e) lasketaan seuraavilla kaavoilla:

, missä

Keskihajonta on klassinen vaihtelun indikaattori kuvaavista tilastoista.

Vakiopoikkeama, keskihajonta, RMS, otoksen keskihajonta (englanniksi standardipoikkeama, STD, STDev) on hyvin yleinen hajontamitta kuvaavissa tilastoissa. Mutta koska Tekninen analyysi on samankaltainen kuin tilastot, tätä indikaattoria voidaan (ja pitäisi) käyttää teknisessä analyysissä analysoitavan instrumentin hinnan hajoamisasteen havaitsemiseksi ajan kuluessa. Merkitään kreikkalaisella symbolilla Sigma "σ".

Kiitos Karl Gaussille ja Pearsonille siitä, että meillä on mahdollisuus käyttää keskihajontaa.

Käyttämällä keskihajonta teknisessä analyysissä, käännämme tämän "sirontaindeksi" sisään "volatiliteettiindikaattori"Merkityksen säilyttäminen, mutta termien muuttaminen.

Mikä on standardipoikkeama

Mutta välitason apulaskelmien lisäksi keskihajonta on varsin hyväksyttävä itselaskennassa ja sovellukset teknisessä analyysissä. Kuten yksi aktiivinen lehden takiainen lukija totesi, " En edelleenkään ymmärrä, miksi RMS ei sisälly kotimaisten kauppakeskusten standardiindikaattoreihin«.

Todella, keskihajonta voi klassisella ja "puhtaalla" tavalla mitata instrumentin vaihtelua. Mutta valitettavasti tämä indikaattori ei ole niin yleinen arvopaperianalyysissä.

Standardipoikkeaman soveltaminen

Keskihajonnan manuaalinen laskeminen ei ole kovin mielenkiintoista. mutta hyödyllinen kokemukselle. Keskihajonta voidaan ilmaista kaava STD=√[(∑(x-x ) 2)/n] , joka kuulostaa otoskohteiden ja keskiarvon neliöerojen juurisummalta jaettuna otoksen kohteiden lukumäärällä.

Jos alkioiden lukumäärä näytteessä ylittää 30, niin juuren alla olevan murto-osan nimittäjä saa arvon n-1. Muussa tapauksessa käytetään n:ää.

askel askeleelta keskihajonnan laskenta:

  1. laskea datanäytteen aritmeettinen keskiarvo
  2. vähennä tämä keskiarvo jokaisesta otoksen elementistä
  3. kaikki tuloksena saadut erot on neliöity
  4. summaa kaikki tuloksena saadut neliöt
  5. jaa saatu summa näytteen alkioiden lukumäärällä (tai n-1:llä, jos n>30)
  6. laskea tuloksena olevan osamäärän neliöjuuri (kutsutaan dispersio)