Metode de netezire și egalizare a seriilor temporale. Elaborarea unei prognoze folosind metoda mediei mobile

O analiză aprofundată a seriilor de timp necesită utilizarea unor metode mai complexe de statistică matematică. Dacă există o eroare aleatorie semnificativă (zgomot) în seria de timp, se utilizează una dintre cele două metode simple - netezirea sau nivelarea prin mărirea intervalelor și calcularea mediilor de grup. Această metodă vă permite să creșteți vizibilitatea seriei, dacă majoritatea componentelor „zgomote” sunt în interiorul intervalelor. Totuși, dacă „zgomotul” nu este în concordanță cu periodicitatea, distribuția nivelurilor de indicator devine aspră, ceea ce limitează posibilitatea unei analize detaliate a schimbării fenomenului în timp.

Se obțin caracteristici mai precise dacă se utilizează medii mobile - o metodă utilizată pe scară largă pentru netezirea indicatorilor seriei medii. Se bazează pe trecerea de la valorile inițiale ale seriei la valorile medii într-un anumit interval de timp. În acest caz, intervalul de timp în timpul calculului fiecărui indicator ulterior, așa cum ar fi, alunecă de-a lungul seriei temporale.

Utilizarea unei medii mobile este utilă atunci când tendințele serielor cronologice sunt incerte sau când valorile aberante ciclice (valori anormali sau intervenții) sunt puternic afectate.

Cu cât intervalul de netezire este mai mare, cu atât graficul cu medie mobilă arată mai neted. Atunci când se alege valoarea intervalului de netezire, este necesar să se pornească de la valoarea seriei dinamice și sensul semnificativ al dinamicii reflectate. O serie temporală mare cu un număr mare de puncte inițiale permite utilizarea unor intervale de timp de netezire mai mari (5, 7, 10 etc.). Dacă procedura medie mobilă este utilizată pentru a netezi o serie non-sezonieră, atunci cel mai adesea intervalul de netezire este luat egal cu 3 sau 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - a mare oportunitate de a alege o companie aeriană pentru un zbor de la Moscova la New York

Să dăm un exemplu de calcul al numărului mediu mobil de ferme cu producții mari (mai mult de 30 kg/ha) (Tabelul 10.3).

Tabelul 10.3 Netezirea seriei temporale prin intervale grosiere și medie mobilă

Anul contabil

Numărul de ferme cu producții mari

Sume pe trei ani

Se rulează pe trei ani

medii mobile

90,0

89,7

1984

88,7

87,3

87,3

87,0

86,7

83,0

83,0

82,3

82,3

82,6

82,7

82,7

Exemple de calcul a mediei mobile:

1982 (84 + 94 + 92) / 3 = 90,0;

1983 (94 + 92 + 83) / 3 = 89,7;

1984 (92 + 83 + 91) / 3 = 88,7;

1985 (83 + 91 + 88) / 3 = 87,3.

Se întocmește un orar. Pe axa absciselor sunt indicați anii, iar pe axa ordonatelor este indicat numărul de ferme cu producții mari. Pe grafic sunt indicate coordonatele numărului de ferme, iar punctele obținute sunt legate printr-o linie întreruptă. Apoi, coordonatele mediei mobile de-a lungul anilor sunt indicate pe diagramă, iar punctele sunt conectate printr-o linie netedă și îndrăzneață.

O metodă mai complexă și mai eficientă este netezirea (nivelarea) seriilor de timp folosind diverse funcții de aproximare. Ele vă permit să formați un nivel neted al tendinței generale și al axei principale a dinamicii.

Cea mai eficientă metodă de netezire cu funcții matematice este netezirea exponențială simplă. Această metodă ia în considerare toate observațiile anterioare ale seriei conform formulei:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

unde S t este fiecare nouă netezire la momentul t ; S t - 1 - valoare netezită la momentul anterior t -1; X t este valoarea reală a seriei la momentul t ; α - parametru de netezire.

Dacă α = 1, atunci observațiile anterioare sunt complet ignorate; când α = 0, observațiile curente sunt ignorate; valorile α între 0 și 1 dau rezultate intermediare. Prin modificarea valorilor acestui parametru, puteți alege cea mai acceptabilă opțiune de aliniere. Alegerea valorii optime a lui α se realizează prin analiza imaginilor grafice obținute ale curbelor originale și nivelate, sau luând în considerare suma erorilor (erorilor) pătrate a punctelor calculate. Utilizarea practică a acestei metode trebuie efectuată folosind un computer în programul MS Excel. Expresia matematică a modelelor de dinamică a datelor poate fi obținută folosind funcția de netezire exponențială.

Econometrie 1 modul
1. În ce lege au fost clarificate modelele cererii pe baza relației dintre recolta de cereale și prețurile cerealelor?
în Legea Regelui
2. Cum se numește măsura răspândirii unei variabile aleatoare?
dispersie
3. Când se studiază ce modele, cercetarea econometrică poate include identificarea tendințelor, a decalajelor și a componentelor ciclice?
modele serii de timp
4. Care dintre următoarele scale nu aparține principalelor scale de trăsături calitative?
scara relațiilor
5. Cine a fondat revista „Econometrics”?
R. Frisch
6. Care dintre următoarele pot include cercetarea econometrică în stadiul actual de dezvoltare în studiul modelelor din observații aleatoare independente?
estimarea parametrilor modelului
7. Care scară are o unitate naturală de măsură, dar nu are un punct de referință natural?
în scară de diferență
8. Care om de știință a creat teoria modelelor integrate ale mediei mobile autoregresive ¾?
J. Box şi G. Jenkins
9. În ce sistem este considerată fiecare variabilă explicată în funcție de același set de factori?
în sistemul de ecuaţii independente
10. Ce scară de măsurare se referă la scalele trăsăturilor cantitative?
scala intervalului
11. Ce modele econometrice au fost dezvoltate în anii 80 - începutul anilor 90. RE. Eagle, T. Bolleslev și Nelson?
modele autoregresive de heteroscedasticitate condiționată
12. Ce scale de măsurare sunt cele mai comune și mai convenabile?
scalele de relație
13. Care om de știință a primit Premiul Nobel în 1980 pentru aplicarea modelelor econometrice la analiza fluctuațiilor economice și a politicii economice?
L. Klein
14. În ce țară a fost creată prima societate econometrică internațională?
în S.U.A
15. Care dintre următoarele este o componentă constantă a unei variabile aleatoare?
medie aritmetică
16. Care este scopul econometriei ca știință? (după E. Malenvo)
analiza empirică a legilor economice
17. Care dintre cercetători a dat o interpretare largă a econometriei, interpretând-o ca orice aplicare a metodelor matematice sau statistice la studiul fenomenelor economice?
E. Malenvo
18. Ce componente sunt incluse în compoziția variabilelor aleatoare în procesul de analiză?
componente constante și aleatorii
19. Care este media unei componente aleatoare sau a unui rest?
0
20. Cine a introdus primul termenul „econometrie”?
P. Tsempa
21. Care dintre oamenii de știință autohtoni de la nivelul Uniunii au descris dinamica randamentelor culturilor de cereale cu ecuații cu un număr mic de parametri?
V. Obukhov
22. Ce secțiuni conține econometria?
modelarea datelor dezordonate în timp și teoria seriilor temporale
23. Ce caracteristici ale economiei nu pot fi măsurate direct?
caracteristici latente
24. Care dintre oamenii de știință s-a ocupat de problema ciclicității?
K. Juglar
25. Cine este autorul primei cărți de econometrie, The Laws of Wages: Essays in Statistical Economics?
G. Moore

2 module
1. Dacă regresia este semnificativă, atunci
Fobs>Fcrit
2. Ce arată valoarea coeficientului de regresie?
modificarea medie a rezultatului cu o modificare a factorului cu o unitate
3. Ce înseamnă coincidența mediei estimării eșantionului cu valoarea necunoscută a parametrului corespunzător pentru populația generală?
imparțialitatea
4. Care este regresia dacă k= 2?
multiplu
5. Ce caracterizează dispersia (deviația) punctelor de observație în raport cu curba de regresie?
regresie reziduală
6. Ce coeficient este un indicator al etanșeității conexiunii?
coeficient de corelație liniară
7. Ce valoare este pur și simplu media sumei pătratelor reziduurilor (abaterilor)?
regresie reziduală
8. Ce expresie determină coeficientul de corelație, care este o măsură a relației liniare dintre variabilele aleatoare x și y?
r(x, y)=…
9. Ce valoare nu trebuie să depășească eroarea medie de aproximare?
7-8%
10. Cine a inventat termenul de „regresie”?
F. Galton
11. Ce factor din funcția de consum este utilizat pentru a calcula multiplicatorul?
coeficient de regresie
12. Ce coeficient se folosește pentru a determina calitatea selecției unei funcții liniare?
folosind coeficientul de determinare
13. Ce expresie determină coeficientul de corelație al eșantionului?
r(x,y) cu pătrate
14. Ce se numește o caracteristică eficientă în analiza regresiei?
variabilă dependentă
15. Varianta a ce variabilă este analizată prin analiza varianței?
variabilă dependentă
16. Ce regresie se caracterizează printr-o interpretare transparentă a parametrilor modelului?
regresie liniara
17. Ce coeficient caracterizează proporția varianței explicată prin regresie în varianța totală a caracteristicii rezultate y?
coeficient de determinare
18. Ce coeficient arată cu câte procente, în medie, se va schimba rezultatul y față de valoarea sa medie atunci când factorul x se va modifica cu 1% față de valoarea sa medie (factorul x)?
coeficient de elasticitate
19. Care este valoarea variației reziduale dacă valorile reale ale caracteristicii efective coincid cu valorile teoretice sau calculate?
0
20. Ce metodă se utilizează pentru estimarea parametrilor a, b ai ecuației de regresie?
metoda celor mai mici pătrate (LSM)
21. Ce metodă se bazează pe cerința de a minimiza suma abaterilor pătrate a valorilor reale ale atributului efectiv față de cele calculate?
metoda celor mai mici pătrate
22. La ce valoare a lui k se numește regresia pereche?
k=1
23. Care dintre următoarele nu se aplică regresiilor neliniare asupra parametrilor estimați?
functie exponentiala
24. Esența teoremei este că, dacă o variabilă aleatoare este rezultatul general al interacțiunii unui număr mare de alte variabile aleatoare, dintre care niciuna nu are un efect predominant asupra rezultatului general, atunci o astfel de variabilă aleatoare rezultată va fi descrisă printr-o distribuție aproximativ normală?
teorema limitei centrale
25. Ce ecuație descrie regresia liniară?
y = a + bx + ε
(3 greseli)

3 module ()1 eroare
1. Cum este verificată heteroscedasticitatea modelelor în testul asimptotic Breusch și Pagan?
după criteriul c2(r)
2. Ce criteriu vă permite să alegeți cel mai bun model din multe specificații diferite și este construit numeric în așa fel încât să țină cont de influența a două tendințe opuse asupra calității potrivirii modelului?
criteriul Schwartz
3. După ce valoare se apreciază calitatea modelului?
prin eroarea relativă medie de aproximare
4. Ce expresie descrie condiția de omogenitate (homoscedasticitate) a observațiilor?
s2(yu)=s2(hu+eu)=s2(eu)=s2
5. Ce metodă este aplicabilă cu condiția ca matricea de covarianță a vectorului de eroare să fie diagonală?
metoda celor mai mici pătrate
6. Ce expresie determină eroarea absolută de aproximare?
yi-y1i=e
7. Ce se înțelege prin multicoliniaritate?
grad ridicat de corelare a variabilelor explicative
8. Care variabile sunt variabilele originale din care se scad mediile corespunzătoare, iar diferența rezultată se împarte la abaterea standard?
variabile standardizate
9. Ce eroare de pe proba de control indică calitatea bună a modelului construit?
4-9%
10. Ce metodă poate fi folosită pentru a evalua semnificația factorilor de multicoliniaritate?
metoda de testare a ipotezei de independenţă a variabilelor
11. Ce variabilă ar trebui exprimată ca funcție liniară a unei variabile necunoscute?
variabilă substitutivă
12. Dispersiile și covarianțele erorilor de observație în modelul liniar generalizat de regresie multiplă
poate fi arbitrară
13. Care este a doua abordare pentru rezolvarea problemei heteroscedasticității?
în construirea unor modele care să ţină cont de heteroscedasticitatea erorilor de observaţie
14. Care este coeficientul de regresie standardizat în cel mai simplu caz de regresie în perechi?
coeficient de corelație liniară
15. Care dintre următoarele este folosită pentru a testa ipoteza dacă cercetătorul presupune că în perioada de observație au avut loc schimbări structurale abrupte sub formă de relații între variabilele dependente și independente?
test de mâncare
16. Care este determinantul matricei dacă există o dependență liniară completă între factori și toți coeficienții de corelație sunt egali cu 1?
0
17. Ce formulă se utilizează pentru a calcula coeficienții modelului atunci când se folosește metoda regresiei crestei?
bgr= (XTX+DgrIk+ 1)-1XTY
18. Conform teoremei lui Aitken, ce formulă se folosește pentru estimarea coeficienților modelului?
b= (X¢W-1X)-1X¢W-1Y
19. Care dintre următoarele teste nu necesită ipoteza că distribuția reziduurilor de regresie este normală?
Testul de corelare a rangului lui Spearman
20. Care este numele variabilei care ar trebui să fie în model conform teoriei corecte?
esenţial
21. Cu cât este mai aproape de unul valoarea determinantului matricei de corelație interfactorială, cu
mai puțină multicoliniaritate a factorilor
22. Ce criteriu este folosit pentru a evalua semnificația ecuației de regresie în ansamblu?
Testul F Fisher
23. Ce indicator fixează proporția variației explicate a atributului efectiv datorită factorilor considerați în regresie?
indicator de determinare
24. Ce coeficienți permit excluderea factorilor duplicați din model?
coeficienții de intercorelație
25. Care este numărul de grade de libertate al sumei reziduale de pătrate în regresie liniară?
n-2
Modulul 4
1. Care sunt etapele implicate în procesul de modelare structurală?
toți pașii de mai sus
2. Esența cărei metode este înlocuirea parțială a unei variabile explicative inutilizabile cu o variabilă care nu este corelată cu un membru aleatoriu?
metoda variabilei instrumentale
3. Ce reprezintă variabila x din expresie?
proces perturbator
4. În ce condiție are caracter „exploziv” soluția generală a unei ecuații la diferență de formă?
pentru |a1|> 2
5. Care sunt numele variabilelor interdependente care sunt determinate în cadrul modelului (în cadrul sistemului însuși) și notate cu y?
variabile endogene
6. În ce model, pe baza coeficienților formei reduse, se pot obține două sau mai multe valori ale unui coeficient structural?
într-un supraidentificat
7. Ce coeficienți se numesc coeficienți structurali ai modelului?
coeficienți pentru variabile endogene și exogene în forma structurală a modelului
8. Ce metodă, cu informații limitate, se numește metoda cu cel mai mic raport de dispersie?
metoda cu maxima probabilitate
9. Care sunt numele variabilelor legate de momentele anterioare din timp?
variabile de lag
10. Dacă o mulțime de numere X este legată de un alt set de numere Y prin Y = 4X, atunci varianța lui Y trebuie să fie
De 16 ori mai mare decât varianța X
11. Ce metodă se utilizează pentru rezolvarea sistemului identificat?
cele mai mici pătrate indirecte
12. Ce variabile sunt înțelese ca variabile predefinite?
variabile exogene și variabile endogene întârziate
13. Ce metodă este folosită dacă trebuie doar să clarificați natura relațiilor variabilelor?
metoda analizei traseului
14. Ce vă permite să faceți construcția de modele ale structurii de corelație?
testați ipoteza că matricea de corelație are o anumită formă
15. Care este modelul dacă toți coeficienții săi structurali sunt determinați în mod unic de coeficienții formei reduse a modelului și numărul de parametri din ambele forme ale modelului este același?
identificabile
16. Ce expresie determină dependența consumului în anul cu numărul t de venitul din perioada anterioară y(t- 1)?
C(t)=b+cy(t- 1)
17. Care sunt numele variabilelor independente care sunt determinate în afara sistemului și sunt notate cu x?
variabile exogene
18. În ce condiție este considerat identificabil întregul model?
dacă cel puţin o ecuaţie a sistemului este identificabilă
19. Când este un model neidentificabil?
dacă numărul de coeficienţi redusi este mai mic decât numărul de coeficienţi structurali
20. Ce variabile trebuie introduse adesea pentru a explica influența factorilor calitativi?
variabile fictive
21. Ce vă permite să faceți construcția de modele ale structurii mediilor?
explorați structura mijloacelor concomitent cu analiza varianțelor și covarianțelor
22. Ce variabile ar putea include modele cauzale?
variabile explicite și latente
23. În ce condiție este ecuația neidentificabilă?
dacă numărul de variabile predefinite care nu sunt prezente în ecuație, dar prezente în sistem, crescut cu unu, este mai mic decât numărul de variabile endogene din ecuație
24. La rezolvarea expresiei prin metoda deplasării „înapoi”, erorile ei
acumula
25. Ce se poate face prin modelarea structurii de covarianță?
testați ipoteza că matricea de covarianță are o anumită formă

4 module
1. Ce indică valorile mari apropiate de 1 (1 - a1) ale modelului de corectare a erorilor (ECM)?
că factorii economici modifică puternic rezultatul
2. În câte segmente este împărțită secvența pentru a verifica starea de staționaritate a seriei?
în două secțiuni
3. Pentru a reduce amplitudinea de oscilație a seriei netezite Y(t), este necesar
măriți lățimea intervalului de netezire m
4. Care ipoteză este una dintre ipotezele anterioare atunci când se aplică teste parametrice pentru a testa staționaritatea?
ipoteza despre legea normală de distribuție a valorilor seriilor temporale
5. Ce se numește o serie de timp?
o succesiune de valori caracteristice luate pe mai multe puncte de timp sau perioade consecutive
6. Cum se modifică varianța seriei Y(t) netezite printr-un polinom pătratic cu o creștere a numărului m de ecuații?
scade
7. Ce tendințe se corelează între ele?
temporar
8. Care dintre următoarele este folosită pentru a testa staționaritatea unei serii de timp?
criteriul staționarității în serie
9. Cum se numește dependența de corelație dintre nivelurile succesive ale seriei de timp?
autocorelare a nivelurilor seriei
10. Care este numele unei variabile aleatoare cu varianță variabilă?
heteroscedastic
11. În ce condiție se numește netezirea unei serii centrată?
pentru k=l
12. Cum poate fi exclusă tendința temporală din variabila rezultată?
prin construirea unei regresii a acelei variabile în timp și trecând la reziduuri care formează o nouă variabilă staționară deja fără tendințe
13. Prin ce formulă se calculează coeficienții dacă luăm drept polinom de netezire?
ar= 1/m
14. Ce componentă explică abaterile de la tendință cu o frecvență de 2 până la 10 ani?
componentă ciclică
15. Care este parametrul L din expresie?
funcția de probabilitate
16. Ce succesiune este zgomotul alb?
dacă fiecare variabilă aleatorie a secvenței are medie zero și este necorelată cu alte elemente ale secvenței
17. Cărei clasă aparține o serie dacă conține rădăcini unitare și este integrabilă cu ordinul d?
eu (d)
18. Care este numele unei variabile stocastice cu varianță constantă?
variabilă homoscedastică
19. Ce principiu de elaborare a prognozelor presupune respectarea, apropierea maximă a modelelor teoretice de procesele reale de producție și economice?
adecvarea prognozei
20. Cum se numește numărul de valori ale seriei originale care participă simultan la netezire?
lățimea intervalului de netezire
21. Care sunt principiile de bază pentru elaborarea prognozelor?
consecvență, adecvare, alternativitate
22. Pentru ce se utilizează criteriul serial al staționarității?
pentru a verifica staționaritatea seriei temporale
23. Cum se numește modelul de vedere?
model heteroscedastic condiționat autoregresiv (model ARHG)
24. Ce reprezintă ecuația?
Procesul APCC pentru secvența (et2).
25. Ce variabile sunt folosite în procesul de mers aleatoriu?
variabile non-staționare necorelate

Păducel comun Pducel comun Clasificare științifică Regatul: Plante ... Wikipedia

Netezirea exponențială este o metodă de transformare matematică folosită în prognoza serii de timp... Wikipedia

Indicator stocastic- (Oscilator Stochastic) Oscilator Stochastic, descrierea Stochasticului, versiuni ale indicatorului de tendință Stochastic, Semnale de tranzacționare ale indicatorului Stochastic Adăugarea indicatorului Stochastic la graficul terminalului de tranzacționare Metatrader (MT), setarea ... ... Enciclopedia investitorului

Cuprins: I. Eseul fizic. 1. Compoziție, spațiu, coastă. 2. Orografie. 3. Hidrografie. 4. Clima. 5. Vegetația. 6. Fauna. II. Populația. 1. Statistici. 2. Antropologie. III. eseu economic. 1. Agricultura. 2.… …

I HARTA IMPERIULUI JAPONEZ. Cuprins: I. Eseul fizic. 1. Compoziție, spațiu, coastă. 2. Orografie. 3. Hidrografie. 4. Clima. 5. Vegetația. 6. Fauna. II. Populația. 1. Statistici. 2. Antropologie. III. eseu economic. unu … Dicţionar enciclopedic F.A. Brockhaus și I.A. Efron

I Ural este un teritoriu situat între câmpiile est-europene și vestul Siberiei și se întinde de la nord la sud de la nord. Oceanul Arctic până la secțiunea latitudinală a râului. Ural sub orașul Orsk. Partea principală a acestuia este sistemul muntos Ural, ......

Schizane erbacee, mai rar ferigi asemănătoare lianelor, în principal tropicale și subtropicale. Doar câteva specii se găsesc în zonele temperate din America de Nord și Japonia, Chile, Noua Zeelandă, Tasmania și Africa de Sud. Schizane, ...... Enciclopedia biologică

Acest termen are alte semnificații, vezi Poză (sensuri). Postura (din franceză poză prin germană, mai devreme din latină pono (supin positum) „pune, pune”) poziția luată de corpul uman, poziția corpului, a capului și ... ... Wikipedia

Poziție (lat. positum a pune, pune; fr: pose) poziția luată de corpul uman, poziția corpului, a capului și a membrelor unul față de celălalt. Cuprins 1 Caracteristicile generale ale posturii ... Wikipedia

Ural, teritoriul situat între câmpiile est-europene și vestul Siberiei și alungit de la nord la sud de la nord. Oceanul Arctic până la secțiunea latitudinală a râului. Ural sub orașul Orsk. Partea principală a acestuia este sistemul muntos Ural, ...... Marea Enciclopedie Sovietică

16.02.15 Viktor Gavrilov

38133 0

O serie temporală este o succesiune de valori care se modifică în timp. Voi încerca să vorbesc despre câteva abordări simple, dar eficiente pentru a lucra cu astfel de secvențe în acest articol. Există o mulțime de exemple de astfel de date - cotații valutare, volume de vânzări, solicitări ale clienților, date din diverse științe aplicate (sociologie, meteorologie, geologie, observații în fizică) și multe altele.

Seriile sunt o formă comună și importantă de descriere a datelor, deoarece ne permit să observăm întreaga istorie a modificării valorii care ne interesează. Acest lucru ne oferă posibilitatea de a judeca comportamentul „tipic” al cantității și abaterile de la un astfel de comportament.

M-am confruntat cu sarcina de a alege un set de date pe care să fie posibil să demonstrez în mod clar caracteristicile seriei temporale. Am decis să folosesc statisticile internaționale de trafic de pasageri, deoarece acest set de date este destul de descriptiv și a devenit oarecum un standard (http://robjhyndman.com/tsdldata/data/airpass.dat, sursă Time Series Data Library, R. J. Hyndman). Seria descrie numărul de pasageri aerieni internaționali pe lună (în mii) din 1949 până în 1960.

Deoarece am mereu la îndemână, care are un instrument interesant "" pentru lucrul cu rânduri, îl voi folosi. Înainte de a importa date într-un fișier, trebuie să adăugați o coloană de dată, astfel încât valorile să fie legate de timp și o coloană cu numele seriei pentru fiecare observație. Mai jos puteți vedea cum arată fișierul meu sursă, pe care l-am importat în platforma Prognoz folosind vrăjitorul de import direct din instrumentul de analiză a seriilor de timp.

Primul lucru pe care îl facem de obicei cu o serie de timp este să o reprezentam pe o diagramă. Platforma Prognoz vă permite să construiți un grafic prin simpla glisare și plasare a unei serii într-un registru de lucru.

Serii temporale pe diagramă

Simbolul „M” de la sfârșitul numelui seriei înseamnă că seria are o dinamică lunară (intervalul dintre observații este de o lună).

Deja din grafic, putem vedea că seria demonstrează două caracteristici:

  • tendinţă- pe graficul nostru, aceasta este o creștere pe termen lung a valorilor observate. Se poate observa că tendința este aproape liniară.
  • sezonalitate- pe grafic, acestea sunt fluctuații periodice ale valorii. În următorul articol despre seria de timp, vom învăța cum să calculăm perioada.

Seria noastră este destul de „îngrijită”, dar adesea există serii care, pe lângă cele două caracteristici descrise mai sus, demonstrează încă un lucru - prezența „zgomotului”, adică. variații aleatorii într-o formă sau alta. Un exemplu de astfel de serie poate fi văzut în graficul de mai jos. Acesta este un semnal sinusoidal amestecat cu o variabilă aleatorie.

Atunci când analizăm seriale, suntem interesați să identificăm structura acestora și să evaluăm toate componentele principale - tendință, sezonalitate, zgomot și alte caracteristici, precum și capacitatea de a face previziuni ale schimbărilor de amploare în perioadele viitoare.

Când lucrați cu seriale, prezența zgomotului îngreunează adesea analiza structurii seriei. Pentru a exclude influența acesteia și pentru a vedea mai bine structura seriei, puteți utiliza metodele de netezire a seriei.

Cea mai simplă metodă de netezire a seriei este media mobilă. Ideea este că pentru orice număr impar de puncte dintr-o succesiune serie, înlocuiți punctul central cu media aritmetică a punctelor rămase:

Unde x i- rândul original s i- rând netezit.

Mai jos puteți vedea rezultatul aplicării acestui algoritm celor două serii ale noastre. În mod implicit, Prognoz Platform sugerează utilizarea anti-aliasing cu o dimensiune a ferestrei de 5 puncte ( kîn formula noastră de mai sus va fi egal cu 2). Vă rugăm să rețineți că semnalul netezit nu mai este afectat de zgomot, dar odată cu zgomotul, desigur, dispar și câteva informații utile despre dinamica seriei. De asemenea, se poate observa că seriei netezite îi lipsește prima (și, de asemenea, ultima) k puncte. Acest lucru se datorează faptului că netezirea este efectuată pentru punctul central al ferestrei (în cazul nostru, pentru al treilea punct), după care fereastra este deplasată cu un punct, iar calculele sunt repetate. Pentru a doua serie, aleatorie, am folosit netezirea cu o fereastră egală cu 30 pentru a dezvălui mai bine structura seriei, deoarece seria este „de înaltă frecvență”, există o mulțime de puncte.

Metoda mediei mobile are anumite dezavantaje:

  • Media mobilă este ineficientă în calcul. Pentru fiecare punct, media trebuie recalculată într-un mod nou. Nu putem reutiliza rezultatul calculat pentru punctul anterior.
  • Media mobilă nu poate fi extinsă la primul și ultimul punct al seriei. Acest lucru poate cauza o problemă dacă suntem interesați exact de aceste puncte.
  • Media mobilă nu este definită în afara seriei și, prin urmare, nu poate fi utilizată pentru prognoză.

Netezire exponențială

O metodă de netezire mai avansată care poate fi folosită și pentru predicție este netezirea exponențială, numită uneori și metoda Holt-Winters după numele creatorilor săi.

Există mai multe variante ale acestei metode:

  • netezire unică pentru seriale care nu au tendință și sezonalitate;
  • netezire dublă pentru seriale care au tendință, dar fără sezonalitate;
  • netezire triplă pentru seriale care au atât tendințe, cât și sezonalitate.

Metoda de netezire exponențială calculează valorile seriei netezite prin actualizarea valorilor calculate în pasul anterior folosind informațiile din pasul curent. Informațiile de la pașii anteriori și actuali sunt preluate cu greutăți diferite care pot fi controlate.

În cea mai simplă versiune de netezire unică, raportul este:

Parametru α definește raportul dintre valoarea netejită la pasul curent și valoarea netezită din pasul precedent. La α =1 vom lua numai punctele seriei originale, i.e. nu va exista netezire. La α =0 seria, vom lua numai valorile netezite din pașii anteriori, adică. seria va deveni o constantă.

Pentru a înțelege de ce netezirea se numește exponențială, trebuie să extindem relația recursiv:

Se poate observa din relația că toate valorile anterioare ale seriei contribuie la valoarea netezită actuală, cu toate acestea, contribuția lor se estompează exponențial din cauza creșterii gradului parametrului α .

Cu toate acestea, dacă există o tendință în date, o simplă netezire va „rămîne în urmă” (sau va trebui să luați valori α aproape de 1, dar apoi netezirea va fi insuficientă). Trebuie să utilizați netezirea exponențială dublă.

Netezirea dublă folosește deja două ecuații - o ecuație evaluează tendința ca diferență între valorile netezite curente și anterioare, apoi netezește tendința cu o netezire simplă. A doua ecuație efectuează netezirea ca în cazul simplu, dar al doilea termen folosește suma valorii netezite anterioare și a tendinței.

Netezirea triplă include o altă componentă, sezonalitate și folosește o altă ecuație. În același timp, se disting două variante ale componentei sezoniere - aditivă și multiplicativă. În primul caz, amplitudinea componentei sezoniere este constantă și nu depinde de amplitudinea de bază a seriei în timp. În al doilea caz, amplitudinea se modifică odată cu modificarea amplitudinii de bază a seriei. Acesta este doar cazul nostru, așa cum se poate observa din grafic. Pe măsură ce seria crește, amplitudinea fluctuațiilor sezoniere crește.

Deoarece prima noastră serie are atât tendințe, cât și sezonalitate, am decis să ajustez parametrii de netezire triplă pentru aceasta. În Platforma Prognoz, acest lucru este destul de ușor de făcut, deoarece atunci când valoarea parametrului este actualizată, platforma redesenează imediat graficul seriei netezite și vizual puteți vedea imediat cât de bine descrie seria noastră originală. M-am stabilit pe următoarele valori:

Cum am calculat perioada, ne vom uita în următorul articol despre seriile de timp.

De obicei, valorile între 0,2 și 0,4 pot fi considerate ca prime aproximări. Platforma Prognoz folosește și un model cu un parametru suplimentar ɸ , care atenuează tendința astfel încât să se apropie de o constantă în viitor. Pentru ɸ Am luat valoarea 1, care corespunde modelului obișnuit.

Am făcut și o prognoză a valorilor seriei prin această metodă pentru ultimii 2 ani. În figura de mai jos, am marcat punctul de pornire al prognozei trasând o linie prin el. După cum puteți vedea, seria originală și cea netezită coincid destul de bine, inclusiv în perioada de prognoză - nu-i rău pentru o metodă atât de simplă!

Platforma Prognoz vă permite, de asemenea, să selectați automat valorile optime ale parametrilor utilizând o căutare sistematică în spațiul valorilor parametrilor și minimizând suma abaterilor pătrate ale seriei netezite față de original.

Metodele descrise sunt destul de simple, ușor de aplicat și un bun punct de plecare pentru analiza structurii și prognoza serii de timp.

Citiți mai multe despre serii cronologice în articolul următor.

Ministerul Educației al Federației Ruse

Institutul rusesc de corespondență de finanțe și economie

ramura Yaroslavl

Departamentul de Statistică

Lucru de curs

dupa disciplina:

"Statistici"

sarcina numărul 19

Elev: Kurashova Anastasia Yurievna

Specialitatea „Finanțe și credit”

3 cursuri, periferie

Șef: Sergeev V.P.

Iaroslavl, 2002

1. Introducere………………………………………………………………………3 p.

2. Partea teoretică…………………………………………………… …4 p.

2.1 Concepte de bază ale serii cronologice…………………………….4 p.

2.2 Metode de netezire și egalizare a seriilor temporale……………………………………………………………………………….6 p.

2.2.1 Metode de „netezire mecanică”……………6 p.

2.2.2 Metode de aliniere „analitică”…………………. 8 p.

3. Partea estimată……………………………………………………… 11 p.

4. Partea analitică……………………………………………………. .16 pag

5. Concluzie ………………………………………………………. 25 pagini

6. Referințe…………………………………………………… 26 p.

7. Aplicații…………………………………………………………………. 27 pagini


Introducere

Informațiile statistice complete și de încredere reprezintă baza necesară pe care se bazează procesul de management economic. Toate informațiile de importanță economică națională sunt în cele din urmă procesate și analizate folosind statistici.

Sunt date statistice care permit determinarea volumului produsului intern brut și al venitului național, identificarea principalelor tendințe de dezvoltare a sectoarelor economice, evaluarea nivelului inflației, analiza situației piețelor financiare și de mărfuri, studiază nivelul de trai al populaţiei şi alte fenomene şi procese socio-economice.

Stăpânirea metodologiei statistice este una dintre condițiile pentru înțelegerea condițiilor pieței, studierea tendințelor și prognozarea și luarea deciziilor optime la toate nivelurile de activitate.

Complicat, consumator de timp și responsabil este etapa finală, analitică a studiului. În această etapă se calculează indicatorii medii și indicatorii de distribuție, se analizează structura populației, se studiază dinamica și relația dintre fenomenele și procesele studiate.

În toate etapele cercetării, statistica folosește metode diferite. Metodele statisticii sunt tehnici și metode speciale de studiere a fenomenelor sociale de masă.

I. Partea teoretică.

1.1 Concepte de bază despre serii de dinamică.

Serii temporale sunt date statistice care reflectă evoluția fenomenului studiat în timp. Ele sunt numite și serii dinamice, serii de timp.

Există două elemente principale în fiecare rând de dinamică:

1) indicator de timp t;

2) nivelurile corespunzătoare de dezvoltare ale fenomenului studiat y;

Ca indicații de timp în seria dinamicii, sunt folosite fie anumite date (momente), fie perioade separate (ani, trimestre, luni, zile).

Nivelurile seriei de dinamică afișează o evaluare (măsurare) cantitativă a evoluției în timp a fenomenului studiat. Ele pot fi exprimate ca valori absolute, relative sau medii.

Serii dinamice diferă în următoarele moduri:

1) După timp. În funcție de natura fenomenului studiat, nivelurile seriei de dinamică se pot referi fie la anumite date (momente) în timp, fie la perioade individuale. În conformitate cu aceasta, seriile de dinamică sunt împărțite în moment și interval.

Serii momentane de dinamică reflectă starea fenomenelor studiate la anumite date (puncte) în timp. Un exemplu de serie de momente de dinamică sunt următoarele informații despre numărul de salarii al angajaților magazinului în 1991 (tab. 1):

tabelul 1

Listați numărul de angajați ai magazinului în 1991

O caracteristică a seriei de momente a dinamicii este că nivelurile sale pot include aceleași unități ale populației studiate. Deși există intervale în seria de momente - intervale între date adiacente din serie, valoarea unuia sau altuia anumit nivel nu depinde de lungimea perioadei dintre două date. Astfel, cea mai mare parte a personalului magazinului, care alcătuiește efectivul de la 01/01/1991, care continuă să lucreze în acest an, este afișată în nivelurile perioadelor ulterioare. Prin urmare, la însumarea nivelurilor seriei de momente, pot apărea numărări repetate.

Prin serii de momente de dinamică a comerțului, se studiază stocurile de mărfuri, starea personalului, cantitatea de echipamente și alți indicatori care reflectă starea fenomenelor studiate la anumite date (puncte) în timp.

Serii de intervale de dinamică reflectă rezultatele dezvoltării (funcționării) fenomenelor studiate pentru anumite perioade (intervale) de timp.

Un exemplu de serie de intervale sunt datele privind cifra de afaceri cu amănuntul a unui magazin în 1987-1991. (tab. 2):

masa 2

Volumul cifrei de afaceri cu amănuntul a magazinului în 1987 - 1991.

Volumul cifrei de afaceri din comerțul cu amănuntul, mii de ruble

885.7 932.6 980.1 1028.7 1088.4

Fiecare nivel al seriei de intervale este deja suma nivelurilor pentru perioade mai scurte de timp. În acest caz, unitatea populației, care face parte dintr-un nivel, nu este inclusă în alte niveluri.

O caracteristică a seriei de intervale de dinamică este că fiecare dintre nivelurile sale este alcătuit din date pentru intervale mai scurte (sub-perioade) de timp. De exemplu, însumând cifra de afaceri din primele trei luni ale anului, obțineți volumul acesteia pentru primul trimestru, iar însumând cifra de afaceri pentru patru trimestre, obțineți valoarea acesteia pentru anul etc. nivelul seriei de intervale este cu atât mai mare, cu atât este mai lung intervalul căruia îi aparține acest nivel.

Proprietatea însumării nivelurilor pentru intervale de timp succesive face posibilă obținerea unor serii de dinamică a unor perioade mai lărgite.

Prin intermediul seriilor de intervale, dinamica în studiul comerțului se modifică în momentul primirii și vânzării mărfurilor, cuantumul costurilor de distribuție și alți indicatori care reflectă rezultatele funcționării fenomenului studiat pentru anumite perioade.

Structura dinamică a seriei:

Orice serie de dinamică poate fi reprezentată teoretic ca componente:

1) tendință - tendința principală în dezvoltarea unei serii dinamice (să crească sau să scadă nivelurile acesteia);

2) ciclice (fluctuații periodice, inclusiv sezoniere);

fluctuații aleatorii.

1. 2. Metode de netezire și egalizare a seriilor temporale.

Eliminarea fluctuațiilor aleatorii ale valorilor nivelurilor seriei se realizează prin găsirea valorilor „medie”. Modalitățile de eliminare a factorilor aleatori sunt împărțite în alte două grupuri:

1. Modalități de netezire „mecanică” a fluctuațiilor prin mediarea valorilor seriei în raport cu alte niveluri, adiacente, ale seriei.

2. Metode de aliniere „analitică”, adică determinarea mai întâi a expresiei funcționale a tendinței seriei, iar apoi a noilor valori calculate ale seriei.

1.2. 1 Metode de netezire „mecanică”.

Acestea includ:

A. Metodă de mediere a două jumătăți de serie, când seria este împărțită în două părți. Apoi, se calculează două valori ale nivelurilor medii ale seriei, în funcție de care tendința seriei este determinată grafic. Este evident că o astfel de tendință nu reflectă pe deplin principala regularitate a dezvoltării fenomenului.

b. Metoda de mărire a intervalelor, în care se mărește durata intervalelor de timp și se calculează noi valori ale nivelurilor seriei.

în. metoda mediei mobile. Această metodă este utilizată pentru a caracteriza tendința de dezvoltare a populației statistice studiate și se bazează pe calculul nivelurilor medii ale seriei pentru o anumită perioadă. Secvența pentru determinarea mediei mobile:

Este setat intervalul de netezire sau numărul de niveluri incluse în acesta. Dacă se iau în considerare trei niveluri la calcularea mediei, media mobilă se numește trei termeni, cinci niveluri se numește cinci termeni și așa mai departe. Dacă fluctuațiile mici, haotice ale nivelurilor într-o serie de dinamică sunt netezite, atunci intervalul (numărul mediei mobile) crește. Dacă valurile trebuie păstrate, numărul de termeni este redus.

Calculați primul nivel mediu prin aritmetică simplă:

y1 = Sy1/m, unde

y1 – nivelul I al seriei;

m - apartenența la media mobilă.

Primul nivel este eliminat, iar nivelul următor ultimului nivel care participă la primul calcul este inclus în calculul mediei. Procesul continuă până când ultimul nivel al seriei studiate de dinamică y n este inclus în calculul lui y.

Conform unei serii de dinamici construite de la niveluri medii, se releva o tendinta generala de dezvoltare a fenomenului.

Partea negativă a utilizării metodei mediei mobile este formarea deplasărilor în fluctuațiile nivelurilor seriei, datorită „alunecării” intervalelor de mărire. Netezirea cu o medie mobilă poate duce la fluctuații „inversate”, atunci când o „undă” convexă este înlocuită cu una concavă.

Recent, a început să fie calculată media mobilă adaptivă. Diferența sa constă în faptul că valoarea medie a caracteristicii, calculată așa cum este descris mai sus, nu se referă la mijlocul seriei, ci la ultimul interval de timp din intervalul de mărire. Mai mult, se presupune că media adaptivă depinde într-o măsură mai mică de nivelul anterior decât de cel actual. Adică, cu cât sunt mai multe intervale de timp între nivelul seriei și valoarea medie, cu atât mai puțină influență are valoarea acestui nivel al seriei asupra valorii medii.

d. Metoda medie exponențială. O medie exponențială este o medie mobilă adaptivă calculată folosind ponderi care depind de gradul de „depărtare” a nivelurilor individuale ale seriei de valoarea medie. Valoarea ponderii scade pe măsură ce nivelul se îndepărtează de-a lungul liniei drepte cronologice de valoarea medie în conformitate cu funcția exponențială, prin urmare o astfel de medie se numește exponențială. În practică, se folosește netezirea exponențială multiplă a seriei de timp, care este folosită pentru a prezice evoluția fenomenului.

Concluzie: metodele incluse în primul grup, datorită metodelor de calcul utilizate, oferă cercetătorului o idee foarte simplificată, inexactă a tendinței într-o serie de dinamici. Cu toate acestea, aplicarea corectă a acestor metode impune cercetătorului să aibă o cunoaștere profundă a dinamicii diverselor fenomene socio-economice.