Построение точечного и интервального прогнозов. Построение точечных и интервальных прогнозов

§ 4.1. Доверительные интервалы прогноза

Заключительным этапом применения кривых роста является экстраполяция тенденции на базе выбранного уравнения. Прогнозные значения исследуемого показателя вычисляют путем подстановки в уравнение кривой значений времени t, соответствующих периоду упреждения. Полученный таким образом прогноз называют точечным, так как для каждого момента времени определяется только одно значение прогнозируемого показателя.

На практике в дополнении к точечному прогнозу желательно определить границы возможного изменения прогнозируемого показателя, задать "вилку" возможных значений прогнозируемого показателя, т.е. вычислить прогноз интервальный.

Несовпадение фактических данных с точечным прогнозом, полученным путем экстраполяции тенденции по кривым роста, может быть вызвано:

1) субъективной ошибочностью выбора вида кривой;

2) погрешностью оценивания параметров кривых;

3) погрешностью, связанной с отклонением отдельных наблюдений от тренда, характеризующего некоторый средний уровень ряда на каждый момент времени.

Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза. Доверительный интервал, учитывающий неопределенность, связанную с положением тренда, и возможность отклонения от этого тренда, определяется в виде:

(4.1.),

где n - длина временного ряда;

L -период упреждения;

Точечный прогноз на момент n+L;

Значение t-статистики Стьюдента;

Средняя квадратическая ошибка прогноза.

Предположим, что тренд характеризуется прямой:

Так как оценки параметров определяются по выборочной совокупности, представленной временным рядом, то они содержат погрешность. Погрешность параметра приводит к вертикальному сдвигу прямой, погрешность параметра - к изменению угла наклона прямой относительно оси абсцисс. С учетом разброса конкретных реализаций относительно линий тренда, дисперсию можно представить в виде:

(4.2.),

где - дисперсия отклонений фактических наблюдений от расчетных;

Время упреждения, для которого делается экстраполяция;

N + L ;

t- порядковый номер уровней ряда, t=1,2, ... , n;

Порядковый номер уровня, стоящего в середине ряда,

=(n+1):2

Тогда доверительный интервал можно представить в виде:

(4.3.)

Обозначим корень в выражении (4.3.) через К. Значение К зависит только от n и L, т.е. от длины ряда и периода упреждения. Поэтому можно составить таблицы значений К или К*= t a K . Тогда интервальная оценка будет иметь вид:

(4.4.)

Выражение, аналогичное (4.3.), можно получить для полинома второго порядка:

(4.5.)

или

(4.6.)

Дисперсия отклонений фактических наблюдений от расчетных определяется выражением:

(4.7.),

где - фактические значения уровней ряда,

Расчетные значения уровней ряда,

n- длина временного ряда,

k - число оцениваемых параметров выравнивающей кривой.

Таким образом, ширина доверительного интервала зависит от уровня значимости, периода упреждения, среднего квадратического отклонения от тренда и степени полинома.

Чем выше степень полинома, тем шире доверительный интервал при одном и том же значении , так как дисперсия уравнения тренда вычисляется как взвешенная сумма дисперсий соответствующих параметров уравнения

Рисунок 4.1. Доверительные интервалы прогноза для линейного тренда

Доверительные интервалы прогнозов, полученных с использованием уравнения экспоненты, определяют аналогичным образом. Отличие состоит в том, что как при вычислении параметров кривой, так и при вычислении средней квадратической ошибки используют не сами значения уровней временного ряда, а их логарифмы.

По такой же схеме могут быть определены доверительные интервалы для ряда кривых, имеющих асимптоты, в случае, если значение асимптоты известно (например, для модифицированной экспоненты).

В таблице 4.1. приведены значения K* в зависимости от длины временного ряда n и периода упреждения L для прямой и параболы. Очевидно, что при увеличении длины рядов (n) значения K* уменьшаются, с ростом периода упреждения L значения K* увеличиваются. При этом влияние периода упреждения неодинаково для различных значений n: чем больше длина ряда, тем меньшее влияние оказывает период упреждения L.


Таблица 4.1.

Значения К * для оценки доверительных интервалов прогноза на основе линейного тренда и параболического тренда при доверительной вероятности 0,9 (7).

Линейный тренд

Параболический тренд

Длина ряда (n)

Период упреждения (L)

длина ряда (n)

период упреждения (L)

2,6380 2,8748 3,1399

2,4631 2,6391 2,8361

2,3422 2,4786 2,6310

2,2524 2,3614 2,4827

2,1827 2,2718 2,3706

2,1274 2,2017 2,2836

2,0837 2,1463 2,2155

2,0462 2,1000 2,1590

2,0153 2,0621 2,1131

1,9883 2,0292 2,0735

1,9654 2,0015 2,0406

1,9455 1,9776 2,0124

1,9280 1,9568 1,9877

1,9117 1,9375 1,9654

1,8975 1,9210 1,9461

1,8854 1,9066 1,9294

1,8738 1,8932 1,9140

1,8631 1,8808 1,8998

1,8538 1,8701 1,8876

3,948 5,755 8,152

3,459 4,754 6,461

3,144 4,124 5,408

2,926 3,695 4,698

2,763 3,384 4,189

2,636 3,148 3,808

2,536 2,965 3,516

2,455 2,830 3,286

2,386 2,701 3,100

2,330 2,604 2,950

2,280 2,521 2,823

2,238 2,451 2,717

2,201 2,391 2,627

2,169 2,339 2,549

2,139 2,293 2,481

2,113 2,252 2,422

2,090 2,217 2,371

2,069 2,185 2,325

2,049 2,156 2,284

§ 4.2. Проверка адекватности выбранных моделей

Проверка адекватности выбранных моделей реальному процессу (в частности, адекватности полученной кривой роста) строится на анализе случайной компоненты. Случайная остаточная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во временном ряду). Предположим, что исходный временной ряд описывает процесс, не подверженный сезонным колебаниям, т.е. примем гипотезу об аддитивной модели ряда вида:

(4.8.)

Тогда ряд остатков будет получен как отклонения фактических уровней временного ряда () от выравненных, расчетных ( ):

(4.9.)

При использовании кривых роста вычисляют, подставляя в уравнения выбранных кривых соответствующие последовательные значения времени.

Принято считать, что модель адекватна описываемому процессу, если значения остаточной компоненты удовлетворяют свойствам случайности, независимости, а также случайная компонента подчиняется нормальному закону распределения.

При правильном выборе вида тренда отклонения от него будут носить случайный характер. Это означает, что изменение остаточной случайной величины не связано с изменением времени. Таким образом, по выборке, полученной для всех моментов времени на изучаемом интервале, проверяется гипотеза о зависимости последовательности значений от времени, или, что то же самое, о наличии тенденции в ее изменении. Поэтому для проверки данного свойства может быть использован один из критериев, рассматриваемых в разделе I, например, критерий серий.

Если вид функции, описывающей систематическую составляющую, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, т.к. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция ошибок.

В условиях автокорреляции оценки параметров модели, полученные по методу наименьших квадратов, будут обладать свойствами несмещенности и состоятельности (с этими свойствами знакомятся в курсе математической статистики). В то же время эффективность этих оценок будет снижаться, а, следовательно, доверительные интервалы будут иметь мало смысла в силу своей ненадежности.

Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является метод, предложенный Д арби ным и Уотсоном. Критерий Д арби на-Уотсона связан с гипотезой о существовании автокорреляции первого порядка, т.е. автокорреляции между соседними остаточными членами ряда. Значение этого критерия определяется по формуле:

(4.10.)

Можно показать, что величина d приближенно равна:

d » 2(1- ) (4.11),

где - коэффициент автокорреляции первого порядка (т.е. парный коэффициент корреляции между двумя рядами и ).

Из последней формулы видно, что если в значениях имеется сильная положительная автокорреляция ( » 1), то величина d=0 , в случае сильной отрицательной автокорреляции ( » -1) d=4. При отсутствии автокорреляции ( » 0) d=2.

Для этого критерия найдены критические границы, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции. Авторами критерия границы определены для 1, 2,5 и 5% уровней значимости . Значения критерия Д арби на-Уотсона при 5% уровне значимости приведены в таблице 4.2. В этой таблице и - соответственно нижняя и верхняя доверительные границы критерия Д арби на-Уотсона; - число переменных в модели; n - длина временного ряда.

Таблица 4.2.

Значения критерия Д арби на-Уотсона d 1 и d 2 при 5% уровне значимости

1,08

1,13

1,16

1,18

1,22

1,”4

1,26

1,27

1,29

1,32

1,33

1,34

1,35

1,36

1,37

1,38

1,49

1,41

1,36

1,37

1,38

1,39

1,41

1,42

1,43

1,44

1,45

1,45

1,46

1,47

1,48

1,48

1,49

1,51

1,51

1,52

1,52

0,95

0,98

1,02

1,05

1,08

1,13

1,15

1,17

1,19

1,21

1,22

1,24

1,26

1,27

1,28

1,31

1,32

1,33

1,34

1,35

1,54

1,54

1,54

1,53

1,53

1,54

1,54

1,54

1,54

1,55

1,55

1,55

1,56

1,56

1,56

1,57

1,57

1,57

1,58

1,58

1,58

1,59

0,82

0,86

0,93

0,97

1,03

1,05

1,08

1,12

1,14

1,16

1,18

1,21

1,23

1,24

1,26

1,27

1,28

1,29

1,75

1,73

1,71

1,69

1,68

1,68

1,67

1,66

1,66

1,66

1,66

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

1,65

Применение на практике критерия Д арби на-Уотсона основано на сравнении величины d, рассчитанной по формуле (4.10.), с теоретическими значениями d 1 и d 2 , взятыми из таблицы. Отметим, что большинство программных пакетов статистической обработки данных осуществляет расчет этого критерия (например, ППП "Олимп", "Мезозавр", "Statistica" и др.).

При сравнении величины d с и возможны следующие варианты:

1) Если d < , то гипотеза о независимости случайных отклонений (отсутствие автокорреляции) отвергается;

2) Если d > , то гипотеза о независимости случайных отклонений не отвергается;

3) Если £ d £ , то нет достаточных оснований для принятия решений, т.е. величина попадает в область "неопределенности".

Рассмотренные варианты относятся к случаю, когда в остатках имеется положительная автокорреляция.

Когда же расчетное значение d превышает 2, то можно говорить о том, что в существует отрицательная автокорреляция.

Для проверки отрицательной автокорреляции с критическими значениями и сравнивается не сам коэффициент d, а 4-d.

Для определения доверительных интервалов модели свойство нормальности распределения остатков имеет важное значение . Поскольку временные ряды экономических показателей, как правило, невелики (<50), то проверка распределения на нормальность может быть произведена лишь приближенно, например, на основе исследования показателей асимметрии и эксцесса.

При нормальном распределении показатели асимметрии (А) и эксцесса (Э) равны нулю. Так как мы предполагаем, что отклонения от тренда представляют собой выборку из некоторой генеральной совокупности, то можно определить выборочные характеристики асимметрии и эксцесса, а также их среднеквадратические ошибки.

Если выполняется хотя бы одно из неравенств

(4.17.),

то гипотеза о нормальном характере распределения отвергается.

Другие случаи требуют дополнительной проверки с помощью более мощных критериев.

Пример 4.1.

Программа выдала следующие характеристики ряда остатков:

длина ряда n=20;

коэффициент асимметрии А =0,6;

Коэффициент эксцесса Э=0,7.

На основании этих характеристик можно считать, что:

а) случайная компонента подчиняется нормальному закону распределения;

б) случайная компонента не подчиняется нормальному закону распределения;

в) требуется дополнительная проверка характера распределения случайной компоненты.

Решение:

Определим:


Т. к. одновременно выполняются оба неравенства


§ 4.3. Характеристики точности моделей

Важнейшими характеристиками качества модели, выбранной для прогнозирования, являются показатели ее точности. Они описывают величины случайных ошибок, полученных при использовании модели. Таким образом, чтобы судить о качестве выбранной модели, необходимо проанализировать систему показателей, характеризующих как адекватность модели, так и ее точность.

На практике широко используется относительная ошибка прогноза, выраженная в процентах относительно фактического значения показателя:

(4.19.)

Также используются средние ошибки по модулю (абсолютные и относительные):

(4.20.),

Где n- число уровней временного ряда, для которых определялось прогнозное значение.

Из (4.18.), (4.19.) видно, что если абсолютная и относительная ошибка больше 0, то это свидетельствует о "завышенной" прогнозной оценке, если - меньше 0, то прогноз был занижен.

Очевидно, что все указанные характеристики могут быть вычислены после того, как период упреждения уже окончился, и имеются фактические данные о прогнозируемом показателе или при рассмотрении показателя на ретроспективном участке.

В последнем случае имеющаяся информация делится на две части: по первой - оцениваются параметры модели, а данные второй части рассматриваются в качестве фактических. Ошибки прогнозов, полученные ретроспективно (на втором участке) характеризуют точность применяемой модели.

На практике при проведении сравнительной оценки моделей могут использоваться такие характеристики качества как дисперсия () или среднеквадратическая ошибка прогноза (S):

(4.21.).

Чем меньше значения этих характеристик, тем выше точность модели.

О точности модели нельзя судить по одному значению ошибки прогноза. Например, если прогнозная оценка месячного уровня производства в июне совпала с фактическим значением, то это не является достаточным доказательством высокой точности модели. Надо учитывать, что единичный хороший прогноз может быть получен и по плохой модели, и наоборот.

Следовательно, о качестве применяемых моделей можно судить лишь по совокупности сопоставлений прогнозных значений с фактическими .

Простой мерой качества прогнозов может стать m - относительное число случаев, когда фактическое значение охватывалось интервальным прогнозом:

(4.22.),

где р - число прогнозов, подтвержденных фактическими данными;

q - число прогнозов, не подтвержденных фактическими данными.

Когда все прогнозы подтверждаются, q=0 и m =1.

Если же все прогнозы не подтвердились, то р =0 и m =0.

Отметим, что сопоставление коэффициентов m для разных моделей может иметь смысл при условии, что доверительные вероятности приняты одинаковыми.

Идея социально-экономического прогнозирования базируется на предположении, что закономерность развития, действовавшая в прошлом (внутри ряда экономической динамики), сохранится и в прогнозируемом будущем. В этом смысле прогноз основан на экстраполяции. Экстраполяция, проводимая в будущее, называет­ся перспективной, а в прошлое - ретроспективной.

Прогнозирование методом экстраполяции базируется на сле­дующих предположениях:

а) развитие исследуемого явления в целом описывается плавной кривой;

б) общая тенденция развития явления в прошлом и настоящем не указывает на серьезные изменения в будущем;

в) учет случайности позволяет оценить вероятность отклонения от закономерного развития.

Поэтому надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предполо­жения и насколько точно удалось охарактеризовать выявленную в прошлом закономерность.

На основе построенной модели рассчитываются точечные и интервальные прогнозы. Точечный прогноз на основе временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. t = n+1 , п+2 , …, n+к.

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, ха­рактеризующих тенденцию, имеет малую вероятность. Возник­новение соответствующих отклонений объясняется следующими причинами.

1. Выбранная для прогнозирования кривая не является единствен­но возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.

2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень об­ладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.

3. Тенденция характеризует движение среднего уровня ряда ди­намики, поэтому отдельные наблюдения могут от него откло­няться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Интервальные прогнозы строятся на основе точечных прогнозов. До верительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.

При построении доверительного интервала прогноза рассчитывается величина U(к), которая для линейной модели имеет вид

(3.11)

Стандартная ошибка (среднеквадратическое откло­нение от модели);

m - количество факторов в модели, для линейной моде­ли т = 1 .

Коэффициент является табличным значением t -статистики Стьюдента при заданном уровне значимости и числе наблюде­ний. Если исследователь задает уровень вероятности попадания прогнозируемой величины внутрь доверительного интервала, равной 70%, то при n = 9 = 1,12. При вероятности, равной 95%, = 2,36.

Для других моделей величина U(к) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы (3.10), величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности степени углубления в будущее на k шагов вперед, т.е. на момент t = n + k и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующие границы:

Верхняя граница прогноза = Y прогноз (n + к) + U(к);

Нижняя граница прогноза = Y прогноз (n + к) - U(к).

Если построенная модель адекватна, то с выбранной пользова­телем вероятностью можно утверждать, что при сохранении сло­жившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.

После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

3.2. ИСПОЛЬЗОВАНИЕ НАДСТРОЙКИ EXCEL АНАЛИЗ ДАННЫХ ДЛЯ МОДЕЛИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ

Установка Пакета анализа

Ни в одном меню стандартной конфигурации программы Excel вы не найдете указания на Пакет анализа. Даже после установки с компакт-диска Excel он не появится в меню Сервис до тех пор, пока вы не выполните следующие действия:

1) выберите команду Сервис => Надстройки;

2) в диалоговом окне Надстройки (рис. 3.2) установите флажок Пакет анализа, а затем нажмите кнопку 0К;

3) выберите команду Сервис => Анализ данных. Если в меню отсут­ствует команда Анализ данных, то необходимо выполнить установку Пакета анализа с компакт-диска Excel. После этого в нижней части меню Сервис появится новая команда Анализ данных, которая предоставляет доступ к средствам анализа. Для активизации надстройки Пакет анализа следует установить соответствующий флажок.

Пример 3.1. Проверка наличия тренда.

Один из способов проверки обнаружения тренда основан на сравнении средних уровней ряда: временной ряд разбивают на две примерно равные по числу уровней части, каждая из которых рассматривается как некоторая самостоятельная выборочная со­вокупность, имеющая нормальное распределение. Если времен­ной ряд имеет тенденцию к тренду, то средние, вычисленные для каждой совокупности, должны существенно (значимо) различаться между собой. Если же расхождение незначительно, несуществен­но (случайно), то временной ряд не имеет тенденции. Таким об­разом, проверка наличия тренда в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распре­деленных совокупностей.

Определим наличие основной тенденции (тренда) по данным табл. 3.1 (рис. 3.3).

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

В данной работе необходимо выполнить следующие задания в соответствии со своим вариантом:

1) построить линейную модель Y(t) = a 0 + a 1 t, параметры которой оценить методом наименьших квадратов (МНК);

2) оценить адекватность построенной модели на основе исследования:

случайной остаточной компоненты по критерию пиков;

независимости уровней ряда остатков по d-критерию и по первому коэффициенту автокорреляции;

нормальности распределения остаточной компоненты по RS-критерию;

3) построить точечный и интервальный прогнозы на два шага вперед;

4) отобразить на графике фактические данные, результаты расчетов и прогнозирования;

5) для данного ряда выбрать наилучший вид тренда.

Пусть имеются данные о динамике объемов ВВП США (в ценах 1997 г., млрд долл. США)

Объем ВВП США, млрд. долл.

Объем ВВП США, млрд. долл.

Порядок выполнения.

1. Оценка параметров модели

Оценим параметры с помощью надстройки Excel Анализ данных .

Для этого выполним следующие действия:

введем исходные данные (рис. 1):

Рис. 1. Исходные данные

выберем команду Сервис + Анализ данных ;

в появившемся окне выберем инструмент Регрессия , а затем щелкнем по кнопке ОК (рис. 2).

Рис. 2. Диалоговое окно Анализ данных

в диалоговом окне Регрессия в поле Входной интервал Y введем диапазон ячеек зависимой переменной (Котировки). В поле Входной интервал Х введем диапазон ячеек, который содержит значения независимой переменной (t). Если выделить и заголовки столбцов, то необходимо установить флажок в поле Метки.

Для параметров вывода выберем поле Новый рабочий лист.

Для анализа остатков выберем поля Остатки и График подбора.

Диалоговое окно будет выглядеть следующим образом (рис. 3).

Рис. 3. Диалоговое окно Регрессия

Результат регрессионного анализа будет выведен на новый лист рабочей книги Excel. Анализ содержит таблицу регрессионной статистики и дисперсионного анализа, таблицу регрессионного анализа, а также график подбора (рис. 4).

Дисперсионный анализ

Значимость F

Регрессия

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

Переменная X 1

Вывод остатка

Наблюдение

Предсказанное Y

Рис. 4. График подбора

В результате расчетов получено линейное уравнение зависимости y t (урожайность) от t (время) в виде:

Y(t) = 3151,126 + 105,0833t

Оценка параметров модели "вручную ". Расчеты коэффициентов модели будем проводить по формулам кривых роста оцененных МНК:

где, - средние значения уровней ряда и моментов наблюдения соответственно.

Оценка параметров регрессии:

а 0 = 4096,876471 - 105,083 9 3151,1294.

В результате ручного расчета получено линейное уравнение зависимости y t (объем ВВП) от t (время) в виде:

Y(t) = 3151,1294 + 105,083t.

Оценка параметров модели средствами мастера диаграмм представлена на рис.

(t-tср)(y-yср)

Рис. 5. Корреляционное поле и тренд

Оценка качества построенной модели

Для этого исследуем адекватность модели. Модель является адекватной, если математическое ожидание значений остатков близко или равно нулю, и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения;

Проверка равенства нулю математического ожидания уровней ряда остатков

Для этого найдем значения ряда остатков и произведем суммирование

Объем ВВП США, млрд. долл. (yt)

В нашем случае 0, поэтому гипотеза о равенстве математического ожидания значений остаточного ряда нулю выполняется. Модель по данному свойству адекватна .

Проверка независимости (отсутствие автокорреляции)

Данное свойство проверяют с помощью критерия Дарбина-Уотсона. Для этого находится статистика Дарбина-Уотсона (d-статистика):

Для проверки используют два пороговых значения d в и d н, зависящие только от числа наблюдений, числа регрессоров и уровня значимости.

Расчетное значение d равно:

Значение рассчитанного параметра d больше d в и меньше 4d в, поэтому принимаем гипотезу об отсутствии автокорреляции по критерию Дарбина-Уотсона.

Также для проверки наличия автокорреляции можно воспользоваться первым коэффициентом автокорреляции:

Для принятия решения об отсутствии или наличие автокорреляции в исследуемом ряду расчетное значение r(1) сопоставляют с табличным (критическим) значением r для = 0,05. Если r(1) < r , то гипотеза об отсутствии автокорреляции в исследуемом ряду может быть принята, иначе - делают вывод о наличии автокорреляции в ряду.

Вычислим r(1) для нашего примера:

r(1) = = 0,6205.

Рассчитанное значение меньше табличного. Это означает, что гипотеза об отсутствии автокорреляции в ряду урожайности может быть принята.

Модель по параметру независимости адекватна .

Проверка случайности возникновения отдельных отклонений от тренда

Используем критерий, основанный на поворотных точках.

Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Если остатки случайны, то поворотная точка приходится примерно на каждые 1,5 наблюдения. Если их больше, то возмущения быстро колеблются, и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения случайного компонента положительно коррелированны.

Критерий случайности отклонений от тренда при уровне вероятности 0,95 можно представить как

где р фактическое количество поворотных точек в случайном ряду; 1,96 квантиль нормального распределения для 5%-го уровня значимости.

Квадратные скобки означают, что от результата вычисления следует взять целую часть (не путать с процедурой округления!).

Если неравенство не соблюдается, то ряд остатков нельзя считать случайным (т.е. он содержит регулярную компоненту), стало быть, модель не является адекватной.

Построим график остатков.

Рис. 6. График остатков

Количество поворотных точек равно 3.

Значение = = 6.

Неравенство выполняется 3 < 6. Следовательно, свойство случайности выполняется. Модель по данному параметру не адекватна .

Соответствие ряда остатков нормальному закону распределения

Данное соответствие можно проверить с помощью RS-критерия:

где max , min - соответственно максимальный и минимальный уровни ряда остатков; S среднеквадратическое отклонение ряда остатков.

Если расчетное значение RS попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении ряда остатков принимается. В этом случае допустимо строить доверительный интервал прогноза.

Среднеквадратическое отклонение ряда остатков S = 3,6912.

Расчетное значение попадает в интервал , следовательно, выполняется свойство нормального распределения. Модель по этому параметру адекватна .

Если все пункты проверки дают положительный результат, то выбранная трендовая модель является адекватной реальному ряду экономической динамики, и, следовательно, ее можно использовать для построения прогнозных оценок. В противном случае модель надо улучшать.

Точечный и интервальный прогнозы на два шага вперед

Точечный прогноз - это прогноз, которым называется единственное значение прогнозируемого показателя. Это значение определяется подстановкой в полученное (рассчитанное) уравнение выбранной кривой роста величины времени t, соответствующей периоду упреждения:

t = n + 1; t = n + 2 и т.д.

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами.

1. Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.

2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.

3. Тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.

При построении доверительного интервала прогноза рассчитывается величина U(k), которая для линейной модели имеет следующий вид

где р - число факторных переменных; k - период прогнозирования; t б - табличное значение t-статистики Стьюдента при заданном уровне значимости и числе наблюдений (значение t б можно получить с помощью встроенной функции Excel СТЬЮДРАСПОБР);

Стандартная ошибка (среднеквадратическое отклонение от модели).

Для других моделей величина U(k) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы, величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности t б, степени углубления в будущее на k шагов вперед, т.е. на момент t = n + k, и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующий вид:

Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.

После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

Построим прогнозы на два шага вперед (k = 1 и k = 2):

1) точечный

2) интервальный

Рассчитаем стандартную ошибку:

Тогда значение U(k) для расчета доверительного интервала будет равно:

Данные расчета верхних и нижних границ доверительного интервала приведены в таблице.

Верхняя граница

Нижняя граница

График фактических данных, результатов расчета и прогнозирования

Для построения графика прогнозирования воспользуемся инструментом Excel Мастер диаграмм.

Для этого необходимо:

1. Выделить диапазоны ячеек значений t, урожайности и оценки урожайности.

2. Запустить Мастер диаграмм, в диалоговом окне мастера выбрать тип диаграммы Точечный, на котором значения соединены отрезками.

3. В диалоговом окне Исходные данные на вкладке Ряд добавить ряды для значений точечного и интервального прогноза. Для этого выбрать кнопку Добавить, в поле Имя указать название ряда, в поле Значение Х диапазон прогноза, в поле Значение Y диапазон либо точного, либо интервального прогнозов.

В результате график прогноза выглядит следующим образом (рис. 7).

Рис. 7. Результаты моделирования и прогнозирования

Выбор наилучшего тренда для оценки временного ряда

При анализе временных рядов широко используются графические методы, которые задают направление его дальнейшего анализа. В Excel для этого можно использовать средство Мастер диаграмм.

Для создания диаграммы необходимо выделить данные, которые будут отображены на диаграмме. Сюда следует включить как числовые данные, так и подписи к ним. Excel автоматически распознает подписи и использует их при построении диаграммы.

Работа мастера состоит из четырех основных шагов.

Шаг 1. Выбор типа и вида диаграммы. Во вкладке Стандартные можно увидеть основные типы диаграмм. Выбрав тип диаграммы, нажать кнопку Далее (рис. 8).

Рис. 8. Окно выбора типа диаграммы

Шаг 2. Выбор и уточнение ориентации диапазона данных и ряда.

Следующее диалоговое окно позволяет выполнить следующие действия:

выбрать (или изменить) диапазон данных листа. Если перед началом работы с мастером данные не были выделены, то, используя это поле, можно выбрать их сейчас;

уточнить ориентацию диапазона данных диаграммы с помощью переключателя Ряды в строках столбцах;

добавлять и удалять ряды;

присваивать рядам имена;

Шаг 3. Настройка диаграммы. Это наиболее сложный этап работы мастера. В появившемся окне предлагается большое количество самых различных параметров диаграммы. Если параметры не изменяются, то используются установленные по умолчанию значения.

Шаг 4. Выбор месторасположения диаграммы. На этом шаге определяется месторасположение созданной диаграммы.

Построение линий тренда

Для описания закономерностей в исследуемом временном ряду строятся линии тренда. В табл. приведены типы линий тренда, используемые в Excel.

Для добавления линии тренда в диаграмму необходимо выполнить следующие действия: excel автокорреляция точечный

1) щелкнуть правой кнопкой мыши по ряду данных;

2) в динамическом меню выбрать команду Добавить линию тренда.

На экране появится окно Линия тренда;

3) выбрать вид зависимости регрессии. Если выбран тип Полиномиальная, то необходимо обязательно выбрать степень полинома. Если выбран тип Линейная фильтрация (данный тип не является регрессией, производится сглаживание данных методом скользящей средней), то в поле точки необходимо ввести число точек для расчета средней величины;

4) перейти на вкладку Параметры. В списке Название аппроксимирующей (сглаженной) кривой установить переключатель Автоматическое или Другое, после чего введите название кривой и оно появится в легенде диаграммы;

5) если линия тренда регрессия, то можно задать прогнозируемое количество периодов, которые будут добавлены к линии тренда;

6) в случае необходимости можно задать остальные параметры.

На один график корреляционного поля можно нанести несколько линий тренда и по параметру R^2 (коэффициент детерминации) определить вид тренда для предложенного временного ряда.

Для нашего примера график для выбора наилучшей модели выглядит следующим образом (рис. 9).

Рис. 9. Выбор наилучшей модели

В качестве лучшего можно выбрать тренд полиномиальный шестого порядка.

Размещено на Allbest.ru

...

Подобные документы

    Предварительный анализ заданного временного ряда на предмет наличия тренда. Обоснование наличия сезонности по графическому представлению одноименных элементов ряда разных лет. Применение модели для прогноза. Выбор типа остатков и корректировка модели.

    контрольная работа , добавлен 12.09.2011

    Проведение анализа динамики валового регионального продукта и расчета его точечного прогноза при помощи встроенных функций Excel. Применение корреляционно-регрессионного анализа с целью выяснения зависимости между основными фондами и объемом ВРП.

    реферат , добавлен 20.05.2010

    Ознакомление с разнообразными надстройками, входящими в состав Microsoft Excel; особенности их использования. Примеры решения задач линейного программирования с помощью вспомогательных программ "Подбор параметра", "Поиск решения" и "Анализ данных".

    реферат , добавлен 25.04.2013

    Построение графика на основе табличных данных, их анализ с использованием математического метода наименьших квадратов. Зависимость электрического сопротивления медного стержня от температуры. Использование линий тренда в MS Excel для прогнозирования.

    контрольная работа , добавлен 24.04.2011

    Анализ возможностей текстового редактора Word и электронных таблиц Excel для решения экономических задач. Описание общих формул, математических моделей и финансовых функций Excel, используемых для расчета скорости оборота инвестиций. Анализ результатов.

    курсовая работа , добавлен 21.11.2012

    Использование функции Excel для расчета экспоненциального роста на основании имеющихся данных. Построение графика прогноза по методу скользящей средней. Определение коэффициента детерминации. Полиномиальная зависимость между исследуемыми показателями.

    лабораторная работа , добавлен 01.12.2011

    Создание макроса на языке Statistica Visual Basic (SVB) для проверки гипотезы о нормальности остатков множественной регрессии. Возможности программирования на языке SVB в пакете STATISTICA. Проверка гипотезы в модели вторичного рынка жилья в г. Минске.

    курсовая работа , добавлен 02.10.2009

    Определение доли перевозчиков в их общем количестве средствами Excel. Автоматическое и ручное прогнозирование линейной и экспоненциальной зависимости. Вычисление тенденций с помощью добавления линии тренда на диаграмму. Возможности процессора MathCAD.

    контрольная работа , добавлен 03.04.2012

    Составление отчетной ведомости "Магазины" в Excel 2013. Работа с таблицами семейства Microsoft Office. Построение круговой диаграммы и гистограммы, графиков. Разработка процедур для табулирования функций. Программирование функций пользователя на VBA.

    курсовая работа , добавлен 03.04.2014

    Рассмотрение и ознакомление с одним из наиболее используемых языков программирования - С++. Его применение в процессе работы со строковыми типами данных и символами. Исследование кодов написания программ в режиме разработки консольного приложения.

После установления РВД и выбора вида распределения и уровня ДВ расчет границ интервального прогноза становится чисто технической задачей. Ее решение заключается в отсечении "лишних" концов РВД соответственно принятой доверительной вероятности. Иначе говоря, находят величины

А = а + х; B = b - x ,

где x - величина, зависящая от вида распределения и вероятности неудачи (неосуществления прогноза); очевидно, что упомянутая вероятность равна 1 - ДВ. Площади под кривой распределения, отсекаемые от "хвостов", равны половине этой вероятности (см. рис. 8.2) для треугольного распределения:

Значения этой вероятности для некоторых уровней ДВ приведены в табл. 8.1.

Рис. 8.2

Таблица 8.1

ДВ, %

Из сказанного следует, что задача определения интервального прогноза сводится к расчету размера x . Методики разработаны для следующих ситуаций:

А. Объект прогнозирования - отдельная количественная характеристика. Эксперт указывает РВД, вид распределения, а для распределения Тр и интервал наиболее вероятных значений прогнозируемого показателя.

Б. Прогноз суммы показателей, . Например, сумма объемов выпуска нескольких видов продукции. Для каждого слагаемого указывается РВД и вид распределения. ДВ назначается только для итоговой суммы.

В. Прогноз произведения двух показателей, Y = vw . Например, произведение "нормативного" и объемного показателей. Эксперт указывает РВД, вид распределения и ДВ для каждого сомножителя.

На первый взгляд представляется, что обсуждаемую методику легко распространить на прогноз суммы произведений. Формально это несложно выполнить. Однако, как показали расчеты, степень "сжатия" прогнозного интервала в этих условиях весьма мала, так что применение данной методики не имеет смысла.

Покажем технику применения перечисленных методик для каждого из указанных распределений вероятностей.

Методика а. Расчет интервального прогноза отдельной характеристики

Распределение N.

Известно, что площадь под кривой нормального распределения в пределах примерно равна 99%. Отсюда

где М - средняя,

Стандартное (среднее квадратическое) отклонение.

Пусть z - нормированное отклонение от средней 43 , зависящее от выбранной доверительной вероятности. Тогда нормированное значение искомой величины x составит:

u = 3 - z . (8.3)

Вероятности невыполнения прогноза в каждом "хвосте" нормального распределения составят:

. (8.4)

Заметим, что для нормального распределения ДВ = F (z ).

В табл. 8.2 44 приводятся значения z , и, в зависимости от уровня ДВ.

Таблица 8.2

Необходимое для расчета по формуле (8.2) значение находим следующим образом:

Распределение Т.

Искомая величина находится как функция от L и :

Распределение Тр.

Здесь возможны два варианта. Если , то

, (8.7)

где l = М 2 - М 1 .

Если же , то

, (8.8)

Распределение Р.

ПРИМЕР 1

Ожидается, что РВД (допустим, речь идет о годовом размере добычи минерального сырья) оценивается экспертом в объеме 1,2 - 1,8 млн. т. Определим интервальный прогноз для всех перечисленных выше видов распределений при условии, что ДВ = 80%. Для принятого уровня доверительной вероятности = 0,1.

Идея экономического прогнозирования временных рядов базируется на предположении о том, что закономерность развития, действовавшая в прошлом (внутри ряда экономической динамики), сохранится и в прогнозируемом будущем. В этом смысле прогноз основан на экстраполяции.

Экстраполяция, проводимая в будущее, называется перспективной, а в прошлое - ретроспективной.

Прогнозирование методом экстраполяции базируется на следующих предположениях:

  • а) развитие исследуемого явления в целом описывается плавной кривой;
  • б) общая тенденция развития явления в прошлом и настоящем не указывает на серьезные изменения в будущем;
  • в) учет случайности позволяет оценить вероятность отклонения от закономерного развития.

Надежность и точность прогноза зависят от того, насколько близкими к действительности окажутся эти предположения и насколько точно удалось охарактеризовать выявленную в прошлом закономерность.

На основе построенной модели рассчитываются точечные и интервальные прогнозы.

Точечный прогноз. Точечный прогноз для временных моделей получается подстановкой в модель (уравнение тренда) соответствующего значения фактора времени, т.е. t = п + 1, /? + 2,..., п + k, где k - прогнозируемый период.

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции, происходит очень редко. Возникновение отклонений от прогнозного значения объясняется следующими причинами:

  • модель, выбранная для прогнозирования, является не единственно возможной для описания тенденции. Можно подобрать другую модель, которая дает более точные результаты;
  • прогноз осуществляется на основании ограниченного числа исходных данных. Каждый исходный уровень обладает случайной компонентой, поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную составляющую;
  • тенденция характеризует движение среднего уровня ряда динамики. Отдельные наблюдения могут отклоняться от среднего уровня. Такие отклонения будут наблюдаться и в будущем.

Интервальные прогнозы. Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя.

Ширина интервала зависит от качества модели (г.е. степени ее близости к фактическим данным), числа наблюдений, горизонта прогнозирования, выбранного пользователем уровня вероятности и других факторов.

При построении доверительного интервала прогноза рассчитывается величина Д^, которая для линейной модели имеет вид

где S e - стандартная ошибка (СКО от линии тренда).

Коэффициент? кр - табличное значение ^-статистики Стьюдента при заданных уровне значимости а и числе степеней свободы v.

Доверительный интервал прогноза будет иметь следующие границы: г/прош - Д^ - нижняя граница, г/ прогн + Д^ - верхняя граница.

Только проведя все необходимые проверки, можно утверждать, что прогнозируемая величина попадает в интервал, образованный верхней и нижней границами. После получения всех оценок необходимо убедиться в их непротиворечивости смыслу изучаемого экономическому процесса.

Пример 10.9

Директор интенсивно развивающейся компании планирует развитие экономической деятельности, опираясь на результаты предыдущих лет (табл. 10.24).

Таблица 10.24

Исходные данные к примеру 10.9

Требуется выполнить следующее.

  • 1. Построить линейную модель зависимости результатов экономической деятельности от времени.
  • 2. Оценить качество построенной модели на основе исследований:
    • а) случайности остаточной компоненты по критерию пиков;
    • б) отсутствия автокорреляции уровней ряда остатков по 1)1У-критерию (а = 0,05);
    • в) нормальности распределения остаточной компоненты но критерию;
    • г) относительной максимальной ошибки.
  • 3. Определить размеры прогноза экономической деятельности предприятия на следующие два квартала. Построить график полученных результатов расчетов и прогнозирования.

Решение. 1. Построение модели.

Уравнение тренда ищем в виде T t = b 0 + b x t. Методом наименьших квадратов, используя инструмент «Регрессия», найдем коэффициенты уравнения тренда. Получаем уравнение Т г = 2,22 + 1,05?. Стандартная ошибка - 1,71. Коэффициент детерминации R 2 = 0,82, значимость уравнения (статистика Фишера) F= 41,7, F Kp (0,05; 1; 9) = 5,12. Значимость коэффициента уравнения b x =6,46, ? кр (0,05; 11) = 2,26. Уравнение статистически значимо.

  • 2. Оценка качества модели.
  • а) Проверка случайности остаточной компоненты по критерию пиков. Данные но остаткам приведены в табл. 10.25. На графике остатков, представленном на рис. 10.5, подсчитываем число поворотных точек р = 5. Проверяем но формуле (10.5) значение р :

Данные по остаткам к примеру 10.9

Таблица 10.25

t

y(t)

е}

(е с ~е,-) 2


Так как неравенство справедливо (5 > 3), свойство случайности выполняется.

6) Проверка отсутствия автокорреляции уровней ряда остатков по DlT-критерию. Исходные данные для расчета статистики приведены в табл. 10.25. Имеем

Критические значения статистики Дарбина - Уотсона для а = 0,05 равны d L = 0,93, d v = 1,32. Найденное значение статистики попадает в интервал d v - (4 - d v) автокорреляция не обнаружена.

в) Проверка нормальности распределения остаточной компоненты по /^-критерию. Используем формулу (10.6):

Расчетное значение 2,98 попадает в интервал 2,67-3,69, следовательно, свойство нормальности распределения выполняется.

г) Нахождение относительной максимальной ошибки проводим по формуле

Отметим, что если вычислять среднюю по модулю ошибку по формуле получим |е ср | = 1,38. Видно различие способов оценки точности модели.

Данные анализа ряда остатков приведены в табл. 10.26.

Данные анализа ряда остатков

Таблица 10.26

Вывод. Построенная модель статистически адекватна изучаемому временному процессу, несмотря на недостаточную точность модели .

3. Построение точечного и интервального прогноза на два шага вперед.

Для вычисления точечного прогноза в построенную модель подставляем соответствующие значения фактора t = n + k:

Для построения интервального прогноза рассчитаем доверительный интервал. При уровне значимости а = 0,05 доверительная вероятность равна 95%, а значение критерия Стьюдента при v = п - 2 = 9 равно 2,26.

Ширину доверительного интервала вычисляем по формуле (10.7):

Прогнозные значения и доверительные интервалы для них приведены в табл. 10.27.

Таблица 10.27

Прогнозные значения и доверительные интервалы к примеру 10.9

Нижняя граница

Верхняя граница

На рис. 10.6 представлены исходные и рассчитанные по уравнению регрессии данные с учетом прогнозных значений.


Рис. 10.6.

1/(0: - Упф)

Вывод. Модель регрессии имеет вид T t = 2,22 + l,05f. Модель адекватна по всем проверенным параметрам и может использоваться для краткосрочного прогноза.

На этом мы заканчиваем рассмотрение временных рядов. Существуют и другие методы сглаживания и коррекции временных рядов, но их рассмотрение выходит за рамки настоящей книги.

  • Это повлияло на прогнозные значения в сторону увеличения ширины доверительногоинтервала (см. далее табл. 10.27).