Линейное уравнение тренда статистика пример. Построение линейного тренда

ПРИМЕР . Статистическое изучение динамики численности населения.

    С помощью цепных, базисных, средних показателей динамики оцените изменение численности, запишите выводы.

    С помощью метода аналитического выравнивания (по прямой и параболе, определив коэффициенты с помощью МНК) выявите основную тенденцию в развитии явления (численность населения Республики Коми). Оцените качество полученных моделей с помощью ошибок и коэффициентов аппроксимации.

    Определите коэффициенты линейного и параболического трендов с помощью средств «Мастера диаграмм». Дайте точечный и интервальный прогнозы численности на 2010 г. Запишите выводы.

Метод аналитического выравнивания а) Линейное уравнение тренда имеет вид y = bt + a 1. Находим параметры уравнения методом наименьших квадратов . Используем способ отсчета времени от условного начала. Система уравнений МНК для линейного тренда имеет вид: a 0 n + a 1 ∑t = ∑y a 0 ∑t + a 1 ∑t 2 = ∑y t

Для наших данных система уравнений примет вид: 10a 0 + 0a 1 = 10400 0a 0 + 330a 1 = -4038 Из первого уравнения выражаем а 0 и подставим во второе уравнение Получаем a 0 = -12.236, a 1 = 1040 Уравнение тренда: y = -12.236 t + 1040

Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации. Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения тренда к исходным данным.

б) выравнивание по параболе Уравнение тренда имеет вид y = at 2 + bt + c 1. Находим параметры уравнения методом наименьших квадратов. Система уравнений МНК: a 0 n + a 1 ∑t + a 2 ∑t 2 = ∑y a 0 ∑t + a 1 ∑t 2 + a 2 ∑t 3 = ∑yt a 0 ∑t 2 + a 1 ∑t 3 + a 2 ∑t 4 = ∑yt 2

Для наших данных система уравнений имеет вид 10a 0 + 0a 1 + 330a 2 = 10400 0a 0 + 330a 1 + 0a 2 = -4038 330a 0 + 0a 1 + 19338a 2 = 353824 Получаем a 0 = 1.258, a 1 = -12.236, a 2 = 998.5 Уравнение тренда: y = 1.258t 2 -12.236t+998.5

Ошибка аппроксимации для параболического уравнения тренда. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве тренда.

Минимальная ошибка аппроксимации при выравнивании по параболе. К тому же коэффициент детерминации R 2 выше чем при линейной. Следовательно, для прогнозирования необходимо использовать уравнение по параболе.

Интервальный прогноз. Определим среднеквадратическую ошибку прогнозируемого показателя. m = 1 - количество влияющих факторов в уравнении тренда. Uy = y n+L ± K где L - период упреждения; у n+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; T табл - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2 . По таблице Стьюдента находим Tтабл T табл (n-m-1;α/2) = (8;0.025) = 2.306 Точечный прогноз, t = 10: y(10) = 1.26*10 2 -12.24*10 + 998.5 = 1001.89 тыс. чел. 1001.89 - 71.13 = 930.76 ; 1001.89 + 71.13 = 1073.02 Интервальный прогноз: t = 9+1 = 10: (930.76;1073.02)

Согласно формуле (9.29) параметры линейного тренда равны а = 1894/11 = 172,2 ц/га; b = 486/110 = 4,418 ц/га. Уравнение линейного тренда имеет вид:

у̂ = 172,2 + 4,418t , где t = 0 в 1987 г Это означает,что средний фактический и выравненный уровень, отнесенный к середине периода, т.е. к 1991 г., равен 172 ц с 1 ra a среднегодовой прирост составляет 4,418 ц/га в год

Параметры параболического тренда согласно (9.23) равны- b = 4,418; a = 177,75; с = -0,5571. Уравнение параболического тренда имеет вид у̃ = 177,75 + 4,418t - 0.5571t 2 ; t = 0 в 1991 г. Это означает, что абсолютный прирост урожайности замедляется в среднем на 2·0,56 ц/га в год за год. Сам же абсолютный прирост уже не является константой параболического тренда, а является средней величиной за период. В год, принятый за начало отсчета т.е. 1991 г., тренд проходит через точку с ординатой 77,75 ц/га; Свободный член параболического тренда не является средним уровнем за период. Параметры экспоненциального тренда вычисляются по формулам(9.32) и (9.33) lnа = 56,5658/11 = 5,1423; потенцируя, получаем а = 171,1; lnk = 2,853:110 = 0,025936; потенцируя, получаем k = 1,02628.

Уравнение экспоненциального тренда имеет вид: y̅ = 171,1·1,02628 t .

Это означает, что среднегодовой темп поста урожайности за период составил 102,63%. В точке принятК начало отсчета, тренд проходит точку с ординатой 171,1 ц/га.

Рассчитанные по уравнениям трендов уровни записаны в трех последних графах табл. 9.5. Как видно по этим данным. расчетные значения уровней по всем трем видам трендов различаются ненамного, так как и ускорение параболы, и темп роста экспоненты невелики. Существенное отличие имеет парабола - рост уровней с 1995 г. прекращается, в то время как при линейном тренде уровни растут и далее, а при экспоненте их ост ускоряется. Поэтому для прогнозов на будущее эти три тренда неравноправны: при экстраполяции параболы на будущие годы уровни резко разойдутся с прямой и экспонентой, что видно из табл. 9.6. В этой таблицепредставлена распечатка решения на ПЭВМ по программе «Statgraphics» тех же трех трендов. Отличие их свободных членов от приведенных выше объясняется тем, что программа нумерует года не от середины, а от начала, так что свободные члены трендов относятся к 1986 г., для которого t = 0. Уравнение экспоненты на распечатке оставлено в логарифмированном виде. Прогноз сделан на 5 лет вперед, т.е. до 2001 г.. При изменении начала координат (отсчета времени) в уравнении параболы меняется и средний абсолютной прирост, параметр b. так как в результате отрицательного ускорения прирост все время сокращается, а его максимум - в начале периода. Константой параболы является только ускорение.


В строке «Data» приводятся уровни исходного ряда; «Forecast summary» означает сводные данные для прогноза. В следующих строках - уравнения прямой, параболы, экспоненты - в логарифмическом виде. Графа ME означает среднее расхождение между уровнями исходного ряда и уровнями тренда (выравненными). Для прямой и параболы это расхождение всегда равно нулю. Уровни экспоненты в среднем на 0,48852 ниже уровней исходного ряда. Точное совпадение возможно, если истинный тренд - экспонента; в данном случае совпадения нет, но различие, мало. Графа МАЕ -это дисперсия s 2 - мера колеблемости фактических уровней относительно тренда, о чем сказано в п. 9.7. Графа МАЕ - среднее линейное отклонение уровней от тренда по модулю (см. параграф 5.8); графа МАРЕ - относительное линейное отклонение в процентах. Здесь они приведены как показатели пригодности выбранного вида тренда. Меньшую дисперсию и модуль отклонения имеет парабола: она за период 1986 - 1996 гг. ближе к фактическим уровням. Но выбор типа тренда нельзя сводить лишь к этому критерию. На самом деле замедление прироста есть результат большого отрицательного отклонения, т. е. неурожая в 1996 г.

Вторая половина таблицы - это прогноз уровней урожайности по трем видам трендов на годы; t = 12, 13, 14, 15 и 16 от начала отсчета (1986 г.). Прогнозируемые уровни по экспоненте вплоть до 16-го года ненамного выше,.чем по прямой. Уровни тренда-параболы - снижаются, все более расходясь с другими трендами.

Как видно в табл. 9.4, при вычислении параметров тренда уровни исходного ряда входят с разными весами - значениями t p и их квадратов. Поэтому влияние колебаний уровней на параметры тренда зависит от того, на какой номер года приходится урожайный либо неурожайный год. Если резкое отклонение приходится на год с нулевым номером (t i = 0 ), то оно никакого влияния на параметры тренда не окажет, а если попадет на начало и конец ряда, то повлияет сильно. Следовательно, однократное аналитическое выравнивание неполно освобождает параметры тренда от влияния колеблемости, и при сильных колебаниях они могут быть сильно искажены, что в нашем примере случилось с параболой. Для дальнейшего исключения искажающего влияния колебаний на параметры тренда следует применить метод многократного скользящего выравнивания.

Этот прием состоит в том, что параметры тренда вычисляются не сразу по всему ряду, а скользящим методом, сначала за первые т периодов времени или моментов, затем за период от 2-го до т + 1, от 3-го до (т + 2)-го уровня и т.п. Если число исходных уровней ряда равно п, а длина каждой скользящей базы расчета параметров равна т, то число таких скользящих баз t или отдельных значений параметров, которые будут по ним определены, составит:

L = п + 1 - т.

Применение методики скользящего многократного выравнивания рассматривать, как видно из приведенных расчетов, возможно только при достаточно большом числе уровней ряда, как правило 15 и более. Рассмотрим эту методику на примере данных табл. 9.4 -динамики цен на нетопливные товары развивающихся стран, что опять же дает возможность читателю участвовать в небольшом научном исследовании. На этом же примере продолжим и методику прогнозирования в разделе 9.10.

Если вычислять в нашем ряду параметры по 11 -летним периодам (по 11 уровням), то t = 17 + 1 - 11 = 7. Смысл многократного скользящего выравнивания в том, что при последовательных сдвигах базы расчета параметров на концах ее и в середине окажутся разные уровни с разными по знаку и величине отклонениями от тренда. Поэтому при одних сдвигах базы параметры будут завышаться, при других - занижаться, а при последующем усреднении значений параметров по всем сдвигам базы расчета произойдет дальнейшее взаимопогашение искажений параметров тренда колебаниями уровней.

Многократное скользящее выравнивание не только позволяет получить более точную и надежную оценку параметров тренда, но и осуществить контроль правильности выбора типа уравнения тренда. Если окажется, что ведущий параметр тренда, его константа при расчете по скользящим базам не беспорядочно колеблется, а систематически изменяет свою величину существенным образом, значит, тип тренда был выбран неверно, данный параметр константой не является.

Что касается свободного члена при многократном выравнивании, то нет необходимости и, более того, просто неверно вычислять его величину как среднюю по всем сдвигам базы, ибо при таком способе отдельные уровни исходного ряда входили бы в расчет средней с разными весами, и сумма выравненных уровней разошлась бы с суммой членов исходного ряда. Свободный член тренда - это средняя величина уровня за период, при условии отсчета времени от середины периода. При отсчете от начала, если первый уровень t i = 1, свободный член будет равен: a 0 = у̅ - b ((N-1)/2). Рекомендуется длину скользящей базы расчета параметров тренда выбирать не менее 9-11 уровней, чтобы в достаточной мере погасить колебания уровней. Если исходный ряд очень длинный, база может составлять до 0,7 - 0,8 его длины. Для устранения влияния долго-периодических (циклических) колебаний на параметры тренда, число сдвигов базы должно быть равно или кратно длине цикла колебаний. Тогда начало и конец базы будут последовательно «пробегать» все фазы цикла и при усреднении параметра по всем сдвигам его искажения от циклических колебаний будут взаимопогашаться. Другой способ - взять длину скользящей базы, равной длине цикла, чтобы начало базы и конец базы всегда приходились на одну и ту же фазу цикла колебаний.

Поскольку по данным табл. 9.4, уже было установлено, что тренд имеет линейную форму, проводим расчет среднегодового абсолютного прироста, т. е. параметра b уравнения линейного тренда скользящим способом по 11-летним базам (см. табл. 9.7). В ней же приведен расчет данных, необходимых для последующего изучения колеблемости в параграфе 9.7. Остановимся подробнее на методике многократного выравнивания по скользящим базам. Рассчитаем параметр b по всем базам:


Для наглядной иллюстрации тенденций изменения цены применяется линия тренда. Элемент технического анализа представляет собой геометрическое изображение средних значений анализируемого показателя.

Рассмотрим, как добавить линию тренда на график в Excel.

Добавление линии тренда на график

Для примера возьмем средние цены на нефть с 2000 года из открытых источников. Данные для анализа внесем в таблицу:



Линия тренда в Excel – это график аппроксимирующей функции. Для чего он нужен – для составления прогнозов на основе статистических данных. С этой целью необходимо продлить линию и определить ее значения.

Если R2 = 1, то ошибка аппроксимации равняется нулю. В нашем примере выбор линейной аппроксимации дал низкую достоверность и плохой результат. Прогноз будет неточным.

Внимание!!! Линию тренда нельзя добавить следующим типам графиков и диаграмм:

  • лепестковый;
  • круговой;
  • поверхностный;
  • кольцевой;
  • объемный;
  • с накоплением.


Уравнение линии тренда в Excel

В предложенном выше примере была выбрана линейная аппроксимация только для иллюстрации алгоритма. Как показала величина достоверности, выбор был не совсем удачным.

Следует выбирать тот тип отображения, который наиболее точно проиллюстрирует тенденцию изменений вводимых пользователем данных. Разберемся с вариантами.

Линейная аппроксимация

Ее геометрическое изображение – прямая. Следовательно, линейная аппроксимация применяется для иллюстрации показателя, который растет или уменьшается с постоянной скоростью.

Рассмотрим условное количество заключенных менеджером контрактов на протяжении 10 месяцев:

На основании данных в таблице Excel построим точечную диаграмму (она поможет проиллюстрировать линейный тип):


Выделяем диаграмму – «добавить линию тренда». В параметрах выбираем линейный тип. Добавляем величину достоверности аппроксимации и уравнение линии тренда в Excel (достаточно просто поставить галочки внизу окна «Параметры»).


Получаем результат:


Обратите внимание! При линейном типе аппроксимации точки данных расположены максимально близко к прямой. Данный вид использует следующее уравнение:

y = 4,503x + 6,1333

  • где 4,503 – показатель наклона;
  • 6,1333 – смещения;
  • y – последовательность значений,
  • х – номер периода.

Прямая линия на графике отображает стабильный рост качества работы менеджера. Величина достоверности аппроксимации равняется 0,9929, что указывает на хорошее совпадение расчетной прямой с исходными данными. Прогнозы должны получиться точными.

Чтобы спрогнозировать количество заключенных контрактов, например, в 11 периоде, нужно подставить в уравнение число 11 вместо х. В ходе расчетов узнаем, что в 11 периоде этот менеджер заключит 55-56 контрактов.

Экспоненциальная линия тренда

Данный тип будет полезен, если вводимые значения меняются с непрерывно возрастающей скоростью. Экспоненциальная аппроксимация не применяется при наличии нулевых или отрицательных характеристик.

Построим экспоненциальную линию тренда в Excel. Возьмем для примера условные значения полезного отпуска электроэнергии в регионе Х:

Строим график. Добавляем экспоненциальную линию.


Уравнение имеет следующий вид:

y = 7,6403е^-0,084x

  • где 7,6403 и -0,084 – константы;
  • е – основание натурального логарифма.

Показатель величины достоверности аппроксимации составил 0,938 – кривая соответствует данным, ошибка минимальна, прогнозы будут точными.

Логарифмическая линия тренда в Excel

Используется при следующих изменениях показателя: сначала быстрый рост или убывание, потом – относительная стабильность. Оптимизированная кривая хорошо адаптируется к подобному «поведению» величины. Логарифмический тренд подходит для прогнозирования продаж нового товара, который только вводится на рынок.

На начальном этапе задача производителя – увеличение клиентской базы. Когда у товара будет свой покупатель, его нужно удержать, обслужить.

Построим график и добавим логарифмическую линию тренда для прогноза продаж условного продукта:


R2 близок по значению к 1 (0,9633), что указывает на минимальную ошибку аппроксимации. Спрогнозируем объемы продаж в последующие периоды. Для этого нужно в уравнение вместо х подставлять номер периода.

Например:

Период 14 15 16 17 18 19 20
Прогноз 1005,4 1024,18 1041,74 1058,24 1073,8 1088,51 1102,47

Для расчета прогнозных цифр использовалась формула вида: =272,14*LN(B18)+287,21. Где В18 – номер периода.

Полиномиальная линия тренда в Excel

Данной кривой свойственны переменные возрастание и убывание. Для полиномов (многочленов) определяется степень (по количеству максимальных и минимальных величин). К примеру, один экстремум (минимум и максимум) – это вторая степень, два экстремума – третья степень, три – четвертая.

Полиномиальный тренд в Excel применяется для анализа большого набора данных о нестабильной величине. Посмотрим на примере первого набора значений (цены на нефть).


Чтобы получить такую величину достоверности аппроксимации (0,9256), пришлось поставить 6 степень.

Зато такой тренд позволяет составлять более-менее точные прогнозы.

  • 6.Статистическая сводка и группировка. Виды группировок.
  • 7.Абсолютные статистические величины: понятия, виды.
  • 8.Относительные статистические величины: понятия, виды.
  • 9.Средние величины: понятия, виды. (степенные, структурные) Средние величины.
  • Степенные средние
  • Структурные средние
  • 10.Средняя арифметическая и средняя гармоническая величины. Средняя арифметическая
  • Средняя гармоническая.
  • 11.Основные свойства средней арифметической.
  • 12.Показатели вариации признака и способы их расчета.
  • Абсолютные и средние показатели вариации и способы их расчета.
  • 13.Экономические индексы: понятия, виды. Индивидуальные индексы цен, физического объема реализации, товарооборота. Понятие индексов
  • Индивидуальные индексы
  • Сводные индексы
  • Индекс цены товарооборота Индекс физического объема товарооборота Проблема выбора весов
  • Цепные и базисные индексы с постоянными и переменными весами
  • Индексы постоянного состава, переменного состава и структурных сдвигов
  • Территориальные индексы
  • 14.Агрегатные индексы цен, физического объема, товарооборота, их взаимосвязь. Агрегатные индексы.
  • 15.Средние арифметический и средние гармонический индексы физического объема продукции. Средние индексы.
  • 16.Выборочное наблюдение, виды выработки (повторная, бесповторная).
  • 17.Средняя и предельная ошибки выборки. Расчет доверительного интервала.
  • 18.Расчет необходимой численности выборки, обеспечивающий с определенной вероятностью заданную точность наблюдения.
  • 19.Ряды динамики: понятия, виды (моментальные, интервальные). Показатели ряда
  • 20.Среднии показатели ряда динамики. Определение среднего уровня ряда динамики.
  • 21.Методы сглаживания рядов динамики.
  • 22.Виды взаимосвязей между явлениями (функциональные, корреляционные). Классификация корреляционных взаимосвязей.
  • 23.Расчет параметров линейного тренда.
  • 24.Линейный коэффициент корреляции.
  • 25.Расчет параметров линейной парной регрессии.
  • 26.Понятие и формирование снс.
  • 27.Система национальных счетов: стандартный набор счетов для секторов экономики.
  • 28.Основные макроэкономические показатели снс.
  • 29.Методы расчета валового внутреннего продукта.
  • 30.Показатели естественного движения населения и методы их расчета.
  • 31.Показатели миграции населения и методы их расчета.
  • 32.Расчет перспективной численности населения.
  • 33.Система показателей уровня жизни. Индекс развития человеческого потенциала.
  • 34.Категория людей, относящимся к занятым. Расчет коэффициента занятости и нагрузке на оного занятого в экономике.
  • 35.Категория людей, относящимся к безработным. Расчет коэффициента безработицы.
  • 36.Статистика численности работников предприятия.
  • 37.Фонды рабочего времени и методы их расчета.
  • 38Коэффициенты использования фондов рабочего времени и методы их расчета.
  • 39.Статистика национального богатства: состав нефинансовых производственных активов.
  • 40.Статистика национального богатства: состав нефинансовых непроизводственных активов.
  • 41.Статистика национального богатства: состав финансовых активов.
  • Структура национального богатства. Элементы национального богатства* (на начало года; без учета стоимости земли, недр и лесов)
  • 42.Статистика международной торговли.
  • 43.Статистика госбюджета.
  • 44.Статистика основных фондов.
  • 45.Статистика оборотных фондов.
  • 46.Статистика производительности труда.
  • 47.Статистика заработной платы.
  • 48.Статистика себестоимости продукции.
  • 49.Расчет индексов, используемых для изучения динамики средних цен, индекса постоянного состава, индекса структурных сдвигов, индекса переменного состава.
  • 50.Агрегатные индексы цен ласпейреса, пааше, фишера, маршалла.
  • Индексы Пааше, Ласпейреса и "идеальный индекс" Фишера
  • 23.Расчет параметров линейного тренда.

    Основной тенденцией развития (трендом) называется плавное и устойчивое изменение уровня явления во времени, свободное от случайных колебаний.

    Задача состоит в том, чтобы выявить общую тенденцию в изменении уровней ряда, освобожденную от действия различ­ных случайных факторов. С этой целью ряды динамики подвергаются обработке методами укрупнения ин­тервалов, скользящей средней и аналитического выравнивания.

    *Одним из наиболее простых методов изучения основной тенденции в рядах динамики является укрупнение интервалов. Он основан на укрупнении периодов времени, к которым отно­сятся уровни ряда динамики (одновременно уменьшается коли­чество интервалов). Например, ряд ежесуточного выпуска про­дукции заменяется рядом месячного выпуска продукции и т.д. Средняя, исчисленная по укрупненным^ интервалам, позволяет выявлять направление и характер (ускорение или замедление роста) основной тенденции развития.

    * Выявление основной тенденции может осуществляться также методом скользящи (подвижной) средней. Сущность его заключается в том, что исчисляется средний уровень из опреде­ленного числа, обычно нечетного (3, 5, 7 и т.д.), первыхтю сче­ту уровней ряда, затем - из такого же числа уровней, но начи­ная со второго по счету, далее - начиная с третьего и т.д. Таким образом, средняя как бы «скользит» по ряду динамики, пере­двигаясь на один срок.

    на два члена в начале и конце ряда. Он меньше, чем фактиче­ский подвержен колебаниям из-за случайных причин, и четче, в виде некоторой плавной линии на графике, выражает основную тенденцию роста урожайности за изучаемый период, связанную с действием долговременно существующих причин и условий развития.

    Недостатком сглаживания ряда является «укорачивание» сглаженного ряда по сравнению с фактическим, а следователь­но, потеря информации.

    Рассмотренные приемы сглаживания динамических рядов (укрупнение интервалов и метод скользящей средней) дают воз­можность определить лишь общую тенденцию развития явле­ния, более или менее освобожденную от случайных и волнооб­разных колебаний. Однако получить обобщенную статистиче­скую модель тренда посредством этих методов нельзя.

    *Для того чтобы дать количественную модель, выражающую основную тенденцию изменения уровней динамического ряда во вре­мени, используется аналитическое выравнивание ряда динамики.

    где yt - уровни динамического ряда, вычисленные по соответст­вующему аналитическому уравнению на момент времени t.

    Определение теоретических (расчетных) уровней yt произ­водится на основе так называемой адекватной математической модели, которая наилучшим образом отображает (аппроксимиру­ет) основную тенденцию ряда динамики. Выбор типа модели зависит от цели исследования и должен быть основан на теоретическом анализе, выявляющем характер развития явления, а также на графическом изображении ряда динамики (линейной диаграмме).

    Например, простейшими моделями (формулами), выражаю­щими тенденцию развития, являются:

    линейная функция - прямая yt = a0 + a1t,

    где a0,a1 - параметры уравнения; t - время;

    показательная функция yt = A0A1t

    степенная функция - кривая второго порядка (парабола)

    В тех случаях, когда требуется особо точное изучение тен­денции развития (например, модели тренда для прогнозирова­ния), при выборе вида адекватной функции можно использовать специальные критерии математической статистики.

    Расчет параметров функции обычно производится методом наименьших квадратов, в котором в качестве решения принима­ется точка минимума суммы квадратов отклонений между тео­ретическими и эмпиричесими уровнями:

    где yt - выравненные (расчетные) уровни; yt - фактические уровни.

    Параметры уравнения а,-, удовлетворяющие этому условию, могут быть найдены решением системы нормальных уравнений. На основе найденного уравнения тренда вычисляются выравненные уровни. Таким образом, выравнивание ряда динамики заключается в замене фактических уровней у,- плавно изменяю­щимися уровнями У(, наилучшим образом аппроксимирующилми статистические данные.

    Выравнивание по прямой используется, как правило, в тех случаях, когда абсолютные приросты практически постоянны, т. е. когда уровни изменяются в арифметической прогрессии (или близко к ней).

    Выравнивание по показательной функции используется в тех случаях, когда ряд отражает развитие в геометриче­ской прогрессии, т. е. когда цепные коэффициенты рос­та практически постоянны.

    Рассмотрим «технику» выравнивания ряда динамики по прямой: yt=a0+a1t

    Параметры а0, а1 согласно методу наименьших квадратов находятся решением следующей системы нор­мальных уравнений, полученной путем алгебраического преобразования условия

    где у - фактические (эмпирические) уровни ряда; t - время (порядковый номеа периода или момента времени).

    Покажем пример подробного расчета параметров уравнения тренда на основе следующих данных (см. таблицу) с использованием калькулятора .

    Линейное уравнение тренда имеет вид y = at + b.
    1. Находим параметры уравнения методом наименьших квадратов .
    Система уравнений МНК:
    a 0 n + a 1 ∑t = ∑y
    a 0 ∑t + a 1 ∑t 2 = ∑y t

    t y t 2 y 2 t y y(t) (y-y cp) 2 (y-y(t)) 2 (t-t p) 2 (y-y(t)) : y
    1 17.4 1 302.76 17.4 12.26 895.01 26.47 30.25 0.3
    2 26.9 4 723.61 53.8 18.63 416.84 68.39 20.25 0.31
    3 23 9 529 69 25 591.3 4.02 12.25 0.0872
    4 23.7 16 561.69 94.8 31.38 557.75 58.98 6.25 0.32
    5 27.2 25 739.84 136 37.75 404.68 111.4 2.25 0.39
    6 34.5 36 1190.25 207 44.13 164.27 92.72 0.25 0.28
    7 50.7 49 2570.49 354.9 50.5 11.45 0.0383 0.25 0.0039
    8 61.4 64 3769.96 491.2 56.88 198.34 20.44 2.25 0.0736
    9 69.3 81 4802.49 623.7 63.25 483.27 36.56 6.25 0.0872
    10 94.4 100 8911.36 944 69.63 2216.84 613.62 12.25 0.26
    11 61.1 121 3733.21 672.1 76 189.98 222.11 20.25 0.24
    12 78.2 144 6115.24 938.4 82.38 953.78 17.46 30.25 0.0534
    78 567.8 650 33949.9 4602.3 567.8 7083.5 1272.21 143 2.41

    Для наших данных система уравнений имеет вид:
    12a 0 + 78a 1 = 567.8
    78a 0 + 650a 1 = 4602.3
    Из первого уравнения выражаем а 0 и подставим во второе уравнение
    Получаем a 0 = 6.37, a 1 = 5.88

    Примечание: значения столбца №6 y(t) рассчитываются на основе полученного уравнения тренда. Например, t = 1: y(1) = 6.37*1 + 5.88 = 12.26

    Уравнение тренда

    y = 6.37 t + 5.88

    Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.


    Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве тренда.

    Средние значения:


    Дисперсия

    Среднеквадратическое отклонение

    Коэффициент эластичности


    Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.

    Коэффициент детерминации

    т.е. в 82.04 % случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - высокая

    2. Анализ точности определения оценок параметров уравнения тренда .
    Дисперсия ошибки уравнения.

    где m = 1 - количество влияющих факторов в модели тренда.

    Стандартная ошибка уравнения.



    3. Проверка гипотез относительно коэффициентов линейного уравнения тренда .
    1) t-статистика. Критерий Стьюдента.
    По таблице Стьюдента находим Tтабл
    T табл (n-m-1;α/2) = (10;0.025) = 2.228

    >
    Статистическая значимость коэффициента a 0 подтверждается. Оценка параметра a 0 является значимой и тренд у временного ряда существует..


    Статистическая значимость коэффициента a 1 не подтверждается.

    Доверительный интервал для коэффициентов уравнения тренда .
    Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими:
    (a 1 - t набл S a 1 ;a 1 + t набл S a 1)
    (6.375 - 2.228*0.943; 6.375 + 2.228*0.943)
    (4.27;8.48)
    (a 0 - t набл S a 0 ;a 0 + t набл S a 0)
    (5.88 - 2.228*6.942; 5.88 + 2.228*6.942)
    (-9.59;21.35)
    Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента a 0 статистически незначима.
    2) F-статистика. Критерий Фишера.


    Fkp = 4.84
    Поскольку F > Fkp, то коэффициент детерминации статистически значим

    Проверка на наличие автокорреляции остатков .
    Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
    Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
    В экономических задачах значительно чаще встречается положительная автокорреляция , нежели отрицательная автокорреляция . В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
    Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).
    Среди основных причин, вызывающих автокорреляцию , можно выделить следующие:
    1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.
    2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.
    3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).
    4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.
    Последствия автокорреляции схожи с последствиями гетероскедастичности : выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.

    Обнаружение автокорреляции
    1. Графический метод
    Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения e i с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения e i (либо оценки отклонений).
    Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.
    Автокорреляция становится более наглядной, если построить график зависимости e i от e i-1
    Критерий Дарбина-Уотсона .
    Этот критерий является наиболее известным для обнаружения автокорреляции.
    При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин e i .

    y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
    17.4 12.26 5.14 26.47 0
    26.9 18.63 8.27 68.39 9.77
    23 25 -2 4.02 105.57
    23.7 31.38 -7.68 58.98 32.2
    27.2 37.75 -10.55 111.4 8.26
    34.5 44.13 -9.63 92.72 0.86
    50.7 50.5 0.2 0.0384 96.53
    61.4 56.88 4.52 20.44 18.71
    69.3 63.25 6.05 36.56 2.33
    94.4 69.63 24.77 613.62 350.63
    61.1 76 -14.9 222.11 1574.09
    78.2 82.38 -4.18 17.46 115.03
    1272.21 2313.98

    Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона :


    Критические значения d 1 и d 2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 12 и количества объясняющих переменных m=1.
    Автокорреляция отсутствует, если выполняется следующее условие:
    d 1 < DW и d 2 < DW < 4 - d 2 .
    Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Поскольку 1.5 < 1.82 < 2.5, то автокорреляция остатков отсутствует .
    Для более надежного вывода целесообразно обращаться к табличным значениям.
    По таблице Дарбина-Уотсона для n=12 и k=1 (уровень значимости 5%) находим: d 1 = 1.08; d 2 = 1.36.
    Поскольку 1.08 < 1.82 и 1.36 < 1.82 < 4 - 1.36, то автокорреляция остатков отсутствует .

    Проверка наличия гетероскедастичности .
    1) Методом графического анализа остатков .
    В этом случае по оси абсцисс откладываются значения объясняющей переменной X, а по оси ординат либо отклонения e i , либо их квадраты e 2 i .
    Если имеется определенная связь между отклонениями, то гетероскедастичность имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии гетероскедастичности.
    2) При помощи теста ранговой корреляции Спирмена .
    Коэффициент ранговой корреляции Спирмена .
    Присвоим ранги признаку Y и фактору X. Найдем сумму разности квадратов d 2 .
    По формуле вычислим коэффициент ранговой корреляции Спирмена.

    t табл (n-m-1;α/2) = (10;0.05/2) = 2.228
    Поскольку Tнабл < tтабл, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции. Другими словами, коэффициент ранговой корреляции статистически - не значим.
    Проверим гипотезу H 0: гетероскедастичность отсутствует.
    Поскольку 2.228 > 0.45, то гипотеза об отсутствии гетероскедастичности принимается.
    t e i ранг X, d x ранг e i , d y (d x - d y) 2
    1 -5.14 1 4 9
    2 -8.27 2 2 0
    3 2 3 7 16
    4 7.68 4 9 25
    5 10.55 5 11 36
    6 9.63 6 10 16
    7 -0.2 7 6 1
    8 -4.52 8 5 9