Для оценки значимости уравнения регрессии используется критерий. Оценка значимости уравнения регрессии и особенности применения коэффициента детерминации

После оценки индивидуальной статистической значимости каждого из коэффициентов регрессии обычно анализируется совокупная значимость коэффициентов, т.е. всего уравнения в целом. Такой анализ осуществляется на основе проверки гипотезы об общей значимости гипотезы об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:

H 0: b 1 = b 2 = ... = b m = 0.

Если данная гипотеза не отклоняется, то делается вывод о том, что совокупное влияние всех m объясняющих переменных Х 1 , Х 2 , ..., Х m модели на зависимую переменную Y можно считать статистически несущественным, а общее качество уравнения регрессии – невысоким.

Проверка данной гипотезы осуществляется на основе дисперсионного анализа сравнения объясненной и остаточной дисперсии.

Н 0: (объясненная дисперсия) = (остаточная дисперсия),

H 1: (объясненная дисперсия) > (остаточная дисперсия).

Строится F-статистика:

где – объясненная регрессией дисперсия;

– остаточная дисперсия (сумма квадратов отклонений, поделённая на число степеней свободы n-m-1). При выполнении предпосылок МНК построенная F-статистика имеет распределение Фишера с числами степеней свободы n1 = m, n2 = n–m–1. Поэтому, если при требуемом уровне значимости a F набл > F a ; m ; n - m -1 = F a (где F a ; m ; n - m -1 - критическая точка распределения Фишера), то Н 0 отклоняется в пользу Н 1 . Это означает, что объяснённая регрессией дисперсия существенно больше остаточной дисперсии, а следовательно, уравнение регрессии достаточно качественно отражает динамику изменения зависимой переменной Y. Если F набл < F a ; m ; n - m -1 = F кр. , то нет основания для отклонения Н 0 . Значит, объясненная дисперсия соизмерима с дисперсией, вызванной случайными факторами. Это дает основание считать, что совокупное влияние объясняющих переменных модели несущественно, а следовательно, общее качество модели невысоко.

Однако на практике чаще вместо указанной гипотезы проверяют тесно связанную с ней гипотезу о статистической значимости коэффициента детерминации R 2:



Н 0: R 2 > 0.

Для проверки данной гипотезы используется следующая F-статистика:

. (8.20)

Величина F при выполнении предпосылок МНК и при справедливости H 0 имеет распределение Фишера, аналогичное распределению F-статистики (8.19). Действительно, разделив числитель и знаменатель дроби в (8.19) на общую сумму квадратов отклонений и зная, что она распадается на сумму квадратов отклонений, объяснённую регрессией, и остаточную сумму квадратов отклонений (это является следствием, как будет показано позже, системы нормальных уравнений)

,

мы получим формулу (8.20):

Из (8.20) очевидно, что показатели F и R 2 равны или не равны нулю одновременно. Если F = 0, то R 2 = 0, и линия регрессии Y = является наилучшей по МНК, и, следовательно, величина Y линейно не зависит от Х 1 , Х 2 , ..., Х m . Для проверки нулевой гипотезы Н 0: F = 0 при заданном уровне значимости a по таблицам критических точек распределения Фишера находится критическое значение F кр = F a ; m ; n - m -1 . Нулевая гипотеза отклоняется, если F > F кр. Это равносильно тому, что R 2 > 0, т.е. R 2 статистически значим.

Анализ статистики F позволяет сделать вывод о том, что для принятия гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии коэффициент детерминации R 2 не должен существенно отличаться от нуля. Его критическое значение уменьшается при росте числа наблюдений и может стать сколь угодно малым.

Пусть, например, при оценке регрессии с двумя объясняющими переменными X 1 i , X 2 i по 30 наблюдениям R 2 = 0,65. Тогда

F набл = =25,07.

По таблицам критических точек распределения Фишера найдем F 0,05; 2; 27 = 3,36; F 0,01; 2; 27 = 5,49. Поскольку F набл = 25,07 > F кр как при 5%–м, так и при 1%–м уровне значимости, то нулевая гипотеза в обоих случаях отклоняется.

Если в той же ситуации R 2 = 0,4, то

F набл = = 9.

Предположение о незначимости связи отвергается и здесь.

Отметим, что в случае парной регрессии проверка нулевой гипотезы для F-статистики равносильна проверке нулевой гипотезы для t-статистики

коэффициента корреляции. В этом случае F-статистика равна квадрату t-статистики. Самостоятельную значимость коэффициент R 2 приобретает в случае множественной линейной регрессии.

8.6. Дисперсионный анализ для разложения общей суммы квадратов отклонений. Степени свободы для соответствующих сумм квадратов отклонений

Применим изложенную выше теорию для парной линейной регрессии.

После того, как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Оценка значимости уравнения регрессии в целом даётся с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т.е. b = 0, и, следовательно, фактор х не оказывает влияния на результат у.

Непосредственному расчёту F-критерия предшествует анализ дисперсии. Центральное место в нём занимает разложение общей суммы квадратов отклонений переменной у от среднего значения на две части – “объяснённую” и “необъяснённую”:

Уравнение (8.21) является следствием системы нормальных уравнений, выведенных в одной предыдущих тем.

Доказательство выражения (8.21).

Осталось доказать, что последнее слагаемое равно нулю.

Если сложить от 1 до n все уравнения

y i = a+b×x i +e i , (8.22)

то получим åy i = a×å1+b×åx i +åe i . Так как åe i =0 и å1 =n, то получим

Тогда .

Если же вычесть из выражения (8.22) уравнение (8.23), то получим

В результате получим

Последние суммы равны нулю в силу системы двух нормальных уравнений.

Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения вызвана влиянием множества причин. Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы. Если фактор на оказывает никакого влияния на результат, то линия регрессии параллельна оси OX и . Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связана с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объяснённая регрессией, совпадает с общей суммой квадратов.

Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный влиянием фактора х, т.е. регрессией у по х, так и вызванный действием прочих причин (необъяснённая вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объяснённую вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное влияние на признак у. Это равносильно тому, что коэффициент детерминации будет приближаться к единице.

Любая сумма квадратов связана с числом степеней свободы (df – degrees of freedom), с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из n возможных требуется для образования данной суммы квадратов. Так, для общей суммы квадратов требуется (n-1) независимых отклонений, ибо по совокупности из n единиц после расчёта среднего свободно варьируют лишь (n-1) число отклонений. Например, мы имеем ряд значений у: 1,2,3,4,5. Среднее из них равно 3, и тогда n отклонений от среднего составят: -2, -1, 0, 1, 2. Так как , то свободно варьируют лишь четыре отклонения, а пятое отклонение может быть определено, если предыдущие четыре известны.

При расчёте объяснённой или факторной суммы квадратов используются теоретические (расчётные) значения результативного признака

Тогда сумма квадратов отклонений, обусловленных линейной регрессии, равна

Поскольку при заданном объёме наблюдений по x и y факторная сумма квадратов при линейной регрессии зависит только от константы регрессии b, то данная сумма квадратов имеет только одну степень свободы.

Существует равенство между числом степеней свободы общей, факторной и остаточной суммой квадратов отклонений. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет n-2. Число степеней свободы общей суммы квадратов определяется числом единиц варьируемых признаков, и поскольку мы используем среднюю вычисленную по данным выборки, то теряем одну степень свободы, т.е. df общ. = n–1.

Итак, имеем два равенства:

Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений, или, что то же самое, дисперсию на одну степень свободы D.

;

;

.

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчёте на одну степень свободы, получим величину F-критерия Фишера

где F-критерий для проверки нулевой гипотезы H 0: D факт = D ост.

Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для H 0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при различных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия – это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признаётся достоверным, если оно больше табличного. Если F факт > F табл, то нулевая гипотеза H 0: D факт = D ост об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи.

Если F факт < F табл, то вероятность нулевой гипотезы H 0: D факт = D ост выше заданного уровня (например, 0,05) и она не может быть отклонена без серьёзного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Гипотеза H 0 не отклоняется.

В рассматриваемом примере из главы 3:

= 131200 -7*144002 = 30400 – общая сумма квадратов;

1057,878*(135,43-7*(3,92571) 2) = 28979,8 – факторная сумма квадратов;

=30400-28979,8 = 1420,197 – остаточная сумма квадратов;

D факт = 28979,8;

D ост = 1420,197/(n-2) = 284,0394;

F факт =28979,8/284,0394 = 102,0274;

F a =0,05; 2; 5 =6,61; F a =0,01; 2; 5 = 16,26.

Поскольку F факт > F табл как при 1%-ном, так и при 5%-ном уровне значимости, то можно сделать вывод о значимости уравнения регрессии (связь доказана).

Величина F-критерия связана с коэффициентом детерминации . Факторную сумму квадратов отклонений можно представить как

,

а остаточную сумму квадратов – как

.

Тогда значение F-критерия можно выразить как

.

Оценка значимости регрессии обычно даётся в виде таблицы дисперсионного анализа

, его величина сравнивается с табличным значением при определённом уровне значимости α и числе степеней свободы (n-2).
Источники вариации Число степеней свободы Сумма квадратов отклонений Дисперсия на одну степень свободы F-отношение
фактическое Табличное при a=0,05
Общая
Объяснённая 28979,8 28979,8 102,0274 6,61
Остаточная 1420,197 284,0394

Итоговые тесты по эконометрике

1. Оценка значимости параметров уравнения регрессии осуществляется на основе:

А) t - критерия Стьюдента;

б) F -критерия Фишера – Снедекора;

в) средней квадратической ошибки;

г) средней ошибки аппроксимации.

2. Коэффициент регрессии в уравнении , характеризующем связь между объемом реализованной продукции (млн. руб.) и прибылью предприятий автомобильной промышленности за год (млн. руб.) означает, что при увеличении объема реализованной продукции на 1 млн. руб. прибыль увеличивается на:

г) 0,5млн. руб.;

в) 500тыс. руб.;

Г) 1,5 млн. руб.

3. Корреляционное отношение (индекс корреляции) измеряет степень тесноты связи между Х и Y :

а) только при нелинейной форме зависимости;

Б) при любой форме зависимости;

в) только при линейной зависимости.

4. По направлению связи бывают:

а) умеренные;

Б) прямые;

в) прямолинейные.

5. По 17 наблюдениям построено уравнение регрессии:
.
Для проверки значимости уравнения вычислено наблюдаемое значение t - статистики: 3.9. Вывод:

А) Уравнение значимо при a= 0,05;

б) Уравнение незначимо при a = 0,01;

в) Уравнение незначимо при a = 0,05.

6. Каковы последствия нарушения допущения МНК «математическое ожидание регрессионных остатков равно нулю»?

А) Смещенные оценки коэффициентов регрессии;

б) Эффективные, но несостоятельные оценки коэффициентов регрессии;

в) Неэффективные оценки коэффициентов регрессии;

г) Несостоятельные оценки коэффициентов регрессии.

7. Какое из следующих утверждений верно в случае гетероскедастичности остатков?

А) Выводы по t и F- статистикам являются ненадежными;

г) Оценки параметров уравнения регрессии являются смещенными.

8. На чем основан тест ранговой корреляции Спирмена?

А) На использовании t – статистики;

в) На использовании ;

9. На чем основан тест Уайта?

б) На использовании F– статистики;

В) На использовании ;

г) На графическом анализе остатков.

10. Каким методом можно воспользоваться для устранения автокорреляции?

11. Как называется нарушение допущения о постоянстве дисперсии остатков?

а) Мультиколлинеарность;

б) Автокорреляция;

В) Гетероскедастичность;

г) Гомоскедастичность.

12. Фиктивные переменные вводятся в:

а) только в линейные модели;

б) только во множественную нелинейную регрессию;

в) только в нелинейные модели;

Г) как в линейные, так и в нелинейные модели, приводимые к линейному виду.

13. Если в матрице парных коэффициентов корреляции встречаются
, то это свидетельствует:

А) О наличии мультиколлинеарности;

б) Об отсутствии мультиколлинеарности;

в) О наличии автокорреляции;

г) Об отсутствии гетероскедастичности.

14. С помощью какой меры невозможно избавиться от мультиколлинеарности?

а) Увеличение объема выборки;

Г) Преобразование случайной составляющей.

15. Если
и ранг матрицы А меньше (К-1) то уравнение:

а) сверхиденцифицировано;

Б) неидентифицировано;

в) точно идентифицировано.

16.Уравнение регрессии имеет вид:

А)
;

б)
;

в)
.

17.В чем состоит проблема идентификации модели?

А) получение однозначно определенных параметров модели, заданной системой одновременных уравнений;

б) выбор и реализация методов статистического оценивания неизвестных параметров модели по исходным статистическим данным;

в) проверка адекватности модели.

18. Какой метод применяется для оценивания параметров сверхиденцифицированного уравнения?

В) ДМНК, КМНК;

19. Если качественная переменная имеет k альтернативных значений, то при моделировании используются:

А) (k-1) фиктивная переменная;

б) kфиктивных переменных;

в) (k+1) фиктивная переменная.

20. Анализ тесноты и направления связей двух признаков осуществляется на основе:

А) парного коэффициента корреляции;

б) коэффициента детерминации;

в) множественного коэффициента корреляции.

21. В линейном уравнении x = а 0 +a 1 х коэффициент регрессии показывает:

а) тесноту связи;

б) долю дисперсии "Y", зависимую от "X";

В) на сколько в среднем изменится "Y" при изменении "X" на одну единицу;

г) ошибку коэффициента корреляции.

22. Какой показатель используется для определения части вариации, обусловленной изменением величины изучаемого фактора?

а) коэффициент вариации;

б) коэффициент корреляции;

В) коэффициент детерминации;

г) коэффициент эластичности.

23. Коэффициент эластичности показывает:

А) на сколько % изменится значение y при изменении x на 1 %;

б) на сколько единиц своего измерения изменится значение yпри измененииxна 1 %;

в) на сколько % изменится значение yпри измененииxна ед. своего измерения.

24. Какие методы можно применить для обнаружения гетероскедастичности ?

А) Тест Голфелда-Квандта;

Б) Тест ранговой корреляции Спирмена;

в) Тест Дарбина- Уотсона.

25. На чем основан тест Голфельда -Квандта

а) На использовании t– статистики;

Б) На использовании F – статистики;

в) На использовании ;

г) На графическом анализе остатков.

26. С помощью каких методов нельзя устранить автокорреляцию остатков?

а) Обобщенным методом наименьших квадратов;

Б) Взвешенным методом наименьших квадратов;

В) Методом максимального правдоподобия;

Г) Двухшаговым методом наименьших квадратов.

27. Как называется нарушение допущения о независимости остатков?

а) Мультиколлинеарность;

Б) Автокорреляция;

в) Гетероскедастичность;

г) Гомоскедастичность.

28. Каким методом можно воспользоваться для устранения гетероскедастичности?

А) Обобщенным методом наименьших квадратов;

б) Взвешенным методом наименьших квадратов;

в) Методом максимального правдоподобия;

г) Двухшаговым методом наименьших квадратов.

30. Если по t -критерию большинство коэффициентов регрессии статистически значимы, а модель в целом по F - критерию незначима то это может свидетельствовать о:

а) Мультиколлинеарности;

Б) Об автокорреляции остатков;

в) О гетероскедастичности остатков;

г) Такой вариант невозможен.

31. Возможно ли с помощью преобразования переменных избавиться от мультиколлинеарности?

а) Эта мера эффективна только при увеличении объема выборки;

32. С помощью какого метода можно найти оценки параметра уравнения линейной регрессии:

А) методом наименьшего квадрата;

б) корреляционно-регрессионного анализа;

в) дисперсионного анализа.

33. Построено множественное линейное уравнение регрессии с фиктивными переменными. Для проверки значимости отдельных коэффициентов используется распределение:

а) Нормальное;

б) Стьюдента;

в) Пирсона;

г) Фишера-Снедекора.

34. Если
и ранг матрицы А больше (К-1) то уравнение:

А) сверхиденцифицировано;

б) неидентифицировано;

в) точно идентифицировано.

35. Для оценивания параметров точно идентифицируемой системы уравнений применяется:

а) ДМНК, КМНК;

б) ДМНК, МНК, КМНК;

36. Критерий Чоу основывается на применении:

А) F - статистики;

б) t - статистики;

в) критерии Дарбина –Уотсона.

37. Фиктивные переменные могут принимать значения:

г) любые значения.

39. По 20 наблюдениям построено уравнение регрессии:
.
Для проверки значимости уравнения вычислено значение статистики: 4.2. Выводы:

а) Уравнение значимо при a=0.05;

б) Уравнение незначимо при a=0.05;

в) Уравнение незначимо при a=0.01.

40. Какое из следующих утверждений не верно в случае гетероскедастичности остатков?

а) Выводы по tиF- статистикам являются ненадежными;

б) Гетероскедастичность проявляется через низкое значение статистики Дарбина-Уотсона;

в) При гетероскедастичности оценки остаются эффективными;

г) Оценки являются смещенными.

41. Тест Чоу основан на сравнении:

А) дисперсий;

б) коэффициентов детерминации;

в) математических ожиданий;

г) средних.

42. Если в тесте Чоу
то считается:

А) что разбиение на подынтервалы целесообразно с точки зрения улучшения качества модели;

б) модель является статистически незначимой;

в) модель является статистически значимой;

г) что нет смысла разбивать выборку на части.

43. Фиктивные переменные являются переменными:

а) качественными;

б) случайными;

В) количественными;

г) логическими.

44. Какой из перечисленных методов не может быть применен для обнаружения автокорреляции?

а) Метод рядов;

б) критерий Дарбина-Уотсона;

в) тест ранговой корреляции Спирмена;

Г) тест Уайта.

45. Простейшая структурная форма модели имеет вид:

А)

б)

в)

г)
.

46. С помощью каких мер возможно избавиться от мультиколлинеарности?

а) Увеличение объема выборки;

б) Исключения переменных высококоррелированных с остальными;

в) Изменение спецификации модели;

г) Преобразование случайной составляющей.

47. Если
и ранг матрицы А равен (К-1) то уравнение:

а) сверхиденцифицировано;

б) неидентифицировано;

В) точно идентифицировано;

48. Модель считается идентифицированной, если:

а) среди уравнений модели есть хотя бы одно нормальное;

Б) каждое уравнение системы идентифицируемо;

в) среди уравнений модели есть хотя бы одно неидентифицированное;

г) среди уравнений модели есть хотя бы одно сверхидентифицированное.

49. Какой метод применяется для оценивания параметров неиденцифицированного уравнения?

а) ДМНК, КМНК;

б) ДМНК, МНК;

В) параметры такого уравнения нельзя оценить.

50. На стыке каких областей знаний возникла эконометрика:

А) экономическая теория; экономическая и математическая статистика;

б) экономическая теория, математическая статистика и теория вероятности;

в) экономическая и математическая статистика, теория вероятности.

51. В множественном линейном уравнении регрессии строятся доверительные интервалы для коэффициентов регрессии с помощью распределения:

а) Нормального;

Б) Стьюдента;

в) Пирсона;

г) Фишера-Снедекора.

52. По 16 наблюдениям построено парное линейное уравнение регрессии. Для проверки значимости коэффициента регрессии вычислено t на6л =2.5.

а) Коэффициент незначим при a=0.05;

б) Коэффициент значим при a=0.05;

в) Коэффициент значим при a=0.01.

53. Известно, что между величинами X и Y существует положительная связь. В каких пределах находится парный коэффициент корреляции?

а) от -1 до 0;

б) от 0 до 1;

В) от –1 до 1.

54. Множественный коэффициент корреляции равен 0.9. Какой процент дисперсии результативного признака объясняется влиянием всех факторных признаков?

55. Какой из перечисленных методов не может быть применен для обнаружения гетероскедастичности ?

А) Тест Голфелда-Квандта;

б) Тест ранговой корреляции Спирмена;

в) метод рядов.

56. Приведенная форма модели представляет собой:

а) систему нелинейных функций экзогенных переменных от эндогенных;

Б) систему линейных функций эндогенных переменных от экзогенных;

в) систему линейных функций экзогенных переменных от эндогенных;

г) систему нормальных уравнений.

57. В каких пределах меняется частный коэффициент корреляции вычисленный по рекуретным формулам?

а) от - до +;

б) от 0 до 1;

в) от 0 до + ;

Г) от –1 до +1.

58. В каких пределах меняется частный коэффициент корреляции вычисленный через коэффициент детерминации?

а) от - до +;

Б) от 0 до 1;

в) от 0 до + ;

г) от –1 до +1.

59. Экзогенные переменные:

а) зависимые переменные;

Б) независимые переменные;

61. При добавлении в уравнение регрессии еще одного объясняющего фактора множественный коэффициент корреляции:

а) уменьшится;

б) возрастет;

в) сохранит свое значение.

62. Построено гиперболическое уравнение регрессии: Y = a + b / X . Для проверки значимости уравнения используется распределение:

а) Нормальное;

Б) Стьюдента;

в) Пирсона;

г) Фишера-Снедекора.

63. Для каких видов систем параметры отдельных эконометрических уравнений могут быть найдены с помощью традиционного метода наименьших квадратов?

а) система нормальных уравнений;

Б) система независимых уравнений;

В) система рекурсивных уравнений;

Г) система взаимозависимых уравнений.

64. Эндогенные переменные:

А) зависимые переменные;

б) независимые переменные;

в) датированные предыдущими моментами времени.

65. В каких пределах меняется коэффициент детерминации?

а) от 0 до +;

б) от -до +;

В) от 0 до +1;

г) от -l до +1.

66. Построено множественное линейное уравнение регрессии. Для проверки значимости отдельных коэффициентов используется распределение:

а) Нормальное;

б) Стьюдента;

в) Пирсона;

Г) Фишера-Снедекора.

67. При добавлении в уравнение регрессии еще одного объясняющего фактора коэффициент детерминации:

а) уменьшится;

Б) возрастет;

в) сохранит свое значение;

г) не уменьшится.

68. Суть метода наименьших квадратов заключается в том, что:

А) оценка определяется из условия минимизации суммы квадратов отклонений выборочных данных от определяемой оценки;

б) оценка определяется из условия минимизации суммы отклонений выборочных данных от определяемой оценки;

в) оценка определяется из условия минимизации суммы квадратов отклонений выборочной средней от выборочной дисперсии.

69. К какому классу нелинейных регрессий относится парабола:

73. К какому классу нелинейных регрессий относится экспоненциальная кривая:

74. К какому классу нелинейных регрессий относится функция вида ŷ
:

А) регрессии, нелинейные относительно включенных в анализ переменных, но линейных по оцениваемым параметрам;

б) нелинейные регрессии по оцениваемым параметрам.

78. К какому классу нелинейных регрессий относится функция вида ŷ
:

а) регрессии, нелинейные относительно включенных в анализ переменных, но линейных по оцениваемым параметрам;

Б) нелинейные регрессии по оцениваемым параметрам.

79. В уравнении регрессии в форме гиперболы ŷ
если величина
b >0 , то:

А) при увеличении факторного признака х значения результативного признака у замедленно уменьшаются, и при х→∞ средняя величина у будет равна а;

б) то значение результативного признака у возрастает с замедленным ростом при увеличении факторного признака х , и при х→∞

81. Коэффициент эластичности определяется по формуле

А) Линейной функции;

б) Параболы;

в) Гиперболы;

г) Показательной кривой;

д) Степенной.

82. Коэффициент эластичности определяется по формуле
для модели регрессии в форме:

а) Линейной функции;

Б) Параболы;

в) Гиперболы;

г) Показательной кривой;

д) Степенной.

86. Уравнение
называется:

А) линейным трендом;

б) параболическим трендом;

в) гиперболическим трендом;

г) экспоненциальным трендом.

89. Уравнение
называется:

а) линейным трендом;

б) параболическим трендом;

в) гиперболическим трендом;

Г) экспоненциальным трендом.

90. Система виды называется:

А) системой независимых уравнений;

б) системой рекурсивных уравнений;

в) системой взаимозависимых (совместных, одновременных) уравнений.

93. Эконометрику можно определить как:

А) это самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенных для того, чтобы на базе экономической теории, экономической статистики и математико-статистического инструментария придавать конкретное количественное выражение общим (качественным) закономерностям, обусловленным экономической теорией;

Б) наука об экономических измерениях;

В) статистический анализ экономических данных.

94. К задачам эконометрики можно отнести:

А) прогноз экономических и социально-экономических показателей, характеризующих состояние и развитие анализируемой системы;

Б) имитация возможных сценариев социально-экономического развития системы для выявления того, как планируемые изменения тех или иных поддающихся управлению параметров скажутся на выходных характеристиках;

в) проверка гипотез по статистическим данным.

95. По характеру различают связи:

А) функциональные и корреляционные;

б) функциональные, криволинейные и прямолинейные;

в) корреляционные и обратные;

г) статистические и прямые.

96. При прямой связи с увеличением факторного признака:

а) результативный признак уменьшается;

б) результативный признак не изменяется;

В) результативный признак увеличивается.

97. Какие методы используются для выявления наличия, характера и направления связи в статистике?

а) средних величин;

Б) сравнения параллельных рядов;

В) метод аналитической группировки;

г) относительных величин;

Д) графический метод.

98. Какой метод используется для выявления формы воздействия одних факторов на другие?

а) корреляционный анализ;

Б) регрессионный анализ;

в) индексный анализ;

г) дисперсионный анализ.

99. Какой метод используется для количественной оценки силы воздействия одних факторов на другие:

А) корреляционный анализ;

б) регрессионный анализ;

в) метод средних величин;

г) дисперсионный анализ.

100. Какие показатели по своей величине существуют в пределах от минус до плюс единицы:

а) коэффициент детерминации;

б) корреляционной отношение;

В) линейный коэффициент корреляции.

101. Коэффициент регрессии при однофакторной модели показывает:

А) на сколько единиц изменяется функция при изменении аргумента на одну единицу;

б) на сколько процентов изменяется функция на одну единицу изменения аргумента.

102. Коэффициент эластичности показывает:

а) на сколько процентов изменяется функция с изменением аргумента на одну единицу своего измерения;

Б) на сколько процентов изменяется функция с изменением аргумента на 1%;

в) на сколько единиц своего измерения изменяется функция с изменением аргумента на 1%.

105. Величина индекса корреляции, равная 0,087, свидетельствует:

А) о слабой их зависимости;

б) о сильной взаимосвязи;

в) об ошибках в вычислениях.

107. Величина парного коэффициента корреляции, равная 1,12, свидетельствует:

а) о слабой их зависимости;

б) о сильной взаимосвязи;

В) об ошибках в вычислениях.

109. Какие из приведенных чисел могут быть значениями парного коэффициента корреляции:

111. Какие из приведенных чисел могут быть значениями множественного коэффициента корреляции:

115. Отметьте правильную форму линейного уравнения регрессии:

а) ŷ
;

б) ŷ
;

в) ŷ
;

Г) ŷ
.

Проверку значимости уравнения регрессии произведем на основе

F-критерия Фишера:

Значение F-критерия Фишера можно найти в таблице Дисперсионный анализ протокола Еxcel. Табличное значение F-критерия при доверительной вероятности α = 0,95 и числе степеней свободы, равном v1 = k = 2 и v2 = n – k – 1= 50 – 2 – 1 = 47, составляет 0,051.

Поскольку Fрасч > Fтабл, уравнение регрессии следует признать значимым, то есть его можно использовать для анализа и прогнозирования.

Оценку значимости коэффициентов полученной модели, используя результаты отчета Excel, можно осуществить тремя способами.

Коэффициент уравнения регрессии признается значимым в том случае, если:

1) наблюдаемое значение t-статистики Стьюдента для этого коэффициента больше, чем критическое (табличное) значение статистики Стьюдента (для заданного уровня значимости, например α = 0,05, и числа степеней свободы df = n – k – 1, где n – число наблюдений, а k – число факторов в модели);

2) Р-значение t-статистики Стьюдента для этого коэффициента меньше, чем уровень значимости, например, α = 0,05;

3) доверительный интервал для этого коэффициента, вычисленный с некоторой доверительной вероятностью (например, 95%), не содержит ноль внутри себя, то есть нижняя 95% и верхняя 95% границы доверительного интервала имеют одинаковые знаки.

Значимость коэффициентов a 1 и a 2 проверим по второму и третьему способам:

P-значение (a 1 ) = 0,00 < 0,01 < 0,05.

Р-значение (a 2 ) = 0,00 < 0,01 < 0,05.

Следовательно, коэффициенты a 1 и a 2 значимы при 1%-ном уровне, а тем более при 5%-ном уровне значимости. Нижние и верхние 95% границы доверительного интервала имеют одинаковые знаки, следовательно, коэффициенты a 1 и a 2 значимы.

Определение объясняющей переменной, от которой

Может зависеть дисперсия случайных возмущений.

Проверка выполнения условия гомоскедастичности

Остатков по тесту Гольдфельда–Квандта

При проверке предпосылки МНК о гомоскедастичности остатков в модели множественной регрессии следует вначале определить, по отношению к какому из факторов дисперсия остатков более всего нарушена. Это можно сделать в результате визуального исследования графиков остатков, построенных по каждому из факторов, включенных в модель. Та из объясняющих переменных, от которой больше зависит дисперсия случайных возмущений, и будет упорядочена по возрастанию фактических значений при проверке теста Гольдфельда–Квандта. Графики легко получить в отчете, который формируется в результате использования инструмента Регрессия в пакете Анализ данных).

Графики остатков по каждому из факторов двухфакторной модели

Из представленных графиков видно, что дисперсия остатков более всего нарушена по отношению к фактору Краткосрочная дебиторская задолженность.

Проверим наличие гомоскедастичности в остатках двухфакторной модели на основе теста Гольдфельда–Квандта.

    Упорядочим переменные Y и X2 по возрастанию фактора Х4 (в Excel для этого можно использовать команду Данные – Сортировка по возрастанию Х4):

    Данные, отсортированные по возрастанию X4:

  1. Уберем из середины упорядоченной совокупности С = 1/4 · n = 1/4 · 50 = 12,5 (12) значения. В результате получим две совокупности соответственно с малыми и большими значениями Х4.

    Для каждой совокупности выполним расчеты:

Сумма

111234876536,511

966570797682,068

455748832843,413

232578961097,877

834043911651,192

193722998259,505

1246409153509,290

31419681912489,100

2172804245053,280

768665257272,099

2732445494273,330

163253156450,331

18379855056009,900

10336693841766,000

Сумма

69977593738424,600

Уравнения для совокупностей

Y = -27275,746 + 0,126X2 + 1,817 X4

Y = 61439,511 + 0,228X2 + 0,140X4

Результаты данной таблицы получены с помощью инструмента Регрессия поочередно к каждой из полученных совокупностей.

4. Найдем отношение полученных остаточных сумм квадратов

(в числителе должна быть большая сумма):

5. Вывод о наличии гомоскедастичности остатков делаем с помощью F-критерия Фишера с уровнем значимости α = 0,05 и двумя одинаковыми степенями свободы k1 = k2 = == 17

где р – число параметров уравнения регрессии:

Fтабл (0,05; 17; 17) = 9,28.

Так как Fтабл > R ,то подтверждается гомоскедастичность в остатках двухфакторной регрессии.

Оценка значимости параметров уравнения регрессии

Оценка значимости параметров уравнения линейной регрессии производится с помощью критерия Стьюдента:

если t расч. > t кр, то принимается основная гипотеза (H o ), свидетельствующая о статистической значимости параметров регрессии;

если t расч. < t кр, то принимается альтернативная гипотеза (H 1 ), свидетельствующая о статистической незначимости параметров регрессии.

где m a , m b – стандартные ошибки параметров a и b:

(2.19)

(2.20)

Критическое (табличное) значение критерия находится с помощью статистических таблиц распределения Стьюдента (приложение Б) или по таблицам Excel (раздел мастера функций «Статистические»):

t кр = СТЬЮДРАСПОБР(α=1-P; k=n-2 ), (2.21)

где k=n-2 также представляет собой число степенейсвободы.

Оценка статистической значимости может быть применена и к линейному коэффициенту корреляции

где m r – стандартная ошибка определения значений коэффициента корреляции r yx

(2.23)

Ниже представлены варианты заданий для практических и лабораторных работ по тематике второго раздела.

Вопросы для самопроверки по 2 разделу

1. Укажите основные составляющие эконометрической модели и их сущность.

2. Основное содержание этапов эконометрического исследования.

3. Сущность подходов по определению параметров линейной регрессии.

4. Сущность и особенность применения метода наименьших квадратов при определении параметров уравнения регрессии.

5. Какие показатели используются для оценки тесноты взаимосвязи исследуемых факторов?

6. Сущность линейного коэффициента корреляции.

7. Сущность коэффициента детерминации.

8. Сущность и основные особенности процедур оценки адекватности (статистической значимости) регрессионных моделей.

9. Оценка адекватности линейных регрессионных моделей по коэффициенту аппроксимации.

10. Сущность подхода оценки адекватности регрессионных моделей по критерию Фишера. Определение эмпирических и критических значений критерия.

11. Сущность понятия «дисперсионный анализ» применительно к эконометрическим исследованиям.

12. Сущность и основные особенности процедуры оценки значимости параметров линейного уравнения регрессии.

13. Особенности применения распределения Стьюдента при оценке значимости параметров линейного уравнения регрессии.

14. В чем состоит задача прогноза единичных значений исследуемого социально-экономического явления?

1. Построить поле корреляции и сформулировать предположение о форме уравнения взаимосвязи исследуемых факторов;

2. Записать основные уравнения метода наименьших квадратов, произвести необходимые преобразования, составить таблицу для промежуточных расчетов и определить параметры линейного уравнения регрессии;

3. Осуществить проверку правильности проведенных вычислений с помощью стандартных процедур и функций электронных таблиц Excel.

4. Провести анализ результатов, сформулировать выводы и рекомендации.

1. Расчет значения линейного коэффициента корреляции;

2. Построение таблицы дисперсионного анализа;

3. Оценка коэффициента детерминации;

4. Осуществить проверку правильности проведенных вычислений с помощью стандартных процедур и функций электронных таблиц Excel.

5. Провести анализ результатов, сформулировать выводы и рекомендации.

4. Провести общую оценку адекватности выбранного уравнения регрессии;

1. Оценка адекватности уравнения по значениям коэффициента аппроксимации;

2. Оценка адекватности уравнения по значениям коэффициента детерминации;

3. Оценка адекватности уравнения по критерию Фишера;

4. Провести общую оценку адекватности параметров уравнения регрессии;

5. Осуществить проверку правильности проведенных вычислений с помощью стандартных процедур и функций электронных таблиц Excel.

6. Провести анализ результатов, сформулировать выводы и рекомендации.

1. Использование стандартных процедур мастера функций электронных таблиц Excel (из разделов «Математические» и «Статистические»);

2. Подготовка данных и особенности применения функции «ЛИНЕЙН»;

3. Подготовка данных и особенности применения функции «ПРЕДСКАЗ».

1. Использование стандартных процедур пакета анализа данных электронных таблиц Excel;

2. Подготовка данных и особенности применения процедуры «РЕГРЕССИЯ»;

3. Интерпретация и обобщение данных таблицы регрессионного анализа;

4. Интерпретация и обобщение данных таблицы дисперсионного анализа;

5. Интерпретация и обобщение данных таблицы оценки значимости параметров уравнения регрессии;

При выполнении лабораторной работы по данным одного из вариантов необходимо выполнить следующие частные задания:

1. Осуществить выбор формы уравнения взаимосвязи исследуемых факторов;

2. Определить параметры уравнения регрессии;

3. Провести оценку тесноты взаимосвязи исследуемых факторов;

4. Провести оценку адекватности выбранного уравнения регрессии;

5. Провести оценку статистической значимости параметров уравнения регрессии.

6. Осуществить проверку правильности проведенных вычислений с помощью стандартных процедур и функций электронных таблиц Excel.

7. Провести анализ результатов, сформулировать выводы и рекомендации.

Задания для практических и лабораторных работ по теме «Парная линейная регрессия и корреляция в эконометрических исследованиях».

Вариант 1 Вариант 2 Вариант 3 Вариант 4 Вариант 5
x y x y x y x y x y
Вариант 6 Вариант 7 Вариант 8 Вариант 9 Вариант 10
x y x y x y x y x y