Коэфф. (индекс) множественной корреляции

1. Парная корреляция 1

2. Множественная корреляция 26

1. Парная корреляция

При парной корреляции устанавливают зависимость меж­ду двумя признаками, один из которых является факторным, другой  результатив­ным. Связь между ними может иметь различный характер. Поэтому важно правильно установить форму связи между признаками и в соответствии с этим по­добрать математическое уравнение, выражающее эту связь.

Вопрос о форме связи можно решить несколькими спосо­бами: на основе логического анализа, по данным статистичес­кой группировки или графическим способом. При парной корреляции предпочтителен последний способ, так как он позволяет выявить не только характер связи, но дает пред­ставление о степени связи.

После того, как определен вид уравнения связи, необхо­димо найти числовые значения его параметров. При вычисле­нии параметров применяют различные методы: метод наи­меньших квадратов, метод средних, метод наименьшего пре­дельного уклонения и др. Наиболее распространенным явля­ется метод наименьших квадратов. При его использовании находят такие значения параметров уравнения регрессии, при которых сумма квадратов отклонений фактических данных от расчетных является минимальной:

где y – фактическое значение результативного признака;

расчетное значение результативного признака.

Для этого решают систему нормальных уравнений, кото­рые строятся следующим образом. Исходное уравнение пере­множают сначала на коэффициент при первом неизвестном и полученные данные суммируют. Затем исходное уравнение перемножают на коэффициент при втором неизвестном, полу­ченные данные также суммируют и т. д.

Рассмотрим, как получается система нормальных уравне­ний для уравнения линейной регрессии
.

В данном уравнении коэффициент при первом неизвестном а 0 равен 1. Следовательно, исходное уравнение после перемножения сохраняет прежний вид:

,

а после суммирования

.

Коэффициент при втором неизвестном a 1 равен x . Умно­жая на него все члены исходного уравнения, получим:

,

а после суммирования

.

Значения
,
,
и
рассчитывают по данным на­блюдения, а неизвестные параметрыa 0 и a 1 путем решения системы уравнений:

Правила получения системы нормальных уравнений распространяются на все виды уравнений регрессии. После того, как определены параметры уравнения регрес­сии, необходимо его оценить, то есть проверить, насколько оно соответствует изучаемой совокупности и как тесно связан результативный признак с фактором, обусловливающим его уровень. Для этого сравнивают вариацию значений результа­тивного признака, рассчитанных по уравнению регрессии, то есть зависящих от факторного признака, с вариацией факти­ческих (исходных) значений результативного признака. Чем ближе первая вариация будет ко второй, тем в большей сте­пени уравнение регрессии отражает связь между признаками, тем теснее они связаны.

Показатель, характеризующий отношение вариаций рас­четных и исходных значений результативного признака, на­зывают индексом корреляции. Его рассчитывают по формуле:

,

где I – индекс корреляции;

общая дисперсия результативного признака (средний квадрат отклонений фактических значений у от средней );

факторная дисперсия результативного признака, рассчитанного по уравнению регрессии (средний квадрат отклонений расчетных значений от средней);

n – численность совокупности.

Индекс корреляции изменяется в пределах от 0 до 1. Он показывает, что чем ближе его значение к 1, тем сильнее связь между признаками, и тем лучше уравнение регрессии описывает взаимосвязь между признаками. При индексе кор­реляции равном 1 взаимосвязь между признаками является функциональной. Если же индекс корреляции равен 0, то связь между признаками отсутствует.

Поскольку факторная дисперсия показывает вариацию результативного признака, зависящую от факторного призна­ка, то можно рассчитать остаточную дисперсию, показываю­щую вариацию других неучтенных факторов. Она равна раз­нице между общей и факторной дисперсиями:

где  остаточная дисперсия.

Остаточная дисперсия показывает вариацию фактических значений результативного признака относительно расчетных значений, то есть колеблемость фактических значений относи­тельно линии регрессии. Чем меньше будет эта колеблемость, тем в большей степени уравнение регрессии отражает связь между признаками.

Формула индекса корреляции, рассчитанного на основе ос­таточной и общей дисперсий, имеет вид:

.

Для линейной регрессии индекс корреляции называют коэффициентом корреляции. Формула его при парной корре­ляции после преобразования имеет вид:

,

где r – коэффициент корреляции;


средние значения факторного и результативного признаков;

среднее значение произведений факторного и результативного признаков;


средние квадратические отклонения факторного и результативного признаков.

В отличие от индекса корреляции коэффициент корреля­ции показывает не только тесноту связи, но и ее направление, поскольку меняется в пределах от −1 до +1. Если коэффи­циент корреляции положительный, то связь между призна­ками прямая (прямо пропорциональная), если отрицательный, то связь обратная (обратно пропорциональная).

Квадраты индекса корреляции и коэффициента корреля­ции называют соответственно индексом детерминации (I 2) и коэффициентом детерминации (r 2). Индекс детерминации и коэффициент детерминации показывают, какая доля общей вариации результативного признака определяется изучаемым фактором.

Так как надежность изучения связей в значительной сте­пени зависит от количества сопоставляемых данных, необхо­димо измерять существенность полученного уравнения регрес­сии и индекса (коэффициента) корреляции. Показатели кор­реляции, исчисленные для ограниченной по объему совокуп­ности, могут быть искажены действием случайных факторов.

Существенность индекса (коэффициента) корреляции, а, следовательно, всего уравнения регрессии, может быть оцене­на с помощью дисперсионного анализа (F -критерия Фишера). При этом сравнивают факторную и остаточную дисперсии с учетом числа степеней свободы вариации. F -критерий в данном случае рассчиты­вают по формуле:

,

где
 выборочная факторная дисперсия;

выборочная остаточная дисперсия;

n – численность выборочной совокупности;

k – число параметров в уравнении регрессии.

Значение F -критерия можно получить также, используя значения индекса или коэффициента корреляции:

;
.

Полученное значение F-критерия сравнивают с табличным значением. При этом для факторной дисперсии число степеней свободы вариации составляет
, а для остаточной дисперсии
Если фактическое значе­ниеF -критерия больше табличного, следовательно, связь между признаками достоверна и уравнение регрессии в пол­ной мере отражает эту связь. Если фактическое значение F -критерия меньше табличного, то можно сделать вывод, что связь между признаками носит случайный характер.

Для оценки значимости индекса (коэффициента) корреля­ции и уравнения регрессии также используют t -критерий Стьюдента, который для больших выборок рассчитывают по формулам:


Для малых выборок формулы имеют вид:


Также, как при дисперсионном анализе, фактическое зна­чение t -критерия сравнивают с табличным с учетом числа степеней свободы вариации = n k . Если фактическое значение t -критерия больше табличного, то связь достоверна, если меньше, то связь несущественна.

Рассмотрим методику корреляционного анализа для пар­ной корреляции.

Пример 1 . По выборочным данным получены сведения о среднегодовом удое коров и расходе кормов на голову (табл. 7.1).

Корреляционное отношение

Коэффициент корреляции является полноценным показателем тесноты связи лишь в случае линейной зависимости между переменными. Однако часто возникает необходимость в достоверном показателе интенсивности связи при любой форме зависимости.

Для получения такого показателя вспомним правило сложения дисперсий (19)

где S 2 y -- общая дисперсия переменной

S " 2 iy -- средняя групповых дисперсий S у , или остаточная дисперсия --

Остаточной дисперсией измеряют ту часть колеблемости Y, которая возникает из-за изменчивости неучтенных факторов, не зависящих от X.

Межгрупповая дисперсия выражает ту часть вариации Y, которая обусловлена изменчивостью X. Величина

получила название эмпирического корреляционного отношения Y по X. Чем теснее связь, тем большее влияние на вариацию переменной доказывает изменчивость X по сравнению с неучтенными факторами, тем выше з yx .

Величина з 2 ух , называемая эмпирическим коэффициентом детерминации, показывает, какая часть общей вариации Y обусловлена вариацией X. Аналогично вводится эмпирическое корреляционное отношение X по Y.

Отметим основные свойства корреляционных отношений (при достаточно большом объеме выборки п):

1. Корреляционное отношение есть неотрицательная величина, не превосходящая 1: 0?з? 1.

2. Если з = 0, то корреляционная связь отсутствует.

3. Если з= 1, то между переменными существует функциональная зависимость.

4. з xy ? з xy т.е. в отличие от коэффициента корреляции r (для которого r yx = r xy = r ) при вычислении корреляционного отношения существенно, какую переменную считать независимой, а какую -- зависимой.

Эмпирическое корреляционное отношение з xy является показателем рассеяния точек корреляционного поля относительно эмпирической линии регрессии, выражаемой ломаной, соединяющей значения y i . Однако в связи с тем, что закономерное изменение у, нарушается случайными зигзагами ломаной, возникающими вследствие остаточного действия неучтенных факторов, R xy преувеличивает тесноту связи. Поэтому наряду с з xy рассматривается показатель тесноты связи R yx , характеризующий рассеяние точек корреляционного поля относительно линии регрессии у х.

Показатель R yx получил название теоретического корреляционного отношения или индекса корреляции Y по X

где дисперсии д 2 у и s " y 2 определяются по (20) - (22), в которых групповые средние y i , заменены условными средними у хi , вычисленными по уравнению регрессии. Подобно R yx вводится и индекс корреляции X по Y

Достоинством рассмотренных показателей з и R является то, что они могут быть вычислены при любой форме связи между переменными. Хотя з и завышает тесноту связи по сравнению с R, но для его вычисления не нужно знать уравнение регрессии. Корреляционные отношения з и R связаны с коэффициентом корреляции r следующим образом:

Покажем, что в случае линейной модели, т.е. зависимости

у х - у = b yx (x - х), индекс корреляции R xy равен коэффициенту корреляции r (по абсолютной величине): R yx = |r| (или R yx= |r|), для простоты n i = 1. По формуле (26)


(так как из уравнения регрессии y xi -y=b yx (x i -x)

Теперь, учитывая формулы дисперсии, коэффициентов регрессии и корреляции, получим:

Индекс корреляции

Коэффициент индекса корреляции показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной. Чем ближе индекс корреляции к 1, тем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает зависимость переменных.

Проверка значимости корреляционного отношения з основана на том, что статистика

(где т -- число интервалов по группировочному признаку) имеет F-распределение Фишера - Снедекора с к1=т- 1 и k 2 =n - т степенями свободы. Поэтому з значимо отличается от нуля, если F >F a,k1,k2 , где F a,k1,k2 - табличное значение F-критерия на уровне значимости б при числе степеней свободы к 1 = т - 1 и к 2 = п - т.

Индекс корреляции R двух переменных значим, если значение статистики:

больше табличного F a,k1,k2 , где к1=1 и k 2 = n - 2.

Коррелированность и зависимость случайных величин

Две случайные величины x и у называют коррелированными, если их корреляционный момент (или, что то же, коэффициент корреляции) отличен от нуля; X и у называют некоррелированными величинами, если их корреляционный момент равен нулю. Две коррелированные величины также и зависимы. Действительно, допустив противное, мы должны заключить, что K xy =0, а это противоречит условию, так как для коррелированных величин K xy ?0. Обратное предположение не всегда имеет место, т. е. если две величины зависимы, то они могут быть как коррелированными, так и некоррелированными. Другими словами, корреляционный момент двух зависимых величин может быть не равен нулю, но может и равняться нулю.

Итак, из коррелированности двух случайных величин следует их зависимость, но из зависимости еще не вытекает коррелированность из независимости двух величин следует их некоррелированность, но из некоррелированности еще нельзя заключить о независимости этих величин.


Исторически первым показателем тесноты связи был парный коэффициент корреляции, предложенный К. Пирсоном. Он основан на показателе ковариации, который представляет собой среднее значение произведения отклонений индивидуальных значений результативного и факторного признаков от своих средних значений. Показатель ковариации оценивает совместное изменение двух признаков, результата и фактора:

где - значение признака-результата у i-й единицы совокупности; - значение признака-фактора у i-й единицы совокупности; - среднее значение признака-результата; - среднее значение признака-фактора.

Показатель ковариации содержательно сложно интерпретировать. Нормированное значение показателя ковариации – это и есть показатель парной корреляции Пирсона.

, (53)

или после преобразований:

, (54)

где - стандартное отклонение признака-результата; - стандартное отклонение признака-фактора.

Достоинством коэффициента корреляции является то, что он имеет пределы изменения, следовательно, его величина легко может быть интерпретирована. Значения показателя изменяются от -1 до +1. Близость коэффициента к нулю свидетельствует об отсутствии корреляционной зависимости. Близость к единице – о тесной корреляционной зависимости. Знак коэффициента корреляции указывает на прямую, либо обратную зависимость. Величина конкретных значений интерпретируется следующим образом:

- связь практически отсутствует;

- связь заметная;

- связь умеренная;

- связь тесная.

Парный коэффициент корреляции – симметричный показатель, т.е. . Это означает, что высокое значение коэффициента корреляции не может свидетельствовать о наличии причинно-следственной связи, а говорит лишь о наличии параллельной вариации признаков (показателей). Что есть фактор, а что есть результат, не имеет значения. Наличие причинно-следственной связи обосновывается теоретическим анализом изучаемого объекта на основе положений экономической теории.

Расчет коэффициента корреляции, как и большинства статистических показателей, рассчитываемых по ограниченному объему совокупности, сопровождается оценкой его значимости (существенности). Необходимо подтвердить, что полученное значение коэффициента – не результат действия случайных факторов. Для оценки значимости рассчитывается t-статистика, как отношение оцениваемой характеристики (в данном случае - r) к ее стандартной ошибке (). Иными словами, осуществляется проверка гипотезы об отсутствии корреляционной зависимости между изучаемыми переменными, т.е. предполагается, что коэффициент корреляции в генеральной совокупности равен нулю ():

(55)

При условии справедливости нулевой гипотезы, распределение t-статистики соответствует закону распределения вероятностей Стьюдента с n-2 степенями свободы. Исходя из этого, находится табличное значение t-статистики, соответствующее заданному аналитиком уровню вероятности и полученному числу степеней свободы. Если расчетное значение t окажется больше табличного, то гипотеза об отсутствии связи должна быть отвергнута (с вероятностью ошибки =1- принятый уровень вероятности) и принята альтернативная гипотеза о значимости полученного коэффициента корреляции, т.е. о наличии статистически значимой связи между изучаемыми признаками.

В практике экономических исследований и анализа часто приходится изучать множественную корреляционную зависимость, т.е. оценивать влияние двух и более факторов на признак-результат. Теснота связи между комплексом факторов и зависимой переменной оценивается с помощью множественного коэффициента корреляции (). При двухфакторной зависимости множественный коэффициент корреляции рассчитывается следующим образом:

где - парные коэффициенты корреляции результата и каждого из факторов, - коэффициент корреляции между факторами.

Множественный коэффициент корреляции изменяется от нуля до единицы, не может быть отрицательным. Интерпретация конкретных значений множественного коэффициента корреляции аналогична интерпретации значений парного коэффициента с той только разницей, что оценивается теснота корреляционной зависимости между результативным признаком и всей совокупностью анализируемых факторов.

Квадрат коэффициента корреляции (r 2 ; ) – это показатель, который называется коэффициентом детерминации. Он характеризует долю объясненной (факторной) дисперсии результативного признака в общей дисперсии результативного признака.

При изучении множественной корреляционной зависимости рассчитываются также частные коэффициенты корреляции, характеризующие тесноту связи между результатом и одним признаком-фактором, при условии элиминирования влияния других факторов, включенных в анализ. Элиминирование выполняется путем закрепления значений факторов (кроме оцениваемого) на неизменном уровне (как правило, на среднем).

При двухфакторной корреляционной зависимости рассчитывается два частных коэффициента корреляции:

, (57)

- данный частный коэффициент характеризует степень тесноты корреляционной зависимости между результатом (y) и фактором x 1 при элиминировании фактора x 2.

, (58)

Этот коэффициент характеризует тесноту зависимости признака-результата (y) от признака- фактора x 2 при элиминировании фактора x 1.

Коэффициенты корреляции, в большей степени, пригодны для оценки линейной зависимости между изучаемыми признаками. Если связь нелинейная, то следует отдать предпочтение универсальному показателю, который называется корреляционное отношение() . Оно может быть:

Ø Эмпирическое, рассчитанное по данным аналитической группировки, как отношение межгрупповой дисперсии () к общей ():

. (59)

Ø Теоретическое, рассчитанное по результатам регрессионного анализа, как отношение факторной дисперсии () к общей ():

. (60)

Корреляционное отношение изменяется так же от нуля до единицы и интерпретируется аналогично коэффициенту корреляции. Квадрат корреляционного отношения () - коэффициента детерминации.

Для понимания сути корреляционного отношения и коэффициента детерминации, следует сформулировать правило сложения дисперсий в терминах регрессионного анализа. Оно звучит так: общая дисперсия признака-результата есть сумма факторной и остаточной дисперсий:

. (61)

Факторная дисперсия () – это аналог межгрупповой дисперсии. Показатель характеризует вариацию признака-результата, обусловленную вариацией признаков-факторов, включенных в анализ.

Остаточная дисперсия( ) – аналог внутригрупповой дисперсии. Характеризует вариацию признака-результата, обусловленную вариацией факторов, не включенных в анализ, т.е. оставшихся за пределами внимания аналитика.

Общая дисперсияпризнака-результата () обусловлена вариацией всех факторов, объективно влияющих на результат (зависимую переменную).

Коэффициент детерминации ( , )– это важный аналитический показатель, характеризующий долю факторной дисперсии в общей дисперсии результативного признака, т.е. долю объясненной вариации зависимой переменной, которую удается объяснить вариацией факторов, включенных в анализ.

Величина коэффициента детерминации реагирует на число факторов, включенных в уравнение регрессии. Поэтому для ответа на вопрос, какую часть дисперсии результативного признака удается объяснить в каждом конкретном случае, исходят из величины скорректированного коэффициента детерминации. Корректировка коэффициента осуществляется с учетом числа степеней свободы, т.е. с учетом объема изучаемой совокупности и числа факторов, включенных в анализ:

, (62)

где - коэффициента детерминации, скорректированный с учетом числа степеней свободы; n – объем изучаемой совокупности; k – число факторов, включенных в анализ.

Оценка корреляционной зависимости может быть также дана на основе индекса корреляции ( - «ро»), который рассчитывается с использованием величины остаточной дисперсии по следующей формуле:

. Суть данного показателя также вытекает из правила сложения дисперсий, т.е. - аналог коэффициента корреляции, а - коэффициента детерминации.

Как акции, так и индексы нередко используются для прогнозирования именно валютного рынка. Ничего удивительного, в этом нашем мире спекулянтов все, так или иначе, взаимосвязано. Безусловно, фондовый рынок - самый частый гость финансовых новостей на ТВ и в интернете. Акции то, акции се… акции Apple выросли на 5%, ну и замечательно, я как раз люблю свой iPhone.

Тут сразу же прослеживается связь между акциями и валютами. Скажем, если вы захотите купить акции японской компании на Токийской фондовой бирже, сделать это можно только в национальной валюте. В результате, ваши рубли или что там у вас есть в заначке нужно будет конвертировать в йену (JPY), что приводит, естественно, к увеличению спроса на нее. Чем больше акций на Токийской бирже покупается, тем йена более востребована. И напротив, чем больше валюту продают, для любых целей, тем меньше ее стоимость.

Когда фондовый рынок страны кажется инвесторам вкусным и питательным, они начинают заливать его деньгами. И напротив, если фондовый рынок страны находится в развалинах, инвесторы бегут с него сломя голову, ища более привлекательные места для инвестиций.

Трейдеры БО и форекса акции, естественно, не покупают (разве что CFD на них) хотя многие БО конторы и принимают ставки на их котировки. Несмотря на это, состояние акций ведущих стран мира должно представлять для вас первостепенный интерес.

Если фондовый рынок одной страны показывает лучшие результаты, нежели рынок другой, капитал из одной страны будет перетекать в другую. Это незамедлительно скажется на их валютах. Где деньги - там и крепче валюта, где фондовый рынок слаб - национальная валюта ослабляется.

  • Сильный фондовый рынок - сильная валюта.
  • Слабый фондовый рынок - слабая валюта.

Другими словами, между состоянием фондового рынка и курсом национальной валюты нередко прослеживается прямая корреляция. Упал юань - перед этим рухнула Шанхайская биржа. Растет MICEX (индекс Московской биржи) – за ним бежит рубль.

Самый простой способ отслеживать состояние фондового рынка - это поставить на график специальный индекс. У него есть цена, как и у каждого актива и за ней весьма удобно наблюдать.

Основные мировые индексы

Рассмотрим ключевые мировые индексы, что нас интересуют. Как вы сразу заметите, многие из них коррелируют и дополняют друг друга.

Индекс Доу Джонса

Старейший и самый известный индекс в мире. Их, на самом-то деле, несколько, но самый популярный называется «промышленный индекс Доу Джонса», он же Dow Jones Industrial Average (тикер DJIA ).

Ключевой фондовый индекс США, в котором объединены 30 компаний с публично доступными акциями. Кстати несмотря на название, эти компании не особенно связаны с промышленностью, ибо она сейчас не в фаворе. Там просто 30 крупнейших компаний Америки.

За этим индексом пристально наблюдают инвесторы во всем мире. Он представляет собой отличный индикатор всего состояния американской экономики, реагирует на местные и зарубежные экономические и политические события. В индексе отслеживаются невероятно богатые компании, вы слышали о большинстве из них. Макдональдс, Intel, Pfizer – все это там есть.

Индекс S&P 500

Индекс Standard & Poor 500, он же S&P 500 – один из самых известных индексов планеты. Это средневзвешенный индекс цен на акции 500 крупнейших компаний США.

По сути, это ключевой индикатор всей американской экономики и по нему судят о ее состоянии. Индекс S&P 500 (тикер SPX ) - самый популярный по торговым объемам индекс в мире после промышленного индекса Доу Джонса.

Есть целые фонды, будь-то ETF либо пенсионные, основная задача которых - отслеживать эффективность S&P 500, в торговлю которым вложены сотни миллиардов долларов.

NASDAQ Composite

Это биржевой индекс NASDAQ (National Association of Securities Dealers Automated Quotations) – крупнейшего электронного рынка США, в котором участвует более 4000 компаний и корпораций.

Это один из самых ликвидных фондовых рынков в мире. Тикер на графике NASX .

Nikkei

Индекс Nikkei – это такой промышленный индекс Доу Джонса, но для японцев. В нем усредненно отображаются показатели 225 крупнейших компаний японского фондового рынка.

Типичные представители Nikkei - это компании Toyota, Mitsubishi, Fuji и прочие. Тикер на графике NKY .

DAX

Расшифровывается как Deutscher Aktien Index - индекс немецкой фондовой биржи, включающий в себя 30 «голубых фишек» — крупнейших компаний, чьи акции торгуются на Франкфуртской фондовой бирже.

Германия - самая мощная экономика ЕС, поэтому если вас интересует судьба Евро - вы должны смотреть за DAX. В индекс входят компании вроде Adidas, Deutsche Bank, SAP, Daimler AG и Volkswagen. Тикер на графике DAX .

DJ EURO STOXX 50

Индекс Dow Jones Euro Stoxx 50 - один из ключевых индексов еврозоны, отображающих успехи крупнейших компаний ЕС. В индекс входит 50 предприятий из 12 стран ЕС.

Создан компанией Stoxx Ltd., что является совместным предприятием Deutsche Boerse AG, Dow Jones & Company и SIX Swiss Exchange. Тикер на графике MPY0 .

FTSE

Расшифровывается как Financial Times Stock Exchange, он же «футси» (footsie) - индекс акций крупнейших компаний, котируемых на Лондонской фондовой бирже.

Есть несколько его разновидностей (так часто с индексами бывает). Скажем, FTSE 100 включает в себя 100 компаний, а FTSE 250, соответственно, 250 крупнейших компаний Великобритании. Тикер на графике FTSE .

Hang Seng

Фондовый индекс Hang Seng для Гонконгской биржи отображает изменения в ценах компаний, что котируются на бирже Гонконга.

В индекс входит 50 крупнейших компаний с капитализацией 58% от общего объема биржи. Тикер на графике HSI .

Индекс РТС

Наш, родной русский индекс (тикер RTS ), учитывающий 50 крупнейших отечественных компаний, чьи акции котируются на Московской бирже. Считается, кстати, в долларах США. Список компаний, чьи акции учитываются в индексе, пересматриваются раз в 3 месяца. Появился индекс 1 сентября 1995 года и получил базовое значение 100.

В индекс РТС входят такие компании, как АФК Система, Аэрофлот, Башнефть, Лукойл, РусГидро, УралКалий, Татнефть и многие другие. Есть и разновидности этого индекса - RTS-2, RTS Standard Index и прочие, но старый добрый индекс РТС - самый популярный.

Как видите, индексы штука простая и очень полезная - позволяет сразу получить полную информацию о состоянии не просто отдельно взятого фондового рынка, но и всей экономики страны в целом. Ведь состояние крупнейших компаний и является ключевым индикатором.

Взаимосвязь фондового и валютного рынка

Теперь разберемся, стоит ли принимать во внимание все эти индексы, если работать с валютными парами в FX/БО. Безусловно, стоит - для определения общих рыночных трендов на старших таймфреймах (вспоминаем ).

В целом, если не мудрить, когда фондовый рынок на подъеме, инвесторы охотнее в него инвестируют, скупая для этого национальную валюту. Что приводит, естественно, к ее укреплению.

Если же фондовый рынок безутешно падает, инвесторы забирают свои денежки, конвертируя их обратно в свою валюту и национальная денежная единица ослабевает. Именно эта история происходит сейчас у нас, достаточно взглянуть на ужасающее состояние индекса РТС, что падает аж с 2011 года.

Однако, есть два исключения - США и Япония. Рост экономики этих стран нередко приводит к тому, что их национальные валюты ослабевают - такой вот забавный парадокс связанный, тем не менее, с определенными экономическими механизмами.

Взглянем на то, как промышленный индекс Доу Джонса взаимодействует с Nikkei.

Как видим, индекс DJIA и Nikkei 225 идут друг за другом как влюбленная парочка. При этом, обратите внимание - иногда движение одного индекса предвосхищает движение другого, что позволяет использовать такую миниатюрную машину времени для прогнозов.

USD/JPY и индекс Nikkei

Посмотрим, как японский индекс отражается на валюте доллар/йена. Прежде чем в 2007 году начался глобальный финансовый кризис, когда ведущие экономики мира падали квартал за кварталом, между Nikkei и USD/JPY была обратная корреляция.

Инвесторы были уверены, что эффективность японского фондового рынка напрямую влияла на экономическое состояние страны, поэтому рост Nikkei привел к укреплению японской йены. Справедлива и обратная ситуация, если Nikkei падает - йене тоже не здоровится.

И все было хорошо до тех пор, пока не грянул финансовый кризис. Тут-то все перевернулось с ног на голову. В результате, на графике индекс и валюта стали идти в одном направлении. Чудеса, да и только: укрепляется Nikkei - ослабевает йена и наоборот.

Тем не менее, корреляция осталась более чем прозрачной - просто изменилась ее полярность.

USD/JPY и DJIA

Индекс Доу Джонса и доллар/йена, дружат ли они или так, провели ночь вместе и «пока, я позвоню»? Казалось бы, между ними должна быть четкая корреляция. Однако, судя по графику, ситуация вовсе не такая однозначная. Хотя некоторая корреляция присутствует, она вовсе не безусловная.

Видно что после финансового кризиса все снова смешалось и были периоды, когда вместо взаимодействия на графике было черти-что.

Что ж, никто не обещал, что будет легко. Понятно, что нам нужно использовать технический и фундаментальный анализ, не говоря уже об инструментах вроде , чтобы выжать с индексов максимальную пользу.

EUR/JPY и фондовые индексы

Как мы уже обсуждали, чтобы купить акции какой-то компании на фондовой бирже, нужно ваши бумажки поменять на национальную валюту. Возьмем немецкий индекс DAX. В теории, если растет индекс - то укрепляется и евро, ведь все напропалую скупают европейские акции. И такая корреляция действительно существует, хотя и не абсолютная.

Что еще интереснее, у EUR/JPY есть корреляция и с другими мировыми фондовыми индексами. Не удивительно, ведь йена, как и американский доллар, считается «безопасной гаванью» во времена экономических кризисов. Если мировая экономика падает и трейдерам страшненько, они нередко забирают деньги с фондового рынка, что приводит к падению индексов DAX и S&P 500. В результате, цена EUR/JPY падает, ибо трейдеры скупают йену.

Когда же все хорошо, девушки красивы, а солнце сияет, инвесторы заливают деньги в фондовый рынок, то цена на EUR/JPY растет. Вот так и появляется корреляция.

Сравним EUR/JPY с S&P 500:

А вот с DAX:

Мы видим пусть не зеркальную, но вполне отчетливую корреляцию. Так что обязательно возьмите вашу любимую валютную пару и посмотрите, есть ли у нее корреляция с фондовыми индексами или другими активами?

Скажем, взял я любимую свою пару GBP/JPY и сравнил с FTSE. Что мы видим? Им явно интересно вместе, экие шалуны.

Ну а это из разряда «лучше один раз увидеть». Корреляция USD/RUB и цены на нефть сорта Brent. Картина маслом, почти Пикассо: эти ребята явно поцелуются и сойдутся вместе, как уже бывало с ними ранее.

Все взаимосвязано

Корреляцию можно расценивать как дополнительный индикатор глобального рыночного тренда. Если показатели двух взаимосвязанных активов расходятся - тренды каждого намного проще определить методами технического анализа. А уж что делать с линиями тренда и вы так знаете.

Рассмотрим несколько популярных корреляций между товарами и валютными парами.

  • Золото вверх, доллар вниз . В экономические кризисы инвесторы часто за доллары покупают золото, что всегда в цене.
  • Золото вверх, AUD/USD вверх . Австралия - третий по величине поставщик золота в мире, поэтому курс австралийского доллара в немалой степени связан со спросом на золото.
  • Золото вверх, NZD/USD вверх . Новая Зеландия тоже производит немало золотишка.
  • Золото вверх, USD/CAD вниз . Канада - 5й по величине поставщик золота в мире. Поэтому если цены на золото идут вверх, пара USD/CAD движется вниз (ибо все покупают CAD).
  • Золото вверх, EUR/USD вверх . Как золото, так и евро считаются такими себе «антидолларами». Поэтому рост цены на золото нередко приводит к росту курса EUR/USD.
  • Нефть вверх, USD/CAD вниз . Канада - крупнейший нефтедобытчик мира, экспортирующий более 2 миллионов баррелей в сутки, в основном, в США. Если нефть дорожает, пара на графике идет вниз.
  • Проценты по облигациям вверх/нац. валюта вверх . Тут все понятно, чем больше процентов дают гособлигации, тем больше их покупают за национальную валюту. Растет спрос на нее - растет и ее курс.
  • DJIA вниз, Nikkei вниз . Экономики США и Японии очень тесно связаны и вместе идут как вверх, так и вниз.
  • Nikkei вниз, USD/JPY вниз . Инвесторы часто выбирают йену как «безопасную гавань» в периоды экономических проблем.

Фондовый рынок, состояние которого можно анализировать через индексы, самым непосредственным образом коррелирует с валютными парами. Изучая их взаимодействие вы нередко сможете найти ситуации, когда эти данные расходятся так, что одни показатели выступают как “машина времени” для другого. При этом важен факт не только самой корреляции, но и изменения ее полярности с позитивной на негативную и наоборот.

Наконец, почти у всех брокеров есть возможность работать прямо по этим индексам, что в БО, что в форексе. Чем и можно воспользоваться, хоть с корреляциями, хоть без них.

  • Назад:
  • Вперед:

Коэфф. (индекс) множественной корреляции

R = –

Свойства R:

R ху = R ух.

1 . До 0,3 связь слабая 2 . 0,3-0,5 связь умеренная

3 . 0,5-0,7 связь заметная 4. 0,7-0,9 связь высокая

5

R 2 скорр =

R 2 скорр всегда больше, чем R 2 факт.


22. Показатели частной корреляции

Корень из R 2 = R = корень из (SS R / SS T)= корень из (1 - SS E / SS T);

R = – чем ближе к 1, тем теснее связь (а в парной = [-1; 1]).

Свойства R:

R - стандартизованный коэффициент регрессии;

Если связи между х и у нет, то R = 0; НО если R = 0, то нет только линейной связи;

R ху = R ух.

Шкала значения коэфф. корреляции:

1 . До 0,3 связь слабая 2 . 0,3-0,5 связь умеренная

3 . 0,5-0,7 связь заметная 4. 0,7-0,9 связь высокая

5 . 0,9-1,0 связь весьма высокая, близкая к функциональной.

Скорректированный (нормированный) коэфф. детерминации R 2 скорр:

По R 2 можно сравнивать модели, НО необходимо пересчитать его на число степеней свободы, т.к. модели м. иметь разный набор факторов и разные числовые наблюдения.

R 2 скорр = 1 – (SS E: (n-m-1) / SS T: (n-1)) = 1 – (1- R 2) * ((n-1) / (n-m-1))

R 2 скорр всегда больше, чем R 2 факт.

Показатели частной корреляции о снованы на соотношении сокращения остаточной вариации за счет дополнительно включенного в модель фактора к остаточной вариации до включения в модель соответствующего фактора.

Частные коэфф. корреляции (рекуррентные формулы - выражающие каждый член последовательности через предыдущих членов):

r yx 2. x 1 = корень из ((SS E yx 1 – SS E yx 1 x 2) / SS E yx 1) = к. из ((1 – SS E yx 1 x 2) / SS E yx 1), х 2 зафиксирован;

r yx 1. x 2 = корень из ((SS E yx 2 – SS E yx 1 x 2) / SS E yx 2) = к. из ((1 – SS E yx 1 x 2) / SS E yx 2), х 1 зафиксирован.

!!! Матрица частных коэфф. корреляции м.б. использована для отбора факторов в модель.


23. Оценка значимости уравнения множественной регрессии и его параметров

Значение коэфф. детерминации R 2 может отражать истинную зависимость, а может – стечение обстоятельств, т.к. при построении уравнения используются выборочные данные. Поэтому необходимо определить, насколько выборочные показатели (оценки) достоверны, значимы. Для этого используют вероятностные оценки стат. гипотез.



Статистическая гипотеза (Н) - предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки.

Этапы проверки статистических гипотез :

1. формулируется задача исследования в виде стат. гипотезы;

2 . выбирается статистическая характеристика гипотезы;

3. выдвигаются испытуемая и альтернативная Н 0 и Н 1 ;

4. определяется ОДЗ, критическая область и критическое значение статистического критерия;

5. вычисляется фактическое значение статистического критерия;

6. испытуемая Н 1 проверяется на основе сравнения значений фактического и критического критерия, и в зависимости от результатов проверки Н 1 либо отклоняется, либо принимается.

Критическая область – область, попадание значения статистического критерия в которую приводит к отклонению Н 0 . Вероятность попадания значения критерия в эту область равна уровню значимости (1 минус доверительная вероятность).

ОДЗ - область, попадание значения статистического критерия в которую приводит к принятию Н 0 .

I. Статистическая оценка достоверности регрессионной модели:

А. 1 . выдвигается H 0: r 2 в генеральной совокупности = 0;

2. выдвигается H 1: r 2 в генеральной совокупности не = 0;

3. определяется ОДЗ или уровень значимости;

4. рассчитывается критерий Фишера F (n – число единиц совокупности, m – число факторов):

F = MS R / MS E = (Σ(y с крыш – y ср) 2 / m) / (Σ(y– y с крыш) 2 / (n-m-1))

F = R 2 /(1-R 2) * (n-m-1)/m = R 2 / (1-R 2) * (n-2) ;

5 . определяется табличное значение критерия Фишера F табл;

6 . фактическое значение сравнивается с табличным.

а. Если F>Fтабл.

б. Если F

Вывод:

Число степеней свободы (df) - число свободно варьируемых переменных.

df T = df R + df E ; n-1 = m + (n – m – 1).

При расчете фактической суммы квадратных отклонений ((у – у с крыш) 2 = SS R) используются теоретические значения результативного признака (у с крыш), определенного по линии регрессии (у с крыш = a + bx). Т.к. объясненная (факторная) сумма квадратов зависит только от n констант, то данная модель имеет n степеней свободы.

Если разделить сумму квадратов на число степеней свободы, можно получить дисперсии на 1-у степень свободы (MS):

MS R = SS R /df R = Σ(y с крыш – y ср) 2 / m

MS Е = SS Е /df Е = Σ(y– y с крыш) 2 / (n-m-1)

Все показатели м. оформить в виде таблицы дисперсионного анализа ANOVA.

Источник вариации: df SS MS F
- регрессия m SS R MS R F
- остаток n-m-1 SS E MS E
- итого n-1 SS T

df – кол-во степеней свободы; MS =SS/df SS F = MS R /MS E – критерий Фишера.

Б. Есть частные F-критерии

F табл = 10.

Вывод:

df – кол-во степеней свободы; MS =SS/df – дисперсия на 1 степень свободы; SS x 2 = SS T * r 2 yx 2 - сумма квадратов отклонений (общ., факт., остат.); F = MS R /MS E – критерий Фишера. F = t 2 .

II. Оценка значимости коэффициентов регрессии:

1. Выдвигается Н 0: коэффициент регрессии b в генеральной совокупности равен 0;

2. Выдвигается Н 1: коэффициент регрессии b в генеральной совокупности не равен 0;

3. Определяется уровень значимости α;

4. Определяется критическое значение критерия Стьюдента (S eb – станд. ошибка b; b – коэфф. регрессии,абс. показатель силы связи(в лин. ур-ии), мера зависимости у от х):

t = b/S eb

S eb 1 = δ у / δ х1 * корень из ((1 - R 2 yx 1 x 2) / (1- r 2 x 1 x 2 * (n-m-1))

S eb 2 = δ у / δ х2 * корень из ((1 - R 2 yx 1 x 2) / (1- r 2 x 1 x 2 * (n-m-1))

а. t > t табл. , то Н 0 отклоняется, то есть параметр b не случайно отличается от нуля, сформировался под влиянием систематически действующего фактора.

б. t < t табл. , то Н 0 не отклоняется, и признается случайная природа формирования b.

Можно проверить достоверность а (свободный член уравнения регрессии; экономически не интерпретируется):

S e а = корень из (MS E / Σ(x-x ср) 2) = корень из (Σ(у-у с крыш) 2 /(n-2)) * Σx 2 /n* Σ(х- x ср) 2

III. Оценка качества (достоверности) модели

Ошибка аппроксимации (А) ошибка или остаток.

А = (Σ |(у-у с крыш) / у| * 100%) / n

Расчет м. оформить в таблице:

y x у с крыш у-у с крыш |(у-у с крыш) / у| * 100%
10,57 21,48 -10,91 103,22
17,50 22,29 -4,79 27,37
Итого: - - - - 197,15

Если n = 8, то А = 197,15 / 8 = 24,64 %

Если А<10% - норма.


24. Частные критерии Фишера в оценке результатов множественной регрессии

Есть частные F-критерии , с помощью которых м. оценить дополнительное включение фактора в модель. Необходимость такой оценки связана с тем, что не каждый фактор в модели существенно увеличивает фактическую вариацию – поэтому нужно ли включать этот фактор в модель?

Важно, что из-за различной связи между факторов, значимость одного и того же доп. фактора различна в зависимости от порядка его включения в модель.

Частные F-критерии строятся на сравнении прироста факторов на 1 степень свободы за счет доп. включения в модель фактора к остаточной вариации до модели.

F x1 = ((R 2 yx1x2 – r 2 yx2) / (1-R 2 yx1x2)) * (n-m-1) = 0,96

F x2 = ((R 2 yx1x2 – r 2 yx1) / (1-R 2 yx1x2)) * (n-m-1) = 1,9

F табл = 10.

Вывод: С вероятностью α м. утверждать, что включение фактора х 1 после х 2 не целесообразно, и включение х 2 после х 1 нецелесообразно – нельзя построить двухфакторную модель.

Все показатели м. оформить в виде частной таблицы дисперсионного анализа ANOVA.

df – кол-во степеней свободы; MS =SS/df – дисперсия на 1 степень свободы; SS x 2 = SS T * r 2 yx 2 - сумма квадратов отклонений (общ., факт., остат.); F = MS R /MS E – критерий Фишера. F = t 2 .

а. Если F>Fтабл. , то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность.

б. Если F, то гипотеза о случ… не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Вывод: с вероятностью α м. утверждать, что коэфф. детерминацииR 2 в генеральной совокупности не значим; модель недостоверна.


25. Использование фиктивных переменных в моделях множественной регрессии

Фиктивная (структурная) переменная переменная, принимающая значение 1 или 0.

Используется при решении следующих задач:

1. при моделировании качественных признаков;

2. для учета структурной неоднородности, к которой приводят качественные признаки;

3. для оценки сезонных колебаний.

Фиктивные (структурны) переменные это сконструированные искусственно переменные, например, пронумерованные атрибутивные признаки (пол, образование, регион).

Рассмотрим пример:

Дано: Z=0, если камина в доме нет; Z=1, если камин в доме есть.

Рассчитаем показатели тесноты (R 2) и силы (b, Э) связи.

Оценим значимость (достоверность) параметров модели (t) и самой модели (F, F частн).

Общий вид уравнения: Y = 50 + 16X + 3Z .

Вывод: Для домов, не имеющих камина: Y = 50 + 16X (поскольку Z =0); для домов, имеющих камин: Y = 5 + 3 + 16X = 53 + 16Х (поскольку Z =1).

Вывод:

1. Увеличение жилой площади на 1000 кв.футов приводит к увеличению предсказанной средней оценочной стоимости на 16 тыс.долл. (это b) при условии, что фиктивная переменная (наличие камина) имеет постоянное значение.

2. Если жилая площадь постоянна, наличие камина увеличивает среднюю оценочную стоимость дома на 3 тыс.долл. (это коэфф. перед Z = c).

!!! Фиктивные переменные м. вводится и в нелинейные модели . При этом они вводятся линейно.

Рассмотрим пример:

ln y = ln a + b 1 ln x 1 + b 2 z; ln y = 4 +0,3 ln x + 0,05z

y c крыш = e 4 x 0,3 e 0,05z e 4 = 65 e 0,05z = 1,05

y = a + b 1 z 1 +b 2 z 2

Параметр a - среднее значение результативного признака при z 1 , z 2 = 0.

Параметр b1 и b2 характеризует разность средних уравнений результативного признака для группы 1 и базовой группы 0.

Параметр b2 характеризует разность средних уравнений результативного признака для группы 2 и базовой группы 0.

Вывод:

1. 0,3 – коэфф. Э: при увеличении площади на 1 %, стоимость увеличивается на 0,3 %.

2. e 0,05 z - оценка стоимости домов с камином в 1,05 раз дороже (на 5 %), чем без него.


26. Предпосылки метода наименьших квадратов

МНК применяется при оценке уравнения регрессии. Делаются предпосылки относительно случайной составляющей ε (ненаблюдаемой величиной): y = a + b 1 х 1 +b 2 х 2 + … + ε.

Основные предпосылки МНК:

1. случайный характер остатков (если на поле корреляции нет направленности в расположении точек ε);

2 . нулевая средняя остатков, не зависящая от фактора x: Σ(у - у х с крыш) = 0 или нелин. модель - Σ(ln у - ln у х с крыш) = 0 и также на поле корреляции … ;

3 . гомоскедастичность (дисперсия каждого

отклонения одинакова для всех значений x );

4 . отсутствие автокорреляции остатков

(распределение остатков независимо друг от друга);

5 . остатки должны подчиняться нормальному распределению.

Если все 5 предпосылок выполнены, то оценки, полученные МНК и методом максимального правдоподобия, совпадают. Если не все – нужно скорректировать модель.
27. Гетероскедастичность - понятие, проявление и меры устранения

Проблемы, возникающие при построении регрессионных моделей:

1. Гетероскедастичность.

2. Мультиколлинеарность.

Гетероскедастичность (неоднородность) - означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Симптомы Г.:

1 . низкий коэффициент детерминации r 2 ;

2 . это м. привести к смещенности оценки.

Меры по устранению гетероскедастичности:

1 . Увеличение числа наблюдений.

2 . Изменение функциональной формы модели.

3. Разделение исходной совокупности на качественно-однородные группы и проведение анализа в каждой группе.

4 . Использование фиктивных переменных, учитывающих неоднородность.

5 . Исключение из совокупности единиц, дающих неоднородность.

Зависимость остатков от выровненного значения результата:

а. дисперсия остатков увеличивается с

увеличением выровненного значения

результата (один из случаев Г.).

б. нет зависимости (гомоскедастичность). а) б)

Тесты, используемые для выявления Г.:

1. Гольдфельда-Квандта

3. Глейзера

5. Ранговой корреляции Спирмена


28. Оценка гетероскедастичности с помощью метода Гольдфельда и Квандта

Гетероскедастичность (неоднородность) - проблема, возникающая при построении регрессионных моделей; означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Этот метод используется при малом объеме выборки. Рассмотрели однофакторную модель, для кот. дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение Г., предложили параметрический тест.

1. Все наблюдения упорядочивают по мере возрастания какого-либо фактора, который, как предполагается, оказывает влияние на возрастание дисперсии остатков.

2. Упорядоченную совокупность делят на три группы, причем первая и последняя должны быть равного объема с числом единиц, больших, чем число параметров модели регрессии. Число отобранных единиц обозначим k