В эконометрической модели уравнения регрессии

Регрессия в эконометрике

Вы будете перенаправлены на Автор24

Регрессия и ее виды

Регрессионный анализ – это основной математико-статистический инструмент в эконометрике. Регрессия представляет собой зависимость среднего значения величины $y$ от другой величины $x$ или же нескольких величин $x_i$.

Количество факторов, которые включены в равнение регрессии, определяет вид регрессии, которая может быть простой (парной) и множественной.

Простая регрессия – это модель, в которой среднее значение зависимой переменной y является функцией одной независимой переменной x.

Парная регрессия в неявном виде – это уравнение вида:

В явном виде: $y ̂= a + bx$, где $a$ и $b$ – это оценки коэффициента регрессии.

Множественной регрессией является модель, в которой среднее значение объясняемой переменной $y$ – это функция нескольких объясняющих переменных $x_1, x_2, …, x_n$. Множественная регрессия в неявном виде – это модель типа:

$y ̂= f(x_1, x_2,…, x_n)$

В явном виде: $y ̂= a + b_1x_1 + b_2x_2 + … + b_nx_n$

Примером модели множественной регрессии может выступать зависимость зарплаты работников от их возраста, уровня образования, степени квалификации, стажа работы, отрасли и т.д.

Относительно формы регрессия может быть линейной и нелинейной, предполагающей наличие нелинейных соотношений среди факторов. В большинстве случаев нелинейные модели можно привести к линейному виду.

Предпосылки регрессионного анализа

Чтобы проведение регрессионного анализа было наиболее результативным, необходимо выполнять определенные условия:

  • В любом наблюдении математические ожидания случайной ошибки должны быть равны нулю;
  • Дисперсия случайной ошибки для всех наблюдений должна быть постоянной;
  • Случайные ошибки не должны иметь между собой статической зависимости;
  • Объясняющая переменная x должна быть величиной неслучайной.

Если выполняются все вышеперечисленные условия, то модель является линейной классической регрессионной. Рассмотрим подробнее предположения и условия, составляющие основу регрессионного анализа.

Готовые работы на аналогичную тему

Согласно первому условию, случайная ошибка не должна систематически смещаться. Если в уравнении регрессии имеется постоянный член, то данное условие автоматически выполняется.

Второе условие – это наличие в каждом наблюдении только одного значения дисперсии случайной ошибки. Дисперсия – это возможное изменение случайной ошибки до проведения выборки. Величина дисперсии является неизвестной, а задача регрессионного анализа – это ее оценка. Независимость дисперсии случайных ошибок от номера наблюдения – это гомоскедастичность, т.е. одинаковый разброс. Гетероскедастичность – это зависимость дисперсии случайных ошибок от номера наблюдения.

Если не выполняется условие гомоскедастичности, то оценка коэффициентов регрессии будет неэффективной.

Третье условие состоит в некоррелированности случайных отклонений для различных наблюдений. Данное условие часто не выполняется при ситуации, когда данные – это временные ряды. Если оно не выполняется, то это означает автокорреляцию остатков. Чтобы диагностировать и устранить автокорреляцию, существуют специальные методы.

Четвертое условие представляет особую важность, поскольку если не выполняется условие неслучайности объясняющих переменных, то оценка коэффициентов регрессии будет смещенной и несостоятельной. Данное условие нарушается при ошибках в измерении объясняющих переменных или же при использовании лаговых переменных.

Парная регрессионная модель

Как правило в естественных науках рассматриваются функциональные зависимости, в которых каждое значение одной переменной соответствует единственному значению другой. Однако в экономических переменных нет таких зависимостей, но есть статистические и корреляционные зависимости.

Наибольшую опасность в парной регрессии представляют ошибки в измерениях. Если ошибки спецификации возможно уменьшить с помощью изменения формы модели, ошибки выборки – при помощи увеличения объема исходных данных, то ошибки изменения невозможно исправить.

Случайный фактор в регрессионных моделях может отсутствовать по следующим причинам:

  1. В модель не включены все объясняющие переменные. Любая модель эконометрики – это упрощение реальной ситуации, которая является сложнейшим переплетением факторов, большинство из которых не учитываются в модели, из-за чего реальные значения зависимой переменной отклоняются от модельных значений. Невозможно перечислить все виды объясняющих переменных, поскольку неизвестно заранее, какие факторы относятся к определяющим, а какие можно не учитывать.
  2. Неправильное определение функционального типа модели. Слабая изученность исследуемого процесса, его переменчивость влияет на правильность подбора его моделирующей функции. Это отражается и на отклонении модели от реальной жизни.
  3. Агрегирование переменных. Многие модели содержат зависимость между факторами, являющимися комбинацией других переменных. Например, чтобы рассмотреть в качестве зависимой переменной совокупный спрос, необходимо провести анализ зависимости, содержащей объясняемую переменную, являющуюся композицией индивидуальных спросов, которые оказывают влияние на нее. Это может послужить причиной отклонения значений реальных от модельных.
  4. Ошибки в измерениях. Даже при качественной модели ошибки в измерениях сказываются на несоответствии получаемых значений эмпирическим.
  5. Ограниченность статистической информации. Часто строятся модели, которые являются непрерывными функциями. Для этого применяется информация, имеющая дискретную структуру. Данное несоответствие выражается в случайном отклонении.
  6. Непредсказуемость человеческих факторов. Данная причина может исказить любую качественную эконометрическую модель, поскольку даже правильный выбор формы модели, скрупулезный подбор объясняющих переменных не позволяют спрогнозировать поведение индивидов.

Уравнение множественной регрессии

Назначение сервиса . С помощью онлайн-калькулятора можно найти следующие показатели:

  • уравнение множественной регрессии, матрица парных коэффициентов корреляции, средние коэффициенты эластичности для линейной регрессии;
  • множественный коэффициент детерминации, доверительные интервалы для индивидуального и среднего значения результативного признака;

Кроме этого проводится проверка на автокорреляцию остатков и гетероскедастичность.

  • Шаг №1
  • Шаг №2
  • Видеоинструкция
  • Оформление Word

Отбор факторов обычно осуществляется в два этапа:

  1. теоретический анализ взаимосвязи результата и круга факторов, которые оказывают на него существенное влияние;
  2. количественная оценка взаимосвязи факторов с результатом. При линейной форме связи между признаками данный этап сводится к анализу корреляционной матрицы (матрицы парных линейных коэффициентов корреляции). Научно обоснованное решение задач подобного вида также осуществляется с помощью дисперсионного анализа — однофакторного, если проверяется существенность влияния того или иного фактора на рассматриваемый признак, или многофакторного в случае изучения влияния на него комбинации факторов.

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

  1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.
  2. Каждый фактор должен быть достаточно тесно связан с результатом (т.е. коэффициент парной линейной корреляции между фактором и результатом должен быть существенным).
  3. Факторы не должны быть сильно коррелированы друг с другом, тем более находиться в строгой функциональной связи (т.е. они не должны быть интеркоррелированы). Разновидностью интеркоррелированности факторов является мультиколлинеарность — тесная линейная связь между факторами.

Пример . Постройте регрессионную модель с 2-мя объясняющими переменными (множественная регрессия). Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели.
Решение.
К исходной матрице X добавим единичный столбец, получив новую матрицу X

1514.5
11218
1612
1713
1814

Матрица Y

9
13
16
14
21

Транспонируем матрицу X, получаем X T :

11111
512678
14.518121314
Умножаем матрицы, X T X =
53871,5
38318563,5
71,5563,51043,25

В матрице, (X T X) число 5, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы X T и 1-го столбца матрицы X

Умножаем матрицы, X T Y =
73
563
1032,5

Находим обратную матрицу (X T X) -1

13.990.64-1.3
0.640.1-0.0988
-1.3-0.09880.14

Вектор оценок коэффициентов регрессии равен

(X T X) -1 X T Y = y(x) =
13,990,64-1,3
0,640,1-0,0988
-1,3-0,09880,14
*
73
563
1032,5
=
34,66
1,97
-2,45

Получили оценку уравнения регрессии: Y = 34.66 + 1.97X1-2.45X2
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности. Для ее проверки используют F-критерий Фишера.
R 2 = 1 — s 2 e/∑(yi — yср) 2 = 1 — 33.18/77.2 = 0.57
F = R 2 /(1 — R 2 )*(n — m -1)/m = 0.57/(1 — 0.57)*(5-2-1)/2 = 1.33
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 5 — 2 -1 = 2, Fkp(2;2) = 19
Поскольку фактическое значение F = 1.33 Пример №2 . Приведены данные за 15 лет по темпам прироста заработной платы Y (%), производительности труда X1 (%), а также по уровню инфляции X2 (%).

Год123456789101112131415
X13,52,86,34,53,11,57,66,74,22,74,53,55,02,32,8
X24,53,03,13,83,81,12,33,67,58,03,94,76,16,93,5
Y9,06,08,99,07,13,26,59,114,611,99,28,812,012,55,7

Решение. Подготовим данные для вставки из MS Excel (как транспонировать таблицу для сервиса см. Задание №2) .

Включаем в отчет: Проверка общего качества уравнения множественной регрессии (F-статистика. Критерий Фишера, Проверка на наличие автокорреляции),

После нажатия на кнопку Дале получаем готовое решение.
Уравнение регрессии (оценка уравнения регрессии):
Y = 0.2706 + 0.5257X1 + 1.4798X2
Скачать.

Качество построенного уравнения регрессии проверяется с помощью критерия Фишера (п. 6 отчета).

Пример №3 .
В таблице представлены данные о ВВП, объемах потребления и инвестициях некоторых стран.

ВВП16331,9716763,3517492,2218473,8319187,6420066,2521281,7822326,8623125,90
Потребление в текущих ценах771,92814,28735,60788,54853,62900,39999,551076,371117,51
Инвестиции в текущих ценах176,64173,15151,96171,62192,26198,71227,17259,07259,85

Решение:
Для проверки полученных расчетов используем инструменты Microsoft Excel «Анализ данных» (см. пример).

Пример №4 . На основе данных, приведенных в Приложении и соответствующих Вашему варианту (таблица 2), требуется:

  1. Построить уравнение множественной регрессии. При этом признак-результат и один из факторов остаются теми же, что и в первом задании. Выберите дополнительно еще один фактор из приложения 1 (границы наблюдения должны совпадать с границами наблюдения признака-результата, соответствующего Вашему варианту). При выборе фактора нужно руководствоваться его экономическим содержанием или другими подходами. Пояснить смысл параметров уравнения.
  2. Рассчитать частные коэффициенты эластичности. Сделать вывод.
  3. Определить стандартизованные коэффициенты регрессии (b-коэффициенты). Сделать вывод.
  4. Определить парные и частные коэффициенты корреляции, а также множественный коэффициент корреляции; сделать выводы.
  5. Оценить значимость параметров уравнения регрессии с помощью t-критерия Стьюдента, а также значимость уравнения регрессии в целом с помощью общего F-критерия Фишера. Предложить окончательную модель (уравнение регрессии). Сделать выводы.

Решение. Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор получается из выражения:
s = (X T X) -1 X T Y
Матрица X

13.910
13.914
13.715
1416
13.817
14.819
15.419
14.420
15.320
16.820
1621
16.422
16.822
17.225
1828
18.229
18.130
18.531
19.632
1936

Матрица Y
7
7
7
7
7
7
8
8
8
10
9
11
9
11
12
12
12
12
14
14

Матрица X T
11111111111111111111
3.93.93.743.84.85.44.45.36.866.46.87.288.28.18.59.69
1014151617191920202021222225282930313236

Умножаем матрицы, (X T X)

Умножаем матрицы, (X T Y)

Находим определитель det(X T X) T = 139940.08
Находим обратную матрицу (X T X) -1

Уравнение регрессии
Y = 1.8353 + 0.9459X 1 + 0.0856X 2
Для несмещенной оценки дисперсии проделаем следующие вычисления:
Несмещенная ошибка e = Y — X*s

0.62
0.28
0.38
0.01
0.11
-1
-0.57
0.29
-0.56
0.02
-0.31
1.23
-1.15
0.21
0.2
-0.07
-0.07
-0.53
0.34
0.57

se 2 = (Y — X*s) T (Y — X*s)
Несмещенная оценка дисперсии равна

Оценка среднеквадратичного отклонения равна

Найдем оценку ковариационной матрицы вектора k = σ*(X T X) -1

k(x) = 0.36
0,619-0,0262-0,0183
-0,02620,126-0,0338
-0,0183-0,03380,0102
=
0,222-0,00939-0,00654
-0,009390,0452-0,0121
-0,00654-0,01210,00366

Дисперсии параметров модели определяются соотношением S 2 i = Kii, т.е. это элементы, лежащие на главной диагонали
С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции (от 0 до 1)

Связь между признаком Y факторами X сильная
Частные коэффициенты (или индексы) корреляции, измеряющие влияние на у фактора хi при неизменном уровне других факторов определяются по стандартной формуле линейного коэффициента корреляции — последовательно берутся пары yx1,yx2. , x1x2, x1x3.. и так далее и для каждой пары находится коэффициент корреляции

Коэффициент детерминации
R 2 = 0.97 2 = 0.95, т.е. в 95% случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая

Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл: Tтабл (n-m-1;a) = (17;0.05) = 1.74
Поскольку Tнабл Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно

Построение парной регрессионной модели

Рекомендации к решению контрольной работы.

Статистические данные по экономике можно получить на странице Россия в цифрах.
После определения зависимой и объясняющих переменных можно воспользоваться сервисом Множественная регрессия. Регрессионную модель с 2-мя объясняющими переменными можно построить используя матричный метод нахождения параметров уравнения регрессии или метод Крамера для нахождения параметров уравнения регрессии.

Пример №3 . Исследуется зависимость размера дивидендов y акций группы компаний от доходности акций x1, дохода компании x2 и объема инвестиций в расширение и модернизацию производства x3. Исходные данные представлены выборкой объема n=50.

Тема I. Парная линейная регрессия
Постройте парные линейные регрессии — зависимости признака y от факторов x1, x2, x3 взятых по отдельности. Для каждой объясняющей переменной:

  1. Постройте диаграмму рассеяния (поле корреляции). При построении выберите тип диаграммы «Точечная» (без отрезков, соединяющих точки).
  2. Вычислите коэффициенты уравнения выборочной парной линейной регрессии (для вычисления коэффициентов регрессии воспользуйтесь встроенной функцией ЛИНЕЙН (функция находится в категории «Статистические») или надстройкой Пакет Анализа), коэффициент детерминации, коэффициент корреляции (функция КОРЕЛЛ), среднюю ошибку аппроксимации.
  3. Запишите полученное уравнение выборочной регрессии. Дайте интерпретацию найденным в предыдущем пункте значениям.
  4. Постройте на поле корреляции прямую линию выборочной регрессии по точкам .
  5. Постройте диаграмму остатков.
  6. Проверьте статистическую значимость коэффициентов регрессии по критерию Стьюдента (табличное значение определите с помощью функции СТЬЮДРАСПОБР) и всего уравнения в целом по критерию Фишера (табличное значение Fтабл определите с помощью функции FРАСПОБР).
  7. Постройте доверительные интервалы для коэффициентов регрессии. Дайте им интерпретацию.
  8. Постройте прогноз для значения фактора, на 50% превышающего его среднее значение.
  9. Постройте доверительный интервал прогноза. Дайте ему экономическую интерпретацию.
  10. Оцените полученные результаты — сделайте выводы о качестве построенной модели, влиянии рассматриваемого фактора на показатель.

Тема II. Множественная линейная регрессия
1. Постройте выборочную множественную линейную регрессию показателя на все указанные факторы. Запишите полученное уравнение, дайте ему экономическую интерпретацию.
2. Определите коэффициент детерминации, дайте ему интерпретацию. Вычислите среднюю абсолютную ошибку аппроксимации и дайте ей интерпретацию.
3. Проверьте статистическую значимость каждого из коэффициентов и всего уравнения в целом.
4. Постройте диаграмму остатков.
5. Постройте доверительные интервалы коэффициентов. Для статистически значимых коэффициентов дайте интерпретации доверительных интервалов.
6. Постройте точечный прогноз значения показателя y при значениях факторов, на 50% превышающих их средние значения.
7. Постройте доверительный интервал прогноза, дайте ему экономическую интерпретацию.
8. Постройте матрицу коэффициентов выборочной корреляции между показателем и факторами. Сделайте вывод о наличии проблемы мультиколлинеарности.
9. Оцените полученные результаты — сделайте выводы о качестве построенной модели, влиянии рассматриваемых факторов на показатель.

Системы эконометрических уравнений

7. Системы эконометрических уравнений

7.1. Виды систем регрессионных уравнений

Любая экономическая система – это сложная система с множеством входов, выходов и сложной структурой взаимосвязей показателей, характеризующих деятельность этой системы. Поэтому для описания механизма функционирования таких систем обычно изолированных уравнений регрессии недостаточно.

Практически изменение какого-либо показателя в экономической системе, как правило, вызывает изменение целого ряда других. Так изменение производительности труда влияет на затраты труда, а, следовательно на себестоимость, прибыль, рентабельность производства и пр.

Все это вызывает потребность использования при описании сложных экономических явлений и процессов систем взаимосвязанных регрессионных уравнений и тождеств. Особенно актуальна необходимость в применении таких систем при моделировании на макроуровне, так как макроэкономические показатели, являясь обобщающими показателями состояния экономики, чаще всего взаимозависимы. Например, при построении модели национальной экономики необходимо рассмотреть уравнения, описывающие потребление, инвестиции, прирост капиталовложений, воспроизводство трудовых ресурсов, производство продукта и пр.

Переменные, входящие в систему уравнений подразделяют на экзогенные, эндогенные и лаговые (эндогенные переменные, влияние которых характеризуется некоторым запаздыванием, временным лагом ).

Экзогенные и лаговые переменные называют предопределенными, т. е. определенными заранее.

Классификация переменных на эндогенные и экзогенные зависит от принятой теоретической концепции модели. Экономические показатели могут выступать в одних моделях как эндогенные, а в других как экзогенные переменные. Внеэкономические переменные (например, климатические условия, социальное положение, пол, возраст) входят в систему только как экзогенные переменные. В качестве экзогенных переменных могут рассматриваться значения эндогенных переменных за предшествующий период времени (лаговые переменные).

Рассмотрим типы систем эконометрических уравнений.

1. Система независимых регрессионных уравнений (внешне не связанных)

В данном случае каждая зависимая переменная рассматривается как функция некоторого е набора факторов.

. (7.1)

Набор факторов в уравнениях (1) может варьировать. Каждое уравнение системы независимых уравнений может рассматриваться самостоятельно, а его параметры могут быть найдены на основе традиционного метода наименьших квадратов (МНК).

2. Система рекурсивных уравнений

В таких системах в одном из уравнений содержится единственная зависимая переменная , которая в следующем уравнении присутствует в качестве факторной переменной. В третье уравнение эти эндогенные переменные из предыдущих уравнений могут быть включены как факторные и т. д.

(7.2)

В данной системе каждое последующее уравнение наряду с факторными переменными включает в качестве факторов все зависимые переменные предшествующих уравнений. Каждое уравнение этой системы может рассматриваться самостоятельно, и его параметры определяются методом наименьших квадратов (МНК).

3. Система взаимозависимых (одновременных) уравнений

Наибольшее распространение в эконометрических исследованиях получила система взаимозависимых уравнений. В ней одни и те же зависимые (эндогенные) переменные в одних уравнениях входят в левую часть (т. е. выступают в роли результативных признаков), а в других уравнениях – в правую часть системы (т. е. выступают в качестве факторных переменных). Система взаимозависимых уравнений получила название системы совместных, одновременных уравнений. Тем самым подчеркивается, что в системе одни и те же переменные одновременно рассматриваются как зависимые в одних уравнениях и как независимые в других. В эконометрике эта система уравнений также называется структурной формой модели (СФМ).

Система одновременных уравнений в структурной форме и при отсутствии лаговых переменных может быть записана:

(7.3)

Кроме регрессионных уравнений (они называются также поведенческими уравнениями) модель может содержать тождества, которые представляют собой алгебраические соотношения между эндогенными переменными. Тождества позволяют исключать некоторые эндогенные переменные и рассматривать систему регрессионных уравнений меньшей размерности Параметры модели в структурной форме называют ее структурными коэффициентами

Система одновременных уравнений в структурной форме позволяет увидеть влияние изменений любой экзогенной переменной на значения эндогенной переменной. Целесообразно в качестве экзогенных переменных выбирать такие переменные, которые могут быть объектом регулирования. Меняя их и управляя ими, можно заранее иметь целевые значения эндогенных переменных.

В отличие от предыдущих систем каждое уравнение системы одновременных уравнений не может рассматриваться самостоятельно, и для нахождения его параметров традиционный МНК неприменим, т. к. нарушаются предпосылки, лежащие в основе МНК (например, предпосылка о некоррелированности факторных переменных с остатками). Эндогенные переменные являются случайными величинами, зависящими от . В том случае, когда эндогенная переменная входит в некоторое уравнение как факторная происходит нарушение названной предпосылки МНК. Таким образом, для нахождения структурных коэффициентов традиционный МНК неприменим. С этой целью используются специальные приемы оценивания.

7.2. Приведенная форма модели

Для определения структурных коэффициентов на основе структурной модели формируют приведенную форму модели.

Приведенная форма модели представляет собой систему линейных функций эндогенных переменных от экзогенных:

(7.4)

где – коэффициенты приведенной формы модели, – случайные остатки для приведенной формы.

По своему виду приведенная форма модели ничем не отличается от системы независимых уравнений, параметры которой оцениваются традиционным МНК. Применяя МНК, можно оценить , а затем оценить значения эндогенных переменных через экзогенные.

Можно показать, что коэффициенты приведенной формы модели представляют собой нелинейные функции коэффициентов структурной формы модели. Рассмотрим структурную модель с двумя эндогенными переменными.

. (7.5)

Запишем соответствующую приведенную форму модели:

. (7.6)

Выразим коэффициенты приведенной формы модели через коэффициенты структурной модели.

Из первого уравнения (7.5) можно выразить (ради упрощения опускаем случайную величину): .

Подставим во второе уравнение (7.5):

(7.7)

Выразим из (7.7) : .

Поступая аналогично со вторым уравнением системы (7.5), получим

, т. е. система (7.5) принимает вид:

Таким образом, коэффициенты приведенной формы модели выражаются через коэффициенты структурной формы следующим образом:

Следует заметить, что приведенная форма модели хотя и позволяет получить значения эндогенных переменных через значения экзогенных, но аналитически она уступает структурной форме модели, так как в ней отсутствуют взаимосвязи между эндогенными переменными.

7.3. Проблема идентификации

При правильной спецификации модели задача идентификация системы уравнений сводится к корректной и однозначной оценке ее коэффициентов. Непосредственная оценка коэффициентов уравнения возможна лишь в системах внешне не связанных уравнений, для которых выполняются основные предпосылки построения регрессионной модели, в частности, условие некоррелированности факторных переменных с остатками.

В рекурсивных системах всегда возможно избавление от проблемы коррелированности остатков с факторными переменными путем подстановки в качестве значений факторных переменных не фактических, а модельных значений эндогенных переменных, выступающих в качестве факторных переменных. Процесс идентификации осуществляется следующим образом:

1. Идентифицируется уравнение, в котором в качестве факторных не содержатся эндогенные переменные. Находится расчетное значение эндогенной переменной этого уравнения.

2. Рассматривается следующее уравнение, в котором в качестве факторной включена эндогенная переменная, найденная на предыдущем шаге. Модельные (расчетные) значения этой эндогенной переменной обеспечивают возможность идентификации этого уравнения и т. д.

В системе уравнений в приведенной форме проблема коррелированности факторных переменных с отклонениями не возникает, так как в каждом уравнении в качестве факторных переменных используются лишь предопределенные переменные. Таким образом, при выполнении других предпосылок рекурсивная система всегда идентифицируема.

При рассмотрении системы одновременных уравнений возникает проблема идентификации.

Идентификация в данном случае означает определение возможности однозначного пересчета коэффициентов системы в приведенной форме в структурные коэффициенты.

Структурная модель (7.3) в полном виде содержит параметров, которые необходимо определить. Приведенная форма модели в полном виде содержит параметров. Следовательно, для определения неизвестных параметров структурной модели можно составить уравнений. Такие системы являются неопределенными и параметры структурной модели в общем случае не могут быть однозначно определены.

Чтобы получить единственно возможное решение необходимо предположить, что некоторые из структурных коэффициентов модели ввиду слабой их взаимосвязи с эндогенной переменной из левой части системы равны нулю. Тем самым уменьшится число структурных коэффициентов модели. Уменьшение числа структурных коэффициентов модели возможно и другими путями: например, путем приравнивания некоторых коэффициентов друг к другу, т. е. путем предположений, что их воздействие на формируемую эндогенную переменную одинаково и пр.

С позиции идентифицируемости структурные модели можно подразделить на три вида:

Модель идентифицируема, если все структурные ее коэффициенты определяются однозначно, единственным образом по коэффициентам приведенной формы модели, т. е. если число параметров структурной модели равно числу параметров приведенной формы модели.

Модель неидентифицируема, если число коэффициентов приведенной модели меньше числа структурных коэффициентов, и в результате структурные коэффициенты не могут быть оценены через коэффициенты приведенной формы модели.

Модель сверхидентифицируема, если число коэффициентов приведенной модели больше числа структурных коэффициентов. В этом случае на основе коэффициентов приведенной формы можно получить два или более значений одного структурного коэффициента. Сверхидентифицируемая модель в отличие от неидентифицируемой модели практически решаема, но требует для этого специальных методов нахождения параметров.

Чтобы определить тип структурной модели необходимо каждое ее уравнение проверить на идентифицируемость.

Модель считается идентифицируемой, если каждое уравнение системы идентифицируемо. Если хотя бы одно из уравнений системы неидентифицируемо, то и вся модель считается неидентифицируемой. Сверхидентифицируемая модель кроме идентифицируемых содержит хотя бы одно сверхидентифицируемое уравнение.

7.4. Условия идентифицируемости уравнений структурной модели

1. Необходимое условие идентифицируемости

Чтобы уравнение было идентифицируемо, необходимо, чтобы число предопределенных переменных, отсутствующих в данном уравнении, но присутствующих в системе, было равно числу эндогенных переменных в данном уравнении без одного.

Введем следующие обозначения:

М – число предопределенных переменных в модели;

m— число предопределенных переменных в данном уравнении;

— число эндогенных переменных в модели;

— число эндогенных переменных в данном уравнении;

Обозначим число экзогенных (предопределенных) переменных, которые содержатся в системе, но не входят в данное уравнение через , .

Тогда условие идентифицируемости каждого уравнения модели может быть записано в виде следующего счетного правила:

Для оценки параметров структурной модели система должна быть идентифицируема или сверхидентифицируема.

Рассмотренное счетное правило отражает необходимое, но недостаточное условие идентификации.

Достаточное условие идентификации

Уравнение идентифицируемо, если по отсутствующим в нем переменным (эндогенным и экзогенным) можно из коэффициентов при них в других уравнениях системы получить матрицу, определитель которой не равен нулю, а ранг матрицы не меньше, чем число эндогенных переменных в системе без одного.

Целесообразность проверки условия идентификации модели через определитель матрицы коэффициентов, отсутствующих в данном уравнении, но присутствующих в других, объясняется тем, что возможна ситуация, когда для каждого уравнения системы выполнено счетное правило, а определитель матрицы названных коэффициентов равен нулю. В этом случае соблюдается лишь необходимое, но не достаточное условие идентификации.

В эконометрических моделях часто наряду с уравнениями, параметры которых должны быть статистически оценены, используются балансовые тождества переменных, коэффициенты при которых равны . В этом случае, хотя само тождество и не требует проверки на идентификацию, ибо коэффициенты при переменных в тождестве известны, в проверке на идентификацию структурных уравнений системы тождества участвуют..

Изучается модель (одна из версий модели Кейнса):

(7.8)

где – потребление в период ; – ВВП в период ; — ВВП в период (); – валовые инвестиции в период ; – государственные расходы в период .

Первое уравнение – функция потребления, второе уравнение – функция инвестиций, третье уравнение –тождество ВВП. Модель представляет собой систему одновременных уравнений. Проверим каждое ее уравнение на идентификацию.

Модель включает три эндогенные переменные и две предопределенные переменные (одна экзогенная переменная – и одна лаговая переменная –).

Проверим необходимое условие идентификации для каждого из уравнений модели.

тождество, не подлежит проверке

Например, первое уравнение содержит две эндогенные переменные и и одну предопределенную переменную .

Таким образом, ; D=2-1=1. Условие условие выполняется, т. е. уравнение идентифицируемо.

Проверим для каждого уравнения достаточное условие идентификации. Для этого составим матрицу коэффициентов при переменных модели.

В соответствии с достаточным условием идентификации ранг матрицы коэффициентов при переменных, не входящих в исследуемое уравнение, должен быть равен числу эндогенных переменных модели без одного.

Первое уравнение: матрица коэффициентов при переменных, не входящих в уравнение, имеет вид:. Ее определитель не равен нулю, поэтому ранг матрицы равен 2, т. е равняется числу эндогенных переменных без одного. Достаточное условие идентификации выполняется.

Второе уравнение: матрица коэффициентов при переменных, не входящих в уравнение, имеет вид: . Ранг данной матрицы равен 2, так как существут определитель второго порядка не равный нулю:. Следовательно, достаточное условие идентификации для данного уравнения также выполняется Но в соответствии с необходимым условием считаем это уравнение сверхидентифицируемым.

Таким образом, эта система уравнений является сверхидентифицируемой.

7.5. Методы оценки параметров структурной формы модели

Коэффициенты структурной модели могут быть оценены разными способами в зависимости от вида системы одновременных уравнений. Наибольшее распространение в литературе получили следующие методы оценивания коэффициентов структурной модели:

1) косвенный метод наименьших квадратов;

2) двухшаговый метод наименьших квадратов;

3) трехшаговый метод наименьших квадратов;

4) метод максимального правдоподобия с полной информацией;

5) метод максимального правдоподобия при ограниченной информации.

Рассмотрим сущность некоторых из этих методов.

Косвенный метод наименьших квадратов (КМНК) применяется в случае точно идентифицируемой структурной модели. Процедура применения КМНК предполагает выполнение следующих этапов:

1. Для структурной модели строится приведенная форма модели.

2. Для каждого уравнения приведенной формы традиционным МНК оцениваются приведенные коэффициенты .

3. На основе коэффициентов приведенной формы находятся путем алгебраических преобразований параметры структурной модели.

Двухшаговый метод наименьших квадратов (ДМНК)

Если система сверхидентифицируема, то КМНК не используется, ибо он не дает однозначных оценок для параметров структурной модели. В этом случае могут использоваться разные методы оценивания, среди которых наиболее распространенным и простым является двухшаговый метод (ДМНК).

Основная идея ДМНК состоит в следующем:

· на основе приведенной формы модели получить для сверхидентифицируемого уравнения расчетные значения эндогенных переменных, содержащихся в правой части этого уравнения;

· подставляя найденные расчетные значения эндогенных переменных вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифицируемого уравнения.

Метод получил название двухшагового МНК, ибо дважды используется МНК:

· на первом шаге при определении параметров приведенной формы модели и нахождении на их основе оценок расчетных значений эндогенных переменных ; ;

· на втором шаге применительно к структурному сверхидентифицируемому уравнению, когда вместо фактических значений эндогенных переменных рассматриваются их расчетные значения, найденные на предыдущем шаге.

Сверхидентифицируемая структурная модель может быть двух типов:

· все уравнения системы сверхидентифицируемы;

· система содержит наряду со сверхидентифицируемыми точно идентифицируемые уравнения.

Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения используется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним можно найти на основе косвенного МНК. Двухшаговый метод, примененный к точно идентифицированным уравнениям дает такой же результат, что и косвенный МНК.

Продолжение примера 15.

Продолжим рассмотрение примера 15.

Система является сверхидентифицируемой: первое уравнение идентифицируемо, а второе уравнение сверхидентифицируемо. Поэтому для определения коэффициентов первого уравнения можно применить косвенный МНК, а для второго уравнении двухшаговый МНК.

Построим приведенную форму модели:

(7.9)

Исходные данные задачи (в млрд. руб.)

Предсказанное

Найдем параметры модели (7.9), применяя МНК к каждому уравнению,

используем « Пакет анализа» EXCEL):

(7.10)

Каждое уравнение статистически значимо (– статистики: =1302,55;

=281,956; =847,65). Коэффициенты детерминации свидетельствуют о хорошей связи между эндогенными и предопределенными переменными:=0,9977; =0,989; =0,996.

На основе уравнений модели (7.10) найдем структурные коэффициенты первого уравнения.

Выразим из третьего уравнения (7.10) переменную и подставим в первое уравнение. Получим первое структурное уравнение:

Так как второе уравнение сверхидентифицировано, то применим двухшаговый МНК. Найдем на основе третьего уравнения (7.10) расчетные значения переменной ( столбец «предсказанное » табл.23) и используем их для нахождения параметров второго структурного уравнения.

Получим: 4; .

В результате получим следующую систему структурных уравнений:

Трехшаговый метод наименьших квадратов (ТМНК)

Трехшаговый метод наименьших квадратов применяется для оценки параметров системы одновременных уравнений в целом. Сначала к каждому уравнению применяется двухшаговый метод с целью оценить коэффициенты и случайные остатки каждого уравнения. Затем строится ковариационная матрица остатков и проводится ее оценка. После этого для оценивания коэффициентов всей системы применяется обобщенный метод наименьших квадратов. ТМНК является достаточно эффективным, но требует существенно больших вычислительных затрат. Более подробное описание можно найти в работе[1][1]

7.6. Инструментальные переменные

Метод инструментальных переменных (МИП) применяется для оценивания уравнений, в которых регрессоры (факторы) коррелируют со свободными членами. Коррелированность между факторными переменными и случайными ошибками может быть вызвана разными причинами:

· пропущенными переменными, которые находятся в корреляционной связи с факторными переменными;

· ошибками измерений факторных переменных;

· включением лагированной зависимой переменной при наличии автокоррелированности ошибок. В этом случае лаговые переменные скорее всего будут коррелировать с ошибками;

· одновременные взаимосвязи между переменными (эндогенность переменных, включенных в правые части регрессионных уравнений).

Именно это явление оказывается характерным для систем одновременных уравнений;

Если между факторными переменными и случайными остатками имеется корреляционная зависимость (,), то нарушаются условия классической модели и оценки параметров, найденные по МНК будут смещенными и не состоятельными.

Идея МИП заключается в том, чтобы подобрать новые переменные , которые бы тесно коррелировали с и не коррелировали со случайными остатками . Такие переменные называют инструментальными или просто инструментами). Включение их в модель обеспечивает состоятельность оценок МНК.

Набор переменных может включать факторные переменные, которые не коррелируют с остатками, а также другие внешние величины, не входящие в состав факторных переменных модели. Важно, чтобы число инструментов было не меньше, чем число независимых переменных.

Рассмотрим случай парной регрессии: . Предположим, что между факторными переменными и остатками имеется корреляционная зависимость, т. е. . Рассмотрим систему нормальных уравнений для линейной парной регрессии:

, (7.11)

тогда . (7.12)

Можно показать, что . Так как , оценка параметра будет смещенной и не состоятельной.

Предположим, что можно найти такую переменную , которая была бы коррелированна с ( ), но не коррелированна с ( ). Выберем эту переменную в качестве иструментальной переменной.

Заменим второе уравнение системы (7.11) на следующее: и рассмотрим систему:

. (7.13)

Решение системы (7.13) будет, очевидно, отличается от решения предыдущей системы. Обозначим новые оценки соответственно.

В этом случае оценка . (7.14)

Покажем, что она является несмещенной и состоятельной при условии, что при увеличивающемся числе наблюдений стремится к конечному, отличному от нуля пределу, который мы обозначим, как .

, здесь , так как – постоянная величина.

Тогда . (7.15)

Так как , а , то в больших выборках стремится к истинному значению .

Сравним (формула (7.14) с оценкой МНК (формула 7.12). Очевидно, что оценку , можно получить путем подстановки инструментальной переменной вместо в числителе и вместо одного (но не обоих) в знаменателе в формуле (7.12) для оценки .

Чем теснее корреляция между и Z, тем меньше будет их дисперсия и, следовательно, тем меньше будет дисперсия . Следовательно, если мы стоим перед выбором между несколькими возможными инструментальными переменными, то следует выбрать наиболее тесно коррелированную с , потому что при прочих равных условиях она даст наиболее эффективные оценки. Вместе с тем не рекомендуется использовать инструментальную переменную, имеющую функциональную зависимость с , даже если бы ее удалось найти, потому что тогда она автоматически оказалась бы коррелированной с остатками и оценки по-прежнему были бы не состоятельны.

Нетрудно понять, что метод оценивания с помощью инструментальных переменных является обобщением обычного метода наименьших квадратов.

Пусть — матрица значений инструментальных переменных размерности (), а — матрица значений факторных переменных размерности (),. Здесь— матрица факторных переменных, которые включены в состав инструментов, — инструменты, которые не входят в число факторных переменных. В этом случае матрица оценок параметров находится следующим образом:

, где , (7.16)

здесь , а метод ИП называют обобщенным методом инструментальных переменны (ОМИП).

Если число инструментальных переменных равняется числу факторных переменных (), то матрица ) будет квадратной размерности (). Метод ИП в этом случае называется простым, а оценки вычисляются следующим образом:

=

=[2] . (7.17)

Самая трудная проблема метода ИП – это поиск подходящих инструментов. Требуется, чтобы инструменты были тесно связаны с факторными переменными, но сами не были бы эндогенными переменными.

Решение этой проблемы зависит от конкретной ситуации. Например, это могут быть: лаговые значения факторных переменных; показатели, близкие по экономическому смыслу и приближенно отражающие рассматриваемую факторную переменную и пр.

Метод инструментальных переменных используется при оценке СОУ при использовании двухшагового МНК. В качестве инструментов здесь рассматриваются расчетные значения эндогенных переменных, найденные на первом шаге с использованием обычного МНК для приведенной системы уравнений.

Рассмотрим упрощенную кейнсианскую модель формирования доходов в закрытой экономике без государственного вмешательства:

(7.18)

где — представляют совокупный выпуск, объем потребления и объем инвестиций соответственно, . Здесь мы имеем случай одновременных взаимосвязей между переменными: в качестве одной из составляющих содержит ошибку модели, а так как зависит от , то также корреллирует с ошибками модели.

Первое уравнение идентифицируемо ( и матрица коэффициентов при переменных, не входящих в уравнение состоит из одного элемента 1, т. е. ее ранг равен 1, что равняется числу эндогенных переменных без одного). Следовательно выполняютя необходимое и достаточное условие идентифицируемости. Второе уравнение тождество, не подлежит проверке на идентификацию.

Рассмотрим следующие статистические данные:


источники:

http://math.semestr.ru/regress/corel.php

http://pandia.ru/text/77/213/97434.php