Спецификация эконометрической модели: способы и диагностика отбора экзогенных переменных. Тесты Рамсея и Амемья.
Спецификация модели множественной линейной регрессии включает проверку:
1. правильного выбора экзогенных переменных.
2. корректного выбора формы зависимости мду эндо- и экзогенной переменными.
Для решения 1 задачи различают пропущенные и избыточные экзогенные переменные
Пропущенные переменные – существенные факторы, которые не были включены в эконометрическую модель по ошибке. Опасность наличия пропущенных переменных заключается в смещении оценок параметров при включенных переменных. Признак, по которому определяют пропущенную переменную: Знак “+” у произведения оценки параметра при подозреваемой пропущенной переменной и коэффициента корреляции этой переменной с другими переменными, включенными в модель.
Выбранная модель с пропуском переменной :
, где
Тогда, применяя МНК для оценки усеченной модели получаем формулу смещения оценки ^
Экзогенную переменную относят к избыточным, если она по ошибке включена в эконометрическую модель. Включение избыточной переменной оказывает влияние на уменьшение точности (увеличение дисперсии) оценок параметров модели, что, в свою очередь, вызывает уменьшение t-статистик и коэффициента детерминации.
Если – избыточная, то коэффициент корреляции , тогда будет уменьшаться, а в соответствии с формулой будет возрастать.
Замещающие переменные – обычно бывает полезно вместо пропущенной переменной, которую трудно измерить, использовать некоторый её заменитель.
4 основных качественных правила спецификации экономической модели:
1. Опираясь на эконометрическую теорию, следует ответить на вопрос: «Является ли переменная существенной в модели зависимости с эндогенной переменной?».
2. Осуществить проверку значимого отличия от нуля t-статистик.
3. Осуществить проверку, насколько значимо изменяется коэффициент детерминации при добавлении некоторой переменной в модель.
4. Существенно ли изменяются оценки других переменных после добавления новой переменной в модель.
Кроме отмеченных правил спецификации модели, наиболее из-вестны два следующих количественных критерия спецификации:
Критерий Рамсея (Ramsey):
RESET-тест Рамсея — это обобщенный тест на наличие следующих ошибок спецификации модели линейной регрессии:
- наличие пропущенных переменных. Регрессия содержит не все объясняющие переменные;
- неверная функциональная форма. Некоторые или все переменные должны быть преобразованы с помощью логарифмической, степенной, обратной или какой-либо другой функции;
- корреляция между фактором Х и случайной составляющей модели, которая может быть вызвана ошибками измерения факторов, рассмотрением систем уравнений или другими причинами.
Тест Рамсея позволяет проверить, стоит ли начинать поиск дополнительной переменной для включения в уравнение
1. Оценивается уравнение регрессии
2. Вычисляются степени оценок зависимой переменной
3. Оценивается уравнение регрессии с этими степенями
4. Проводится оценка улучшения по F-критерию
Ошибки такого рода приводят к смещению среднего остатков регрессионной модели.
1. Оценивают зависимость в соответствии с выбранной моделью по МНК:
2. Анализируют вид функциональной зависимости остатков и её номинальное приближение включают в модель.
3. Например, с учетом 2) вычисляют величины , конструируют новую модель:
и применяют для ее оценивания по МНК.
4) Сравнивают качество модели по отношению к модели с помощью F-критерия:
Если где M – число дополнительных переменных, включенных в модель (M=3), k – число экзогенных переменных в то модель плохо специфицирована.
Недостаток: он указывает только на наличие ошибочной спец-ции модели, но не выявляет, сколько и какого рода переменную нужно добавить в модель.
Критерий Амемья (Amemiya):
Решающей функцией F-критерия служит:
Модель, для которой значение AF меньше, является лучше специфицированной.
Этот критерий минимизирует число экзогенных переменных.
Специфика уравнения множественно регрессии. Тест Рамсея
Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Поведение отдельных экономических переменных контролировать нельзя, т. е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т. е. построить уравнение множественной регрессии:
Такого рода уравнение может использоваться при изучении потребления. Тогда коэффициенты — частныепроизводные потребления по соответствующим факторам :
в предположении, что все остальные постоянны.
В 30-е гг. XX в. Кейнс сформулировал свою гипотезу потребительской функции. С того времени исследователи неоднократно обращались к проблеме ее совершенствования. Современная потребительская функция чаще всего рассматривается как модель вида:
где С — потребление; у — доход; Р — цена, индекс стоимости жизни; М — наличные деньги; Z — ликвидные активы.
При этом
Множественная регрессия широко используется в решении проблем спроса, доходности акций; при изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия – один из наиболее распространенных методов эконометрики. Основная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
Построение уравнения множественной регрессия начинается с решения вопроса о спецификации модели. Спецификация модели включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Требования к факторам.
1 Они должны быть количественно измеримы.
2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.
Разновидностью интеркоррелированности факторов является мультиколлинеарность — наличие высокой линейной связи между всеми или несколькими факторами.
Причинами возникновения мультиколлинеарности между призанками являются:
1. Изучаемые факторные признаки, характеризуют одну и ту же сторону явления или процесса. Например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;
2. Использование в качестве факторных признаков показателей, суммарное значение которых представляет собой постоянную величину;
3. Факторные признаки, являющиеся составными элементами друг друга;
4. Факторные признаки, по экономическому смыслу дублирующие друг друга.
5. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 (rxi xj) и др.
Мультиколлинеарность может привести к нежелательным последствиям:
1) оценки параметров становятся ненадежными, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только в величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.
2) затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют экономический смысл;
3) нельзя определить изолированное влияние факторов на результативный показатель.
Включение в модель факторов с высокой интеркорреляцией (Ryx1 Rx1x2) может привести к ненадежности оценок коэф-ов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретированными. Включаемые во множ.регрессию факторы должны объяснить вариацию независимой переменной. Отбор факторов производится на основе качественного теоретико-экономического анализа, который обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.
Если факторы коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.
RESET-тест Рамсея — это обобщенный тест на наличие следующих ошибок спецификации модели линейной регрессии:
наличие пропущенных переменных. Регрессия содержит не все объясняющие переменные;
неверная функциональная форма. Некоторые или все переменные должны быть преобразованы с помощью логарифмической, степенной, обратной или какой-либо другой функции;
корреляция между фактором Х и случайной составляющей модели, которая может быть вызвана ошибками измерения факторов, рассмотрением систем уравнений или другими причинами.
Ошибки такого рода приводят к смещению среднего остатков регрессионной модели.
Объясняющие переменные. Факторы, которые воздействуют на поведение моделируемой переменной. По умолчанию в списке содержатся все факторы тестируемой модели линейной регрессии. Флажок фактора — признак его участия в тесте. По умолчанию все факторы участвуют в тестировании. Для исключения фактора из теста снимите флажок. Число объясняющих переменных, должно быть не менее одного;
Уровень значимости. Значение уровня значимости, при котором гипотеза отвергается;
Степень. Количество дополнительных регрессоров, входящих в тестовую регрессию.
Результаты представлены в виде таблицы, содержащей:
Для каждой статистики приведено: значение, вероятность статистики и результат теста: принимается или отвергается гипотеза о приемлемости функциональной формы;
коэффициенты. Коэффициенты регрессии, рассчитанные при отмеченных факторах и дополнительных регрессорах.
27.Производственная функция Кобба-Дугласа
Производственная функция Кобба-Дугласа (Cobb-Douglas production function) — модель, показывающая зависимость объёма производства (Q) от создающих его факторов производства — труда (L) и капитала (K).
Впервые была предложена Кнутом Викселем, но проверена лишь в 1928 г. американскими экономистами Чарльзом Коббом и Полом Дугласом.
Функция имеет следующий вид:
Q = A × Lα × Kβ
где Q — объем производства;
L — труд;
K — капитал;
A — технологический коэффициент;
α — коэффициент эластичности по труду;
β — коэффициент эластичности по капиталу.
Например, равенство Q = L0,73 К0,27 означает, что доля труда в совокупном продукте составляет 73%, а доля капитала — 27%.
RESET-тест Рамсея
RESET-тест Рамсея — это обобщенный тест на наличие следующих ошибок спецификации модели линейной регрессии:
наличие пропущенных переменных. Регрессия содержит не все объясняющие переменные;
неверная функциональная форма. Некоторые или все переменные должны быть преобразованы с помощью логарифмической, степенной, обратной или какой-либо другой функции;
корреляция между фактором Х и случайной составляющей модели, которая может быть вызвана ошибками измерения факторов, рассмотрением систем уравнений или другими причинами.
Ошибки такого рода приводят к смещению среднего остатков регрессионной модели.
Убедитесь, что панель результатов отображается;
Выделите моделируемую переменную или одну из связей уравнения линейной регрессии в области представления данных;
Перейдите на вкладку « Диагностические тесты » в панели результатов;
Выполните команду « RESET-тест Рамсея » в меню переключателя « Структурные изменения и функциональная форма ».
Объясняющие переменные . Факторы, которые воздействуют на поведение моделируемой переменной. По умолчанию в списке содержатся все факторы тестируемой модели линейной регрессии. Флажок фактора — признак его участия в тесте. По умолчанию все факторы участвуют в тестировании. Для исключения фактора из теста снимите флажок. Число объясняющих переменных, должно быть не менее одного;
Уровень значимости . Значение уровня значимости, при котором гипотеза отвергается;
Степень . Количество дополнительных регрессоров, входящих в тестовую регрессию.
Результаты представлены в виде таблицы, содержащей:
Для каждой статистики приведено: значение, вероятность статистики и результат теста: принимается или отвергается гипотеза о приемлемости функциональной формы;
коэффициенты . Коэффициенты регрессии, рассчитанные при отмеченных факторах и дополнительных регрессорах.
Примечание . Если параметры теста заданы неверно, то таблица результатов не отображается. На её месте будет выведено сообщение об ошибке.
http://poisk-ru.ru/s51813t1.html
http://help.fsight.ru/ru/mergedProjects/uimodelling/web/work/diagnostics_tst/reset_tst.htm