Фиктивные переменные в уравнении регрессии используются если

Построение регрессионных моделей с фиктивными переменными

ПОСТРОЕНИЕ РЕГРЕССИОННЫХ МОДЕЛЕЙ С ФИКТИВНЫМИ ПЕРЕМЕННЫМИ

В регрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные. Например, спрос на какое-либо благо может определяться как количественными переменными (цена данного блага), так и качественными (вкусы потребителей). Качественные показатели в численном виде представить нельзя. Возникает проблема отражения в модели влияния таких переменных на исследуемую величину.

Обычно в моделях влияние качественного фактора выражается в виде фиктивной (искусственной) переменной, которая отражает два противоположных состояния качественного фактора. В этом случае фиктивная переменная может выражаться в двоичной форме:

Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).

Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются моделями дисперсионного анализа (ANOVA-моделями).

Тогда зависимость можно выразить моделью парной регрессии:

.

Коэффициент определяет среднюю начальную заработную плату при отсутствии высшего образования. Коэффициент указывает, на какую величину отличаются средние начальные заработные платы при наличии и при отсутствии высшего образования у претендента. Проверяя статическую значимость коэффициента с помощью t-статистики, либо значимость коэффициента детерминации или F-статистики, можно определить, влияет или нет наличие высшего образования на начальную заработную плату.

Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются моделями ковариационного анализа (ANCOVA-моделями).

Существует несколько разновидностей моделей ковариационного анализа.

1. Модели ковариационного анализа при наличии у фиктивной переменной двух альтернатив.

Рассмотрим простейшую модель с одной количественной и одной качественной переменными, имеющую два альтернативных состояния:

.

Пусть, например, Y – заработная плата сотрудника фирмы, х – стаж сотрудника, D – пол сотрудника, т. е.

Тогда ожидаемое значение заработной платы сотрудников при х годах трудового стажа будет:

Заработная плата в данном случае является линейной функцией от стажа работы.

При составлении моделей с фиктивными переменными необходимо руководствоваться следующим правилом моделирования: если качественная переменная имеет k альтернативных значений, то при моделировании используется (k – 1) фиктивных переменных. Таким образом, если переменная имеет два альтернативных значения (например, пол), то в модель можно ввести только одну фиктивную переменную.

Если не следовать данному правилу, то при моделировании исследователь попадает в ситуацию совершенной мультиколлинеарности или так называемую ловушку фиктивной переменной.

Значение качественной переменной, для которого принимается D = 0, называется базовым или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.

Коэффициент в модели иногда называется дифференциальным коэффициентом свободного члена, так как он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной, равном единице, от свободного члена модели при базовом значении фиктивной переменной.

2. Модели ковариационного анализа при наличии у качественных переменных более двух альтернатив.

Рассмотрим модель с двумя объясняющими переменными, одна из которых количественная, а другая – качественная. Причем качественная переменная имеет три альтернативы. Например, расходы на содержание ребенка могут быть связаны с доходами домохозяйства и возрастом ребенка: дошкольный, младший школьный и старший школьный. Так как качественная переменная имеет три альтернативы, то по общему правилу моделирования необходимо использовать две фиктивные переменные. Таким образом, модель может быть представлена в виде:

,

где Y – расходы, x – доходы домохозяйств.

Образуются следующие зависимости:

1. Средний расход на дошкольника:

(1)

2. Средний расход на младшего школьника:

(2)

3. Средний расход на старшего школьника:

(3)

Здесь γ1, γ2 – дифференциальные свободные члены. Базовым значением качественной переменной является значение «дошкольник». После вычисления коэффициентов уравнений регрессии (1) – (3) определяется статистическая значимость коэффициентов γ1и γ2 на основе обычной t-статистики.

Если коэффициенты γ1 и γ2 оказываются статистически незначимыми, то можно сделать вывод, что возраст ребенка не оказывает влияния на расходы по его содержанию.

3. Регрессия с одной количественной и двумя качественными переменными.

Техника фиктивных переменных может быть распространена на произвольное число качественных факторов. Рассмотрим ситуацию с двумя качественными переменными.

Пусть Y –заработная плата сотрудников фирмы, x – стаж работы, D1 – наличие высшего образования, D2 – пол сотрудника:

Таким образом, получим следующую модель:

.

Из этой модели выводятся следующие регрессионные модели:

1. Средняя зарплата женщины без высшего образования:

2. Средняя зарплата женщины с высшим образованием:

3. Средняя зарплата у мужчины без высшего образования:

4. Средняя зарплата мужчины с высшим образованием:

Очевидно, что все регрессии отличаются только свободными членами. Дальнейшее определение статистической значимости коэффициентов γ1 и γ2 позволяет убедиться, влияют ли образование и пол сотрудника на его заработную плату.

Исследуется зависимость между заработной платой рабочего за месяц у ($), х ‑ возрастом рабочего (лет) и фиктивной переменной D пол рабочего.

1. Необходимо построить модель с фиктивной переменной D, которая принимает два значения: 1 ‑ если пол рабочего мужской; 0 ‑ если пол женский.

2. Проверить статистическую значимость коэффициентов. Сделать выводы.

На предприятии используются станки трех фирм (А, В, С). Исследуется надежность станков. При этом учитывается возраст станка (х, мес.) и время безаварийной работы до последней поломки (y, час). Выборка из 40 станков дала результаты, представленные в таблице.

Тест: Ответы на тест по эконометрике

Тема: Ответы на тест по эконометрике

Тип: Тест | Размер: 16.37K | Скачано: 444 | Добавлен 26.01.10 в 15:48 | Рейтинг: +30 | Еще Тесты

А

Аддитивная модель содержит компоненты в виде …

комбинации слагаемых и сомножителей

слагаемых

В

В линейной регрессии Y=b0+b1X+e параметрами уравнения регрессии являются: (неск)

b0

b1

В правой части приведенной формы системы одновременных уравнений, построенной по перекрестным данным (cross-section data) без учета временных факторов, могут стоять _______ переменные.

экзогенные

В стационарном временном ряде трендовая компонента …

имеет линейную зависимость от времени

отсутствует

имеет нелинейную зависимость от времени

Величина коэффициента детерминации … (неск)

характеризует долю дисперсии зависимой переменной y, объясненную уравнением, в ее общей дисперсии

рассчитывается для оценки качества подбора уравнения регрессии

характеризует долю дисперсии остаточной величины в общей дисперсии зависимой переменной у

оценивает значимость каждого из факторов, включенных в уравнение регрессии

Величина коэффициента регрессии показывает …

среднее изменение фактора при изменении результата на одну единицу измерения

на сколько процентов изменится результат при изменении фактора на 1 %

значение тесноты связи между фактором и результатом

среднее изменение результата при изменении фактора на одну единицу измерения

Величина коэффициента эластичности показывает …

на сколько процентов изменится в среднем результат при изменении фактора на 1%

во сколько раз изменится в среднем результат при изменении фактора в два раза

предельно допустимое изменение варьируемого признака

предельно возможное значение результата

Временным рядом является совокупность значений …

экономического показателя за несколько последовательных моментов (периодов) времени

последовательных моментов (периодов) времени и соответствующих им значений экономического показателя

экономических однотипных объектов по состоянию на определенный момент времени

экономического показателя для однотипных объектов на определенный момент времени

Выберите верные утверждения по поводу структурной формы системы эконометрических уравнений:

каждое уравнение системы может рассматриваться в качестве отдельного уравнения регрессии зависимости одной переменной от группы факторов

система регрессионных уравнений, матрица коэффициентов которых симметрична

эндогенные переменные в одних уравнениях могут выступать в роли независимых переменных в других уравнениях системы

система одновременных уравнений описывает реальное экономическое явление или процесс

Г

Гомоскедастичность остатков подразумевает …

рост дисперсии остатков с увеличением значения фактора

максимальную дисперсию остатков при средних значениях фактора

уменьшение дисперсии остаток с уменьшением значения фактора

одинаковую дисперсию остатков при каждом значении фактора

Д

Диаграмма рассеяния указывает на нелинейную зависимость. В этом случае следует осуществить … (неск)

расчет линейного коэффициента корреляции и использование линейной модели

включение в модель дополнительных факторных признаков

визуальный подбор функциональной зависимости нелинейного характера, соответствующего структуре точечного графика

подбор преобразования переменных, дающего наибольшее по абсолютной величине значение коэффициента парной корреляции

Для линейного уравнения регрессии у = а + bx + e метод наименьших квадратов используется при оценивании параметров…(неск)

a

b

Для расчета критического значения распределения Стьюдента служат следующие параметры:

количество зависимых переменных

объем выборки и количество объясняющих переменных

уровень значимости

К

К классам эконометрических моделей относятся: (неск)

системы нормальных уравнений

корреляционно – регрессионные модели

модели временных рядов

Компонентами временного ряда являются: (неск)

циклическая (сезонная) компонента

тренд

Корреляция подразумевает наличие связи между …

результатом и случайными факторами

переменными

Косвенный метод наименьших квадратов применим для …

неидентифицируемой системы уравнений

неидентифицируемой системы рекурсивных уравнений

любой системы одновременных уравнений

идентифицируемой системы одновременных уравнений

Коэффициент детерминации рассчитывается для оценки качества…

подбора уравнения регрессии

параметров уравнения регрессии

факторов, не включенных в уравнение регрессии

Коэффициент парной корреляции характеризует тесноту ____ связи между _____ переменными.

линейной … двумя

Критические значения критерия Стьюдента определяются по…

двум степеням свободы

трем и более степеням свободы

уровню значимости и одной степени свободы

М

Метод наименьших квадратов используется для оценивания …

величины коэффициента детерминации

параметров линейной регрессии

величины коэффициента корреляции

средней ошибки аппроксимации

Н

Нелинейным является уравнение регрессии нелинейное относительно входящих в него …

факторов

Несмещенность оценки характеризует …

равенство нулю математического ожидания остатков

наименьшую дисперсию остатков

ее зависимость от объема выборки

увеличение точности ее вычисления с увеличением объема выборки

О

Обобщенный метод наименьших квадратов применяется в случае…

автокорреляции остатков

П

Под автокорреляцией уровней временного ряда подразумевается _____ зависимость между последовательными уровнями ряда.

корреляционная

При выполнении предпосылок МНК оценки параметров регрессии обладают свойствами: (неск)

несмещенность

эффективность

Предпосылками МНК являются … (неск)

случайные отклонения коррелируют друг с другом

гетероскедастичность случайных отклонений

случайные отклонения являются независимыми друг от друга

дисперсия случайных отклонений постоянна для всех наблюдений

Примерами фиктивных переменных могут служить: (неск)

пол

образование

Примером нелинейной зависимости экономических показателей является …

зависимость объема продаж от недели реализации, выраженная линейным трендом

линейная зависимость затрат на производство от объема выпуска продукции

линейная зависимость выручки от величины оборотных средств

классическая гиперболическая зависимость спроса от цены

Принципиальные сложности применения систем эконометрических уравнений связаны с ошибками…

однородности выборочной совокупности

спецификации модели

определения случайных воздействий

С

Система эконометрических уравнений включает в себя следующие переменные:

эндогенные

экзогенные

Способами определения структуры временного ряда являются: (неск)

анализ автокорреляционной функции

расчет коэффициентов корреляции между объясняющими переменными

построение коррелограммы

агрегирование данных за определенный промежуток времени

Среди нелинейных эконометрических моделей рассматривают следующие классы нелинейных уравнений: …

внутренне нелинейные

внутреннее линейные

Структурной формой модели называется система ____ уравнений.

взаимосвязанных

Т

Тенденция временного ряда характеризует совокупность факторов, …

оказывающих сезонное воздействие

оказывающих единовременное влияние

оказывающих долговременное влияние и формирующих общую динамику изучаемого показателя

не оказывающих влияние на уровень ряда

У

Укажите верные характеристики коэффициента эластичности:

коэффициент эластичности показывает на сколько процентов изменится значение результирующего фактора при изменении на один процент объясняющего фактора

коэффициент эластичности является постоянной величиной для всех видов моделей

коэффициент эластичности показывает на сколько изменится значение результирующего фактора при изменении объясняющего фактора на одну единицу

по значению коэффициента эластичности можно судить о силе связи объясняющего фактора с результирующим

Укажите последовательность этапов оценки параметров нелинейной регрессии Y = a + b*X + c*X².

3 оцениваются параметры регрессии b0, b1, b2

1 выполняется замена переменной X2 на Z

2 задается спецификация модели в виде Y = b0 + b1*X +b2*Z, где b0 = a; b1 = b; b2 =c

4 определяются исходные параметры из тождеств: a = b0; b = b1; c = b2

Укажите последовательность этапов проведения теста Голдфелда-Квандта для парной линейной регрессии.

4 вычисление статистики Фишера

1 упорядочение наблюдений по возрастанию значений объясняющей переменной

3 оценка сумм квадратов отклонений для регрессий по k-первым и k-последним наблюдений

2 оценка регрессий для k-первых и k-последних наблюдений

Укажите справедливые утверждения по поводу критерия Дарбина-Уотсона: (неск)

позволяет проверить гипотезу о наличии автокорреляции первого порядка

изменяется в пределах от 0 до 4

равен 0 в случае отсутствия автокорреляции

применяется для проверки гипотезы о наличии гетероскедастичности остатков

Укажите существующие классы эконометрических систем: (неск)

система нормальных уравнений

система стандартных уравнений

система одновременных уравнений

система независимых уравнений

Укажите требования к факторам, включаемым в модель множественной линейной регрессии: (неск)

между факторами не должна существовать высокая корреляция

факторы должны быть количественно измеримы

факторы должны иметь одинаковую размерность

факторы должны представлять временные ряды

Установите соответствие между названием модели и видом ее уравнения:

3 y = ab x *e;

Установите соответствие между наименованиями элементов уравнения Y=b0+b1X+e и их буквенными обозначениями:

1. параметры регрессии

2. объясняющая переменная

3. объясняемая переменная

4. случайные отклонения

3 Y

4 e

1 b0, b1

2 X

Установите соответствие между эконометрическими терминами и их определениями.

1. автокорреляция уровней временного ряда

2. коэффициент автокорреляции уровней временного ряда

3. автокорреляционная функция

3 последовательность коэффициентов автокорреляции первого, второго и т.д. порядков

4 график зависимости значений автокорреляционной функции от величины лага

1 корреляционная зависимость между последовательными уровнями ряда

2 коэффициент линейной корреляции между последовательными уровнями

Ф

Фиктивными переменными в уравнении множественной регрессии являются …

качественные переменные, преобразованные в количественные

комбинации из включенных в уравнение регрессии факторов, повышающие адекватность модели

переменные, представляющие простейшие функции от уже включенных в модель переменных

дополнительные количественные переменные, улучшающие решение

Ч

Число степеней свободы общей, факторной и остаточной дисперсий связано …

только с числом единиц совокупности

с числом единиц совокупности и видом уравнения регрессии

характером исследуемых переменных

только с видом уравнения регрессии

Число степеней свободы связано с числом … (неск)

единиц совокупности (количеством наблюдений)

видом уравнения регрессии

Э

раздел экономической теории, связанный с анализом статистической информации

специальный раздел математики, посвященный анализу экономической информации

наука, которая осуществляет качественный анализ взаимосвязей экономических явлений и процессов

наука, которая дает количественное выражение взаимосвязей экономических явлений и процессов

Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы

Понравилось? Нажмите на кнопочку ниже. Вам не сложно, а нам приятно).

Чтобы скачать бесплатно Тесты на максимальной скорости, зарегистрируйтесь или авторизуйтесь на сайте.

Важно! Все представленные Тесты для бесплатного скачивания предназначены для составления плана или основы собственных научных трудов.

Друзья! У вас есть уникальная возможность помочь таким же студентам как и вы! Если наш сайт помог вам найти нужную работу, то вы, безусловно, понимаете как добавленная вами работа может облегчить труд другим.

Если Тест, по Вашему мнению, плохого качества, или эту работу Вы уже встречали, сообщите об этом нам.

Добавление отзыва к работе

Добавить отзыв могут только зарегистрированные пользователи.

Фиктивные переменные

В некоторых задачах по эконометрике, может оказаться нужным включать в модель фактор, имеющий два или более качественных уровней. Это могут быть, например, разного рода атрибутивные признаки: профессия, образование, пол, климатические условия, проживание в определенном регионе.

Пример с фиктивными переменными

Чтобы использовать эти переменные в регрессионной модели, им должны быть присвоены цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сформированные переменные в эконометрике называют фиктивными переменными. В российской литературе по дисциплине эконометрика можно встретить термин «структурные переменные».

Рассмотрим использование фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для всех исследуемых данных уравнение регрессии имеет вид:

где у — количество потребляемого кофе; х — цена кофе.

Аналогичные уравнения находятся отдельно для лиц мужского пола:

и женского пола:

Разница в потреблении кофе проявятся в различии средних y1 и y2 . Вместе с тем сила влияния х на у может быть одинаковой. В этом случае можно построить общее уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения y1 и y2 и вводя фиктивные переменные, можно прийти к следующему выражению:

где z1 и z2 — фиктивные переменные, принимают значения:

z1 = 1 – мужской пол, 0 – женский пол.

z2 = 0 – мужской пол, 1 – женский пол.

В общем уравнении регрессии переменная у рассматривается как функция не только цены х, но также и пола (z1, z2). Переменная z рассматривается как дихотомическая переменная, которая принимает всего два значения: 1 и 0. При этом когда z1 = 1, то z2 = 0 и наоборот.

Для лиц мужского пола, когда z1 = 1 и z2 = 0, объединенное уравнение регрессии составит:

Для лиц женского пола, когда z1 = 0 и z2 = 1

Различия в потреблении для лиц мужского и женского пола обусловлены различиями свободных членов уравнения регрессии а. Параметр b является общим для всех лиц, как для мужчин, так и для женщин.

Следует иметь в виду, что при введении фиктивных переменных z1 и z2 в регрессионную модель применение МНК для оценивания параметров a1 и a2 в контрольные по эконометрике приведет к вырожденной матрице исходных данных, а значит к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в таком уравнении появляется свободный член, т.е. уравнение принимает вид

Теоретические значения размера потребления кофе для мужского пола будут получены из уравнения

Для женского пола соответствующие значения получим из уравнения

Сравнивая эти результаты, видно, что различия в уровне потребления мужчин и женщин состоят в различии свободных членов данных уравнений: А — для женщин и А + А1 — для мужчин.

Источник: Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М: Финансы и статистика, 2002. – 344 с.


источники:

http://studrb.ru/works/entry5528

http://univer-nn.ru/ekonometrika/fiktivnye-peremennye/