Качество подбора нелинейного уравнения показатели

Тема 10: Оценка качества подбора уравнения

1. Известно, что доля остаточной регрессии в общей составила 0,19. Тогда значение коэффициента корреляции равно …

Решение:

Известно, что доля остаточной регрессии в общей составила 0,19. Значит, Найдем коэффициент детерминации: Вычислим коэффициент корреляции:

2. Известно, что общая сумма квадратов отклонений , а остаточная сумма квадратов отклонений, . Тогда значение коэффициента детерминации равно …

Решение:

Для расчета коэффициента детерминации можно пользоваться следующей формулой: . Значит, в нашем случае коэффициент детерминации равен:

3. Для регрессионной модели вида , где рассчитаны дисперсии: ; ; . Тогда величина характеризует долю …

Решение:

Значение коэффициента детерминации характеризует долю дисперсии зависимой переменной, объясненную построенным уравнением регрессии, в общей дисперсии зависимой переменной. Разность характеризует долю остаточной дисперсии, которая может быть рассчитана также по формуле . Поэтому отношение характеризует долю остаточной дисперсии.

4. Если общая сумма квадратов отклонений , и остаточная сумма квадратов отклонений , то сумма квадратов отклонений, объясненная регрессией, равна …

Решение:

Общая сумма квадратов отклонений складывается из суммы квадратов отклонений, объясненных регрессией, и остаточной сумма квадратов отклонений.

Значит, сумма квадратов отклонений, объясненная регрессией, равна разности общей сумме квадратов отклонений и остаточной суммы квадратов отклонений.

Получается .

Тема 11: Проверка статистической значимости эконометрической модели

1. При расчете скорректированного коэффициента множественной детерминации пользуются формулой , где …

n – число наблюдений; m – число факторов, включенных в модель множественной регрессии

m – число наблюдений; n – число факторов, включенных в модель множественной регрессии

n – число параметров при независимых переменных; m – число факторов, включенных в модель множественной регрессии

n – число параметров при независимых переменных; m – число наблюдений

Решение:

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и имеет вид , где n – число наблюдений, m – число факторов, включенных в модель множественной регрессии.

2. Если известно уравнение множественной регрессии построенное по результатам 50 наблюдений, для которого общая сумма квадратов отклонений равна 153, и остаточная сумма квадратов отклонений равна 3, то значение F-статистики равно …

Решение:

Расчет F-статистики начинается с разложения общей суммы квадратов отклонений на сумму квадратов отклонений, объясненную регрессией, и остаточную сумму квадратов отклонений:
, где

– общая сумма квадратов отклонений

– сумма квадратов отклонений, объясненная регрессией

– остаточная сумма квадратов отклонений

В нашем случае дано , . Следовательно,

Существует равенство между числом степеней свободы общей, факторной и остаточной сумм квадратов отклонений:

n – 1 = m + (nm – 1), где n –число наблюдений, m – число параметров перед переменными в уравнений регрессии.

Число степеней свободы для общей суммы квадратов отклонений равно n – 1. В нашем случае n – 1 = 49.

Число степеней свободы для остаточной суммы квадратов отклонений равно nm – 1 = 46.

Число степеней свободы для факторной суммы квадратов отклонений равно m = 3.

Рассчитаем факторную и остаточную дисперсии на одну степень свободы по формулам


F-статистика вычисляется по формуле

3. Для регрессионной модели известны следующие величины дисперсий:
где y – значение зависимой переменной по исходным данным; – значение зависимой переменной, вычисленное по регрессионной модели; – среднее значение зависимой переменной, определенное по исходным статистическим данным. Для указанных дисперсий справедливо равенство …

Решение:

Назовем приведенные дисперсии: – общая дисперсия; – объясненная дисперсия; – остаточная дисперсия. При анализе статистической модели величину общей дисперсии рассматривают как сумму объясненной и остаточной дисперсий, поэтому справедливо равенство:

Тема 12: Оценка значимости параметров эконометрической модели

1. Для уравнения множественной регрессии вида на основании 14 наблюдений рассчитаны оценки параметров и записана модель: (в скобках указаны значения t-статистики, соответствующие параметрам регрессии). Известны критические значения Стьюдента для различных уровней значимости

При уровне значимости 0,1 значимыми являются параметры …

Решение:

Чтобы оценить значимость параметров регрессии используется t-критерий Стьюдента. Для каждого коэффициента регрессии формулируется нулевая гипотеза при альтернативной гипотезе Затем рассчитывается фактическое значение t-статистики, которое сравнивается с критическим значением Стьюдента для требуемого числа степеней свободы и уровня значимости. Если , коэффициент значим; если коэффициент незначим. В нашем случае при уровне значимости 0,1 значимым является параметры

2. Если для среднеквадратической ошибки параметра и значения оценки этого параметра линейной эконометрической модели выполняется соотношение , то это свидетельствует о статистической ______ параметра.

ненадежности среднеквадратической ошибки

надежности среднеквадратической ошибки

Решение:

Превышение среднеквадратической ошибки параметра над значением его оценки свидетельствует о статистической ненадежности параметра.

3. Для уравнения множественной регрессии вида на основании 14 наблюдений рассчитаны оценки параметров и записана модель: (в скобках указаны значения t-статистики соответствующие параметрам регрессии). Известны критические значения Стьюдента для различных уровней значимости

Для данного уравнения при уровне значимости α=0,05 значимыми являются параметры …

Решение:

Чтобы оценить значимость параметров регрессии используется t-критерий Стьюдента. Для каждого коэффициента регрессии формулируется нулевая гипотеза при альтернативной гипотезе . Затем рассчитывается фактическое значение t-статистики, которое сравнивается с критическим значением Стьюдента для требуемого числа степеней свободы и уровня значимости. Если , коэффициент значим; если коэффициент незначим. В нашем случае при уровне значимости 0,05 значимыми является параметры

4. Проверка статистически значимого отличия от нуля оценок коэффициентов линейной модели

осуществляется путем последовательного сравнения отношений ( –среднеквадратическая ошибка параметра ) с точкой, имеющей распределение …

Решение:

При проверке статистически значимого отличия от нуля оценок коэффициентов линейной регрессионной модели выдвигается гипотеза о нулевом значении оценки параметра. Для каждого коэффициента регрессии модели рассчитывают отношение его среднеквадратической ошибки к значению оценки . Полученное значение отношения последовательно сравнивается с точкой, имеющей распределение Стьюдента.

Тема 13: Нелинейные зависимости в экономике

1. Если зависимость объема спроса от цены характеризуется постоянной эластичностью, то моделирование целесообразно проводить на основе …

параболы второй степени

Решение:

Из перечисленных функций только степенная функция характеризуется постоянной эластичностью, следовательно, ее и нужно применить для отражения данной зависимости.

2. Если по результатам анализа поля корреляции замечено, что на интервале изменения фактора меняется характер связи рассматриваемых признаков, прямая связь изменяется на обратную, то моделирование целесообразно проводить на основе …

параболы второй степени

параболы третьей степени

Решение:

Параболу второй степени целесообразно применять в случае, когда на интервале изменения фактора меняется характер связи рассматриваемых признаков, прямая связь изменяется на обратную или обратная на прямую.

3. Нелинейное уравнение регрессии вида является _____ моделью ________ регрессии.

Решение:

Нелинейное уравнение регрессии вида является полиномиальной моделью парной регрессии. Теоретическое значение зависимой переменной рассчитывается в данном случае по формуле полинома третьей степени , а количество независимых переменных х равно единице.

4. Если с увеличением масштабов производства удельный расход сырья сокращается, то моделирование целесообразно проводить на основе …

параболы второй степени

Решение:

Равносторонняя гипербола обычно используется в эконометрике для характеристики связи удельных расходов сырья, материалов, топлива с объемом выпускаемой продукции, поскольку она позволяет учесть эффект масштаба, что с увеличением объемов выпускаемой продукции удельные показатели расходов сырья, материалов или топлива обычно падают.

Тема 14: Виды нелинейных уравнений регрессии

1. Степенной моделью не является регрессионная модель …

Решение:

Степенной моделью регрессии является такая модель, в которой независимая переменная х стоит в основании степени, а параметр – в показателе. Такими моделями из приведенных в ответах являются уравнения:

В уравнении независимая переменная х стоит в показателе степени, а параметр b – в основании, это не степенное уравнение, такая модель является примером показательной зависимости.

2. Среди предложенных нелинейных зависимостей нелинейной по параметрам является …

Решение:

Среди предложенных нелинейных зависимостей зависимость является нелинейной по параметрам, но внутренне линейной, поскольку с помощью логарифмирования ее можно привести к линейному виду. Остальные функции линейны по параметрам, но нелинейны относительно переменных и к линейному виду могут быть приведены с помощью замены переменных.

3. Среди предложенных нелинейных зависимостей нелинейной существенно (внутренне нелинейной) является …

Решение:

Среди предложенных нелинейных зависимостей зависимость является внутренне нелинейной, поскольку с помощью элементарных преобразований или замены переменных ее нельзя привести к линейному виду.

4. Среди предложенных нелинейных зависимостей внутренне линейной является …

Решение:

Среди предложенных нелинейных зависимостей зависимость является внутренне линейной, хотя она и нелинейна по переменным, поскольку с помощью логарифмирования ее можно привести к линейному виду. Остальные функции внутренне нелинейны: они не могут быть приведены к линейному виду.

Тема 15: Линеаризация нелинейных моделей регрессии

1. Для линеаризации нелинейной регрессионной модели используется …

приведение уравнения к виду 1/y

Решение:

Линеаризация – это процедура приведения нелинейной регрессионной модели к линейному виду путем различных математических преобразований. Нелинейная модель является степенной. Приведение ее к линейному виду возможно логарифмированием уравнения. Получаем Остальные виды линеаризации не позволяют линеаризовать исходную нелинейную модель.

2. Для преобразования внутренне нелинейной функции может быть применен метод …

разложения функции в ряд Тейлора

Решение:

Функция является внутренне нелинейной, и для нее отсутствует прямое преобразование, которое превратит ее в линейную функцию. Только разложением функции в ряд Тейлора, то есть заменой данной функции суммой полиномов, можно привести данную функцию к линейному виду.

3. Для линеаризации нелинейной функции может быть применен метод …

логарифмирования и замены переменных

разложения функции в ряд Тейлора

потенцирования и замены переменных

обращения и замены переменных

Решение:

Функция является внутренне линейной и с помощью логарифмирования может быть преобразована к виду , которая является линейной относительно логарифмов переменных. Сделав замену переменных , , , , получим линейную функцию . Поэтому для линеаризации используется сначала логарифмирование, затем замена переменных.

Тема 16: Оценка качества нелинейных уравнений регрессии

1. При расчете уравнения нелинейной регрессии , где y спрос на продукцию, ед.; x – цена продукции, руб., выяснилось, что доля остаточной дисперсии в общей меньше 20%. Коэффициент детерминации для данной модели попадает в отрезок минимальной длины …

Решение:

Доля остаточной дисперсии в общей меньше 20%, значит, доля объясненной регрессии в общей больше 80%, другими словами, коэффициент детерминации больше 0,8. Поскольку коэффициент детерминации может принимать значения только в интервале [0, 1], то отрезком минимальной длины, в который попадает коэффициент детерминации для данной модели, будет отрезок [0,8; 1].

2. По 20 регионам страны изучалась зависимость уровня безработицы y (%) от индекса потребительских цен x (% к предыдущему году) и построено уравнение в логарифмах исходных показателей: . Коэффициент корреляции между логарифмами исходных показателей составил . Коэффициент детерминации для модели в исходных показателях равен …

Решение:

Коэффициент детерминации для модели в исходных показателях в данном случае будет равен коэффициенту детерминации для модели в логарифмах исходных показателей, который вычисляется как квадрат коэффициента корреляции, то есть 0,64.

3. Для регрессионной модели , где – нелинейная функция, – рассчитанное по модели значение переменной , получены значения дисперсий: . Не объяснена моделью часть дисперсии переменной , равная …

Решение:

Значение индекса детерминации R 2 характеризует долю дисперсии зависимой переменной, объясненную независимой переменной (построенным нелинейным уравнением регрессии). Разность (1-R 2 ) характеризует долю дисперсии зависимой переменной, необъясненную уравнением, эту величину и необходимо определить в задании. Воспользуемся формулой для расчета R 2 : . Следовательно, разность . Таким образом, часть дисперсии переменной , необъясненная моделью, равна 0,096. Можно также рассчитать это значение через отношение

4. Для регрессионной модели , где – нелинейная функция, – рассчитанное по модели значение переменной , получено значение индекса корреляции R = 0,64. Моделью объяснена часть дисперсии переменной , равная …

Решение:

Величина, характеризующая долю дисперсии зависимой переменной, объясненную независимой переменной (построенным нелинейным уравнением регрессии), называется индексом (коэффициентом) детерминации – R 2 . Значения индекса детерминации R 2 и индекса корреляции R для нелинейных регрессионных моделей связаны соотношением . Следовательно, значение .

5. По результатам проведения исследования торговых точек было построено уравнение нелинейной регрессии , где y – спрос на продукцию, ед.; x – цена продукции, руб. Если фактическое значение t-критерия Стьюдента составляет –2,05, а критические значения для данного количества степеней свободы равны , , , то …

при уровне значимости можно считать, что эластичность спроса по цене составляет –0,8

при уровне значимости можно считать, что эластичность спроса по цене составляет –0,8

эластичность спроса по цене составляет –0,8

при уровне значимости можно считать, что эластичность спроса по цене составляет –0,8

Решение:

Для проверки значимости коэффициентов нелинейной регрессии, после линеаризации, как и для уравнения парной линейной регрессии, применяется стандартный алгоритм критерия Стьюдента. Для b формулируется нулевая гипотеза при альтернативной гипотезе . Затем рассчитывается фактическое значение t-статистики, которое сравнивается с критическим значением Стьюдента для требуемого числа степеней свободы и уровня значимости. Если , коэффициент значим; если , коэффициент незначим. В нашем случае при уровне значимости коэффициент значим, а при уровнях значимости и незначим.

Тема 17: Временные ряды данных: характеристики и общие понятия

1. В состав любого временного ряда, построенного по реальным данным, обязательно входит _____ компонента.

Решение:

Ряд, построенный по реальным данным, может не содержать тренда, сезонной (циклической) компоненты, однако, он обязательно содержит случайную компоненту.

2. Ряд, уровни которого образуются как сумма среднего уровня ряда и некоторой случайной компоненты, изображен на графике …

Решение:

График ряда, уровни которого образуются как сумма среднего уровня ряда и некоторой случайной компоненты, будет колебаться относительно своего среднего значения.

3. Совокупность значений экономического показателя за несколько последовательных моментов (периодов) времени называется …

Решение:

Совокупность значений экономического показателя за несколько последовательных моментов (периодов) времени называется временным рядом.

4. Выраженную положительную тенденцию содержит ряд …

Решение:

Ряд имеет выраженную положительную тенденцию, если уровни ряда увеличиваются с увеличением периода времени t.

Тема 18: Структура временного ряда

1. Значение коэффициента автокорреляции первого порядка характеризует …

тесноту линейной связи

качество модели временного ряда

тесноту нелинейной связи

Решение:

Структура временного ряда определяется по значениям коэффициента автокорреляции, рассчитанным для разных порядков коэффициента автокорреляции. Коэффициент автокорреляции характеризует тесноту связи между уровнями исходного ряда и уровнями этого же ряда, сдвинутыми на значение порядка, а само значение коэффициента корреляции рассчитывается по аналогии с парным коэффициентом линейной корреляции и характеризует тесноту линейной связи между двумя переменными. Поэтому варианты «качество модели временного ряда», «тесноту нелинейной связи» и «значимость тренда» являются неверными.

Качество регрессионной модели. Нелинейная регрессия

Значимость уравнения регрессии еще не означает, что выбранная модель достаточно правильно (адекватно) описывает исследуемое экономическое явление. Применение неадекватной модели для целей анализа и прогнозирования может приводить к неоправданно большим ошибкам. Если модель адекватна, то остатки регрессии представляют собой независимые нормально распределенные случайные величины с одинаковой дисперсией. В случае неадекватности модели остатки содержат также и систематическую составляющую, а закон их распределения отличается от нормального. Проверка адекватности регрессионной модели рассматривается в § 3.8.

Обычно в начале исследуется линейная модель, для которой после оценки параметров и проверки значимости уравнения регрессии определяется коэффициент детерминации и оценивается точность.

Коэффициент детерминации R 2 рассчитывается по формуле

.(2.19)

Его значение показывает долю вариации результата Y, обусловленную вариацией фактора X. К примеру, если R 2 =0,856, то это означает, что 85,6 % вариации результата Y вызвано вариацией фактора X, а соответственно 14,4 % ( ) — неучтенными и случайными факторами. Коэффициент детерминации принимает значения в интервале от 0 до 1. Чем ближе R 2 к единице, тем лучше модель объясняет вариацию Y, а уравнение регрессии аппроксимирует фактические данные.

Заметим, что для линейной парной модели коэффициент детерминации равен квадрату коэффициента корреляции: , а стандартная ошибка регрессии Sрег связана с R 2 соотношением

,(2.20)

где Sy — стандартное отклонение зависимой переменной Y в исходных данных.

Коэффициент детерминации и F–статистика Фишера (см. § 2.3) связаны между собой соотношением

,(2.21)

где n — число наблюдений; m — число оцениваемых параметров регрессионной модели, включая свободный коэффициент b0.

В случае парной линейной регрессии m=2 и

.(2.22)

Точность модели, т.е. близость линии регрессии к фактическим данным,характеризует средняя относительная ошибка аппроксимации

.(2.23)

Если Еотн не превышает 10 %, то считается, что модель имеет высокую точность, при точность модели хорошая, при — удовлетворительная, а при — неудовлетворительная.

Средняя относительная ошибка аппроксимации Еотн связана со стандартной ошибкой регрессии Sрег приближенным соотношением

.(2.24)

Расхождение между формулами (2.23) и (2.24) обычно незначительное, особенно при достаточно большом объеме наблюдений ( ).

После анализа качества линейной модели переходят к исследованию нелинейных моделей, коэффициент детерминации и средняя относительная ошибка аппроксимации которых, определяются по тем же самым формулам и имеют тот же смысл, что и для линейной модели. Наиболее часто на практике используются нелинейные модели, приведенные в табл. 2.2.

Значимость нелинейного уравнения регрессии проверяется по F‑критерию Фишера. Лучшей считается модель, имеющая наибольший коэффициент детерминации R 2 . При незначительных расхождениях в значениях R 2 предпочтение отдается более простой модели. Если модель предполагается использовать для целей анализа, то ее параметры должны иметь содержательную экономическую интерпретацию. Интерпретация параметров степенной, показательной и логарифмической регрессий рассматривается в приведенных ниже примерах.

Таблица2.2
Часто используемые на практике нелинейные модели
Форма связиМодельУравнение регрессии
1. Степенная
2. Показательная
3. Экспоненциальная (другой вид показательной связи)
4. Логарифмическая
5. Гиперболическая
6. Полиноминальная разных степеней (q — степень полинома)

Решение типовых задач

Пример 2.1

По десяти однородным предприятиям имеется информация, характеризующая зависимость объема выпускаемой продукции (результативная переменная Y, млн. руб.) от объема капиталовложений (фактор X, млн. руб.):

ПредприятиеАБВГДЕЖЗИК
Y
X

1. Рассчитать парный коэффициент корреляции между переменными Y и X и проверить его статистическую значимость (уровень значимости a=0,05).

2. Найти параметры уравнения линейной регрессии Y по X и дать их экономическую интерпретацию.

3. Вычислить коэффициент детерминации R 2 и пояснить его смысл.

4. Проверить статистическую значимость уравнения регрессии по F-критерию Фишера (a=0,05).

5. Определить стандартную ошибку регрессии и оценить точность модели с помощью средней относительной ошибки аппроксимации.

6. Построитьдоверительные интервалы для истинных параметров b0 и b1 регрессионной модели и проверить статистическую значимость коэффициентов уравнения регрессии по t-критерию Стьюдента (a=0,05).

7. Спрогнозировать с доверительной вероятностью 0,9 значение показателя Y, если прогнозное значения фактора Х составит 80 % от максимального значения в исходных данных.

8. Изобразить графически результаты моделирования и прогнозирования.

1. Для определения парного коэффициента корреляции ry,x между переменными Y и X в EXCEL может быть использована любая из встроенных функций «КОРРЕЛ» или «ПИРСОН». Использование встроенных функций EXCEL рассмотрено в § 5.4.

Коэффициент корреляции имеет значение

.

Критическое значение коэффициента корреляции для уровня значимости a=0,05 и числа степеней свободы составляет rкр=0,632, где n=10 — число пар значений переменных. Видно, что коэффициент корреляции превышает по абсолютной величине критическое значение и следовательно является статистически значимым. Положительное значение коэффициента корреляции свидетельствует о прямой связи между переменными Y и X, а превышение им по абсолютной величине 0,8 — о тесной линейной связи.

2. Линейная модель парной регрессии Y по X и уравнение регрессии соответственно имеют вид:

;

.

Коэффициенты уравнения регрессии определяем с помощью встроенных функций «ОТРЕЗОК» и «НАКЛОН» соответственно. Они имеют значения:

млн. руб.;

.

Окончательно уравнение регрессии —

.

Значение свободного коэффициента b0 показывает, что при нулевом объеме капиталовложений X объем выпускаемой продукции Y будет составлять в среднем 13,92 млн. руб. Значение углового коэффициента b1=0,785 показывает, что при увеличении объема капиталовложений на 1 млн. руб. объем выпускаемой продукции возрастает в среднем на 0,785 млн. руб.

3. Коэффициент детерминации R 2 парной линейной регрессии определяется с помощью встроенной функции EXCEL «КВПИРСОН». Получим:

.

Значение R 2 показывает, что линейная модель объясняет 86,9 % вариации Y. Другими словами, 86,9 % вариации объема выпускаемой продукции Y обусловлена вариацией объема капиталовложений X.

4. Для проверки статистической значимости уравнения регрессии F‑статистику Фишера определимчерез коэффициент детерминации по формуле (2.22):

.

Табличное значение F-критерия Фишера для уровня значимости a=0,05 и чисел степеней свободы числителя (регрессии) и знаменателя (остатка) составляет Fтаб=5,32. Так как F-статистика превышает табличное значение F-критерия, то это свидетельствует о статистической значимости уравнения регрессии в целом.

5. Стандартная ошибка линейной парной регрессии Sрег (см. § 2.2) определяется с помощью встроенной функции EXCEL «СТОШYX». Имеем:

млн. руб.

Среднюю относительную ошибку аппроксимации Еотн рассчитаем по приближенной формуле

%,

где млн. руб. — средний объем выпускаемой продукции, определенный с помощью встроенной функции «СРЗНАЧ».

Значение Еотн показывает, что предсказанные уравнением регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 7,1 %. Так как средняя относительная ошибка аппроксимации меньше 10 %, то это свидетельствует о высокой точности линейной модели.

6. Для определения интервальных оценок истинных параметров b0 и b1 регрессионной модели рассчитаем стандартные ошибки коэффициентов уравнения регрессии:

млн. руб.;

,

где млн. руб. — стандартное отклонение переменной X в исходных данных, определяемое с помощью встроенной функции «СТАНДОТКЛОН»; — сумма квадратов значений переменной X в исходных данных (функция «СУММКВ»).

Доверительный интервал, «накрывающий» с заданной надежностью 0,95 неизвестное значение параметра b0 модели, имеет вид:

млн. руб.,

где tтаб=2,306 — табличное значение t-критерия Стьюдента для уровня значимости a=0,05 и числа степеней свободы остатка линейной парной регрессии .

Таким образом, с доверительной вероятностью 95 % истинное значение параметра b0 будет находиться в интервале от 3,89 до 23,95 млн. руб. Так как нижняя и верхняя границы доверительного интервала имеют одинаковый знак, то коэффициент b0 уравнения регрессии признается статистически значимым на уровне значимости a=0,05.

Доверительный интервал для параметра b1 модели имеет вид:

.

Это означает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y с вероятностью 95 % возрастает в среднем на величину, заключенную в интервале от 0,536 до 1,034 млн. руб. Один и тот же знак доверительных границ свидетельствует о статистической значимости коэффициента b1 и уравнения регрессии в целом на уровне a=0,05.

7. Спрогнозируем объем выпускаемой продукции Y, если прогнозное значение x0 объема капиталовложений X составит 80 % от своего максимального значения в исходных данных xmax=59 млн. руб.:

млн. руб.

Среднее прогнозируемое значение объема выпускаемой продукции (точечный прогноз) равно

млн. руб.

Точечный прогноз можно рассчитать и с помощью встроенной функции «ПРЕДСКАЗ».

Стандартная ошибка прогноза фактического значенияобъема выпускаемой продукции y0 рассчитывается по формуле

млн. руб.,

где млн. руб. — средний объем капиталовложений, определенный с помощью встроенной функции «СРЗНАЧ».

Интервальный прогноз фактического значения объема выпускаемой продукции y0 с надежностью g=0,9 (уровень значимости a=0,1) имеет вид:

млн. руб.,

где tтаб=1,860 — табличное значение t-критерия Стьюдента при уровне значимости a=0,1 и числе степеней свободы .

Объем выпускаемой продукции с вероятностью 90 % будет находиться в интервале от 43,13 до 58,81 млн. руб.

8. График, на котором изображены фактические и предсказанные уравнением регрессии значения Y, строим с помощью надстройки «Мастер диаграмм» EXCEL (рис. 2.5). Данная надстройка позволяет построить линии нескольких видов регрессии (линейной, степенной, логарифмической, экспоненциальной и полиноминальной), определить их уравнение и коэффициент детерминации. Использование «Мастера диаграмм» рассмотрено в § 5.1.

рис. 2.5. Линия линейной парной регрессии и точки прогноза

Пример 2.2

Используя исходные данные предыдущего примера, выполнить следующие действия:

1. С помощью табличного процессора EXCEL построить уравнения линейной, логарифмической, степенной и показательной регрессий Y по X. Для указанных регрессий:

· привести графики их линий;

· дать экономическую интерпретацию параметрам уравнений;

· найти коэффициенты детерминации;

· проверить статистическую значимость уравнений по F-критерию Фишера;

· оценить точность моделей с помощью средней относительной ошибки аппроксимации.

2. Сравнить построенные модели между собой и выбрать лучшую из них для целей анализа и прогнозирования.

1. Линейную, степенную, логарифмическую и показательную регрессии строим с помощью «Мастера диаграмм» EXCEL. Линейная и степенная регрессии показаны на рис. 2.6, логарифмическая и показательная — на рис. 2.7. На графиках приводятся не только линии регрессии, но также их уравнения и коэффициенты детерминации (см. § 5.1).

рис. 2.6. Линии линейной и степенной регрессий

рис. 2.7. Линии логарифмической и показательной регрессий

Рассмотрим последовательно каждую модель.

1) Уравнение линейной регрессии имеет вид:

.

Угловой коэффициент b1=0,785 является показателем среднего абсолютного прироста. Его значение показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпускаемой продукции Y возрастает в среднем на 0,785 млн. руб.

Коэффициент детерминации R 2 =0,869 показывает, что линейная модель объясняет 89,8 % вариации объема выпускаемой продукции Y.

F-статистика Фишера линейной модели определяем через коэффициент детерминации R 2 по формуле

.

Табличное значение F-критерия Фишера для уровня значимости a=0,05 и чисел степеней свободы числителя (регрессии) и знаменателя (остатка) составляет Fтаб=5,32. Так как F-статистика превышает табличное значение, то это свидетельствует о статистической значимости уравнения линейной регрессии в целом.

Следует заметить, что табличное значение F-критерия Фишера одинаково как для линейной, так и для всех нелинейных моделей, которые здесь строятся (Fтаб=5,32).

Стандартная ошибка линейной регрессии рассчитывается по формуле

млн. руб.,

где млн. руб. — стандартное отклонение переменной X в исходных данных, определенное с помощью встроенной функции «СТАНДОТКЛОН».

Среднюю относительную ошибку аппроксимации определяем по приближенной формуле

%,

где млн. руб. — средний объем выпускаемой продукции, определенный с помощью встроенной функции «СРЗНАЧ».

Предсказанные уравнением линейной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 7,1 %.

2) Уравнение степенной регрессии выглядит следующим образом:

.

Показатель степени b1=0,721 является средним коэффициентом эластичности. Его значение показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на 0,721 %.

Коэффициент детерминации R 2 =0,873 показывает, что степенная модель объясняет 87,3 % вариации объема выпускаемой продукции Y.

F-статистика степенной модели

также превышает табличное значение F-критерия Фишера (Fтаб=5,32), что указывает на статистическую значимость уравнения степенной регрессии.

Стандартную ошибку и среднюю относительную ошибку аппроксимации нелинейных регрессий будем определять по тем же самым формулам, что и для линейной модели. Для степенной регрессии они равны:

млн. руб.;

%.

Предсказанные уравнением степенной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 7,0 %.

3) Уравнение логарифмической регрессии имеет вид:

.

Значение параметра b1=29,9 показывает, что при увеличении объема капиталовложений X на 1 % объем выпускаемой продукции Y возрастает в среднем на млн. руб.

Коэффициент детерминации R 2 =0,898 показывает, что логарифмическая модель объясняет 89,8 % вариации объема выпускаемой продукции Y.

F-статистика Фишера логарифмической модели равна

и превышает табличное значение F-критерия Фишера (Fтаб=5,32). Это свидетельствует о статистической значимости уравнения регрессии.

Стандартная ошибка логарифмической регрессии составляет

млн. руб.

Средняя относительная ошибка аппроксимации имеет значение

%.

Предсказанные уравнением логарифмической регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 6,2 %.

4) Уравнение показательной регрессии определяется через экспоненциальную регрессию:

,

где е=2,718… — основание натуральных логарифмов; — функция экспоненты (в EXCEL встроенная функция «EXP»).

Параметр b1=1,019 показательной регрессии является средним коэффициентом роста. Его значение показывает, что при увеличении объема капиталовложений X на 1 млн. руб. объем выпуска продукции Y возрастает в среднем в 1,019 раза, т.е. на 1,9 %.

Заметим, что параметр b1 экспоненциальной регрессии , умноженный на 100, является средним темпом прироста, выраженным в процентах. Данный вывод вытекает из приближенного соотношения , при относительно малых значениях a ( ).

Уравнения показательной и экспоненциальной регрессии являются эквивалентными.

Коэффициент детерминации R 2 =0,821 показывает, что показательная модель объясняет 82,1 % вариации объема выпускаемой продукции Y.

F-статистика показательной модели

превышает табличное значение F-критерия Фишера (Fтаб=5,32), что свидетельствует о статистической значимости уравнения регрессии.

Стандартная ошибка показательной регрессии

млн. руб.

Средняя относительная ошибка аппроксимации

%.

Предсказанные уравнением показательной регрессии значения объема выпускаемой продукции Y отличаются от фактических значений в среднем на 8,3 %.

2. Сравнивая между собой коэффициенты детерминации R 2 четырех моделей, можно придти к выводу, что лучшей из них является логарифмическая модель, так как она имеет самое большое значение R 2 . Эту модель и целесообразно использовать в качестве рабочей для анализа и прогнозирования изменения объема выпускаемой продукции Y в зависимости от изменения объема капиталовложений X.

Заметим, что при выборе лучшей модели из четырех рассмотренных для целей анализа параметр b1 должен иметь содержательную интерпретацию. Так, если бы переменные X и Y были относительными величинами и измерялись в процентах, то корректная интерпретация параметра b1 нелинейных моделей оказалась бы затруднительной. В этом случае для прогнозирования следовало бы выбрать модель с большим R 2 , а для целей анализа — линейную модель.

Пример 2.3

В магазине исследуется зависимость количества реализованных за день упаковок шампуня (Y, шт.) от цены одной упаковки (X, руб.). Имеется информация по одиннадцати наименованиям шампуня:

ШампуньАБВГДЕЖЗИКЛ
Y
X

Выполнить те же самые действия, что и в предыдущем примере.

1. Линейную, степенную, логарифмическую и показательную регрессии строим с помощью «Мастера диаграмм» EXCEL. Линейная и степенная регрессии показаны на рис. 2.8, логарифмическая и показательная — на рис. 2.9.

Используя формулы предыдущего примера, рассчитаем для каждой модели коэффициент детерминации R 2 , F-статистику Фишера, стандартную ошибку регрессии Sрег и среднюю относительную ошибку аппроксимации Eотн ( шт.; Sy=13,631 шт.). Полученные результаты сведены в табл. 2.3.

рис. 2.8. Линии линейной и степенной регрессий

рис. 2.9. Линии логарифмической и показательной регрессий

Таблица2.3
Сводная таблица результатов моделирования
МодельУравнение регрессииR 2FSрег, шт.Eотн, %
1. Линейная 0,78833,456,6211,8
2. Степенная 0,85753,945,439,7
3. Логарифмическая 0,83445,225,8610,4
4. Показательная (экспоненциальная) ( )0,82542,436,0110,7

Очевидно, что между переменными X и Y имеется обратная статистическая связь. На это указывают отрицательные значения параметра b1 линейного, степенного и логарифмического уравнений регрессии, а также меньшее единицы значение параметра b1 показательного уравнения. Все уравнения регрессии статистически значимы на уровне значимости a=0,05 ( ; ; Fтаб=5,12).

Угловой коэффициент b1=–0,933 линейной регрессии показывает, что при увеличении цены шампуня X на 1 руб. количество проданных упаковок Y уменьшается в среднем на 0,933 шт. Линейная модель объясняет 78,8 % вариации Y (R 2 =0,788). Предсказанные уравнением регрессии значения Y отличаются от фактических значений в среднем на 11,8 %.

Показатель степени b1=–0,888 степенной регрессии показывает, что при увеличении цены X на 1 % число реализованных упаковок Y уменьшается в среднем на 0,888 %. Степенная модель объясняет 85,7 % вариации Y. Предсказанные уравнением регрессии значения Y отличаются от фактических в среднем на 9,7 %.

Значение параметра b1=39,6 логарифмической регрессии показывает, что при увеличении цены единицы продукции X на 1 % количество проданных упаковок Y уменьшается в среднем на шт. Логарифмическая модель объясняет 83,4 % вариации Y. Средняя погрешность предсказания составляет 10,4 %.

Значение основания степени b1=0,979 показательной регрессии показывает, что при увеличении цены X на 1 руб. объем реализации Y составит в среднем 97,9 % от первоначального значения, или, другими словами, уменьшится на . Это же значение получается, если умножить на 100 параметр «–0,021» экспоненциальной регрессии (см. табл. 2.3). Показательная модель объясняет 82,5 % вариации Y. Предсказанные уравнением регрессии значения Y отличаются от фактических в среднем на 10,7 %.

2. Сравнивая между собой коэффициенты детерминации R 2 четырех построенных моделей, приходим к выводу, что лучшей является степенная модель, имеющая наибольший R 2 . Эту модель и целесообразно использовать в качестве рабочей для анализа и прогнозирования изменения объема реализации Y от изменения цены единицы продукции X.

Контрольные задания

Используя приведенные ниже данные, выполнить расчеты в соответствии с заданием к примерам 2.1 и 2.2. В вариантах 1 – 5 между переменными присутствует прямая связь, в вариантах 6 – 10 — обратная связь.

Вариант 1(прямая связь)

Наблюдение
Y
X

Вариант 2(прямая связь)

Наблюдение
Y
X

Вариант 3(прямая связь)

Наблюдение
Y
X

Вариант 4(прямая связь)

Наблюдение
Y
X

Вариант 5(прямая связь)

Наблюдение
Y
X

Вариант 6(обратная связь)

Наблюдение
Y
X

Вариант 7(обратная связь)

Наблюдение
Y
X

Вариант 8(обратная связь)

Наблюдение
Y
X

Вариант 9(обратная связь)

Наблюдение
Y
X

Вариант 10(обратная связь)

Наблюдение
Y
X

Тестовые вопросы для самоконтроля

Из перечня предлагаемых ответов на вопрос только один является правильным. Правильные ответы приведены на с. 151. Числовые данные тестов можно использовать как исходные для рассмотренных в § 2.7 примеров.

По десяти интернет-брокерам в секции фондового рынка имеются данные, характеризующие зависимость годового торгового оборота (Y, млрд. руб.) от средней ставки маржинального кредитования (X, % годовых):

КомпанияАБВГДЕЖЗИК
Y30,8230,825,1414,112,7310,89,748,427,65
X16,5

Парный коэффициент линейной корреляции между переменными Y и X имеет значение ry,x=–0,451.

Охарактеризовать линейную связь между торговым оборотом Y и средней ставкой маржинального кредитования X, если критическое значение коэффициента корреляции на уровне значимости a=0,05 составляет rкр=0,632.

а) Линейная связь статистически значимая.

б) Линейная связь статистически незначимая.

в) Линейная связь тесная.

г) Линейная связь прямая функциональная.

д) Линейная связь обратная функциональная.

По семи целлюлозно-бумажным компаниям имеются данные, характеризующие зависимость объема выпускаемой продукции (Y, млн. долл. США) от производственной мощности (X, тыс. тонн целлюлозы в год), по итогам года:

КомпанияАБВГДЕЖ
Y
X

Стандартные отклонения переменных Y и X и парный коэффициент корреляции между ними имеют соответственно значения: Sy=344 млн. долл. США, Sx=824 тыс. тонн, ry,x=0,988.

На сколько в среднем увеличивается объем выпускаемой продукции Y при росте производственной мощности X на одну тысячу тонн целлюлозы в год?

а) На 0,344 млн. долл.

б) На 0,824 млн. долл.

в) На 0,412 млн. долл.

г) На 0,988 млн. долл.

д) На 0,280 млн. долл.

Исследуется связь между официальными курсами доллара США (Y, руб./USD) и евро (X, руб./EUR), установленными Центральным банком Российской Федерации. Имеются данные за десять последовательных дней:

День
Y28,1127,9727,9728,0127,9828,1228,1928,1328,0928,07
X36,5936,4636,5636,4736,2836,1335,9835,9736,0036,13

Методом наименьших квадратов было получено уравнение линейной регрессии Y по X:

.

Суммы квадратов отклонений зависимой переменной Y от своего среднего значения составляют:

· обусловленная регрессией — SSрег=0,0240;

Рассчитать F-статистику и проверить статистическую значимость уравнения регрессии, если табличное значение F‑критерия Фишера на уровне значимости a=0,05 составляет Fтаб=5,32.

а) F=6,17; уравнение регрессии статистически значимо.

б) F=0,77; уравнение регрессии статистически незначимо.

в) F=1,77; уравнение регрессии статистически незначимо.

г) F=2,54; уравнение регрессии статистически незначимо.

д) F=14,17; уравнение регрессии статистически значимо.

По девяти из наиболее прибыльных компаний региона имеются данные, характеризующие зависимость чистой прибыли (Y, млн. руб.) от объема реализации (X, млн. руб.) по итогам одного года:

КомпанияАБВГДЕЖЗИ
Y
X

Методом наименьших квадратов было получено уравнение линейной регрессии Y по X:

.

Коэффициент детерминациисоставляет R 2 =0,540.

Рассчитать F-статистику и проверить статистическую значимость уравнения регрессии на уровне a=0,05, если табличное значение F‑критерия Фишера составляет Fтаб=5,59.

а) F=0,73; уравнение регрессии статистически незначимо.

б) F=1,17; уравнение регрессии статистически незначимо.

в) F=3,91; уравнение регрессии статистически значимо.

г) F=8,22; уравнение регрессии статистически значимо.

д) F=22,6; уравнение регрессии статистически значимо.

По восьми крупнейшим западным банкам-консультантам на рынке M&A (сопровождение сделок по слияниям и поглощениям) имеются данные, характеризующие зависимость размера комиссионных (Y, млн. долл. США) от объема сделок (X, млрд. долл. США), по итогам трех кварталов года:

БанкАБВГДЕЖЗ
Y
X305,5265,7240,4149,3101,6114,6122,2

Уравнение линейной регрессии Y по X имеет вид:

.

Стандартные ошибки коэффициентов уравнения составляют:

· свободного коэффициента — млн. долл.;

· углового коэффициента — млн. долл./млрд. долл.

Проверить статистическую значимость уравнения регрессии на уровне значимости a=0,05 для чего рассчитать соответствующую t-статистику. Табличное значение t‑критерия Стьюдента составляет tтаб=2,447.

а) t=0,892; уравнение регрессии статистически незначимо.

б) t=2,510; уравнение регрессии статистически значимо.

в) t=1,121; уравнение регрессии статистически незначимо.

г) t=3,404; уравнение регрессии статистически значимо.

д) t=3,816; уравнение регрессии статистически значимо.

По семи оценочным компаниям имеются данные, характеризующие зависимость совокупной выручки за полугодие (Y, тыс. руб.) от количества специалистов-оценщиков (X, чел.):

КомпанияАБВГДЕЖ
Y
X

С помощью «Мастера диаграмм» EXCEL были получены уравнения линейной, степенной, показательной и логарифмической регрессий Y по X, и для каждой модели определен коэффициент детерминации R 2 :

· линейная: ; R 2 =0,877;

· степенная: ; R 2 =0,858;

· показательная: ; R 2 =0,939;

· логарифмическая: ; R 2 =0,780.

Какая из моделей лучше характеризует вариацию совокупной выручки Y?

Исследуется связь между ценой нефти марки Urals (Y, долл. США/баррель) и ценой нефти марки Brent (X, долл./баррель) по итогам торгов на Международной нефтяной бирже за десять торговых дней:

День
Y39,9141,1840,3839,439,4439,5440,0438,4238,4939,81
X44,845,8744,6443,6543,3843,6943,0542,9342,9844,42

Было получено уравнение линейной регрессии Y по X:

.

Дать правильную экономическую интерпретацию угловому коэффициенту b1=0,715 уравнения регрессии.

Угловой коэффициент b1=0,715 уравнения регрессии показывает, что …

а) … 71,5 % вариации цены нефти Urals объясняется вариацией цены нефти Brent.

б) … с ростом цены нефти Brent на один процент цена нефти Urals возрастает в среднем на 0,715 %.

в) … с ростом цены нефти Brent на один процент цена нефти Urals возрастает в среднем на 0,715 долл./баррель.

г) … с ростом цены барреля нефти Brent на один доллар цена барреля нефти Urals возрастает в среднем на 0,715 %.

д) … с ростом цены барреля нефти Brent на один доллар цена барреля нефти Urals возрастает в среднем на 0,715 доллара.

Исследуется зависимость месячного торгового оборота универсального магазина (Y, млн. руб.) от размера торговых площадей (X, м 2 ). Имеются данные по восьми универмагам города:

МагазинАБВГДЕЖЗ
Y
X

Было получено уравнение степенной регрессии Y по X:

.

Дать правильную экономическую интерпретацию показателю степени b1=0,552 в уравнении регрессии.

Показатель степени b1=0,552 в уравнении регрессии показывает, что …

а) … 55,2 % вариации торгового оборота объясняется вариацией размера торговых площадей.

б) … с увеличением размера торговых площадей на один процент торговый оборот возрастает в среднем на 0,552 %.

в) … с увеличением размера торговых площадей на один процент торговый оборот возрастает в среднем на 0,552 млн. руб.

г) … с увеличением размера торговых площадей на один квадратный метр торговый оборот возрастает в среднем на 0,552 %.

д) … с увеличением размера торговых площадей на один квадратный метр торговый оборот возрастает в среднем на 0,552 млн. руб.

По девяти туристическим агентствам города исследуется зависимость месячного торгового оборота (Y, тыс. долл. США) от количества менеджеров по туризму (X, чел.):

ТурагентствоАБВГДЕЖЗИ
Y
X

Было получено уравнение показательной регрессии Y по X:

.

Дать правильную экономическую интерпретацию основанию степени b1=1,076 в уравнении регрессии.

Основание степени b1=1,076 в уравнении регрессии показывает, что …

а) … с увеличением численности менеджеров по туризму на одного человека торговый оборот возрастает в среднем в 1,076 раз, т.е. на 7,6 %.

б) … с увеличением численности менеджеров по туризму на одного человека торговый оборот возрастает в среднем на 1,076 %.

в) … с увеличением численности менеджеров по туризму на одного человека торговый оборот возрастает в среднем на 1,076 тыс. руб.

г) … с увеличением численности менеджеров по туризму на один процент торговый оборот возрастает в среднем в 1,076 раз, т.е. на 7,6 %.

д) … 1,076 % вариации торгового оборота объясняется вариацией численности менеджеров по туризму.

Исследуется связь между учетной ценой Банка России на аффинированное золото (Y, руб./г) и ценой золота на мировых рынках (X, долл. за тройскую унцию) по данным за десять последовательных дней:

День
Y390,38391,74393,61378,8377,01381,28383,09372,84374,48381,19
X438,9441,1422,2422,5423,3426,8415,9418,85427,1

Методом наименьших квадратов было получено уравнение линейной регрессии Y по X:

.

Построить интервальный прогноз учетной цены Банка России на аффинированное золото y0 с надежностью 90 % при цене золота x0=410 долл. за тройскую унцию, если стандартная ошибка прогноза фактического значения Y при этом составляет руб./г, а табличное значение t-критерия Стьюдента — tтаб=1,86.

С вероятностью 0,9 учетная цена золота будет находиться в интервале …


источники:

http://lektsii.org/3-35810.html