Уравнение временного ряда имеет вид

Анализ временных рядов, тренд ряда динамики, точечная оценка прогноза

МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ

Анализ временных рядов

Временной ряд (или ряд динамики) – это упорядоченная по времени последовательность значений некоторой произвольной переменной величины. Тем самым, временной ряд существенным образом отличается от простой выборки данных. Каждое отдельное значение данной переменной называется отсчётом (уровнем элементов) временного ряда.

Временные ряды состоят из двух элементов:

  • периода времени, за который или по состоянию на который приводятся числовые значения;
  • числовых значений того или иного показателя, называемых уровнями ряда.

Временные ряды классифицируются по следующим признакам:

  • по форме представления уровней: ряды абсолютных показателей, относительных показателей, средних величин;
  • по количеству показателей, когда определяются уровни в каждый момент времени: одномерные и многомерные временные ряды;
  • по характеру временного параметра: моментные и интервальные временные ряды. В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени. В интервальных рядах уровни характеризуют значение показателя за определенные периоды времени. Важная особенность интервальных временных рядов абсолютных величин заключается в возможности суммирования их уровней. Отдельные же уровни моментного ряда абсолютных величин содержат элементы повторного счета. Это делает бессмысленным суммирование уровней моментных рядов;
  • по расстоянию между датами и интервалами времени выделяют равноотстоящие – когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами и неполные (неравноотстоящие) – когда принцип равных интервалов не соблюдается;
  • по наличию пропущенных значений: полные и неполные временные ряды. Временные ряды бывают детерминированными и случайными: первые получают на основе значений некоторой неслучайной функции (ряд последовательных данных о количестве дней в месяцах); вторые есть результат реализации некоторой случайной величины;
  • в зависимости от наличия основной тенденции выделяют стационарные ряды – в которых среднее значение и дисперсия постоянны и нестационарные – содержащие основную тенденцию развития.

Временные ряды, как правило, возникают в результате измерения некоторого показателя. Это могут быть как показатели (характеристики) технических систем, так и показатели природных, социальных, экономических и других систем (например, погодные данные). Типичным примером временного ряда можно назвать биржевой курс, при анализе которого пытаются определить основное направление развития (тенденцию или тренда).

Анализ временных рядов – совокупность математико-статистических методов анализа, предназначенных для выявления структуры временных рядов и для их прогнозирования. Сюда относятся, в частности, методы регрессионного анализа. Выявление структуры временного ряда необходимо для того, чтобы построить математическую модель того явления, которое является источником анализируемого временного ряда. Прогноз будущих значений временного ряда используется для эффективного принятия решений.

Прогноз, характеристики и параметры прогнозирования

Прогноз (от греч. – предвидение, предсказание) – предсказание будущего с помощью научных методов, а также сам результат предсказания. Прогноз – это научная модель будущего события, явлений и т.п.

Прогнозирование, разработка прогноза; в узком значении – специальное научное исследование конкретных перспектив развития какого-либо процесса.

  • по срокам: краткосрочные, среднесрочные, долгосрочные;
  • по масштабу: личные, на уровне предприятия (организации), местные, региональные, отраслевые, мировые (глобальные).

К основным методам прогнозирования относятся:

  • статистические методы;
  • экспертные оценки (метод Дельфи);
  • моделирование.

Прогноз – обоснованное суждение о возможном состоянии объекта в будущем или альтернативных путях и сроках достижения этих состояний. Прогнозирование – процесс разработки прогноза. Этап прогнозирования – часть процесса разработки прогнозов, характеризующаяся своими задачами, методами и результатами. Деление на этапы связано со спецификой построения систематизированного описания объекта прогнозирования, сбора данных, с построением модели, верификацией прогноза.

Прием прогнозирования – одна или несколько математических или логических операций, направленных на получение конкретного результата в процессе разработки прогноза. В качестве приема могут выступать сглаживание динамического ряда, определение компетентности эксперта, вычисление средневзвешенного значения оценок экспертов и т. д.

Модель прогнозирования – модель объекта прогнозирования, исследование которой позволяет получить информацию о возможных состояниях объекта прогнозирования в будущем и (или) путях и сроках их осуществления.

Метод прогнозирования – способ исследования объекта прогнозирования, направленный на разработку прогноза. Методы прогнозирования являются основанием для методик прогнозирования.

Методика прогнозирования – совокупность специальных правил и приемов (одного или нескольких методов) разработки прогнозов.

Прогнозирующая система – система методов и средств их реализации, функционирующая в соответствии с основными принципами прогнозирования. Средствами реализации являются экспертная группа, совокупность программ и т. д. Прогнозирующие системы могут быть автоматизированными и неавтоматизированными.

Прогнозный вариант – один из прогнозов, составляющих группу возможных прогнозов.

Объект прогнозирования – процесс, система, или явление, о состоянии которого даётся прогноз.

Характеристика объекта прогнозирования – качественное или количественное отражение какого-либо свойства объекта прогнозирования.

Переменная объекта прогнозирования – количественная характеристика объекта прогнозирования, которая является или принимается за изменяемую в течение периода основания и (или) периода упреждения прогноза.

Период основания прогноза – промежуток времени, за который используют информацию для разработки прогноза. Этот промежуток времени называют также периодом предыстории.

Период упреждения прогноза – промежуток времени, на который разрабатывается прогноз.

Прогнозный горизонт – максимально возможный период упреждения прогноза заданной точности.

Точность прогноза – оценка доверительного интервала прогноза для заданной вероятности его осуществления.

Достоверность прогноза – оценка вероятности осуществления прогноза для заданного доверительного интервала.

Ошибка прогноза – апостериорная величина отклонения прогноза от действительного состояния объекта.

Источник ошибки прогноза – фактор, способный привести к появлению ошибки прогноза. Различают источники регулярных и нерегулярных ошибок.

Верификация прогноза – оценка достоверности и точности или обоснованности прогноза.

Статистические методы прогнозирования – научная и учебная дисциплина, к основным задачам которой относятся разработка, изучение и применение современных математико-статистических методов прогнозирования на основе объективных данных; развитие теории и практики вероятностно-статистического моделирования экспертных методов прогнозирования; методов прогнозирования в условиях риска и комбинированных методов прогнозирования с использованием совместно экономико-математических и эконометрических (как математико-статистических, так и экспертных) моделей. Научной базой статистических методов прогнозирования является прикладная статистика и теория принятия решений.

Простейшие методы восстановления используемых для прогнозирования зависимостей исходят из заданного временного ряда, т. е. функции, определённой в конечном числе точек на оси времени. Временной ряд при этом часто рассматривается в рамках той или иной вероятностной модели, вводятся другие факторы (независимые переменные), помимо времени, например, объем денежной массы. Временной ряд может быть многомерным. Основные решаемые задачи – интерполяция и экстраполяция. Метод наименьших квадратов в простейшем случае (линейная функция от одного фактора) был разработан К. Гауссом в 1794–1795 гг. Могут оказаться полезными предварительные преобразования переменных, например, логарифмирование. Наиболее часто используется метод наименьших квадратов при нескольких факторах.

Оценивание точности прогноза (в частности, с помощью доверительных интервалов) – необходимая часть процедуры прогнозирования. Обычно используют вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия. Разработаны параметрические (обычно на основе модели нормальных ошибок) и непараметрические оценки точности прогноза и доверительные границы для него (на основе Центральной Предельной Теоремы теории вероятностей). Применяются также эвристические приемы, не основанные на вероятностно-статистической теории: метод скользящих средних, метод экспоненциального сглаживания.

Многомерная регрессия, в том числе с использованием непараметрических оценок плотности распределения – основной на настоящий момент статистический аппарат прогнозирования. Нереалистическое предположение о нормальности погрешностей измерений и отклонений от линии (поверхности) регрессии использовать не обязательно; однако для отказа от предположения нормальности необходимо опереться на иной математический аппарат, основанный на многомерной Центральной Предельной Теореме теории вероятностей, технологии линеаризации и наследования сходимости. Он позволяет проводить точечное и интервальное оценивание параметров, проверять значимость их отличия от 0 в непараметрической постановке, строить доверительные границы для прогноза.

Уравнение тренда временного ряда

Рассматривая временной ряд как множество результатов наблюдений изучаемого процесса, проводимых последовательно во времени, в качестве основных целей исследования временных рядов можно выделить: выявление и анализ характерного изменения параметра у, оценка возможного изменения параметра в будущем (прогноз).

Значения временного ряда можно представить в виде: , где f (t) – неслучайная функция, описывающая связь оценки математического ожидания со временем, – случайная величина, характеризующая отклонение уровня от f(t ).

Неслучайная функция f (t) называется трендом. Тренд отражает характерное изменение (тенденцию) yt за некоторый промежуток времени. На практике в качестве тренда выбирают несколько возможных теоретических или эмпирических моделей. Могут быть выбраны, например, линейная, параболическая, логарифмическая, показательная функции. Для выявления типа модели на координатную плоскость наносят точки с координатами ( t, yt ) и по характеру расположения точек делают вывод о виде уравнения тренда. Для получения уравнения тренда применяют различные методы: сглаживание с помощью скользящей средней, метод наименьших квадратов и другие.

Уравнение тренда линейного вида будем искать в виде yt=f(t ), где f (t) = a0+a1(t ).

Пример 1. Имеется временной ряд:

ti12345678910
xti214468791211

Построим график xti во времени. Добавим на графике линию тренда исходных значений ряда. При этом, щелкнув правой кнопкой мыши по линии тренда, можно вызвать контекстное меню «Формат линии тренда», а в нем поставить флажок «показывать уравнение на диаграмме», тогда на диаграмме высветится уравнение линии тренда, вычисленное встроенными возможностями Excel .

Чтобы определить уравнение тренда, необходимо найти значения коэффициентов а0 и а1. Эти коэффициенты следует определять, исходя из условия минимального отклонения значений функции f (t) в точках ti от значений исходного временного ряда в тех же точках ti . Это условие можно записать в виде (на основе метода наименьших квадратов):

где n – количество значений временного ряда.

Для того, чтобы найти значения а0 и а1, необходимо иметь систему из двух уравнений. Эти уравнения можно получить, используя условие равенства нулю производной функции в точках её экстремума. В нашем случае эта функция имеет вид . Обозначим её через Q . Найдем производные функции Q(а0, а1) по переменным а0 и а1. Получим систему уравнений:

Полученная система может быть преобразована (математически) в систему так называемых нормальных уравнений. При этом уравнения примут вид:

Теперь необходимо решить преобразованную систему уравнений относительно а0 и а1. Однако предварительно следует составить и заполнить вспомогательную таблицу:

tt 2хtхtt
1122
2412
39412
416416
525630
636848
749749
864972
98112108
1010011110

Подставив значения n = 10 в систему уравнений (2), получим

Решив систему уравнений относительно а0 и а1, получим а0 = -0,035, а1 = 1,17. Тогда функция тренда заданного временного ряда f (t) имеет вид:

f (t) = -0,035 + 1,17t.

Изобразим полученную функцию на графике.

Временной ряд приведен в таблице. Используя средства MS Excel :

  1. построить график временного ряда;
  2. добавить линию тренда и ее уравнение;
  3. найти уравнение тренда методом наименьших квадратов, сравнить уравнения (выше на графике и полученное);
  4. построить график временного ряда и полученной функции тренда в одной системе координат.

1. Реализация аспирина по аптеке (у.е.) за последние 7 недель приведена в таблице:

t1234567
хti3,23,32,92,21,61,51,2

2. Динамика потребления молочных продуктов (у.е.) по району за последние 7 месяцев:

t1234567
хti30292724252423

3. Динамика числа работников, занятых в одной из торговых сетей города за последние 8 лет приведена в таблице:

t12345678
хti280361384452433401512497

4. Динамика потребления сульфаниламидных препаратов в клинике по годам (тыс. упаковок):

t12345678
хti1421293338444650

5. Динамика продаж однокомнатных квартир в городе за последние 8 лет (тыс. ед.):

t12345678
уt3940363436373335

6. Динамика потребления антибиотиков в клинике (тыс. упаковок):

t12345678
хti1017181317212529

7. Динамика производства хлебобулочных изделий на хлебозаводе (тонн):

t12345678
хti510502564680523642728665

8. Динамика потребления противовирусных препаратов по аптечной сети в начале эпидемии гриппа (тыс. единиц):

t12345678
хti3642343812322620

9. Динамика потребления противовирусных препаратов по аптечной сети в конце эпидемии гриппа (тыс. единиц):

t12345678
хti4652444832423630

10. Динамика потребления витаминов по аптечной сети в весенний период (с марта по апрель) в разные годы (у.е.):

t12345678
хti0,91,71,51,71,52,12,53,6

Пример 2. Используя данные примера 1, приведенного выше, вычислить точечный прогноз исходного временного ряда на 5 шагов вперед.

Исходя из условия задачи, необходимо определить точечную оценку прогноза для t = 11, 12, 13, 14, 15, где t в данном случае – шаг упреждения.

Рассмотрим решение этой задачи средствами Microsoft Excel . При решении данной задачи следует так же, как и в примере 1, ввести исходные данные. Выделив данные, построить точечный график, щелкнув правой кнопкой мыши по ряду данных, вызвать контекстное меню и выбрать «Добавить линию тренда».

Щелкнув правой кнопкой мыши по линии тренда, вызвать контекстное меню, выбрать «Формат линии тренда», в окне Параметры линии тренда указать прогноз на 5 периодов и поставить флажок в окошке «Показывать уравнение на диаграмме (рис. 14.3 рис. 14.3.). В версии Excel ранее 2007 окно диалога представлено на рисунке 14.4 рис. 14.4.

Итоговый график представлен на рисунке 14.5 рис. 14.5.

Значения прогноза для 11, 12, 13, 14 и 15 уровней получим, используя функцию ПРЕДСКАЗ( ). Данная функция позволяет получить значения прогноза линейного тренда. Вычисленные значения: 12,87, 14,04, 15,22, 16,39, 17,57.

Значения точечного прогноза для исходного временного ряда на 5 шагов вперед можно вычислить и с помощью уравнения функции тренда f(t ), найденного по методу наименьших квадратов. Для этого в полученное для f (t) выражение необходимо подставить значения t = 11, 12, 13, 14, 15. В результате получим (эти значения следует рассчитать, сформировав формулу в табличном процессоре MS Excel ):

Сравнивая результаты точечных прогнозных оценок, полученных разными способами, выявляем, что данные отличаются незначительно, таким образом, в любом из способов расчета присутствует определенная погрешность (ошибка) прогноза ().

Используя значения временного ряда Задания 1 согласно вашего варианта, вычислить точечный прогноз на 4 шага вперед. Продлить линию тренда на 4 прогнозных значения, вывести уравнение тренда, определить эти значения с помощью функции ПРЕДСКАЗ() или ТЕНДЕНЦИЯ(), а также по выражению функции тренда f(t ), полученному по методу наименьших квадратов в Задании 1. Сравнить полученные результаты.

ВРЕМЕННЫЕ РЯДЫ В ЭКОНОМЕТРИЧЕСКИХ ИССЛЕДОВАНИЯХ

Краткая теория

Модели, построенные по данным, характеризующим один объект за ряд последовательных моментов (периодов), называются моделями временных рядов.

Временной ряд – это совокупность значения какого-либо показателя за несколько последовательных моментов или периодов.

Каждый уровень временного ряда ( ) формируется из трендовой ( ), циклической ( ) и случайной ( ) компонент.

Модели, в которых временной ряд представлен как сумма перечисленных компонент,- аддитивные модели, как произведение — мультипликативными моделями временного ряда.

Аддитивная модель имеет вид: ;

мультипликативная модель: .

Построение аддитивной и мультипликативной моделей сводится к расчету значений , и для каждого уровня ряда.

Построение модели включает следующие шаги:

1. выравнивание исходного ряда методом скользящей средней;

2. расчет значений сезонной компоненты ;

3. устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных в аддитивной или в мультипликативной модели;

4. аналитическое выравнивание уровней или и расчет значений с использованием полученного уравнение тренда;

5. расчет полученных по модели значений или ;

6. расчет абсолютных и/или относительных ошибок.

Автокорреляция уровней ряда – это корреляционная зависимость между последовательными уровнями временного ряда:

,

где , -коэффициент автокорреляции уровней ряда первого порядка;

,

где , -коэффициент автокорреляции уровней ряда второго порядка.

Формулы для расчета коэффициентов автокорреляции старших порядков легко получить из формулы линейного коэффициента корреляции.

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда, а график зависимости ее значений от величины лага (порядка коэффициента автокорреляции) – коррелограммой.

Построение аналитической функции для моделирования тенденции (тренда) временного ряда называют аналитическим выравниванием временного ряда. Для этого чаще всего применяются следующие функции:

· линейная ;

· гипербола ;

· экспонента ;

· степенная функция ;

· парабола второго и более высоких порядков .

Параметры трендов определяются обычным МНК, в качестве зависимой переменной выступает время , а в качестве зависимой переменной- фактические уровни временного ряда . Критерием отбора наилучшей формы тренда является наибольшее значение скорректированного коэффициента детерминации .

При построении моделей регрессии по временным рядам для устранения тенденции используются следующие методы.

Метод отклонений от тренда предполагает вычисление трендовых значений для каждого временного ряда модели, например и , и расчет отклонений от трендов: и . Для дальнейшего анализа используются не исходные данные, а отклонения от тренда.

Метод последовательных разностей заключается в следующем: если ряд содержит линейный тренд, тогда исходные данные заменяются первыми разностями:

;

если параболический тренд – вторыми разностями:

.

В случае экспоненциального и степенного ряда метод последовательных разностей применяется к логарифмам исходных данных.

Модель, включающая фактор времени, имеет вид:

.

Параметры и в этой модели определяются обычным МНК.

Автокорреляция в остатках – корреляционная зависимость между значениями остатков за текущий и предыдущие моменты времени.

Для определения автокорреляции в остатках используют критерий Дарбина-Уотсона и расчет величины:

, .

Коэффициент автокорреляции остатков первого порядка определятся по формуле:

, .

Критерий Дарбина-Уотсона и коэффициент автокорреляции остатков первого порядка связаны соотношением:

.

Эконометрические модели, содержащие не только текущие, но и лаговые значения факторных переменных, называются моделями с распределенным лагом.

Модель с распределенным лагом в предположении, что максимальная величина лага конечна, имеет вид

.

Коэффициент при переменной характеризует среднее абсолютное изменение при изменении на 1 ед. своего измерения в некоторый фиксированный момент времени без учета лаговых значений фактора . Этот коэффициент называется краткосрочным мультипликатором.

В момент времени воздействие факторной переменной на результат составит условных единиц; в момент времени воздействие на можно охарактеризовать величиной и т.д. Эти суммы называются промежуточными мультипликаторами. Для максимального лага воздействие факторной переменной на результат описывается долгосрочным мультипликатором .

, ( )

называют относительными коэффициентами модели с распределенным лагом. Если все коэффициенты имеют одинаковые знаки, то для любого

и .

Величина среднего лага определяется по формуле средней арифметической взвешенной

и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени .

Медианный лаг — это период, в течение, которого с момента времени будет реализована половина общего воздействия фактора на результат:

, где — медианный лаг.

Оценку параметров модели с распределенными лагами можно проводить согласно одному из двух методов: методу Койка или методу Алмон.

В распределении Койка делается предположение, что коэффициенты при лаговых значениях объясняющей переменной убывают в геометрической прогрессии:

, , .

Уравнение регрессии преобразуется к виду:

.

В методе Алмон предполагается, что веса текущих и лаговых значений объясняющих переменных подчиняются полиномиальному распределению:

.

Уравнение регрессии примет вид:

,

где , , .

Модели, содержащие в качестве фактора лаговые значения зависимой переменной, называют моделями авторегрессии, например:

.

Как и в модели с распределенным лагом, в этой модели характеризует краткосрочное изменение под воздействием изменения на 1 ед. Долгосрочный мультипликатор в модели авторегрессии рассчитывается как сумма краткосрочного и промежуточных мультипликаторов:

.

Отметим, что такая интерпретация коэффициентов модели авторегрессии и расчет долгосрочного мультипликатора основаны на предпосылке о наличии бесконечного лага в воздействии текущего значения зависимой переменной на ее будущие значения.

Примеры решения задач

Пример 5.2.1.

По данным за 18 месяцев построено уравнение зависимости прибыли предприятия (млн. руб.) от цен на сырье (тыс. руб. за 1 т) и производительности труда (ед. продукции на 1 работника):

.

При анализе остаточных величин были использованы значения, приведенные в таблице 5.2.1.

, .

1. По трем позициям рассчитать , , , , .

2. Рассчитать критерий Дарбина-Уотсона.

3. Оценить полученный результат при 5%-ном уровне значимости.

4. Указать, пригодно ли данное уравнение для прогноза.

Решение.

1. определяется путем подстановки фактических значений и в уравнение регрессии:

Остатки рассчитываются по формуле .

, , ;

, , ;

— те же значения, что и , но со сдвигом на один месяц.

Результаты вычислений оформим в виде таблицы 5.2.2.

-50-70

2. Критерий Дарбина-Уотсона рассчитывается по формуле

.

3. Выдвигаем гипотезу о наличии автокорреляции в остатках. Определяем табличное значение статистики Дарбина-Уотсона. При уровне значимости , (месяцев) и (число факторов) нижнее значение равно , а верхнее .Чтобы оценить значимость коэффициента автокорреляции вычислим интервалы:

Если статистика Дарбина-Уотсона , то принимается гипотеза о наличии положительной автокорреляции в остатках, если , то принимается гипотеза о наличии отрицательной автокорреляции в остатках, если , то гипотеза отклоняется, наконец, если или , то гипотезу нельзя ни принять, ни отвергнуть.

В данной задаче , то есть . Это означает наличие отрицательной автокорреляции в остатках.

4. Уравнение не может быть использовано для прогноза, так как в нем не устранена автокорреляция в остатках, которая может иметь различные причины: возможно, в уравнение не включен какой-либо существенный фактор, либо неточна форма связи, а, может быть, в рядах динамики имеется общая тенденция.

Пример 5.2.2

Имеются следующие данные о величине дохода на одного члена семьи и расхода на товар А (таблица 5.2.3).

Показатель1985г.1986г.1987г.1988г.1989г.1990г.
Расходы на товар А, руб.
Доход на одного члена, % к 1985 г.

1. Определить ежегодные абсолютные приросты доходов и расходов и сделать выводы о тенденции развития каждого ряда.

2. Перечислить основные пути устранения тенденции для построения модели спроса на товар А в зависимости от дохода.

3. Построить линейную модель спроса, используя первые разности уровней исходных динамических рядов.

4. Пояснить экономический смысл коэффициента регрессии.

5. Построить линейную модель спроса на товар А, включая в нее фактор времени. Интерпретировать полученные параметры.

Решение.

1. Обозначим расходы на товар А через , а доходы одного члена семьи- через . Ежегодные абсолютные приросты определяются по формулам

, .

Расчеты можно оформить в виде таблицы (табл. 5.2.4).

Значения не имеют четко выраженной тенденции, они варьируются вокруг среднего уровня, что означает наличие в ряде динамики линейного тренда (линейной тенденции). Аналогичный вывод можно сделать и по ряду ; абсолютные приросты не имеют систематической направленности, они примерно стабильны, а следовательно характеризуются линейной тенденцией.

2. Так как ряды динамики имеют общую тенденцию к росту, то для построения регрессионной модели спроса на товар А необходимо устранить тенденцию. С этой целью модель может строиться по первым разностям, т.е. , если ряды динамики характеризуются линейной тенденцией.

Другой возможный путь учета тенденции при построении модели — найти по каждому ряду уравнение тренда:

и

и отклонения от него:

и .

Далее модель строится по отклонениям от тренда:

.

При построении эконометрических моделей чаще используется другой путь устранения тенденции – включение в модель фактора времени. Иными словами, модель строится по исходным данным, но в нее в качестве самостоятельно фактора включается время, т.е. .

3. Модель имеет вид

.

Для определения параметров и применяется МНК. Система нормальных уравнений следующая:

Применительно к нашим данным имеем

Решая эту систему, получим и , откуда модель имеет вид:

.

4. Коэффициент регрессии . Он означает, что с ростом душевого дохода на 1%-ный пункт расходы на товар А увеличиваются со средним ускорением, равным 0,565 руб.

5. Модель имеет вид

.

Применяя МНК, получим систему нормальных уравнений:

Применительно к нашим данным, система примет вид:

Решая ее, получим , , .

Уравнение регрессии имеет вид

.

Параметр фиксирует силу связи и . Его величина означает, что с ростом дохода на одного члена семьи на 1%-ный пункт при условии неизменной тенденции расходы на товар А возрастают в среднем на 0,322 руб. Параметр характеризует среднегодовой абсолютный прирост расходов на товар А под воздействием прочих факторов при условии неизменного дохода.

Пример 5.2.3.

По данным за 18 месяцев некоторого временного ряда были получены значения коэффициентов автокорреляции уровней:

,

,

,

,

,

,

;

-коэффициенты автокорреляции -го порядка.

Для прогнозирования значений в будущие периоды предполагается построить уравнение авторегрессии. Выбрать наилучшее уравнение, обосновать выбор. Указать общий вид этого уравнения.

Решение.

Наиболее целесообразно построение уравнения авторегрессии вида:

,

так как значение свидетельствует очень тесной связи между уровнями ряда с лагом в 4 месяца.

Кроме того, возможно построение и множественного уравнения авторегрессии от и , так как :

.

Сравнить полученные уравнения и выбрать наилучшее решение можно с помощью скорректированного коэффициента детерминации.

Пример 5.2.4.

На основе помесячных данных о потреблении электроэнергии в регионе (млн. кВт∙ч) за последние три года была построена аддитивная модель временного ряда. Скорректированные значения сезонной компоненты за соответствующие месяцы приводятся ниже:

январь+25май-32сентябрь+2
февраль+10июнь-38октябрь+15
март+6июль-25ноябрь+27
апрель-4август-18декабрь?

Уравнение тренда выглядит следующим образом:

(при расчете параметров тренда для моделирования переменной времени использовались натуральные числа ).

1. Определите значение сезонной компоненты за декабрь.

2. На основе построенной модели дайте точечный прогноз потребления электроэнергии на первый квартал следующего года.

Решение.

1. Сумма значений сезонной компоненты внутри одного цикла должна быть равна нулю (в соответствии с методикой построения аддитивной модели временного ряда). Следовательно, значение сезонной компоненты за декабрь составит:

.

2. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендового значения и соответствующего значения сезонной компоненты .

Ожидаемое потребление электроэнергии за первый квартал следующего года есть сумма ожидаемого потребления электроэнергии за январь , февраль и март .

Для расчета трендовых значений воспользуемся уравнением тренда:

;

;

.

Соответствующие значения сезонной компоненты составят

, , .

;

;

.

Ожидаемое потребление электроэнергии за первый квартал следующего года в регионе составит (млн. кВт∙ч).

При исследовании капитальных расходов от капитальных ассигнований была получена модель:

где — капитальные расходы в квартале (млн. $),

-капитальные ассигнования в квартале (млн. $),

— фиктивная переменная, равная 1 в квартале и равная 0 в остальных кварталах .

Задание.

Выпишите краткосрочный, долгосрочный и промежуточные мультипликаторы в данной модели. Определите средний и медианный лаг. Поясните смысл этих показателей.

Решение.

Рассматриваемое уравнение представляет собой модель с распределенными лагами вида:

.

Коэффициент при переменной характеризует среднее абсолютное изменение капитальных расходов при изменении капитальных ассигнований на 1 млн. $ за фиксированный квартал без учета лаговых значений . Этот коэффициент называется краткосрочным мультипликатором.

В момент времени воздействие факторной переменной на результат составит (млн. $). То есть в следующем квартале от фиксированного квартала увеличение капитальных ассигнований на 1 млн. $ влечет увеличение капитальных расходов на 0,147 млн. $. В момент времени воздействие на можно охарактеризовать величиной (млн. $) и т.д.. Эти суммы называются промежуточными мультипликаторами.

Для максимального лага воздействие факторной переменной на результат описывается долгосрочным мультипликатором . В рассматриваемой модели , поэтому через 7 кварталов от фиксированного квартала увеличение капитальных ассигнований на 1 млн. $ влечет увеличение капитальных расходов на величину

(млн. $).

Для определения среднего и медианного лага нам потребуется рассчитать относительные коэффициенты, которые определяются по формуле:

, ( ).

, , , ,

, , , .

Величина среднего лага определяется по формуле средней арифметической взвешенной

и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени :

.

Медианный лаг-это период, в течение, которого с момента времени будет реализована половина общего воздействия фактора на результат:

, где — медианный лаг.

Так как , то .

Пример 5.2.6.

На основе помесячных данных за последние 20 лет изучается зависимость между уровнем дивидендов по обыкновенным акциям (%) от прибыли компании (тыс. $). Имеется следующая информация:

1) результаты аналитического выравнивания рядов:

тренд в форме параболы второго порядка

а) для ряда : , ( );

б) для ряда : , ( );

а) для ряда : , ( );

б) для ряда : , ( );

2) коэффициенты корреляции:

по исходным уровням рядов -0,98;

по отклонениям от параболического тренда- 0,78;

по отклонениям от линейных трендов-0,45;

по первым разностям – 0,42;

по вторым разностям -0,76.

Задание.

1. Есть ли взаимосвязь между исследуемыми временными рядами? Если есть, то укажите количественную характеристику взаимосвязи между исследуемыми временными рядами. Ответ обоснуйте.

2. Поясните причины различия полученных мер тесноты связи.

Решение.

1. Высокие коэффициенты детерминации, полученные при построении параболических трендов по исходным уровням временных рядов, указывают на нарушение условия стационарности, то есть исходные временные ряды характеризуются параболической тенденцией. Следовательно, уравнение регрессии следует строить не по исходным уровням временных рядов, а по вторым разностям или по отклонениям от параболического тренда. Из условия задачи видно, что коэффициенты корреляции для уравнений регрессии, построенных по вторым разностям и по отклонениям от параболического тренда высоки (0,84 и 0,78 соответственно), что говорит о том, что между исходными временными рядам действительно существует тесная связь. Количественной характеристикой этой связи можно считать коэффициент корреляции для уравнения регрессии, построенного по вторым разностям 0,84.

2. Коэффициент корреляции, полученный по исходным уровням 0,98, дает завышенную оценку тесноты связи между исследуемыми признаками, поскольку на него оказывает влияние сильная тенденция исходных временных рядов.

КОНТРОЛЬНЫЕ ВОПРОСЫ И ЗАДАЧИ

1. Что такое эконометрика? Что является предметом изучения эконометрики? Назовите основные задачи эконометрики.

2. Что такое парная регрессия? Что такое парная линейная регрессия? Какие классы нелинейных регрессий вызнаете? Приведите примеры.

3. В чем заключается метод наименьших квадратов (МНК)?

4. По совокупности 30 предприятий торговли строится модель вида между признаками: -цена на товар А, тыс.руб.; -прибыль торгового предприятия, млн.руб. Рассчитаны величины , , , . Найдите коэффициенты и .

5. По совокупности 25 предприятий торговли изучается зависимость между признаками: — цена на товар А, тыс.руб.; -прибыль торгового предприятия, млн.руб. При оценке нелинейной регрессионной модели были получены результаты: ; . Оцените тесноту связи между признаками и .

6. Как произвести оценку качества построенной парной регрессии? Допустимый предел?

7. Для продукции вида А модель зависимости удельных постоянных расходов от объема выпускаемой продукции выглядит следующим образом: . Известно также, что в среднем объем выпускаемой продукции составил 2000 единиц. На сколько процентов в среднем по совокупности увеличатся удельные постоянные расходы, если объем выпускаемой продукции увеличится на 1% от своего среднего значения?

Учебное пособие: Анализ временных рядов

В данной главе рассматриваются задачи описания упорядоченных данных, полученных последовательно (во времени). Вообще говоря, упорядоченность может иметь место не только во времени, но и в пространстве, например, диаметр нити как функция её длины (одномерный случай), значение температуры воздуха как функция пространственных координат (трёхмерный случай).

В отличие от регрессионного анализа, где порядок строк в матрице наблюдений может быть произвольным, во временных рядах важна упорядоченность, а следовательно, интерес представляет взаимосвязь значений, относящихся к разным моментам времени.

Если значения ряда известны в отдельные моменты времени, то такой ряд называют дискретным , в отличие от непрерывного , значения которого известны в любой момент времени. Интервал между двумя последовательными моментами времени назовём тактом (шагом) . Здесь будут рассматриваться в основном дискретные временные ряды с фиксированной протяжённостью такта, принимаемой за единицу счёта. Заметим, что временные ряды экономических показателей, как правило, дискретны.

Значения ряда могут быть измеряемыми непосредственно (цена, доходность, температура), либо агрегированными (кумулятивными) , например, объём выпуска; расстояние, пройдённое грузоперевозчиками за временной такт.

Если значения ряда определяются детерминированной математической функцией, то ряд называют детерминированным . Если эти значения могут быть описаны лишь с привлечением вероятностных моделей, то временной ряд называют случайным .

Явление, протекающее во времени, называют процессом , поэтому можно говорить о детерминированном или случайном процессах. В последнем случае используют часто термин “стохастический процесс” . Анализируемый отрезок временного ряда может рассматриваться как частная реализация (выборка) изучаемого стохастического процесса, генерируемого скрытым вероятностным механизмом.

Временные ряды возникают во многих предметных областях и имеют различную природу. Для их изучения предложены различные методы, что делает теорию временных рядов весьма разветвленной дисциплиной. Так, в зависимости от вида временных рядов можно выделить такие разделы теории анализа временных рядов:

– стационарные случайные процессы, описывающие последовательности случайных величин, вероятностные свойства которых не изменяются во времени. Подобные процессы широко распространены в радиотехнике, метереологии, сейсмологии и т. д.

– диффузионные процессы, имеющие место при взаимопроникновении жидкостей и газов.

– точечные процессы, описывающие последовательности событий, таких как поступление заявок на обслуживание, стихийных и техногенных катастроф. Подобные процессы изучаются в теории массового обслуживания.

Мы ограничимся рассмотрением прикладных аспектов анализа временных рядов, которые полезны при решении практических задач в экономике, финансах. Основной упор будет сделан на методы подбора математической модели для описания временного ряда и прогнозирования его поведения.

1.Цели, методы и этапы анализа временных рядов

Практическое изучение временного ряда предполагает выявление свойств ряда и получение выводов о вероятностном механизме, порождающем этот ряд. Основные цели при изучении временного ряда следующие:

– описание характерных особенностей ряда в сжатой форме;

– построение модели временного ряда;

– предсказание будущих значений на основе прошлых наблюдений;

– управление процессом, порождающим временной ряд, путем выборки сигналов, предупреждающих о грядущих неблагоприятных событиях.

Достижение поставленных целей возможно далеко не всегда как из-за недостатка исходных данных (недостаточная длительность наблюдения), так из-за изменчивости со временем статистической структуры ряда.

Перечисленные цели диктуют в значительной мере, последовательность этапов анализа временных рядов:

1) графическое представление и описание поведения ряда;

2) выделение и исключение закономерных, неслучайных составляющих ряда, зависящих от времени;

3) исследование случайной составляющей временного ряда, оставшейся после удаления закономерной составляющей;

4) построение (подбор) математической модели для описания случайной составляющей и проверка ее адекватности;

5) прогнозирование будущих значений ряда.

При анализе временных рядов используются различные методы, наиболее распространенными из которых являются :

1) корреляционный анализ, используемый для выявления характерных особенностей ряда (периодичностей, тенденций и т. д.);

2) спектральный анализ, позволяющий находить периодические составляющие временного ряда;

3) методы сглаживания и фильтрации, предназначенные для преобразования временных рядов с целью удаления высокочастотных и сезонных колебаний;

4) модели авторегрессии и скользящего среднего для исследование случайной составляющей временного ряда ;

5) методы прогнозирования.

2.Структурные компоненты временного ряда

Как уже отмечалось, в модели временного ряда принято выделять две основные составляющие : детерминированную и случайную (рис.). Под детерминированной составляющей временного ряда понимают числовую последовательность , элементы которой вычисляются по определенному правилу как функция времени t . Исключив детерминированную составляющую из данных, мы получим колеблющийся вокруг нуля ряд, который может в одном предельном случае представлять чисто случайные скачки, а в другом – плавное колебательное движение. В большинстве случаев будет нечто среднее: некоторая иррегулярность и определенный систематический эффект, обусловленный зависимостью последовательных членов ряда.

В свою очередь, детерминированная составляющая может содержать следующие структурные компоненты:

1) тренд g, представляющий собой плавное изменение процесса во времени и обусловленный действием долговременных факторов. В качестве примера таких факторов в экономике можно назвать : а) изменение демографических характеристик популяции (численности, возрастной структуры); б) технологическое и экономическое развитие; в) рост потребления.

2) сезонный эффект s , связанный с наличием факторов, действующих циклически с заранее известной периодичностью. Ряд в этом случае имеет иерархическую шкалу времени (например, внутри года есть сезоны, связанные с временами года, кварталы, месяцы) и в одноименных точках ряда имеют место сходные эффекты.

Рис. Структурные компоненты временного ряда.

Типичные примеры сезонного эффекта: изменение загруженности автотрассы в течение суток, по дням недели, временам года, пик продаж товаров для школьников в конце августа — начале сентября. Сезонная компонента со временем может меняться, либо носить плавающий характер. Так на графике объема перевозок авиалайнерами (см рис.) видно, что локальные пики, приходящиеся на праздник Пасхи «плавают» из-за изменчивости ее сроков.

Циклическая компонента c , описывающая длительные периоды относительного подъема и спада и состоящая из циклов переменной длительности и амплитуды. Подобная компонента весьма характерна для рядов макроэкономических показателей. Циклические изменения обусловлены здесь взаимодействием спроса и предложения, а также наложением таких факторов, как истощение ресурсов, погодные условия, изменения в налоговой политике и т. п. Отметим, что циклическую компоненту крайне трудно идентифицировать формальными методами, исходя только из данных изучаемого ряда.

«Взрывная» компонента i , иначе интервенция, под которой понимают существенное кратковременное воздействие на временной ряд. Примером интервенции могут служить события «черного вторника» 1994г., когда курс доллара за день вырос на несколько десятков процентов.

Случайная составляющая ряда отражает воздействие многочисленных факторов случайного характера и может иметь разнообразную структуру, начиная от простейшей в виде «белого шума» до весьма сложных, описываемых моделями авторегрессии-скользящего среднего (подробнее дальше).

После выделения структурных компонент необходимо специфицировать форму их вхождения во временной ряд. На верхнем уровне представления с выделением лишь детерминированной и случайной составляющих обычно используют аддитивную либо мультипликативную модели.

Аддитивная модель имеет вид

;

,

где — значение ряда в момент t ;

— значение детерминированной составляющей;

— значение случайной составляющей.

В свою очередь, детерминированная составляющая может быть представлена как аддитивная комбинация детерминированных компонент:

,

как мультипликативная комбинация:

,

либо как смешанная комбинация, например,

3.Модели компонентов детерминированной составляющей временного ряда

3.1.Модели тренда

Тренд отражает действие постоянных долговременных факторов и носит плавный характер, так что для описания тренда широко используют полиномиальные модели, линейные по параметрам

,

где значения степени k полинома редко превышает 5.

Наряду с полиномиальными моделями экономические данные, описывающие процессы роста, часто аппроксимируются следующими моделями:

.

Эта модель описывает процесс с постоянным темпом прироста, то есть

У процесса, описываемого логистической кривой, темп прироста изучаемой характеристики линейно падает с увеличением y , то есть

.

Эта модель описывает процесс, в котором темп прироста исследуемой характеристики пропорционален ее логарифму

.

Две последние модели задают кривые тренда S -образной формы, представляя процессы с нарастающим темпом роста в начальной стадии с постепенным замедлением в конце.

При подборе подходящей функциональной зависимости, иначе спецификации тренда, весьма полезным является графическое представление временного ряда.

Отметим также, что тренд, отражая действие долговременных факторов, является определяющим при построении долговременных прогнозов.

3.2 Модели сезонной компоненты

Сезонный эффект во временном ряде проявляется на «фоне» тренда и его выделение оказывается возможным после предварительной оценки тренда. (Здесь не рассматриваются методы спектрального анализа, позволяющего выделить вклад сезонной компоненты в спектр без вычисления других компонент ряда). Действительно, линейно растущий ряд помесячных данных будет иметь схожие эффекты в одноименных точках – наименьшее значение в январе и наибольшее в декабре; однако вряд ли здесь уместно говорить о сезонном эффекте: исключив линейный тренд, мы получим ряд, в котором сезонность полностью отсутствует. В то же время ряд, описывающий помесячные объемы продаж новогодних открыток, хотя и будет иметь такую же особенность (минимум продаж в январе и максимум в декабре) будет носить скорее всего колебательный характер относительно тренда, что позволяет специфицировать эти колебания как сезонный эффект.

В простейшем случае сезонный эффект может проявляться в виде строго периодической зависимости.

, для любого t , где t — период сезонности.

В общем случае значения, отстоящие на t могут быть связаны функциональной зависимостью, то есть

.

К примеру, сезонный эффект сам может содержать трендовую составляющую, отражающую изменение амплитуды колебаний .

Если сезонный эффект входит в ряд аддитивно, то модель сезонного эффекта можно записать как

,

где — булевы, иначе индикаторные, переменные, по одной на каждый такт внутри периода t сезонности. Так, для ряда месячных данных =0 для всех t , кроме января каждого года, для которого =1 и так далее. Коэффициент при показывает отклонение январских значений от тренда, — отклонение февральских значений и так далее до . Чтобы снять неоднозначность в значениях коэффициентов сезонности , вводят дополнительное ограничение, так называемое условие репараметризации, обычно

.

В том случае, когда сезонный эффект носит мультипликативный характер, то есть

модель ряда с использованием индикаторных переменных можно записать в виде

Коэффициенты , в этой модели принято называть сезонными индексами.

Для полностью мультипликативного ряда

обычно проводят процедуру линеаризации операцией логарифмирования

.

Условимся называть представленные модели сезонного эффекта «индикаторными». Если сезонный эффект достаточно «гладкий» – близок к гармонике, используют «гармоническое» представление

,

где d — амплитуда, w — условия частоты (в радианах в единицу времени), a — фаза волны. Поскольку фаза обычно заранее неизвестна. Последнее выражение записывают как

,

где , .

Параметры А и В можно оценить с помощью обычно регрессии. Угловая частота w считается известной. Если качество подгонки окажется неудовлетворительным, наряду с гармоникой w основной волны в модель включают дополнительно первую гармонику (с удвоенной основной частотой 2w ), при необходимости и вторую и так далее гармоники. В принципе, из двух представлений: индикаторного и гармоничного – следует выбирать то, которое потребует меньшего числа параметров.

3.3 Модель интервенции

Интервенция, представляющая собой воздействие, существенно превышающее флуктуации ряда, может носить характер «импульса» или «ступеньки».

Импульсное воздействие кратковременно: начавшись, оно почти тут же заканчивается. Ступенчатое воздействие длительно, носит устойчивый характер. Обобщенная модель интервенции имеет вид

,

где — значение детерминированной компоненты ряда, описываемой как интервенция;

— коэффициенты типа авторегрессии;

— коэффициенты типа скользящего среднего;

— экзогенная переменная одного из двух типов;

(«ступень»), или («импульс»)

где — фиксированный момент времени, называемый моментом интервенции.

4.Методы выделения тренда

Приведенные в п.3.1 спецификации ряда являются параметрическими функциями времени. Оценивание параметров может быть проведено по методу наименьших квадратов так же, как в регрессионном анализе. Хотя статистические предпосылки регрессионного анализа (см п. ) во временных рядах часто не выполняются (особенно п.5 – некоррелированность возмущений), тем не менее оценки тренда оказываются приемлемыми, если модель специфицирована правильно и среди наблюдений нет больших выбросов. Нарушение предпосылок регрессионного анализа сказывается не столько на оценках коэффициентов, сколько на их статистических свойствах, в частности, искажаются оценки дисперсии случайной составляющей и доверительные интервалы для коэффициентов модели.

В литературе описываются методы оценивания в условиях коррелированности возмущений, однако их применение требует дополнительной информации о корреляции наблюдений.

Главная проблема при выделении тренда состоит в том, что подобрать единую спецификацию для всего временного часто невозможно, поскольку меняются условия протекания процесса. Учет этой изменчивости особенно важен, если тренд вычисляется для целей прогнозирования. Здесь сказывается особенность именно временных рядов: данные относящиеся к «далекому прошлому» будут неактуальными, бесполезными или даже «вредными» для оценивания параметров модели текущего периода. Вот почему при анализе временных рядов широко используются процедуры взвешивания данных.

Для учета изменчивости условий модель ряда часто наделяют свойством адаптивности, по крайней мере, на уровне оценок параметров. Адаптивность понимается в том смысле, что оценки параметров легко пересчитываются по мере поступления новых наблюдений. Конечно, и обычному методу наименьших квадратов можно придать черты адаптивности, пересчитывая оценки каждый раз, вовлекая в процесс вычислений старые данные плюс свежие наблюдения. Однако при этом каждый новый пересчет ведет к изменению прошлых оценок, тогда как адаптивные алгоритмы свободны от этого недостатка.

4.1 Скользящие средние

Метод скользящих средних – один из самых старых и широко известных способов выделения детерминированной составляющей временного ряда. Суть метода состоит в усреднении исходного ряда на интервале времени, длина которого выбрана заранее. При этом сам выбранный интервал скользит вдоль ряда, сдвигаясь каждый раз на один такт вправо (отсюда название метода). За счет усреднения удается существенно уменьшить дисперсию случайной составляющей.

Ряд новых значений становится более гладким, вот почему подобную процедуру называют сглаживанием временного ряда.

Процедуру сглаживания рассмотрим вначале для ряда, содержащего лишь трендовую составляющую, на которую аддитивно наложен случайных компонент.

Как известно, гладкая функция может быть локально представлена в виде полинома с довольно высокой степенью точности. Отложим от начала временного ряда интервал времени длиной (2m +1) точек и построим полином степени m для отобранных значений и используем этот полином для определения значения тренда в (m +1 )-й, средней, точке группы.

Построим для определенности полином 3-го порядка для интервала из семи наблюдений. Для удобства дальнейших преобразований занумеруем моменты времени внутри выбранного интервала так, чтобы его середина имела нулевое значение, т.е. t = -3, -2, -1, 0, 1, 2, 3. Запишем искомый полином:

.

Константы находим методом наименьших квадратов:

.

Дифференцируем по коэффициентам :

;

;

.

Суммы нечетных порядков t от -3 до +3 равны 0, и уравнения сводятся к виду:

;

;

;

.

Используя первое и третье из уравнений, получаем при t=0:

(1)

Следовательно, значение тренда в точке t = 0 равно средневзвешенному значению семи точек с данной точкой в качестве центральной и весами

, которые в силу симметрии можно записать короче:

.

Для того чтобы вычислить значение тренда в следующей, (m+2)-й точке исходного ряда (в нашем случае пятой), следует воспользоваться формулой (1), где значения наблюдений берутся из интервала, сдвинутого на такт вправо, и т.д. до точки N m .

Далее приводятся формулы для подсчета скользящего среднего подбором полиномов второго и третьего порядка к отрезкам ряда длиной до 9 точек:

количество точек формула

5

7

9 .

Свойства скользящих средних:

1) сумма весов равна единице (т.к. сглаживание ряда , все члены которого равны одной и той же константе, должно приводить к той же константе);

2) веса симметричны относительно серединного значения ;

3) формулы не позволяют вычислить значения тренда для первых и последних m значений ряда;

4) можно вывести формулы для построения трендов на четном числе точек, однако при этом были бы получены значения трендов в серединах временных тактов. Значение тренда в точках наблюдений можно определить в этом случая как полусумма двух соседних значений тренда.

Следует отметить, что при четном числе 2m тактовв интервале усреднения (двадцать четыре часа в сутки, четыре недели в месяце, двенадцать месяцев в году), широко практикуется простое усреднение с весами . Пусть имеются, например, наблюдения на последний день каждого месяца с января по декабрь. Простое усреднение 12 точек с весами дает значение тренда в середине июля. Чтобы получить значение тренда на конец июля надо взять среднее значение тренда в середине июля и середине августа. Оказывается, это эквивалентно усреднению 13-месячных данных, но значения на краях интервала берут с весами . Итак, если интервал сглаживания содержит четное число 2m точек, в усреднении задействуют не 2m , а 2m +1 значений ряда :

.

Скользящие средние, сглаживая исходный ряд, оставляют в нем трендовую и циклическую составляющие. Выбор величины интервала сглаживания должен делаться из содержательных соображений. Если ряд содержит сезонный компонент, то величина интервала сглаживания выбирается равной или кратной периоду сезонности. В отсутствии сезонности интервал сглаживания берется обычно в диапазоне три-семь

Рассмотрим, как влияет процесс сглаживания на случайную составляющую ряда, относительно которой будем полагать, что она центрирована и соседние члены ряда некоррелированы.

Скользящее среднее случайного ряда x есть:

.

В силу центрированности x и отсутствия корреляций между членами исходного ряда имеем:

и .

Далее, .

Из полученных соотношений видно, что усреднение приводит к уменьшению дисперсии колебаний. Кроме того члены ряда, полученные в результате усреднения, не являются теперь независимыми. Производный, сглаженный, ряд имеет ненулевые автокорреляции (корреляции между членами ряда, разделенных k-1 наблюдениями) вплоть до порядка 2m. Таким образом производный ряд будет более гладким, чем исходный случайный ряд, и в нем могут проявляться систематические колебания. Этот эффект называется эффектом Слуцкого-Юла .

4.2 Определение порядка полинома методом последовательных разностей

Если имеется ряд, содержащий полином (или локально представляемый полиномом) с наложенным на него случайным элементом , то было бы естественно исследовать, нельзя ли исключить полиномиальную часть вычислением последовательных разностей ряда. Действительно, разности полинома порядка k представляют собой полином порядка k-1. Далее , если ряд содержит полином порядка p , то переход к разностям , повторенный (p+1) раз, исключает его и оставляет элементы, связанные со случайной компонентой исходного ряда.

Рассмотрим, к примеру, переход к разностям в ряде, содержащим полином третьего порядка.

0 1 8 27 64 125

1 7 19 37 61

6 12 18 24

6 6 6

0 0

Взятие разностей преобразует случайную составляющую ряда.

В общем случае получаем :

;

;

;

;

.

Из последнего соотношения получаем

.

Следовательно, метод последовательных разностей переменной состоит в вычислении первых, вторых, третьих и т.д. разностей , определении сумм квадратов, делении на и т.д. и обнаружения момента , когда это отношение становится постоянным. Таким образом мы получаем оценки порядка полинома , содержащегося в исходном ряде, и дисперсии случайного компонента.

4.3.Методы экспоненциального сглаживания

Методы построения функций для описания наблюдений до сих пор основывался на критерии наименьших квадратов, в соответствии с которым все наблюдения имеют равный вес. Однако, можно предположить, что недавним точкам следует придавать в некотором смысле больший вес, а наблюдения, относящиеся к далекому прошлому, должны иметь по сравнению с ними меньшую ценность. До некоторой степени мы учитывали это в скользящих средних с конечной длиной отрезка усреднения, где значения весов, приписываемых группе из 2m+1 значений, не зависят от предшествующих значений. Теперь обратимся к другому методу выделения более «свежих» наблюдений.

Рассмотрим ряд весов, пропорциональных множителю b, а именно и т.д. Так как сумма весов должна равняться единице, т.е. , весами фактически будут и т.д. ( предполагается , что 0 yt+1 yt-1 > yt yt+1 или yt-1 > yt q .

Модель приобретает вид

(1)

(В (1) коэффициенты переобозначены через.)

Соотношение (1) определяет процесс скользящего среднего порядка q , или сокращенно СС(q ). Условие обратимости ( ) для процесса СС(q ) выполняется, если корни многочлена b (В ) лежат вне единичного круга.

Найдем дисперсию процесса СС(q ):

Все смешанные произведения вида равны нулю в силу некоррелированности возмущений в разные моменты времени. Для нахождения автокорреляционной функции процесса СС(q ) последовательно умножим (1) на и возьмем математическое ожидание

(2)

В правой части выражения (2) останутся только те члены, которые отвечают одинаковым временным тактам (см. рис )

Название: Анализ временных рядов
Раздел: Рефераты по экономико-математическому моделированию
Тип: учебное пособие Добавлен 22:56:54 22 марта 2011 Похожие работы
Просмотров: 14588 Комментариев: 22 Оценило: 6 человек Средний балл: 4.2 Оценка: 4 Скачать

(k =2)

Следовательно, выражение (2) есть

(3)

поделив (3) на , получим

(4)

Тот факт, что автокорреляционная функция процесса СС(q) имеет конечную протяженность (q тактов) – характерная особенность такого процесса. Если известны, то (4) можно в принципе разрешить относительно параметров . Уравнения (4) нелинейные и в общем случае имеют несколько решений, однако условие обратимости всегда выделяет единственное решение.

Как уже отмечалось, обратимые процессы СС можно рассматривать как бесконечные АР- процессы -АР(¥). Следовательно, частная автокорреляцонная функция процесса СС(р ) имеет бесконечную протяженность. Итак, у процесса СС(q ) автокорреляционная функция обрывается на лаге q , тогда как частная автокорреляционная функция плавно спадает.

10.1.5 Комбинированные процессы авторегрессии — скользящего среднего

Хотя модели АР(р ) и СС(q ) позволяют описывать многие реальные процессы, число оцениваемых параметров может оказываться значительным. Для достижения большей гибкости и экономичности описания при подборе моделей к наблюдаемым временным рядам весьма полезными оказались смешанные модели, содержащие в себе и авторегрессию и скользящее среднее. Эти модели были предложены Боксом и Дженкинсом и получили название модели авторегрессии — скользящего среднего (сокращенно АРСС(р, q )):

(1)

С использованием оператора сдвига В модель (1) может быть представлена более компактно:

, ( )

где а (В )—авторегрессионный оператор порядка р ,

b (В )—оператор скользящего среднего порядка q .

Модель () может быть записаны и так :

Рассмотрим простейший смешанный процесс АРСС(1,1)

Согласно

(2)

Из соотношения (2) видно, что модель АРСС(1,1) является частным случаем общей линейной модели ( ) с коэффициентами (j >0)

Из (2) легко получить выражение для дисперсии :

Для получения корреляционной функции воспользуемся тем же приемом, что и при анализе моделей авторегрессии. Умножим обе части модельного представления процесса АРСС(1,1)

на и возьмем математическое ожидание :

или (с учетом того, что второе слагаемое в правой части равенства равно нулю)

Поделив ковариации на дисперсию получаем выражения для автокорреляции

полученные соотношения показывают, что экспоненциально убывает от начального значения , зависящего от и при этом, если > , то затухание монотонное; при 0.

Отсюда следует, что для значений q +1 автоковариации и автокорреляции удовлетворяют тем же соотношениям, что и в модели АР(р ):

В итоге оказывается, что при q p будет q p значений , выпадающих из данной схемы.

10.1.6 Интегрированная модель авторегрессии- скользящего среднего

Модель АРСС допускает обобщение на случай, когда случайный процесс является нестационарным. Ярким примером такого процесса являются «случайные блуждания»:

(1)

С использованием оператора сдвига модель (1) принимает вид

(2)

Из (2) видно, что процесс (1) расходящийся, поскольку. Характеристическое уравнение этого процесса имеет корень, равный единице, то есть имеет место пограничный случай, когда корень характеристического уравнения оказался на границе единичной окружности. В то же время, если перейти к первым разностям , то процесс окажется стационарным.

В общем случае полагается, что нестационарный авторегрессионный оператор в модели АРСС имеет один или несколько корней, равных единице. Иными словами, является нестационарным оператором авторегрессии порядка p + d ; d корней уравнения =0 равны единице, а остальные р корней лежат вне единичного круга. Тогда можно записать, что

,

где a (B ) – стационарный оператор авторегрессии порядка р (с корнями вне единичного круга).

Введем оператор разности , такой что =(1-B ) , тогда нестационарный процесс АРСС запишется как

, (3)

где b (B ) – обратимый оператор скользящего среднего (вне его корни лежат вне единичного круга).

Для разности порядка d , то есть модель

описывает уже стационарный обратимый процесс АРСС(р, q ).

Для того чтобы от ряда разностей вернуться к исходному ряду требуется оператор s , обратный :

Этот оператор называют оператором суммирования, поскольку

.

Если же исходной является разность порядка d , то для восстановления исходного ряда понадобится d — кратная итерация оператора s , иначе d — кратное суммирование (интегрирование). Поэтому процесс (3) принято называть процессом АРИСС, добавляя к АРСС термин интегрированный. Кратко модель (3) записывают как АРИСС(р, d , q ), где р – порядок авторегрессии, d – порядок разности, q – порядок скользящего среднего. Ясно, что при d =0 модель АРИСС переходит в модель АРСС .

На практике d обычно не превышает двух, то есть d .

Модель АРИСС допускает представление, аналогичное общей линейной модели, а так же в виде «чистого » процесса авторегрессии (бесконечного порядка). Рассмотрим, к примеру, процесс АРИСС (1, 1, 1):

(4)

Из (4) следует, что

(5)

В выражении (5) коэффициенты, начиная с третьего, вычисляются по формуле .

Представление (5) интересно тем, что веса, начиная с третьего, убывают по экспоненциальному закону. Поэтому, хотя формально зависит от всех прошлых значений, однако реальный вклад в текущее значение внесут несколько «недавних» значений ряда. Поэтому уравнение (5) более всего подходит для прогнозирования.

11.Прогнозирование по модели АРИСС

Как уже отмечалось, процессы АРИСС допускают представление в виде обобщенной линейной модели, то есть

Естественно искать будущее (прогнозное) значение ряда в момент в виде

Ожидаемое значение , которое мы будем обозначать как

=

Первая сумма в правой части последнего соотношения содержат лишь будущие возмущения (прогноз делается в момент t , когда известны прошлые значения и ряда и возмущений) и для них математическое ожидание равно 0 по определению. Что же касается второго слагаемого, то возмущения здесь уже состоялись, так что

= (1)

Ошибка прогноза, представляющая расхождение между прогнозным значением и его ожиданием есть

=

Дисперсия ошибки отсюда есть

(2)

Прогнозирование по соотношению (1) в принципе возможно, однако затруднительно поскольку требует знания всех прошлых возмущений. К тому же для стационарных рядов скорость затухания часто оказывается недостаточной, не говоря уже о нестационарных процессах, для которых ряды расходятся.

Поскольку модель АРИСС допускает и другие представления, рассмотрим возможности их использования для прогнозирования. Пусть модель задана непосредственно разностным уравнением

(3)

По известным значениям ряда (результатам наблюдений) и оцененным значениям возмущений , опираясь на рекуррентную формулу (3) можно оценить ожидаемое значение ряда в момент t +1:

, (4)

При прогнозировании на два такта следует вновь воспользоваться рекуррентным соотношением (3), где в качестве наблюденного значения ряда в момент t +1 следует взять предсказанную по (4) величину , то есть и так далее.

Наконец, возможно прогнозирование опираясь на представление процесса АРИСС в виде авторегрессии (). Как уже отмечалось, несмотря на то что порядок авторегрессии бесконечен, весовые коэффициенты в представлении ряда убывают довольно быстро, поэтому для вычисления прогноза достаточно умеренное число прошлых значений ряда.

Дисперсия ошибки прогноза на шагов вперед есть

и согласно выражению (2) дается выражением

В предположении, что случайные возмущения являются гаусовским белым шумом, то есть можно рассматривать доверительный интервал для прогнозного значения ряда стандартным образом.

12.Технология построения моделей АРИСС

Описанные выше теоретические схемы строились в предположении, что временной ряд имеет бесконечную предысторию, тогда как реально исследователю доступен ограниченный объем наблюдений. Модель приходится подбирать экспериментально, подгоняя ее к имеющимся в распоряжении данным. Поэтому с позиций теоретического применения теории анализа временных рядов определяющее значение имеют вопросы корректной спецификации модели АРИСС(p , d , q ) (ее идентификации) и последующего оценивания ее параметров.

На этапе идентификации наблюденные данные используются для определения подходящего класса моделей и делаются предварительные оценки ее параметров, то есть строится пробная модель. Затем пробная модель подгоняется к данным более тщательно; при этом первичные оценки, полученные на этапе идентификации выступают в качестве начальных значений в итеративных алгоритмах оценивания параметров. И наконец, на третьем этапе полученная модель подвергается диагностической проверке для выявления возможной неадекватности модели и выработки подходящих изменений в ней.Рассмотрим перечисленные этапы подробнее.

Цель идентификации – получить некоторое представление о величинах p , d , q и о параметрах модели. Идентификация модели распадается на две стадии

1. Определение порядка разности d исходного ряда .

2. Идентификация модели АРСС для ряда разностей .

Основной инструмент, используемый на обеих стадиях – автокорреляционная и частная автокорреляционная функции.

В теоретической части мы видели, что у стационарных моделей автокоррелящии спадают с ростом k весьма быстро (по корреляционному закону). Если же автокорреляционная функция затухает медленно и почти линейно, то это свидетельствует о нестационарности процесса, однако, возможно, его первая разность стационарно.

Построив коррелограмму для ряда разностей, вновь повторяют анализ и так далее. Считается, что порядок разности d , обеспечивающий стационарность, достигнут тогда, когда автокорреляционная функция процесса падает довольно быстро. На практике и достаточно просмотреть порядка 15-20 первых значений автокорреляции исходного ряда, его первые и вторые разности.

После того как будет получен стационарный ряд разностей, порядка d, изучают общий вид автокорреляционной и частной автокорреляционной функций этих разностей. Опираясь на теоретические свойства этих функций можно выбрать значения p и q для АР и СС операторов. Далее при выбранных p и q строятся начальные оценки параметров авторегрессии и скользящего среднего b =(). Для авторегрессионных процессов используются уравнения Юла-Уокера, где теоретические автокорреляции заменены на их выборочные оценки. Для процессов скользящего среднего порядка q только первые q автокорреляций отличны от нуля и могут быть выражены через параметры (см. ). Заменяя их выборочными оценками и решая получающиеся уравнения относительно , получим оценку . Эти предварительные оценки можно использовать как начальные значения для получения на следующих шагах более эффективных оценок.

Для смешанных процессов АРСС процедура оценивания усложняется . Так для рассмотренного в п. процесса АРСС(1,1) параметры и , точнее их оценки, получаются из ( ) с заменой и их выборочными оценками.

В общем случае вычисление начальных оценок процесса АРСС(p , q ) представляет многостадийную процедуру и здесь не рассматривается. Отметим только, что для практики особый интерес имеют АР и СС процессы 1-го и 2-го порядков и простейший смешанный процесс АРСС(1,1).

В заключение заметим, что оценки автокорреляций, на основе которых строятся процедуры идентификации могут иметь большие дисперсии (особенно в условиях недостаточного объема выборки – несколько десятков наблюдений) и быть сильно коррелированны. Поэтому говорить о строгом соответствии теоретической и эмпирической автокорреляционных функций не приходится. Это приводит к затруднениям при выборе p , d , q , поэтому для дальнейшего исследования могут быть выбраны несколько моделей.


источники:

http://megalektsii.ru/s25264t2.html

http://www.bestreferat.ru/referat-208334.html