Аналитическое выравнивание ряда по прямой
Решение находим с помощью калькулятора.
Линейное уравнение тренда имеет вид y = at + b
1. Находим параметры уравнения методом наименьших квадратов.
Система уравнений
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а 0 и подставим во второе уравнение
Получаем a0 = -2.89, a1 = 63.27
Уравнение тренда
y = -2.89 t + 63.27
Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.
Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве тренда
Средние значения
т.е. в 39.75 % случаев влияет на изменение данных. Другими словами — точность подбора уравнения тренда — средняя
t | y | t 2 | y 2 | x ∙ y | y(t) | (y-y cp ) 2 | (y-y(t)) 2 | (t-t p ) 2 | (y-y(t)) : y |
1 | 80 | 1 | 6400 | 80 | 60.38 | 1826.44 | 384.99 | 64 | 1569.68 |
2 | 79 | 4 | 6241 | 158 | 57.49 | 1741.96 | 462.7 | 49 | 1699.33 |
3 | 75 | 9 | 5625 | 225 | 54.6 | 1424.07 | 416.16 | 36 | 1530 |
4 | 70 | 16 | 4900 | 280 | 51.71 | 1071.7 | 334.5 | 25 | 1280.26 |
5 | 65 | 25 | 4225 | 325 | 48.82 | 769.33 | 261.76 | 16 | 1051.63 |
6 | 60 | 36 | 3600 | 360 | 45.93 | 516.96 | 197.92 | 9 | 844.11 |
7 | 39 | 49 | 1521 | 273 | 43.04 | 3.02 | 16.34 | 4 | 157.64 |
8 | 35 | 64 | 1225 | 280 | 40.15 | 5.12 | 26.55 | 1 | 180.34 |
9 | 30 | 81 | 900 | 270 | 37.26 | 52.75 | 52.75 | 0 | 217.89 |
10 | 25 | 100 | 625 | 250 | 34.37 | 150.39 | 87.87 | 1 | 234.34 |
11 | 20 | 121 | 400 | 220 | 31.48 | 298.02 | 131.89 | 4 | 229.68 |
12 | 10 | 144 | 100 | 120 | 28.59 | 743.28 | 345.76 | 9 | 185.95 |
13 | 13 | 169 | 169 | 169 | 25.71 | 588.7 | 161.42 | 16 | 165.17 |
14 | 19 | 196 | 361 | 266 | 22.82 | 333.54 | 14.56 | 25 | 72.5 |
15 | 29 | 225 | 841 | 435 | 19.93 | 68.28 | 82.33 | 36 | 263.14 |
16 | 14 | 256 | 196 | 224 | 17.04 | 541.17 | 9.22 | 49 | 42.52 |
17 | 20 | 289 | 400 | 340 | 14.15 | 298.02 | 34.25 | 64 | 117.05 |
18 | 25 | 324 | 625 | 450 | 11.26 | 150.39 | 188.85 | 81 | 343.55 |
171 | 708 | 2109 | 38354 | 4725 | 708 | 11971.68 | 7212.72 | 570 | 10184.79 |
2. Анализ точности определения оценок параметров уравнения тренда.
Анализ точности определения оценок параметров уравнения тренда
По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (17;0.05) = 1.74
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 10
63.27 + -2.89*10 — 1.74*20.55 ; 63.27 + -2.89*10 — 1.74*20.55
(-1.39;70.14)
Интервальный прогноз.
Определим среднеквадратическую ошибку прогнозируемого показателя.
где L — период упреждения; уn+L — точечный прогноз по модели на (n + L)-й момент времени; n — количество наблюдений во временном ряду; Sy — стандартная ошибка прогнозируемого показателя; Tтабл — табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n — 2.
Точечный прогноз, t = 20: y(20) = -2.89*20 + 63.27 = 5.48
K1 = 49.73
5.48 — 49.73 = -44.25 ; 5.48 + 49.73 = 55.21
t = 20: (-44.25;55.21)
3. Проверка гипотез относительно коэффициентов линейного уравнения тренда.
1) t-статистика. Критерий Стьюдента.
Статистическая значимость коэффициента уравнения подтверждается.
Статистическая значимость коэффициента тренда подтверждается.
Доверительный интервал для коэффициентов уравнения тренда
Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими (tтабл=1.74):
(a — tтабл·Sa; a + tтабл·S a)
(-4.3484;-1.4306)
(b — tтабл·S b ; b + tтабл·S b)
(47.898;78.6389)
2) F-статистика. Критерий Фишера.
Fkp = 4.41
Поскольку F > Fkp, то коэффициент детерминации статистически значим
4. Тест Дарбина-Уотсона на наличие автокорреляции остатков для временного ряда.
y | y(x) | e i = y-y(x) | e 2 | (e i — e i-1 ) 2 |
80 | 60.38 | 19.62 | 384.99 | 0 |
79 | 57.49 | 21.51 | 462.7 | 3.57 |
75 | 54.6 | 20.4 | 416.16 | 1.23 |
70 | 51.71 | 18.29 | 334.5 | 4.45 |
65 | 48.82 | 16.18 | 261.76 | 4.45 |
60 | 45.93 | 14.07 | 197.92 | 4.45 |
39 | 43.04 | -4.04 | 16.34 | 327.99 |
35 | 40.15 | -5.15 | 26.55 | 1.23 |
30 | 37.26 | -7.26 | 52.75 | 4.45 |
25 | 34.37 | -9.37 | 87.87 | 4.45 |
20 | 31.48 | -11.48 | 131.89 | 4.45 |
10 | 28.59 | -18.59 | 345.76 | 50.56 |
13 | 25.71 | -12.71 | 161.42 | 34.69 |
19 | 22.82 | -3.82 | 14.56 | 79.02 |
29 | 19.93 | 9.07 | 82.33 | 166.14 |
14 | 17.04 | -3.04 | 9.22 | 146.66 |
20 | 14.15 | 5.85 | 34.25 | 79.02 |
25 | 11.26 | 13.74 | 188.85 | 62.24 |
0 | 0 | 0 | 7212.72 | 6909.71 |
Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости a, числа наблюдений n и количества объясняющих переменных m.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5
Выравнивание по уравнению прямой линии
Аналитическое выравнивание имеет своей конечной целью получение конкретного уравнения связи между двумя сопряженными признаками. В первую очередь исходные данные наносят на систему координат и по характеру расположения точек определяют функцию для выравнивания. Её график должен проходить максимально близко по отношению ко всем исходным точкам. В данном примере характер расположения точек линейный следовательно выравнивание осуществляем по уравнению прямой.
Как известно, уравнение линейной зависимости общего вида будет иметь вид: y = а x+b.
Вычисление конкретного уравнения сводится к определению числовых значений коэффициентов а, b, для получения которых существует несколько способов. Рассмотрим два, наиболее широко применяемых способа, характеризующихся различной точностью и трудоемкостью:
а) способ координат двух избранных точек, обеспечивающий получение менее точных результатов, но гораздо более простым путем;
б) способ наименьших квадратов, позволяющий получить достаточно точные результаты путем использования координат всех выравниваемых точек (наблюдений).
Остановимся на технике работ при вычислении конкретного уравнения методом координат избранных точек. В этом случае исходные данные изображаются на графике, и производится предварительное выравнивание. Результирующая линия проводится между точками с таким расчетом, чтобы разделить их общее количество на две приблизительно равные части. При этом необходимо стремиться к такому положению, чтобы расстояние между линией и исходными точками было кратчайшим. Для облегчения техники выравнивания и увеличения его точности можно рекомендовать следующий прием. Соединить все выравниваемые точки и постараться провести плановую выравнивающую линию по возможности ближе к этим серединам. При этом желательно провести прямую таким образом, чтобы хотя бы две исходные точки попали на неё. С полученной прямой линии снимаем координаты двух любых точек исходных данных (лежащих на проведенной прямой). Если число наблюдений в классах известно, то следует отдать предпочтение точкам, обеспеченным наибольшим числом наблюдений. В нашем примере в качестве избранных использованы координаты точек классов № 2 и № 6.
Система двух конкретных уравнений приобретет вид
После подстановки координат избранных точек:
После решения системы относительно а и b, получим
Следовательно, полученное конкретное уравнение связи Y/Х (Д/Н) будет иметь вид
Для краткости изложения в последующем тексте полученным уравнениям присвоены определенные номера: уравнение, вычисленное методом координат точек, получает номер I, а уравнение, полученное методом наименьших квадратов – номер II.
Пределы «работы» полученного уравнения по диаметру от 10 см до 46 см.
Рассмотрим технику вычислений при использовании способа наименьших квадратов. Для получения конкретного уравнения в этом случае используются координаты всех точек. Это учитывается при выведении системы уравнений для этого метода. Так, если записать уравнения прямой для каждой точки, а потом просуммировать левые и правые части всех уравнений, то получим следующее:
Так как нам необходимо найти два неизвестных значения (a и b), то в системе должно быть два уравнения. Для получения второго уравнения системы умножим обе части каждого уравнения на соответствующий «х» и просуммируем левые и правые части уравнений. Получим:
Таким образом, мы вывели оба уравнения системы:
Для удобства вычислений числовых значений указанной системы составляется вспомогательная таблица (табл.4.2).
Таблица 4.2
Вспомогательные расчеты для вычисления конкретного уравнения
Исходные данные | ХY | Х 2 | |
Х | Y | ||
16,00 | 192,00 | ||
18,00 | 288,00 | ||
20,15 | 403,00 | ||
22,14 | 531,36 | ||
23,48 | 657,64 | ||
23,65 | 756,80 | ||
24,62 | 886,32 | ||
26,00 | 1040,00 | ||
27,00 | 1188,00 | ||
252 | 201,04 | 5943,12 | 8016 |
Подставим итоговые данные в систему уравнений и вычислим коэффициенты а, b, имея в виду, что значение «n» соответствует числу классов по X:
Следовательно, конкретное уравнение будет иметь вид
С целью последующего анализа результатов применения полученных уравнений вычисляются вероятные (теоретические) значения зависимого признака по первому уравнению (yв1) и второму уравнению (yв2). Последние (yв2) сравниваются с исходными (опытными) данными (у). Указанные сравнения (a = y–yв2) производятся по всем классам X, а их результат для прямой линии показан в табл. 4.3.
Таблица 4.3
Сравнение исходных и вероятных высот деревьев, полученных по уравнению прямой линии
Исходные данные | Вероятные высоты | Отклонения, м | ||
диаметр, см | высота, м | Ув1 | Ув2 | a = y–yв2 |
X | Y | |||
16,00 | 16,60 | 17,06 | -1,06 | |
18,00 | 18,00 | 18,38 | -0,38 | |
20,15 | 19,40 | 19,70 | +0,45 | |
22,14 | 20,80 | 21,02 | +1,12 | |
23,48 | 22,20 | 22,34 | +1,14 | |
23,65 | 23,60 | 23,66 | -0,01 | |
24,62 | 25,00 | 24,98 | -0,36 | |
26,00 | 26,40 | 26,40 | -0,40 | |
27,00 | 27,80 | 27,62 | -0,62 | |
∑-0,12 |
Приведенные данные позволяют, прежде всего, проверить правильность вычислений, выполненных при получении конкретных уравнений, на предмет обнаружения грубых арифметических ошибок.
Правильность вычисления уравнений связи проверяется путем сравнения исходных значений Y с вероятными (ув), полученными по уравнению I (ув1) и уравнению II (ув2) Критерием правильности вычислений уравнения I будет совпадение вероятных значений ув1 с исходными значениями Y для тех классов, в которых использованы координаты точек в качестве исходных для получения конкретного уравнения I. В нашем примере для уравнения прямой линии значение ув1 равно 18,0, соответствует исходным данным Y во втором классе, то есть также 18,0. Аналогичное положение и в следующем, шестом классе: ув1 =23,6 практически не отличается от Y =23,65. Совпадение Y и в остальных классах не обязательно и может наступить только случайно.
Некоторый контроль правильности уравнения II можно получить путем сопоставления Y и ув2 – во всех классах. В этом случае должно наблюдаться такое сочетание знаков (плюс и минус), которое отражает «срединное» положение выравнивающей прямой между выравниваемыми исходными значениями Y.
О явной неправильности полученного уравнения будет свидетельствовать наличие во всех классах только +, равно как и знаков -, а также, если в нескольких начальных классах будут наблюдаться отклонения с одним и тем же знаком ( + или -), а во всех последующих классах с противоположным, а именно:
Заметим, что описанные критерии правильности и вычислений I и II уравнений распространяются и на выравнивание по всем другим линиям связи.
Аналитическое выравнивания ряда динамики по прямой
2. Аналитическое выравнивания ряда динамики по прямой.
Рассмотрим применение метода на следующих данных о производстве продукции предприятием ОАО «Технополис»:
Год | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 | 1998 | 1999 |
Объем продукции, тыс. ед. | 10,0 | 10,7 | 12,0 | 10,3 | 12,9 | 16,3 | 15,6 | 17,8 | 18,0 |
Примем за точку отсчета 1995г. Тогда условные годы:
Год | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 | 1998 | 1999 |
t. | -4 | -3 | -2 | -1 | 0 | 1 | 2 | 3 | 4 |
Определим параметры уравнения прямой с использованием программы Excel:
Годы | Объем продукции, тыс. ед. | Условные годы | yt | y1 | |
1 | 2 | 3 | 4 | 5 | 6 |
1991 | 10 | -4 | 16 | -40 | 9,3 |
1992 | 10,7 | -3 | 9 | -32,1 | 10,41 |
1993 | 12 | -2 | 4 | -24 | 11,52 |
1994 | -10,3 | -1 | 1 | 10,3 | 12,63 |
1995 | 12,9 | 0 | 0 | 0 | 13,74 |
1996 | 16,3 | 1 | 1 | 16,3 | 14,85 |
1997 | 15,6 | 2 | 4 | 31,2 | 15,96 |
1998 | 17,8 | 3 | 9 | 53,4 | 17,07 |
1999 | 18 | 4 | 16 | 72 | 18,18 |
Итого: | 123,6 | 0 | 60 | 66,5 | 123,66 |
Т.к. прямая имеет вид y1 = a0 + а1t , то
а0 = 123,6/9 = 13,74 тыс. ед.;
а1 = 66,5/ 60 = 1,11 тыс. ед;
уравнение прямой имеет вид:
Подставив в это уравнение значение t, получим выровненные теоретические значения.
На рис. представлены графики фактических и теоретических уровней ряда.
Штриховая линия, построенная по значениям y1, показывает тенденцию роста объема производства на данном предприятии.
рис. Графики рядов динамики: 1 – фактического, 2 – выровненного.
http://lektsii.org/7-19077.html
http://kazedu.com/referat/50642/3