Выравнивание данных по уравнению прямой

Аналитическое выравнивание ряда по прямой

Решение находим с помощью калькулятора.
Линейное уравнение тренда имеет вид y = at + b
1. Находим параметры уравнения методом наименьших квадратов.
Система уравнений

Для наших данных система уравнений имеет вид

Из первого уравнения выражаем а 0 и подставим во второе уравнение
Получаем a0 = -2.89, a1 = 63.27
Уравнение тренда
y = -2.89 t + 63.27
Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.

Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве тренда
Средние значения

т.е. в 39.75 % случаев влияет на изменение данных. Другими словами — точность подбора уравнения тренда — средняя

tyt 2y 2x ∙ yy(t)(y-y cp ) 2(y-y(t)) 2(t-t p ) 2(y-y(t)) : y
180164008060.381826.44384.99641569.68
2794624115857.491741.96462.7491699.33
3759562522554.61424.07416.16361530
47016490028051.711071.7334.5251280.26
56525422532548.82769.33261.76161051.63
66036360036045.93516.96197.929844.11
73949152127343.043.0216.344157.64
83564122528040.155.1226.551180.34
9308190027037.2652.7552.750217.89
102510062525034.37150.3987.871234.34
112012140022031.48298.02131.894229.68
121014410012028.59743.28345.769185.95
131316916916925.71588.7161.4216165.17
141919636126622.82333.5414.562572.5
152922584143519.9368.2882.3336263.14
161425619622417.04541.179.224942.52
172028940034014.15298.0234.2564117.05
182532462545011.26150.39188.8581343.55
171708210938354472570811971.687212.7257010184.79

2. Анализ точности определения оценок параметров уравнения тренда.

Анализ точности определения оценок параметров уравнения тренда

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;a) = (17;0.05) = 1.74
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 10
63.27 + -2.89*10 — 1.74*20.55 ; 63.27 + -2.89*10 — 1.74*20.55
(-1.39;70.14)
Интервальный прогноз.
Определим среднеквадратическую ошибку прогнозируемого показателя.

где L — период упреждения; уn+L — точечный прогноз по модели на (n + L)-й момент времени; n — количество наблюдений во временном ряду; Sy — стандартная ошибка прогнозируемого показателя; Tтабл — табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n — 2.
Точечный прогноз, t = 20: y(20) = -2.89*20 + 63.27 = 5.48
K1 = 49.73
5.48 — 49.73 = -44.25 ; 5.48 + 49.73 = 55.21
t = 20: (-44.25;55.21)
3. Проверка гипотез относительно коэффициентов линейного уравнения тренда.
1) t-статистика. Критерий Стьюдента.

Статистическая значимость коэффициента уравнения подтверждается.

Статистическая значимость коэффициента тренда подтверждается.
Доверительный интервал для коэффициентов уравнения тренда
Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими (tтабл=1.74):
(a — tтабл·Sa; a + tтабл·S a)
(-4.3484;-1.4306)
(b — tтабл·S b ; b + tтабл·S b)
(47.898;78.6389)
2) F-статистика. Критерий Фишера.

Fkp = 4.41
Поскольку F > Fkp, то коэффициент детерминации статистически значим
4. Тест Дарбина-Уотсона на наличие автокорреляции остатков для временного ряда.

yy(x)e i = y-y(x)e 2(e i — e i-1 ) 2
8060.3819.62384.990
7957.4921.51462.73.57
7554.620.4416.161.23
7051.7118.29334.54.45
6548.8216.18261.764.45
6045.9314.07197.924.45
3943.04-4.0416.34327.99
3540.15-5.1526.551.23
3037.26-7.2652.754.45
2534.37-9.3787.874.45
2031.48-11.48131.894.45
1028.59-18.59345.7650.56
1325.71-12.71161.4234.69
1922.82-3.8214.5679.02
2919.939.0782.33166.14
1417.04-3.049.22146.66
2014.155.8534.2579.02
2511.2613.74188.8562.24
0007212.726909.71

Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости a, числа наблюдений n и количества объясняющих переменных m.
Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5

Выравнивание по уравнению прямой линии

Аналитическое выравнивание имеет своей конечной целью получение конкретного уравнения связи между двумя сопряженными признаками. В первую очередь исходные данные наносят на систему координат и по характеру расположения точек определяют функцию для выравнивания. Её график должен проходить максимально близко по отношению ко всем исходным точкам. В данном примере характер расположения точек линейный следовательно выравнивание осуществляем по уравнению прямой.

Как известно, уравнение линейной зависимости общего вида будет иметь вид: y = а x+b.

Вычисление конкретного уравнения сводится к определению числовых значений коэффициентов а, b, для получения которых существует несколько способов. Рассмотрим два, наиболее широко применяемых способа, характеризующихся различной точностью и трудоемкостью:

а) способ координат двух избранных точек, обеспечивающий получение менее точных результатов, но гораздо более простым путем;

б) способ наименьших квадратов, позволяющий получить достаточно точные результаты путем использования координат всех выравниваемых точек (наблюдений).

Остановимся на технике работ при вычислении конкретного уравнения методом координат избранных точек. В этом случае исходные данные изображаются на графике, и производится предварительное выравнивание. Результирующая линия проводится между точками с таким расчетом, чтобы разделить их общее количество на две приблизительно равные части. При этом необходимо стремиться к такому положению, чтобы расстояние между линией и исходными точками было кратчайшим. Для облегчения техники выравнивания и увеличения его точности можно рекомендовать следующий прием. Соединить все выравниваемые точки и постараться провести плановую выравнивающую линию по возможности ближе к этим серединам. При этом желательно провести прямую таким образом, чтобы хотя бы две исходные точки попали на неё. С полученной прямой линии снимаем координаты двух любых точек исходных данных (лежащих на проведенной прямой). Если число наблюдений в классах известно, то следует отдать предпочтение точкам, обеспеченным наибольшим числом наблюдений. В нашем примере в качестве избранных использованы координаты точек классов № 2 и № 6.

Система двух конкретных уравнений приобретет вид

После подстановки координат избранных точек:

После решения системы относительно а и b, получим

Следовательно, полученное конкретное уравнение связи Y/Х (Д/Н) будет иметь вид

Для краткости изложения в последующем тексте полученным уравнениям присвоены определенные номера: уравнение, вычисленное методом координат точек, получает номер I, а уравнение, полученное методом наименьших квадратов – номер II.

Пределы «работы» полученного уравнения по диаметру от 10 см до 46 см.

Рассмотрим технику вычислений при использовании способа наименьших квадратов. Для получения конкретного уравнения в этом случае используются координаты всех точек. Это учитывается при выведении системы уравнений для этого метода. Так, если записать уравнения прямой для каждой точки, а потом просуммировать левые и правые части всех уравнений, то получим следующее:

Так как нам необходимо найти два неизвестных значения (a и b), то в системе должно быть два уравнения. Для получения второго уравнения системы умножим обе части каждого уравнения на соответствующий «х» и просуммируем левые и правые части уравнений. Получим:

Таким образом, мы вывели оба уравнения системы:

Для удобства вычислений числовых значений указанной системы составляется вспомогательная таблица (табл.4.2).

Таблица 4.2

Вспомогательные расчеты для вычисления конкретного уравнения

Исходные данныеХYХ 2
ХY
16,00192,00
18,00288,00
20,15403,00
22,14531,36
23,48657,64
23,65756,80
24,62886,32
26,001040,00
27,001188,00
252 201,04 5943,12 8016

Подставим итоговые данные в систему уравнений и вычислим коэффициенты а, b, имея в виду, что значение «n» соответствует числу классов по X:

Следовательно, конкретное уравнение будет иметь вид

С целью последующего анализа результатов применения полученных уравнений вычисляются вероятные (теоретические) значения зависимого признака по первому уравнению (yв1) и второму уравнению (yв2). Последние (yв2) сравниваются с исходными (опытными) данными (у). Указанные сравнения (a = y–yв2) производятся по всем классам X, а их результат для прямой линии показан в табл. 4.3.

Таблица 4.3

Сравнение исходных и вероятных высот деревьев, полученных по уравнению прямой линии

Исходные данныеВероятные высотыОтклонения, м
диаметр, смвысота, мУв1Ув2a = y–yв2
XY
16,0016,6017,06-1,06
18,0018,0018,38-0,38
20,1519,4019,70+0,45
22,1420,8021,02+1,12
23,4822,2022,34+1,14
23,6523,6023,66-0,01
24,6225,0024,98-0,36
26,0026,4026,40-0,40
27,0027,8027,62-0,62
∑-0,12

Приведенные данные позволяют, прежде всего, проверить правильность вычислений, выполненных при получении конкретных уравнений, на предмет обнаружения грубых арифметических ошибок.

Правильность вычисления уравнений связи проверяется путем сравнения исходных значений Y с вероятными (ув), полученными по уравнению I (ув1) и уравнению II (ув2) Критерием правильности вычислений уравнения I будет совпадение вероятных значений ув1 с исходными значениями Y для тех классов, в которых использованы координаты точек в качестве исходных для получения конкретного уравнения I. В нашем примере для уравнения прямой линии значение ув1 равно 18,0, соответствует исходным данным Y во втором классе, то есть также 18,0. Аналогичное положение и в следующем, шестом классе: ув1 =23,6 практически не отличается от Y =23,65. Совпадение Y и в остальных классах не обязательно и может наступить только случайно.

Некоторый контроль правильности уравнения II можно получить путем сопоставления Y и ув2 – во всех классах. В этом случае должно наблюдаться такое сочетание знаков (плюс и минус), которое отражает «срединное» положение выравнивающей прямой между выравниваемыми исходными значениями Y.

О явной неправильности полученного уравнения будет свидетельствовать наличие во всех классах только +, равно как и знаков -, а также, если в нескольких начальных классах будут наблюдаться отклонения с одним и тем же знаком ( + или -), а во всех последующих классах с противоположным, а именно:

Заметим, что описанные критерии правильности и вычислений I и II уравнений распространяются и на выравнивание по всем другим линиям связи.

Аналитическое выравнивания ряда динамики по прямой

2. Аналитическое выравнивания ряда динамики по прямой.

Рассмотрим применение метода на следующих данных о производстве продукции предприятием ОАО «Технополис»:

Год199119921993199419951996199719981999
Объем продукции, тыс. ед.10,010,712,010,312,916,315,617,818,0

Примем за точку отсчета 1995г. Тогда условные годы:

Год199119921993199419951996199719981999
t.-4-3-2-101234

Определим параметры уравнения прямой с использованием программы Excel:

ГодыОбъем продукции, тыс. ед.Условные годыyty1
123456
199110-416-409,3
199210,7-39-32,110,41
199312-24-2411,52
1994-10,3-1110,312,63
199512,900013,74
199616,31116,314,85
199715,62431,215,96
199817,83953,417,07
1999184167218,18
Итого:123,606066,5123,66

Т.к. прямая имеет вид y1 = a0 + а1t , то

а0 = 123,6/9 = 13,74 тыс. ед.;

а1 = 66,5/ 60 = 1,11 тыс. ед;

уравнение прямой имеет вид:

Подставив в это уравнение значение t, получим выровненные теоретические значения.

На рис. представлены графики фактических и теоретических уровней ряда.

Штриховая линия, построенная по значениям y1, показывает тенденцию роста объема производства на данном предприятии.

рис. Графики рядов динамики: 1 – фактического, 2 – выровненного.


источники:

http://lektsii.org/7-19077.html

http://kazedu.com/referat/50642/3