Уравнение затрат методом наименьших квадратов

Метод наименьших квадратов.

При использовании графического метода берутся все данные за исследуемый период, все точки наносятся на график и заполняется корреляционное поле. Затем визуально проводится линия совокупных затрат, которая пересекаясь с осью ординат, показывает величину общих издержек в общей сумме затрат [6,24].

На практике очень часто пользуются более простым методом разделения затрат на по­стоянные и переменные — методом высшей и низшей точек. Его сущность заключается в том, что изучаются данные за определенное время, в котором выделяются периоды с максимальным и мини­мальным объемами производства, и определяется отклонение в объемах производства (∆Х) по формуле:

где Xmax, Xmin — объем производства соответственно в

максимальной и минимальной точках.

Затем рассчитывается отклонение в затратах (∆3) на производ­ство в тех же периодах (максимального и минимального объемов производства) по формуле:

где Зmах, Зmin— затраты соответственно в максимальной

и минималь­ной точках.

Рассчитав данные величины, можно определить ставку перемен­ных затрат на единицу продукции С:

Зная ставку переменных расходов на единицу продукции, объем производства (максимальный или минимальный) и совокупные затраты в исследуемом периоде, можно найтиусредненное значение по­стоянных затрат в данном периоде:

где а — постоянные затраты в определенный

Y — совокупные затраты в исследуемом периоде;

b — переменные затраты на единицу продукции

(ставка переменных расходов на единицу

X — объем производства в исследуемом периоде.

Подставляя рассчитанные значения постоянных, переменных затрат и разные значения объема производства в формулу (1.2), можно получать информацию о предполагаемом размере совокуп­ных затрат, которые должно произвести предприятие, чтобы выпус­тить запланированный объем продукции. На основе этой же форму­лы можно построить график зависимости совокупных затрат от объема производства, что позволит более наглядно представить перспективы производства. Особенность построенного графика со­стоит в том, что он пересекает ось, показывающую изменение за­трат, в точке, соответствующей значению постоянных затрат. Но не следует забывать, что, используя в исходных расчетах изменения объемов производства и затрат, мы получим приблизительные дан­ные о совокупных затратах.

При разделении затрат на постоянные и переменные нужно помнить, что переменные затраты изменяются пропорционально уровню деловой активности. Значит, увеличение объема производ­ства в несколько раз повлечет за собой увеличение размера пере­менных затрат в такое же количество раз. Но важно понимать и то, что совокупные переменные затраты зависят от объема производст­ва, а переменные затраты на единицу продукции — это постоянная величина [24].

Пример

Рассмотрим метод «мини-макси», используя следующие данные.

ПоказательОбъем, шт.Затраты, руб.
Максимальное значение
Минимальное значение
Разность

Переменные затраты на единицу = Разность затрат / Разность объемов продукции » 3,14 руб.

Определив, что переменные затраты составляют 3,14 руб. на единицу, мы можем определить величину постоянных затрат. Для этого используем исходные данные о максимальном или минималь­ном объемах производства. Постоянные затраты а рассчитываются вычитанием переменных затрат при соответствующем объеме из общей суммы затрат.

а = 512 — 3,14 х 24 = 512 — 75,36 = 436,64 » 437.

Отсюда формула затрат для нашего примера:

Заметим, что формула вычисления затрат по методу «мини-макси» справедлива только в области релевантности (область релевант­ности — диапазон, в пределах которого сохраняется определенная модель поведения затрат) и может не дать нужных результатов вне этой области. Метод «мини-макси» прост в применении, но его не­достаток заключается в том, что для определения затрат использу­ются только две точки. В общем же случае двух точек недостаточно для определения зависимости и расчета сумм затрат. В частности, периоды, в которых объем производства был необычайно низким или высоким вследствие различных причин (отсутствия сырья, про­стоя оборудования, поломки, т.е. случайные точки), могут исказить общую картину, поэтому для более точного расчета величины за­трат используют методы, основанные на большом количестве на­блюдений за поведением затрат.

Для установления зависимости между затратами и объемом про­изводства и определения суммы затрат используют методы матема­тической статистики, в частности метод наименьших квадратов (МНК). Дифференциация затрат с помощью МНК дает наиболее; точные результаты. Согласно этому методу прямая затрат строится таким образом, чтобы сумма квадратов отклонений расстояний от всех точек до теоретической линии регрессии была бы минималь­ной. Функция Y = a + bХ, отражающая связь между зависимой и независимой переменными, называется уравнением регрессии, а и b — параметры уравнения.

Применительно к задачам управления затратами функция Y в этом уравнении — зависимая переменная (общая сумма затрат, сме­шанные затраты); а — общая сумма постоянных затрат; b — пере­менные затраты на единицу продукции; X — независимая перемен­ная (объем производства).

Математический аппарат МНК описан достаточно подробно в специальной литературе. Итак, сумма квадратов отклонений факти­ческих значений функции Y от значений, найденных по уравнению регрессии, должна быть наименьшей:

где Уф — фактические значения;

Yi — расчетные значения, вычисляемые по заданной

Это условие приводит к системе нормальных уравнений, реше­ние которых позволяет определить параметры уравнения регрессии. Эти уравнения имеют вид:

åху = aåx + båx 2 ;

где х — объем производства;

у — совокупные затраты;

п — количество наблюдений.

Алгоритм решения следующий.

Шаг 1. Рассчитываются åx; åy; åxy; åx 2 и п.

Шаг 2. Рассчитанные величины подставляются в уравнения.

Шаг 3. Система уравнений решается относительно одного из па­раметров, обычно параметра b, т.е. переменных затрат на единицу продукции.

Шаг 4. Зная один из параметров, находим другой, т.е. а или по­стоянные затраты [24].

По степени управляемостизатраты делятся на релевантные и нерелевантные.

Релевантные затраты – затраты, отличающие одну альтернативу от другой, т.е. которые изменяются в результате принятия управленческого решения. Они учитываются при принятии решений.

Нерелевантные затраты – это затраты, которые от принятого решения не зависят.

Бухгалтер-аналитик, представляя руководству предприятия исходную информацию для выбора оптимального решения, готовит свои отчеты таким образом, чтобы они содержали только релевантную информацию ( рис. 1.4).

Рис. 1.4 Разделение затрат на релевантные и нерелевантные

Область релевантности – это диапазон, в пределах которого сохранятся определенная модель поведения затрат

Пример

Предприятием А, реализующим продукцию на внешнем рын­ке, впрок были закуплены основные материалы на сумму 500 руб. Впослед­ствии в связи с изменением технологии выяснилось, что для собственного производства эти материалы малопригодны. Произведенная из них продук­ция окажется неконкурентоспособной на внешнем рынке. Однако российс­кий партнер готов купить у данного предприятия продукцию, изготовлен­ную из этих материалов, за 800 руб. При этом дополнительные затраты предприятия А по изготовлению продукции составят 600 руб. Целесообраз­но ли принимать подобный заказ?

В данном случае сравниваются между собой две альтернативы: не при­нимать или принимать заказ.

Истекшие затраты по приобретению материалов в сумме 500 руб. уже состоялись и не зависят оттого, какой вариант будет выбран. Они не влияют на выбор решения, не являются релевантными и потому могут не учиты­ваться при принятии решения. Сравним альтернативы по релевантным по­казателям (табл. 1.3).

Таблица 1.3
ПоказателиАльтернатива 1Альтернатива II
(не принимать заказ)(принять заказ)
Выручка от продаж
Дополнительные затраты
Прибыль

Видно, что, выбрав альтернативу II, предприятие А уменьшит свой убы­ток от покупки ненужных ему материалов на 200 руб., сократив его с 500 до 300 руб.

Безвозвратные затраты – это затраты, которые возникли в результате принятого ранее решения и которые не могут быть изменены никаким решением в будущем.Это истекшие затраты, которые не могут быть изменены никакими управленческими решениями.

Из предыдущего примера видно, что 500 руб. — безвозврат­ные затраты. Безвозвратные затраты не учитываются при принятии решений.

Однако не всегда не принимаемые в расчет при оценках затраты явля­ются безвозвратными. Так, в результате двух альтернативных методов производства может оказаться, что суммы затрат на основные материалы одинаковы для обоих методов, т.е. при выборе варианта затраты на основные материалы можно отнести к категории нерелевантных. Но они не безвозвратные, поскольку будут отнесены ( или не будут понесены, если мы отклоним решение) только в дальнейшем.

Вмененные (воображаемые) затраты в результате принятого альтернативного решения характеризуют возможность, которая потеряна или которой жертвуют, в результате выбора.

По существу это упущен­ная выгода предприятия.

Печь хлебопекарни работает на полную мощность в три сме­ны и за неделю выпускает батонов нарезных на 10 тыс. руб. Оптовый поку­патель предлагает пекарне новый недельный заказ по выпечке сдобы, что повлечет за собой дополнительные переменные затраты на сумму 3 тыс. руб. Какой должна быть минимальная цена договора?

Приняв заказ, пекарня откажется от дохода в 10 тыс. руб., получаемого ранее от выпечки батонов, т.е. по существу понесет убытки на 10 тыс. руб. Эту сумму предприятию необходимо учесть при обсуждении условий дого­вора. Цена договора не может опуститься ниже 13 тыс. руб. (10 + 3). При этом 10 тыс. руб. — вмененные (воображаемые) затраты, или упущенная выгода предприятия.

Необходимо иметь в виду, что данная категория затрат применима лишь в случае ограниченности ресурсов, в приведенном примере — при полной загрузке производственных мощностей. Если бы хлебопекарная печь была недогружена и работала с простоями, о вмененных затратах речь бы не шла.

Метод наименьших квадратов

Начнем статью сразу с примера. У нас есть некие экспериментальные данные о значениях двух переменных – x и y . Занесем их в таблицу.

i = 1i = 2i = 3i = 4i = 5
x i01245
y i2 , 12 , 42 , 62 , 83 , 0

После выравнивания получим функцию следующего вида: g ( x ) = x + 1 3 + 1 .

Мы можем аппроксимировать эти данные с помощью линейной зависимости y = a x + b , вычислив соответствующие параметры. Для этого нам нужно будет применить так называемый метод наименьших квадратов. Также потребуется сделать чертеж, чтобы проверить, какая линия будет лучше выравнивать экспериментальные данные.

В чем именно заключается МНК (метод наименьших квадратов)

Главное, что нам нужно сделать, – это найти такие коэффициенты линейной зависимости, при которых значение функции двух переменных F ( a , b ) = ∑ i = 1 n ( y i — ( a x i + b ) ) 2 будет наименьшим. Иначе говоря, при определенных значениях a и b сумма квадратов отклонений представленных данных от получившейся прямой будет иметь минимальное значение. В этом и состоит смысл метода наименьших квадратов. Все, что нам надо сделать для решения примера – это найти экстремум функции двух переменных.

Как вывести формулы для вычисления коэффициентов

Для того чтобы вывести формулы для вычисления коэффициентов, нужно составить и решить систему уравнений с двумя переменными. Для этого мы вычисляем частные производные выражения F ( a , b ) = ∑ i = 1 n ( y i — ( a x i + b ) ) 2 по a и b и приравниваем их к 0 .

δ F ( a , b ) δ a = 0 δ F ( a , b ) δ b = 0 ⇔ — 2 ∑ i = 1 n ( y i — ( a x i + b ) ) x i = 0 — 2 ∑ i = 1 n ( y i — ( a x i + b ) ) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Для решения системы уравнений можно использовать любые методы, например, подстановку или метод Крамера. В результате у нас должны получиться формулы, с помощью которых вычисляются коэффициенты по методу наименьших квадратов.

n ∑ i = 1 n x i y i — ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n — ∑ i = 1 n x i 2 b = ∑ i = 1 n y i — a ∑ i = 1 n x i n

Мы вычислили значения переменных, при который функция
F ( a , b ) = ∑ i = 1 n ( y i — ( a x i + b ) ) 2 примет минимальное значение. В третьем пункте мы докажем, почему оно является именно таким.

Это и есть применение метода наименьших квадратов на практике. Его формула, которая применяется для поиска параметра a , включает в себя ∑ i = 1 n x i , ∑ i = 1 n y i , ∑ i = 1 n x i y i , ∑ i = 1 n x i 2 , а также параметр
n – им обозначено количество экспериментальных данных. Советуем вам вычислять каждую сумму отдельно. Значение коэффициента b вычисляется сразу после a .

Обратимся вновь к исходному примеру.

Здесь у нас n равен пяти. Чтобы было удобнее вычислять нужные суммы, входящие в формулы коэффициентов, заполним таблицу.

i = 1i = 2i = 3i = 4i = 5∑ i = 1 5
x i0124512
y i2 , 12 , 42 , 62 , 8312 , 9
x i y i02 , 45 , 211 , 21533 , 8
x i 2014162546

Решение

Четвертая строка включает в себя данные, полученные при умножении значений из второй строки на значения третьей для каждого отдельного i . Пятая строка содержит данные из второй, возведенные в квадрат. В последнем столбце приводятся суммы значений отдельных строчек.

Воспользуемся методом наименьших квадратов, чтобы вычислить нужные нам коэффициенты a и b . Для этого подставим нужные значения из последнего столбца и подсчитаем суммы:

n ∑ i = 1 n x i y i — ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n — ∑ i = 1 n x i 2 b = ∑ i = 1 n y i — a ∑ i = 1 n x i n ⇒ a = 5 · 33 , 8 — 12 · 12 , 9 5 · 46 — 12 2 b = 12 , 9 — a · 12 5 ⇒ a ≈ 0 , 165 b ≈ 2 , 184

У нас получилось, что нужная аппроксимирующая прямая будет выглядеть как y = 0 , 165 x + 2 , 184 . Теперь нам надо определить, какая линия будет лучше аппроксимировать данные – g ( x ) = x + 1 3 + 1 или 0 , 165 x + 2 , 184 . Произведем оценку с помощью метода наименьших квадратов.

Чтобы вычислить погрешность, нам надо найти суммы квадратов отклонений данных от прямых σ 1 = ∑ i = 1 n ( y i — ( a x i + b i ) ) 2 и σ 2 = ∑ i = 1 n ( y i — g ( x i ) ) 2 , минимальное значение будет соответствовать более подходящей линии.

σ 1 = ∑ i = 1 n ( y i — ( a x i + b i ) ) 2 = = ∑ i = 1 5 ( y i — ( 0 , 165 x i + 2 , 184 ) ) 2 ≈ 0 , 019 σ 2 = ∑ i = 1 n ( y i — g ( x i ) ) 2 = = ∑ i = 1 5 ( y i — ( x i + 1 3 + 1 ) ) 2 ≈ 0 , 096

Ответ: поскольку σ 1 σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0 , 165 x + 2 , 184 .

Как изобразить МНК на графике функций

Метод наименьших квадратов наглядно показан на графической иллюстрации. С помощью красной линии отмечена прямая g ( x ) = x + 1 3 + 1 , синей – y = 0 , 165 x + 2 , 184 . Исходные данные обозначены розовыми точками.

Поясним, для чего именно нужны приближения подобного вида.

Они могут быть использованы в задачах, требующих сглаживания данных, а также в тех, где данные надо интерполировать или экстраполировать. Например, в задаче, разобранной выше, можно было бы найти значение наблюдаемой величины y при x = 3 или при x = 6 . Таким примерам мы посвятили отдельную статью.

Доказательство метода МНК

Чтобы функция приняла минимальное значение при вычисленных a и b , нужно, чтобы в данной точке матрица квадратичной формы дифференциала функции вида F ( a , b ) = ∑ i = 1 n ( y i — ( a x i + b ) ) 2 была положительно определенной. Покажем, как это должно выглядеть.

У нас есть дифференциал второго порядка следующего вида:

d 2 F ( a ; b ) = δ 2 F ( a ; b ) δ a 2 d 2 a + 2 δ 2 F ( a ; b ) δ a δ b d a d b + δ 2 F ( a ; b ) δ b 2 d 2 b

Решение

δ 2 F ( a ; b ) δ a 2 = δ δ F ( a ; b ) δ a δ a = = δ — 2 ∑ i = 1 n ( y i — ( a x i + b ) ) x i δ a = 2 ∑ i = 1 n ( x i ) 2 δ 2 F ( a ; b ) δ a δ b = δ δ F ( a ; b ) δ a δ b = = δ — 2 ∑ i = 1 n ( y i — ( a x i + b ) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F ( a ; b ) δ b 2 = δ δ F ( a ; b ) δ b δ b = δ — 2 ∑ i = 1 n ( y i — ( a x i + b ) ) δ b = 2 ∑ i = 1 n ( 1 ) = 2 n

Иначе говоря, можно записать так: d 2 F ( a ; b ) = 2 ∑ i = 1 n ( x i ) 2 d 2 a + 2 · 2 ∑ x i i = 1 n d a d b + ( 2 n ) d 2 b .

Мы получили матрицу квадратичной формы вида M = 2 ∑ i = 1 n ( x i ) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

В этом случае значения отдельных элементов не будут меняться в зависимости от a и b . Является ли эта матрица положительно определенной? Чтобы ответить на этот вопрос, проверим, являются ли ее угловые миноры положительными.

Вычисляем угловой минор первого порядка: 2 ∑ i = 1 n ( x i ) 2 > 0 . Поскольку точки x i не совпадают, то неравенство является строгим. Будем иметь это в виду при дальнейших расчетах.

Вычисляем угловой минор второго порядка:

d e t ( M ) = 2 ∑ i = 1 n ( x i ) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n ( x i ) 2 — ∑ i = 1 n x i 2

После этого переходим к доказательству неравенства n ∑ i = 1 n ( x i ) 2 — ∑ i = 1 n x i 2 > 0 с помощью математической индукции.

  1. Проверим, будет ли данное неравенство справедливым при произвольном n . Возьмем 2 и подсчитаем:

2 ∑ i = 1 2 ( x i ) 2 — ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 — x 1 + x 2 2 = = x 1 2 — 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

У нас получилось верное равенство (если значения x 1 и x 2 не будут совпадать).

  1. Сделаем предположение, что данное неравенство будет верным для n , т.е. n ∑ i = 1 n ( x i ) 2 — ∑ i = 1 n x i 2 > 0 – справедливо.
  2. Теперь докажем справедливость при n + 1 , т.е. что ( n + 1 ) ∑ i = 1 n + 1 ( x i ) 2 — ∑ i = 1 n + 1 x i 2 > 0 , если верно n ∑ i = 1 n ( x i ) 2 — ∑ i = 1 n x i 2 > 0 .

( n + 1 ) ∑ i = 1 n + 1 ( x i ) 2 — ∑ i = 1 n + 1 x i 2 = = ( n + 1 ) ∑ i = 1 n ( x i ) 2 + x n + 1 2 — ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n ( x i ) 2 + n · x n + 1 2 + ∑ i = 1 n ( x i ) 2 + x n + 1 2 — — ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n ( x i ) 2 — ∑ i = 1 n x i 2 + n · x n + 1 2 — x n + 1 ∑ i = 1 n x i + ∑ i = 1 n ( x i ) 2 = = ∑ i = 1 n ( x i ) 2 — ∑ i = 1 n x i 2 + x n + 1 2 — 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 — 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 — 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n ( x i ) 2 — ∑ i = 1 n x i 2 + + ( x n + 1 — x 1 ) 2 + ( x n + 1 — x 2 ) 2 + . . . + ( x n — 1 — x n ) 2 > 0

Выражение, заключенное в фигурные скобки, будет больше 0 (исходя из того, что мы предполагали в пункте 2 ), и остальные слагаемые будут больше 0 , поскольку все они являются квадратами чисел. Мы доказали неравенство.

Ответ: найденные a и b будут соответствовать наименьшему значению функции F ( a , b ) = ∑ i = 1 n ( y i — ( a x i + b ) ) 2 , значит, они являются искомыми параметрами метода наименьших квадратов (МНК).

Решения задач: метод наименьших квадратов

Метод наименьших квадратов применяется для решения различных математических задач и основан на минимизации суммы квадратов отклонений функций от исходных переменных. Мы рассмотриваем его приложение к математической статистике в простейшем случае, когда нужно найти зависимость (парную линейную регрессию) между двумя переменными, заданными выборочными данным. В этом случае речь идет об отклонениях теоретических значений от экспериментальных.

Краткая инструкция по методу наименьших квадратов для чайников: определяем вид предполагаемой зависимости (чаще всего берется линейная регрессия вида $y(x)=ax+b$), выписываем систему уравнений для нахождения параметров $a, b$. По экспериментальным данным проводим вычисления и подставляем значения в систему, решаем систему любым удобным методом (для размерности 2-3 можно и вручную). Получается искомое уравнение.

Иногда дополнительно к нахождению уравнения регрессии требуется: найти остаточную дисперсию, сделать прогноз значений, найти значение коэффициента корреляции, проверить качество аппроксимации и значимость модели. Примеры решений вы найдете ниже. Удачи в изучении!

Примеры решений МНК

Пример 1. Методом наименьших квадратов для данных, представленных в таблице, найти линейную зависимость

Пример 2. Прибыль фирмы за некоторый период деятельности по годам приведена ниже:
Год 1 2 3 4 5
Прибыль 3,9 4,9 3,4 1,4 1,9
1) Составьте линейную зависимость прибыли по годам деятельности фирмы.
2) Определите ожидаемую прибыль для 6-го года деятельности. Сделайте чертеж.

Пример 3. Экспериментальные данные о значениях переменных х и y приведены в таблице:
1 2 4 6 8
3 2 1 0,5 0
В результате их выравнивания получена функция Используя метод наименьших квадратов, аппроксимировать эти данные линейной зависимостью (найти параметры а и b). Выяснить, какая из двух линий лучше (в смысле метода наименьших квадратов) выравнивает экспериментальные данные. Сделать чертеж.

Пример 4. Данные наблюдений над случайной двумерной величиной (Х, Y) представлены в корреляционной таблице. Методом наименьших квадратов найти выборочное уравнение прямой регрессии Y на X.

Пример 5. Считая, что зависимость между переменными x и y имеет вид $y=ax^2+bx+c$, найти оценки параметров a, b и c методом наименьших квадратов по выборке:
x 7 31 61 99 129 178 209
y 13 10 9 10 12 20 26

Пример 6. Проводится анализ взаимосвязи количества населения (X) и количества практикующих врачей (Y) в регионе.
Годы 81 82 83 84 85 86 87 88 89 90
X, млн. чел. 10 10,3 10,4 10,55 10,6 10,7 10,75 10,9 10,9 11
Y, тыс. чел. 12,1 12,6 13 13,8 14,9 16 18 20 21 22
Оцените по МНК коэффициенты линейного уравнения регрессии $y=b_0+b_1x$.
Существенно ли отличаются от нуля найденные коэффициенты?
Проверьте значимость полученного уравнения при $\alpha = 0,01$.
Если количество населения в 1995 году составит 11,5 млн. чел., каково ожидаемое количество врачей? Рассчитайте 99%-й доверительный интервал для данного прогноза.
Рассчитайте коэффициент детерминации


источники:

http://zaochnik.com/spravochnik/matematika/stati/metod-naimenshih-kvadratov/

http://www.matburo.ru/ex_ms.php?p1=msmnk