Проверить адекватность уравнения методом линеаризации

Проверка адекватности линейного уравнения регрессии

Расчет коэффициентов ПФЭ при равном числе параллельных опытов в каждой точке факторного пространства

Коэффициенты находятся по формуле:

где — среднее значение параметра оптимизации, вычисленное по параллельным опытам – ой строки матрицы планирования .

Проверка значимости коэффициентов ПФЭ

Очевидно, что один фактор больше влияет на параметр оптимизации, другой – меньше. Поэтому можно проверить полученные коэффициенты регрессии на значимость, т.е. оценить величину влияния каждого фактора на значение параметра оптимизации. Если эта величина соизмерима с ошибкой эксперимента, то соответствующий коэффициент не несет дополнительной информации об объекте, и его можно приравнять к нулю, что упрощает математическую модель.

Значимость коэффициентов проверяется с помощью – критерия Стьюдента.

Значения – критерия вычисляются для каждого для каждого фактора по формуле:

Полученные значения сравнивают с табличным значением критерия Стъюдента , которое находится по числу степеней свободы , и уровню значимости α — величина, характеризующая вероятность того, что решение будет неправильным. Обычно принимают, что α =0.05.

> ,

то коэффициент значимо отличается от нуля, если же , (1)

то линейное уравнение регрессии признается адекватным. Если это условие не выполняется, т.е.

При расчете F предполагается что . Если наблюдается обратное, то вывод об адекватности может быть сделан и без проверки условия (1).

Если модель адекватна, то ее можно использовать для поиска области оптимума объекта исследования или для предсказания отклика.

При неадекватной линейной модели наиболее часто принимают решение об уменьшении интервалов варьирования факторов и повторении эксперимента.

Итак, алгоритм расчета линейной модели с использованием ПФЭ следующий:

Задают матрицу планирования в кодированной форме для заданного числа факторов

Для каждого фактора задают базовую точку и интервал варьирования

Рассчитывают матрицу планирования в натуральной (размерной) форме

Проводят эксперименты, по матрице планирования, используя случайные числа.

Проводят серию опытов в центре плана, для определения ошибки опыта.

Глава 10. Проверка адекватности модели.

Уравнение регрессии, полученное после вычисления коэффициентов, подвергают статистической обработке. При этом осуществляют проверку:

· адекватности математической модели;

· значимости коэффициентов регрессии.

Чтобы проверить адекватность модели по опытным данным, достаточно оценить отклонение предсказанных по уравнению регрессии значений отклика от результатов наблюдения y в одних и тех же i-х точках факторного пространства. Разность между опытным значением отклика и значением, найденным по уравнению регрессии, принято называть остатком, сумму квадратов остатков – остаточной суммой квадратов.

Рассеяние результатов наблюдения вблизи линии уравнения регрессии, оценивающего истинную функцию отклика, можно охарактеризовать с помощью остаточной дисперсии:

(10.1)

где d – число коэффициентов регрессии. Остаточная дисперсия определяется числом степеней свободы

Если остаточная дисперсия незначимо отличается от дисперсии воспроизводимости эксперимента , то уравнение регрессии адекватно описывает опытные данные. Адекватность уравнения регрессии указывает на то, что его точность соответствует точности эксперимента и, следовательно, уравнение, обладающее более высокой точностью получить нельзя.

Если остаточная дисперсия значительно ниже дисперсии воспроизводимости, то это указывает на включение в уравнение регрессии членов, не несущих информации о влиянии факторов на отклик системы, или на неправильное применение формул регрессионного анализа.

В отдельных случаях, когда параллельные опыты ставятся только в части экспериментальных точек, найденная по этим данным дисперсия не характеризует воспроизводимости во всей области изменения факторов. Тогда ситуация , то вычисляют дисперсионное отношение

. (10.3)

Если вычисленное значение меньше табличного значения F_кр критерия Фишера, найденного для соответствующих степеней свободы

при заданном уровне значимости (обычно задают равным 5%), то гипотезу об адекватности не отвергают. В противном случае гипотезу отвергают, и математическое описание признается неадекватным.

Универсальным измерителем степени статистической связи между y и факторами x₁, x₂, …, x_n, является коэффициент детерминации К_д, который определяется соотношением

, (10.5)

где – остаточная дисперсии; – дисперсия воспроизводимости эксперимента.

Коэффициент детерминации лежит в интервале [0,1]. Нулевое значение коэффициента детерминации соответствует полному отсутствию какой-либо связи между y и факторами x₁, x₁, …, x_r. Значение коэффициента равное 1 соответствует случаю чисто функциональной зависимости между y и факторами, когда значение y может быть в точности (детерминированно) восстановлено по значениям x₁, x₁, …, x_n, с помощью формулы y=f(x₁, x₁, …, x_r).

Численное значение коэффициента детерминации К_д отражает долю общей вариации функции отклика y, объясненную функцией регрессии. Например, если коэффициент детерминации равен 0,769, то это означает, что 76,9% изменения величины отклика может быть объяснено регрессией. Таким образом, чем больше К_д, тем лучше модель аппроксимирует Y.

В моделях линейной регрессии в качестве измерителя степени статистической связи между y и факторами x₁, x₂, …, x_n, используется множественный коэффициент корреляции R. Он определяется как обычный парный коэффициент корреляции между y и линейной функции регрессии по x₁, x₁, …, x_r, т.е.

В этом случае коэффициент детерминации равен квадрату множественного коэффициента корреляции, т.е. К_д = R 2 .

Проверка значимости коэффициентов регрессии. Оценки дисперсий коэффициентов регрессии b_i вычисляются по формуле

где – остаточная дисперсия, c_ii – i-й диагональный элемент матрицы .

Проверку значимости коэффициентов регрессии производят с помощью критерия Стьюдента, эмпирическое значение которого

. (10.6)

Если найденное значение параметра t_э превышает значение t для числа степеней свободы n = n (m–1) при заданном уровне значимости p (обычно 5 %) (Приложение 1), то коэффициент признают значимым. В противном случае коэффициент принимается равным нулю с вероятностью ошибки p.

Факторы, имеющие большие значения t_э оказывают более существенное влияние на отклик системы. Если коэффициент не значим, то соответствующий фактор можно исключить из уравнения регрессии. Эту процедуру необходимо проводить с большой осторожностью. При наличии значительной корреляции между коэффициентами регрессии возможны существенные изменения в величинах остальных коэффициентов. Поэтому исключение членов из уравнения должно сопровождаться повторным вычислением коэффициентов регрессии и повторной проверкой адекватности уравнения регрессии.

Можно построить доверительный интервал

здесь t – табличное значение коэффициента Стьюдента; s<b_j> – среднеквадратичная ошибка коэффициента регрессии.

По умолчанию доверительные интервалы строятся с 95% вероятностью .

Анализ остатков. Остаточная дисперсия является усредненной оценкой точности математической модели. Поэтому дисперсионное отношение также есть усредненная оценка качества уравнения регрессии. Исследователя часто интересует не только усредненная характеристика, но и отклонения (остатки) в отдельных точках, анализ которых может дать дополнительную информацию о процессе. Анализ остатков проводят визуально посредством нанесения их на график. Если модель адекватно описывает экспериментальные данные и не содержит никаких нарушений, то остатки случайно распределены в пределах доверительного интервала, представляющего собой горизонтальную полосу с центром на оси абсцисс.

Наиболее часто встречаются следующие нарушения распределения остатков.

1. Если остатки находятся внутри расширяющейся полосы, это указывает на отсутствие постоянства дисперсии; если полоса не горизонтальна, это дает основание для введения в модель дополнительной независимой переменной.

2. Наличие выбросов, т.е. отдельных остатков, превосходящих доверительный интервал по абсолютной величине. Существование выбросов может быть связано с нарушением режима проведения эксперимента в данной точке. В этом случае необходима постановка дополнительных экспериментов в точках выбросов. Если эта причина не подтверждается, то наличие выбросов может быть связано с несоответствием вида математической модели действительной форме поверхности отклика.

Дата добавления: 2014-11-13 ; просмотров: 72 ; Нарушение авторских прав

Методы линеаризации функции регрессии

Один из подходов оценки параметров нелинейных моделей состоит в линеаризации модели. Линеаризация модели заключается в том, что с помощью подходящих преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения между преобразованными переменными. В рамках этого подхода различают два класса нелинейных регрессионных моделей, допускающих линеаризацию: а) модели, нелинейные относительно включенных в модель переменных, но линейных по оцениваемым параметрам; б) модели, нелинейные по оцениваемым параметрам.

Примером нелинейной регрессии, но линейной по оцениваемым параметрам, могут служить следующие функции: полиномы различных степеней, например

;

К нелинейным регрессионным моделям, нелинейным по оцениваемым параметрам, относятся: степенная функция

;

Нелинейная регрессионная модель с линейно включенными в нее параметрами не таит каких-либо сложностей в оценке ее параметров. Введение новых переменных позволяет свести её к линейной модели, для оценки параметров которой можно использовать обычный МНК. Так, например, если нужно оценить параметры регрессионной модели

то вводя новые переменные , , получим линейную модель

параметры которой находятся обычным МНК.

Следует, однако, отметить и недостаток такой замены переменных, связанный с тем, что оценки параметров получаются не из условия минимизации суммы квадратов отклонений для исходной переменной, а из условия минимизации суммы квадратов отклонений для новых переменных, что не одно и то же. К тому же такое преобразование искажает исходные предпосылки МНК, поскольку новые объясняющие переменные, вообще говоря, будут зависимыми. В связи с этим необходимо определенное уточнение полученных оценок.

Более сложной проблемой является нелинейность модели по параметрам, т.к. линеаризация достигается при помощи более сложных преобразований. Например, приведенную выше степенную модель при помощи логарифмического преобразования можно привести к линейному виду

К этой модели уже можно применить обычный МНК. Однако следует подчеркнуть, что критерии значимости и интервальные оценки параметров, применяемые для нормальной линейной регрессии, требуют, чтобы нормальный закон распределения в такой модели имел логарифм случайного отклонения (т.е. , а вовсе не e. Другими словами, случайное отклонение e должно иметь логарифмически нормальное распределение.

Заметим попутно, что к модели

рассматриваемой в качестве альтернативной к уже рассмотренной, изложенный метод исследования уже непригоден, т.к. ее нельзя привести к линейному виду. В этом случае можно использовать только численные методы нелинейной оптимизации.

Отметим ещё, что при построении нелинейных уравнений более остро, чем в линейном случае, стоит проблема правильной оценки формы зависимости между переменными. Неточности при выборе формы оцениваемой функции существенно сказываются на качестве отдельных параметров уравнений регрессии и, соответственно, на адекватности всей модели в целом (проблема спецификации).

§6.2. ОПИСАНИЕ ОСНОВНЫХ НЕЛИНЕЙНЫХ
РЕГРЕССИОННЫХ МОДЕЛЕЙ

Полиномиальная модель

(6.3)

называется полиномиальной моделью. Как показывает опыт, среди полиномиальных моделей чаще всего используется параболическая и кубическая модели. Ограничение использования полиномов более высоких степеней связана с требованием однородности исследуемой совокупности: чем выше порядок полинома, тем больше изгибов имеет кривая и соответственно менее однородна совокупность по результативному признаку.

(6.4)

может отражать зависимость между объемом выпуска и средними или предельными издержками; или между расходами на рекламу и прибыль и т.д. Параболическая модель целесообразна к применению, если для определенного интервала значений фактора меняется характер связи рассматриваемых признаков: прямая связь меняется на обратную и наоборот. Если же исходные данные не обнаруживают изменения направленности связи, то параметры параболической модели становятся трудно интерпретируемыми, поэтому форма связи заменяется другой нелинейной моделью (например, степенной).

При b₁>0 и b₂ 0). Функция (6.7) может отражать также зависимость объёма выпуска Y от использования ресурса X (производственная функция), в которой 0

источники:

http://lektsii.com/1-22176.html

http://megaobuchalka.ru/9/33848.html

Читайте также:

III-яя глава: Режим, применяемый к почетным консульским должностным лицам и консульским учреждениям, возглавляемым такими должностными лицами.
В каком случае проводится внеочередная проверка знаний работников?
Виды ошибок при составлении бухгалтерской отчетности, выявляемых аудиторскими проверками
Вторая глава
ВЫБОР И ПРОВЕРКА СЕЧЕНИЙ ВЫСОКОВОЛЬТНЫХ КАБЕЛЕЙ ПИТАЮЩЕЙ И РАСПРЕДЕЛИТЕЛЬНОЙ СЕТИ МИКРОРАЙОНА (ОБЪЕКТА)
Глава 1
Глава 1
Глава 1
Глава 1
Глава 1