Движение по градиенту линейного уравнения регрессии крутого восхождения

Крутое восхождение по поверхности отклика

Градиентом называют вектор, показывающий направление наискорейшего изменения некоторой величины, значение которой меняется от одной точки пространства к другой [3]. Градиент непрерывной однозначной функции есть вектор:

,

где частная производная функции по i-му фактору; – единичные векторы в направлении осей факторов. Согласно теореме Тейлора о разложении аналитической функции в ряд частные производные функции по факторам равны по величине и знаку соответствующим коэффициентам регрессии. Следовательно, градиент функции отклика у есть вектор:

.

Движение по градиенту обеспечивает наиболее короткий путь к оптимуму, так как направление градиента – это направление самого крутого склона, ведущего от данной точки к вершине. Если изменять факторы пропорционально их коэффициентам с учетом знака, то движение к оптимуму будет осуществляться по самому крутому пути. Этот процесс движения к области оптимума называют крутым восхождением. Технику расчета крутого восхождения рассмотрим на примере задачи с одним фактором (рис.2.1).

Рис.2.1 Схема к расчету координат точек в направлении градиента:

1 – график неизвестной функции отклика;

2 – прямая — направление градиента.

Предположим, что кривая 1 представляет собой неизвестную функцию отклика. В результате реализации плана эксперимента с центром в точке О получено уравнение регрессии , адекватно описывающее функцию отклика в области значений фактора от –1 до +1.

Значение коэффициента регрессии равно тангенсу угла между линией регрессии и осью данного фактора.

Если шаг движения по оси принять равным , то, умножив его на , получим координаты ( и ) точки А, лежащей на градиенте. После второго шага расстояние по оси будет равно . Умножив на , найдем координаты и точки В, лежащей на градиенте, и т. д. Затем проводят опыты с условиями, отвечающими точкам на градиенте.

По результатам этих опытов определяют область оптимума. В практических задачах для сокращения объема эксперимента проводят не все, а только часть опытов, предусмотренных крутым восхождением.

Условия опытов выбирают так, чтобы область оптимума можно было заключить в «вилку». После этого опыты проводят в точках интервала, образованного точками «вилки», до нахождения наилучшего результата.

В случае k факторов расчет крутого восхождения по оси каждого фактора производят аналогичным образом, так как коэффициенты определяются независимо друг от друга. При этом движение по осям всех факторов осуществляют одновременно.

Шаг движения по градиенту выбирают таким, чтобы его минимальная величина была больше ошибки, с которой фиксируют фактор. Максимальную величину шага ограничивает область определения фактора.

Необходимо учитывать, что при движении к оптимуму малый шаг потребует значительного числа опытов, а большой шаг может привести к проскоку области оптимума. Шаг движения выбирают для одного фактора, а для остальных его рассчитывают по выражению

,

– выбранный шаг движения для фактора

l; – шаг движения для i-го фактора;

, – коэффициенты регрессии i-го и l-го факторов;

, –интервалы варьирования i-го и l-го факторов.

Движение по градиенту должно начинаться от нулевой точки основного уровня каждого фактора, так как коэффициенты регрессии вычислены для функции отклика, разложенной в ряд Тейлора в окрестности нулевой точки.

Если коэффициенты регрессии значительно отличаются друг от друга, то рекомендуют изменить интервалы варьирования факторов и провести новую серию опытов, ибо при различии коэффициентов на порядок и более многофакторный эксперимент при крутом восхождении может превратиться в однофакторный.

Рассчитав шаг движения для каждого фактора, находят условия «мысленных» опытов.

«Мысленными» называют опыты, условия, проведения которых на стадии крутого восхождения установлены с учетом шага движения для каждого фактора. С целью проверки результатов крутого восхождения часть мысленных опытов реализуется.

Если при движении к оптимуму возникает ситуация, препятствующая изменению каких-либо факторов, то эти факторы можно фиксировать на оптимальных уровнях, продолжая движение по остальным факторам.

Крутое восхождение прекращается, если найдены оптимальные условия или если ограничения на факторы делают дальнейшее движение по градиенту неразумным.

Рассмотрим метод Бокса – Уилсона на примере исследования модифицирования чистого алюминия молибденом. В качестве параметра оптимизации y выбрали число зерен алюминия в 1 см 2 , определяющееся металлографически.

На параметр оптимизации оказывают существенное влияние следующие факторы: х1 – количество введенного в алюминий молибдена, %; х2 – температура, ° С; x3 — время нагрева, мин; х4 – скорость охлаждения., х1х2 x3 – факторы количественные; x4 – фактор качественный, принимающий два значения: быстрое охлаждение в графитовом тигле и медленное охлаждение в шамотном тигле. Выбранные интервалы варьирования и уровни факторов указаны в табл. 2.10.

Была реализована полуреплика 2 4-1 с определяющим контрастом l = х1х2 x3x4.Матрица планирования и результаты опытов представлены в табл. (2.11).

Опыты не дублировали. Для определения дисперсии параметра оптимизации было проведено три опыта при нахождении факторов на основных уровнях (графитовый тигель).

Полученные значения параметра оптимизации , его среднее значение , отклонения значений параметра оптимизации от его среднего значениями и квадраты этих отклонений приведены в табл. (2.12).

Уровни и интервалы варьирования факторов

НаименованиеФакторы
х1х2x3x4
Основной уровень Интервал варьирования Верхний уровень(+) Нижний уровень(–)0,40 0,15 0,55 0,25– – Графитовый тигель Шамотный тигель
Номер опытаПорядок реализации опытовx0x1x2x3x4 y
+++++
+++
+++
+++
+++
+++
+++
+

Вспомогательная таблица для расчета

Номер опыта
–2

Дисперсия параметра оптимизации:

.

Находим коэффициенты модели (уравнение регрессии):

Средняя квадратичная ошибка в определении коэффициентов регрессии

Доверительный интервал коэффициентов регрессии .

При 5%–ном уровне значимости и числе степеней свободы табличное значение критерия Следовательно, Все коэффициенты регрессии по абсолютной величине больше доверительного интервала, поэтому их можно признать статистически значимыми. Таким образом, получили модель в виде полинома первой степени:

.

Согласно полученной модели параметр оптимизации возрастает с увеличением значений факторов х1, х2 и уменьшением значений факторов х3, x4. Наибольшее влияние на параметр оптимизации оказывает фактор х1. Проверку адекватности модели производим по F – критерию Фишера. Для вычисления дисперсии адекватности составим вспомогательную таблицу. 2.13.

Вспомогательная таблица для расчета

Номер опыта
–1
+2
95.–1
–1
–2
+3
–2

;

.

Табличное значение FT критерия при 5% – ном уровне значимости и числах степеней свободы для числителя 3 и для знаменателя 2 равно 19,2 FP

Дата добавления: 2019-10-16 ; просмотров: 882 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Завершение этапа крутого восхождения.

Основные свойства ортогонального планирования.

12.Основные свойства ротатабельного планирования.
Ротатабельность — способность матем. модели, полученной в рез-те ПФЭ и ДФЭ, предсказывать зн-ние пар-pa оптимизации с одинаковой точностью на равной расст. от центра эксперим. независимо от направления.

Свойства ротатабельности: 1)равенство дисперсий коэффициентов;

13.Движения по градиенту линейного уравнения регрессии (крутого восхождения).
Предположим, что после первого этапа решения задачи было получено линейное уравнение или линейная функция отклика: . Можно доказать, что движение из некоторой точки внутри изученной области в направлении наибольшей производной функции – кратчайший путь оптимума: , где dy, dx – частные производные функции отклика i,j,m – единичные векторы в направлении координатных осей факторного пространства. Очевидно, что dy, dx линейные функции по каждой из переменных равный соответствующему коэффициенту : . Для осуществления движения по градиенту значения факторов по каждой из осей i,j и m необходимо изменять пропорционально величинам коэффициентов , b2….bk с учетом их знаков. Движение по градиенту обеспечивает наиболее быстрый путь к оптимуму, так как направление градиента представляет собой самого крутого склона, ведущего по данной точке к вершине. Движение по самому крутому склону – крутовосхождение, метод же – метод крутого восхождения. Обобщение на случай k факторов делается механически, так как рассчитаны не зависимо друг от друга. Определяют произведение соответствующих интервалов b1 на Δ , выбирают шаги в изменении каждого фактора пропорционально величине * Δ .Полученные т.о шаги последовательно прибавляют, или вычитают в зависимости от знака коэффициентов регрессии к основному уровню каждого фактора. Для качественных факторов, либо фиксируют лучший уровень, либо реализуют опыты поочередно для каждого уровня. Незначительные факторы стабилизируют на уровне в интервале и в дальнейшем движении по градиенту, эти факторы не участвуют. Если при крутом восхождении не возможно двигаться по какому-либо из факторов, его стабилизируют на достигнутом уровне, по остальным факторам, движение продолжают. Успех крутого восхождения очень сильно зависит от характера поверхности отклика.

Наиболее благоприятные движения по градиенту А, Б (меняется фактор-меняется и направление), В также. Г, ничего хорошего не даст, значения x разные, дают разные значения.

Либо план уже находится в области оптимума, либо были допущены грубые ошибки на этапе планирования эксперимента. Результат движения по градиенту во многом определяется соотношение численных значений коэффициентов регрессии. Наиболее оптимальное движение по градиенту, симметричной функции, т.е функции, величины коэффициентов которых различаются не существенно. Если функция резко несимметрична, движение по градиенту может выразиться в однофакторный эксперимент, когда в опытах будет изменяться один из факторов. Удачный выбор интервала варьирования может сделать симметричной, практически любую функцию.

14.21.Способы расчета коэффициентов регрессии при использовании ПФЭ и ДФЭ.
Полный: , где y- номер опыта; i- № фактора; — значение параметра оптимизации в опыте № N; — значение фактора № i в опыте № n. Таким образом для подсчета коэффициента к столбцу y надо приписать знаки соответственного столбца , сложить значения параметра оптимизации, а результат разделить на число опытов матрицы планирования N.

15.Способ определения доверительных интервалов коэффициентов регрессии.
Рассчитывается по формуле: , где t- критерий Стьюдента; N – число опытов матрицы планирования; — СКО в определении коэффициентов регрессии ( )

16.Статистически значимые и статистически незначимые коэффициенты регрессии.
Коэффициент регрессии считается статистически значимым если его абсолютная величина ≥ доверительному интервалу |bi|≥∆bi; . Смысл неравенства – абсолютная величина коэффициента должна быть в t раз больше, чем ошибка в его определении.

17.Схема расчета дисперсии неадекватности.
Критерий Фишера: гипотеза об адекватности нашей модели чаще всего определяется по критерию Фишера:

f1,f2 — число степеней свободы — разность между числом опытов и числом констант, вычисляемых по результатам опытов, независимо друг от друга.S2неад — вычислена с f2, S2 — вычислена с f1. Выражение, которое написано в числителе, так называется — дисперсия неадекватности. Достаточная дисперсия, дисперсия адекватности:

YuрасчYuэксп — значения параметров оптимизации в опыте и рассчитанные оп уравнению регрессии и определяющиеся экспериментально. N-K =f2 — число степеней свободы при определении дисперсии неадекватности. N — количество экспериментов . К’ — число коэффициентов регрессии, включая b0. Критерий Фишера представляет собой отношение дисперсии предсказания полученной модели к дисперсии опыта. Он показывает во сколько раз модель предсказывает хуже, чем опыт. Гипотеза об адекватности модели принимается в том случае, когда расчет значения критерия Фишера не превышает табличного для выбранного условия значимости Fрасч

20.Генерирующее соотношение и определяющий контраст.
Генерирующее соотношение показывает, с каким из эффектов смешан данный эффект. Пример X1X2=X3 (1)-эффект 3 смешан с эффектами 1 и 2. Умножим (1) на Х3,то Хз 2 =X1X2X3 (Xi 2 =1)=> X1X2X3=1. Символическое обозначение произведения столбцов равное (+1) или (-1) называют определяющим контрастом . С помощью него можно определить систему смешивания эффектов. Чтобы определить какой эффект смешан с данным, надо умножить обе части определяющего контраста на столбец, соответствующий данному эффекту: X1=X1 2 X2 Х3, X1= X2 Х3, т.к. X1 2 =1; X3= X1X2

22.27.Линейная модель уравнения регрессии в матричной форме.
По результатам эксперимента необходимо определить коэффициент модели . Если искомые уравнения нелинейные, их всегда можно привести к линейным, заменив нелинейную составляющую новыми переменными. Коэффициенты регрессии чаще всего определяют по МНК.

Систему всех обозначений и вывод формул можно упростить, используя линейную алгебру , , х — матрица условий эксперимента.
K-количество факторов, n – число опытовB- Матрица неизвестных коэффициентов регрессии , Y – матрица результатов наблюдений ,

, — транспонированная матрица (строки заменены столбцами)

— система нормальных уравнений МНК записанных в матричной форме

Элементы матрицы B определяются из решения этой системы. Получим матрицу обратную


Для расчета коэффициентов регрессии, необходимо найти следующие матрицы .Матрица Х-ортогональная, так как для любых пар столбцов

23.Указать какая часть поверхности отклика называется почти стационарной.
Часть поверхности отклика вблизи экстремума называется почти стационарной областью, она обычно описывается при помощи нелинейных уравнений, чаще всего это полином второго порядка ,где к — число факторов

Для решения такой задачи, придется пользоваться планированием 2-го порядка.

24.Объяснить каким образом матрицу центрального композиционного планирования можно сделать ротатабельной.
Когда проводится эксперимент неизвестно, какое направление факторного пространства представляет больший интерес => необходимо получить одинаковое количество информации по разным направлениям, необходимо, чтобы информации была равномерно распределена по факторному пространству. Используется другой способ, позволяющий равномерно распределить информацию. Это достигается выбором определенного значения звездного плеча и числа опытов в центре эксперимента.
Условия ротатабельности формулируются: достигается инвариантность к вращению координат, позволяющая предсказать значения параметра оптимизации в различных точках факторного пространства с минимальными и равными на равном расстоянии от центра эксперимента дисперсиями; из условия ротатабельности величина звездного плеча определяется если в качестве ядра плана – ПФЭ. Если ядром плана служат дробные реплики, то .

25.Основные особенности этапа выбора факторов.
На первых этапах в программу исследования вносят все факторы. Часто выбранных факторов оказывается слишком много. В этом случае возникает задача выявления наиболее сильно влияющих факторов и их взаимодействий. Все способы выбора факторов при взаимодействии основаны на том, что они ранжируются. Все факторы, которые не включаются в начальные этапы стабилизируются на каком-то постоянном уровне.

26.Указать каким образом матрицу центрального композиционного планирования можно сделать ортогональной.
Одним из достоинств ортогонального планирования является возможность оценить коэффициенты регрессии независимо друг от друга , где N-число опытов, u- номер опыта, i, j = от 0 до x – число факторов. Это условие в общем случае для матрицы центрального композиционного плана не выполняется, так как в таблице сумма произведений не равна нулю. ;. Условия не выполняются, но можно добиться полной ортогональности данного планирования если преобразовать квадратичные переменные и специальным образом выбрать величину звездного плеча. С этой целью вместо вводят новые переменные . В результате этого соблюдаются условия ортогональности:
28.Рандомизация опытов во времени.
Для того, чтобы исключить влияние систематических ошибок, вызванных внешними условиями, рекомендуется опыты проводить в случайной последовательности (рандомизированно во времени). Если достаточно много опытов, то порядок их проведения можно установить по таблице случайных чисел. При проведении эксперимента необходимо учитывать ошибки самого опыта или дисперсию опыта.

29.Центральные композиционные планы.
при числе факторов не более 5! Предполагает реализацию ПФЭ, если к 5 Реализуем опыты ПФЭ или ДФЭ, а потом добавляем к этим опытам (ядру) некоторое количество специальным образом расположенных точек, такие планы носят название центральных. Для центральных планов все опыты располагаются симметрично вокруг центра. Данные планы являются центральными композиционными.

30.Описать способ установления шага в измерении факторов при движении по градиенту (крутом восхождении).
Выбирают шаги в изменении каждого фактора пропорционально величине * Δ .Полученные т.о шаги последовательно прибавляют, или вычитают в зависимости от знака коэффициентов регрессии к основному уровню каждого фактора. (bi – значение коэффициента регрессии, ∆xi – интервал варьирования)

Завершение этапа крутого восхождения.

32.Общее число опытов при центральном композиционном планировании.
Общее количество опытов N при k факторах в ОЦКП равно N = N1+2k+ n0.

Если k>5 ИЛИ k=5,то N1= 2 k – p ;

Метод крутого восхождения при поиске оптимизации

Из целого ряда градиентных методов наиболее широкое приме­нение получил метод «крутого восхождения», предложенный Боксом и Уилсоном в 1951 году. Этот метод определяет стратегию последователь­ного пошагового проведения экспериментов, при котором весь цикл ис­следований разбивается на отдельные этапы. Причем на каждом после­дующем этапе используются результаты предыдущего.

Согласно теореме Тейлора о разложении аналитической функ­ции в ряд, частные производные функции по факторам равны по величи­не и знаку соответствующим коэффициентам линейного уравнения рег­рессии.

grad у = b1 • i + Ь2 * j + • • • + bk • k bi=∂y/∂xi

Рассмотрим формализованную процедуру крутого восхождения с численным примером.

В начале необходимо иметь линейную модель, построенную по результатам эксперимента, и знать интервалы варьирования и нулевой уровень факторов.

Дано: адекватная линейная модель в кодовых переменных:

Известно, что х4 является качественным фактором (например, конструкцией узла) и наилучшие результаты дает конструкция с кодовым значением « -1″. При крутом восхождении это значение качественного фактора фиксируется и модель приобретает вид h = 45 + 10х1 + 6х2 — Зх3 .

Если оба уровня качественного фактора дают близкие результа­ты, то крутое восхождение повторяется на двух уровнях. Интервалы варьирования факторов в натуральных переменных:

нулевой уровень факторов:

1. Выбор базового фактора.

В качестве базового рекомендуется выбирать фактор с наиболь­шей абсолютной величиной коэффициента линейной модели или фактор с наибольшим интервалом варьирования. Пример.

Выбираем в качестве базового фактор х2/ так как

2. Выбор шага базисного фактора.

Величины шагов движения по факторным осям должны быть больше ошибки, с которой фиксируется фактор. Малый шаг увеличивает количество опытов, а слишком большой — может привести к проскоку экстремума.

Обычно шаг Pj выбирают в долях и интервала варьирования фактора:

3. Расчет шагов для остальных факторов выполняем по формуле

где индекс «6» относится к базовому фактору.

Где индекс 6 относится к базовому фактору.

При необходимости шаги можно для удобства счета округлять.

4. Выбор начала движения по градиенту.

За начало движения по градиенту функции отклика можно брать любую точку поверхности отклика. Обычно используют центр экспери­мента (основной или нулевой уровень каждого фактора). Но если есть предположение о наличии экстремума в некоторой точке, то эту точку нужно брать в вилку.

Пример: в качестве начала движения выбираем основной уровень.

5. Расчет величин факторов для первого шага:

где n — порядковый номер шага.

Пример. X1 = 0,4 + 1*0,05 = 0,45; х2 = 840 + 1*20 = 860; х3 = 60 + 1*(-5) = 55.

6. Перевод натуральных значений факторов для первого шага
движения в кодовые.

где Xj — натуральное значение фактора.

X1=(0.45-04)/0.15=0,33 X2=(860-840)/100=0.2 X3=(55-60)/50=-0.1

7. Расчет выходе в первом мысленном опыте,
Пример,

у9 = 45 + 10*0,33 + 6*0,2 — З-(0,1) = 49,2

9. Повторить этапы 5, 6, 7. Результаты сведены в табл. 6.1.

Таблица 6.1 Реализация овальных и мысленных экспериментов

Читайте также:
  1. Cоциологический анализ электорального процесса: проблемы и методы исследования, сферы применения результатов
  2. I. Невербальные методы оценки.
  3. II. 1. Методические указания к выполнению контрольных заданий
  4. II.2. Методика построения напорной и пьезометрической линий
  5. SWOT-анализ и методика его использования. Стратегический анализ, PEST-анализ, SNW-анализ в менеджменте.
  6. А Классификация и общая характеристика основных методов контроля качества.
  7. А) допомозі Німеччини – застосуванню насильницьких методів наведення порядку та дисципліни
  8. А) метод наблюдения
  9. Авторы работ по методике преподавания литературы
  10. Агрентометрия. Методы Мора и Фольгарда
Факторы натуральные кодовые
Номер опытаВы­ходПримечание
опытаХ 1Х 2X .ЗX1X2X3ход
0,55+1+1+1
0,25-1+1+1
3 40,55 0,35740 740+1-1 -1_+1_46 26ДФЭ 2*- 1 для
0,25 0,25740 ;.-1-1 +1+1 -«126 46Построения линейной линейной модели
0,55+1+1-1Линейной модели модели модели
0,25-1+1-1модели
0,55 0,5U740 980.+1-1 0,4-152 53,5Мысленные опыты
0,25-1-1-1Реальный опыт
0745 0,65860 9400.330.2 1-0,1 -0,549.2 69,2Мысленные опыты
0,50880 9800ю670.4 1,4-0,253.5 69,21Реальные опыты

После каждых одного-трех мысленных опытов следует ставить один реальный с тем же шагом для проверки. Обнаружив оптимум, необ­ходимо поставить один или два (с двух сторон от экстремума) реальных опыта для подтверждения наличия оптимума. В процессе движения по градиенту экстремум может быть как внутри интервалов варьирования факторов, так и вне их, т.е. допускается некоторая экстраполяция экспе­риментальной области

Если один из факторов при движении по градиенту достиг своих физических пределов и дальше изменяться не может, то необходимо, фиксировав его из этом предельном уровне, двигаться, меняя оставшие­ся факторы.

Крутое восхождение прекращают, если найден оптимум или если ограничения по факторам делают движение по градиенту нефизичным (нереальным).

Следует иметь в виду, что, сокращая общее число опытов для достижения экстремума, метод крутого восхождения не позволяет обна­ружить экстремум одними мысленными опытами (уравнение регрессии линейно); он указывает лишь на кратчайший путь к оптимуму.

Дата добавления: 2015-04-18 ; просмотров: 9 ; Нарушение авторских прав


источники:

http://lektsii.org/9-29890.html

http://lektsii.com/2-14857.html