В чем сущность экспериментального метода выбора вида уравнения

Корреляция для нелинейной регрессии.

Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем тесноты связи, а именно – индексом корреляции R

(4.18)

где -общая дисперсия результативного признака;

— остаточная дисперсия.

Учитывая связь дисперсии с объемом вариации, можно легко доказать, что индекс корреляции через объемы вариации определяется следующим образом:

(4.19)

Нам уже известно, что величина данного показателя находится в пределах от нуля до единицы. Чем он ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Парабола второй степени, как и полином более высокого порядка, при линеаризации принимает вид уравнения множественной регрессии. Если же нелинейное относительно объясняющей переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого совпадет с индексом корреляции. (Доказательство дано в учебнике Елисеевой И.И. «Эконометрика»)

Обратимся к равносторонней гиперболе . Заменив на z, имеем регрессию вида , для которой может быть определен линейный коэффициент корреляции . По своей величине он будет равен коэффициенту корреляции между у и х , то есть r_y_ч.

Иначе обстоит дело, когда преобразование уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции. Так, для степенной функции после перехода к логарифмически линейному уравнению loqy=loqa+bloqx может быть найден линейный коэффициент корреляции не для фактических значений переменных у и х, а для их логарифмов (то есть r_loqy_._loqx). Квадрат линейного коэффициента корреляции будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не для у, а для его логарифмов. Между тем при расчете индекса корреляции используются суммы квадратов отклонений именно у, а не их логарифмов.

Квадрат индекса корреляции (i 2 ) называют индекс детерминации, он имеет тот же смысл, что и линейный коэффициент детерминации, то есть представляет собой отношение факторной и общей суммы квадратов отклонений.

Индекс детерминации используется для проверки существенности уравнения нелинейной регрессии в целом по F-критерию Фишера

F = (4.20)

где п – число наблюдений;

т – число параметров при переменных х.

Величина m характеризует число степеней свободы для факторной дисперсии, а (n – m – 1) – число степеней свободы для остаточной суммы квадратов. Для степенной функции т=1 и формула F-критерия примет тот же вид, что и при линейной парной зависимости

(4.21)

Для параболы второй степени m=2 и

(4.22)

Расчет критерия Фишера можно вести и в таблице дисперсионного анализа результатов регрессии, как это было показано для линейной функции (лекция 3).

Индекс детерминации можно сравнивать с коэффициентом детерминации для обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем меньше значение линейного коэффициента детерминации по сравнению с индексом детерминации. Близость этих показателей означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Практически если величина i 2 -r 2 ≤0.1 , то предположение о линейной форме связи считается оправданным. Иными словами, если нет уверенности в правильности выбора нелинейной функции, то в целях лучшей интерпретации связи она может быть заменена уравнением прямой.

Вопросы для повторения

1. Какие есть способы выбора вида математической функции в случае парной связи переменных?

2. В чем сущность экспериментального метода выбора вида уравнения?

3. Назовите виды функций, нелинейных относительно объясняющих переменных.

4. Параметризацию каких видов нелинейных регрессий можно выполнить методом наименьших квадратов?

5. С какой целью проводится линеаризация переменных в уравнениях регрессии?

6. Назовите область применения равносторонней гиперболы в эконометрических исследованиях.

7. В чем особенность параболической регрессионной зависимости?

8. Раскройте содержание «кривых Энгеля».

9. Какова интерпретация показателя степени в степенной функции?

10. Назовите показатели корреляции, используемые при нелинейных соотношениях изучаемых признаков.

03. Модель парной линейной регрессии

Методам простой или парной регрессии и корреляции, возможностям их применения в эконометрике посвящен данный раздел.

Любое эконометрическое исследование начинается со Спецификации модели, т. е. с формулировки вида модели исходя из соответствующей теории связи между переменными.

Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной.

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности наблюдений. Например, если зависимость спроса у от цены х будет характеризоваться уравнением , то это означает, что с ростом цены на 1 д. е. спрос в среднем уменьшается на 2 д. е. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых:

, (1.1)

Где – фактическое значение результативного признака;

– теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и х, т. е. их уравнения регрессии;

– случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.

Случайная величина ε, или Возмущение, Включает влияние неучтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных и особенностями измерения переменных.

При правильно выбранной спецификации модели зависит величина случайных ошибок, поэтому, чем они меньше, тем в большей мере теоретические значения результативного признака подходят к фактическим данным .

К ошибкам спецификации будет относится не только неправильный выбор той или иной математической функции для , но и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной.

Наряду с ошибками спецификации могут иметь место ошибки выборки, поскольку исследователь чаще всего работает с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки имеют место и в силу неоднородности данных в исходной статистической совокупности, что, как правило, бывает при изучении эконометрических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла.

Наибольшую опасность в практическом использовании методов регрессии представляют ошибки измерения. Если ошибки спецификации можно уменьшить, изменяя форму модели (вид математической формулы), а ошибки выборки – увеличивая объем исходных данных, то ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками.

Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.

В парной регрессии выбор вида математической функции может быть осуществлен тремя методами:

— аналитическим, т. е. исходя из теории изучаемой взаимосвязи;

При изучении зависимости между двумя признаками Графический метод подбора вида уравнения регрессии достаточно нагляден. Он базируется на поле корреляции.

Класс математических функций для описания связи двух переменных достаточно широк. Кроме уже указанных используются и другие типы кривых:

; ; ; ; ; .

Значительный интерес представляет Аналитический метод выбора типа уравнения регрессии. Он основан на изучении материальной природы связи исследуемых признаков.

При обработке информации на компьютере выбор вида уравнения регрессии обычно проводится экспериментальным методом, т. е. путем сравнения величины остаточной дисперсии Dост, рассчитанной при разных моделях.

Если уравнение регрессии проходит через все точки корреляционного поля, что возможно только при функциональной связи, когда все точки лежат на линии регрессии , то фактические значения результативного признака совпадают с теоретическими , т. е. они полностью обусловлены влиянием фактора х. в этом случае остаточная дисперсия Dост=0. В практических исследованиях, как правило, имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих не учитываемых в уравнении регрессии факторов. Иными словами, имеют место отклонения фактических данных от теоретических (у-). Величина этих отклонений и лежит в основе расчета остаточной дисперсии:

. (1.2)

Чем меньше величина остаточной дисперсии, тем в меньшей мере наблюдается влияние прочих не учитываемых в уравнении регрессии факторов и тем лучше уравнение регрессии подходит к исходным данным.

Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретацией ее параметров.

Линейная регрессия сводится к нахождению уравнения вида

или . (1.3)

Построение линейной регрессии сводится к оценке ее параметров – а и b. Классический подход к оцениванию параметров линейной регрессии основан на Методе наименьших квадратов (МНК).

МНК позволяет получить такие оценки параметров а и b, при которых сумма квадратов отклонений фактических значений результативного признака у от расчетных (теоретических) минимальна:

. (1.4)

Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была минимальной.

Для того чтобы найти минимум функции 1.4, надо вычислить частные производные по каждому из параметров а и b и приравнять их к нулю. Обозначим через S, тогда:

;

; (1.5)

Преобразуя формулу 1.5, получим следующую систему нормальных уравнений для оценки параметров а и b:

. (1.6)

Решая систему нормальных уравнений 1.6 либо методом последовательного исключения переменных, либо методом определителей, найдем искомые оценки параметров а и b. Можно воспользоваться следующими формулами для а и b:

. (1.7)

Формула 1.7. получена из первого уравнения системы 1.6, если все его члены разделить на n:

Где — ковариация признаков;

— дисперсия признака х.

Поскольку , а , получим следующую формулу расчета оценки параметра b:

. (1.8)

Формула 1.8 получается также при решении системы 1.6 методом определителей, если все элементы расчета разделить на n2.

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Знак при коэффициенте регрессии b показывает направление связи: при b>0 – связь прямая, а при b 0, то относительное изменение результата происходит медленнее, чем изменение фактора.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции rxy. Имеются разные модификации формулы линейного коэффициента корреляции, например:

, (1.9)

. (1.10)

Сущность экспериментального метода исследования.

Экспериментальный метод в широком смысле слова, по Т.В. Корниловой, — это изменение каких-либо условий при изучении закономерностей в той или иной области эмпирической реальности.

Экспериментальный метод в узком смысле слова, по Т.В. Корниловой, — это проверка научных гипотез каузального (причинного) характера на основе применения нормативов экспериментального метода.

Суть экспериментального метода заключается в том, что экспериментатор намеренно создает и контролируемым образом изменяет условия, в которых действует изучаемый испытуемый, ставит перед ним определенные задачи и по тому, как они решаются, судит о возникающих при этом процессах и явлениях. Эксперимент (от лат. experimentum — проба, опыт) — исследовательская стратегия, которая характеризуется тем, что в нем осуществляется целенаправленное наблюдение за каким-либо процессом в условиях регламентированного изменения отдельных характеристик условий его протекания. При этом происходит проверка гипотезы. Для практических задач важно то, что, проводя исследование при одинаковых условиях с разными испытуемыми, экспериментатор может установить возрастные и индивидуальные особенности протекания психических процессов у каждого из них.

В психологии применяют два основных типа эксперимента:

— лабораторный эксперимент, который обычно проводится в специально оборудованных помещениях и на испытуемых, которые сознательно участвуют в эксперименте, хотя могут и не знать об истинном назначении эксперимента;

— естественный эксперимент, участники которого не знают о своей роли испытуемых.

Лабораторный эксперимент (от лат. labоrare – работать) — исследовательская стратегия, основанная на моделировании деятельности индивида в специальных условиях. Ведущим признаком лабораторного эксперимента является обеспечение воспроизводимости исследуемой характеристики и условий ее проявлений. Лабораторный эксперимент протекает в специальных условиях, используется специальная аппаратура, действия испытуемого определяются инструкцией, испытуемый знает, что проводится эксперимент, хотя до конца истинного смысла эксперимента может не знать. Эксперимент многократно проводится с большим количеством испытуемых, что позволяет устанавливать общие, достоверные в математико-статистическом плане, закономерности функционирования и развития психических явлений. Традиционно эта стратегия считалась единственно научной.

Лабораторный эксперимент требует специального оснащения, а порой и применения технических приспособлений. Примером лабораторного эксперимента может служить исследование процесса узнавания при помощи специальной установки, которая позволяет на особом экране (тахистоскопе) предъявлять испытуемому разное количество зрительной информации, чтобы выяснить, на каком этапе человек узнает изображаемый предмет. Предметом лабораторного эксперимента выступают общие аспекты поведения и когнитивных процессов, а не индивидуально-специфическое (как, например, в методе беседы). Исследователи, выбирающие эту стратегию, стремятся создать в лабораторных условиях наиболее общий случай.

Однако наряду с достоинствами лабораторный эксперимент имеет и определенные недостатки. Наиболее существенный недостаток этого метода — его искусственность, которая при определенных условиях может привести к нарушению нормального хода психических процессов, а следовательно, к неправильным выводам. Данный недостаток лабораторного эксперимента до известной степени устраняется при организации.

Однако в настоящее время эта стратегия подверглась критике со стороны многих ученых. Известна роль, которую играют социальные условия в когнитивных процессах, а также особая роль самих субъектов исследования и их тенденции действовать так, чтобы соответствовать ожиданиям исследователя. Поэтому считается, что, хотя данная стратегия исследования характеризуется глубоким проникновением в процесс, трудно сравнивать результаты лабораторного эксперимента с результатами, возможными в реальной жизни. Поэтому считается, что в искусственных лабораторных условиях практически невозможно моделировать реальные жизненные обстоятельства, а лишь — отдельные их фрагменты.

Естественный эксперимент, как особая экспериментальная стратегия, был предложен А.Ф.Лазурским в 1910 г. Он реализуется в условиях, близких к обычной деятельности испытуемого, но испытуемый не знает, что участвует в исследовании. За счет этого достигается большая чистота эксперимента.

Естественный эксперимент сочетает в себе положительные стороны метода наблюдения и лабораторного эксперимента. Здесь сохраняется естественность условий наблюдения и вводится точность контролируемого эксперимента. То, что испытуемые не подозревают о том, что они подвергаются психологическому исследованию, обеспечивает естественность их поведения. Вместе с тем, для правильного и успешного проведения естественного эксперимента необходимо соблюдать все те требования, которые предъявляются к лабораторному эксперименту. В соответствии с задачей исследования экспериментатор подбирает такие условия, которые обеспечивают наиболее яркое проявление интересующих его сторон психической деятельности.

Построение естественного эксперимента предполагает ряд этапов:

— функционального анализа деятельности, в которой участвует испытуемый, в аспекте ее требований от исполнителя;

— фиксации ряда наблюдений за деятельностью испытуемого;

— анализа результатов и составление характеристики личности.

Основные исследовательские стратегии при этом дополняются методами наблюдения и беседы с испытуемым. Результаты обрабатываются качественно и количественно.

источники:

http://matica.org.ua/metodichki-i-knigi-po-matematike/ekonometrika-m-a-krivtcova/3-model-parnoi-lineinoi-regressii

http://lektsii.org/18-45524.html