Вид уравнения для описания зависимости

Теоретические и прикладные аспекты применения методов статистических уравнений зависимостей и комплексных статистических коэффициентов

д. э.н., профессор Хмельницкого университета управления и права

ТЕОРЕТИЧЕСКИЕ И ПРИКЛАДНЫЕ АСПЕКТЫ ПРИМЕНЕНИЯ МЕТОДОВ СТАТИСТИЧЕСКИХ УРАВНЕНИЙ ЗАВИСИМОСТЕЙ И КОМПЛЕКСНЫХ СТАТИСТИЧЕСКИХ КОЭФФИЦИЕНТОВ

1. Метод статистических уравнений зависимостей

Для изучения зависимостей социально-экономических явлений можно использовать метод статистических уравнений зависимостей, расчет параметров которых основывается на определении коэффициентов сравнения факторных и результативных признаков путем отношения отдельных значений одноименного признака к его минимальному или максимальному уровню[1] 2.

Коэффициенты сравнения показывают степень изменения (увеличения или уменьшения) величины признака по отношению к принятой базе сравнения. При увеличении значений признака коэффициенты сравнения исчисляют от минимального уровня, а при уменьшении — от максимального. На основе этих коэффициентов определяется параметр уравнения зависимости, представляющий собой отношение суммы отклонений от единицы, вычисленных коэффициентов сравнения результативного и факторного признаков.

В отличие от известных в статистике коэффициентов эластичности параметр уравнения зависимости позволяет учесть влияние на результативный признак не только одного фактора, но и совокупного действия многих факторов.

Применение статистических уравнений зависимости для анализа взаимосвязей социально-экономических явлений требует [2]:

1) качественного анализа исследуемых факторных и результативных признаков;

2) однородности изучаемого явления;

3) оценки устойчивости связи между явлениями.

Первое требование предусматривает наличие логической зависимости между факторными и результативными признаками и использование прямых показателей, позволяющих проводить нормативные расчеты.

Второе требование предполагает исключение из расчетов значений признака (минимальных или максимальных), значительно отличающихся (в два-три раза) соответственно от следующей за минимальной или предшествующей максимальной величины.

Оценка устойчивой или неустойчивой связи между факторным и результативным признаком проводится по шкале зависимостей на основе расчета коэффициента устойчивости связи. Исходными данными для расчета этого коэффициента служат табличные модели определения параметров уравнений зависимости.

Статистические уравнения зависимостей выражают различные виды (однофакторные и многофакторные) и направления связи (линейную, криволинейную и др.). Для расчета параметров уравнений зависимостей целесообразно использовать систему формул, например [2]:

1.Однофакторная линейная связь

а) увеличении факторного и результативного признаков

Уx = Уmin

б) уменьшении факторного и результативного признаков

Уx = Уmax

1.2. Обратная при:

а) увеличении факторного признака и уменьшении результативного

Уx = Уmах

б) уменьшении факторного признака и увеличении результативного

Уx = Уmіп

2. Многофакторная линейная связь

а) при увеличении факторных и результативного признаков

Уxz = Уmin.

б) уменьшении факторных и результативного признаков

Уxz = Уmax.

а) увеличении факторных признаков и уменьшении результативного

Уxz = Уmax

б) уменьшении факторных признаков и увеличении результативного

Уxz = Уmin

3. Комбинационная при:

а) прямой зависимости Y от X и обратной зависимости Y от Z :

Уxz = Уmin

б) обратной зависимости Y от X и прямой зависимости Y от Z :

Уxz = Уmin

Расчет коэффициентов сравнения результативного признака осуществляется с учетом изменения его значений:

а) при увеличении ;

б) при уменьшении 1- .

Для расчета параметров зависимости, оценки тесноты и устойчивости связи используем следующие формулы:

b = ;

B =.

Коэффициент корреляции однофакторный

.

Индекс корреляции (однофакторный и многофакторный)

.

Коэффициент устойчивости связи

K = 1-,

Шкала оценки зависимостей

Коэффициент устойчивости связи

1. Неустойчивая связь

2. Устойчивая связь

Ух, Ухz — уравнения зависимостей однофакторной и многофакторной связи;

Уi— эмпирические значения результативного признака;

Уmin, Уmax — эмпирические значения результативного признака (минимальные и максимальные);

Xi, Zi — эмпирические значения факторных признаков;

Хmin, Zmax — эмпирические значения факторных признаков (минимальные и максимальные);

Хо, Zo — значения факторных признаков, соответствующих максимальному значению результативного признака Уmax при прямой параболической зависимости, а при обратной параболической зависимости — минимальному его значению Уmin;

d — знак отклонений;

b1, b2 — параметры уравнений для отдельных факторных признаков;

В — совокупный параметр уравнения множественной зависимости;

ryx — коэффициент корреляции однофакторной связи;

R — индекс корреляции, совместный для всех видов связи;

dx, dy — размер отклонений коэффициентов сравнения факторного и результативного признаков;

dуx — размер отклонений коэффициентов сравнения теоретических значений результативного признака.

Проведение эконометрических расчетов предлагаем осуществлять по следующим формулам:

Нормативные уровни факторов при нормативной, плановой или заданной величине результативного признака

1.Разность коэффициента сравнения результативного признака

при увеличении значений результативного признака

;

при уменьшении значений результативного признака

.

2.Нормативные уровни факторов

= ;

= .

Нормативные уровни результативного признака при известных (нормативных, плановых или заданных) величинах факторов:

1. Разность коэффициента сравнения факторных признаков

а) при увеличении значений результативного признака

;

;

б) при уменьшении значений результативного признака

;

.

2. Размер отклонений коэффициентов сравнения

3. Нормативные уровни результативного признака

а) при увеличении значений результативного признака

б) при уменьшении значений результативного признака

Расчеты параметров статистических уравнений зависимости, показателей тесноты и устойчивости связи осуществляют с применением програмного обеспечения [2, 3].

Статистические уравнения зависимостей позволяют:

1) оценить взаимосвязь между факторными и результативными признаками при наличии малочисленной и многочисленной совокупности единиц наблюдения;

2) установить уровень и, соответственно, размер изменения результативного признака при изменении одного или многих факторов на единицу;

3) установить размер изменения факторных признаков при изменении результативного признака на единицу или же другую заданную величину (обратная задача);

4) определить нормативные уровни факторных признаков, формирующих планируемую, заданную или нормативную величину результативного признака;

5) установить интенсивность использования факторных признаков для достижения средней величины результативного признака путем сопоставления вычисленных оптимальных (нормативных) уровней факторных признаков с их фактическими средними значениями;

6) оценить устойчивость связи между факторными и результативными признаками. Это дает возможность отграничить устойчивую зависимость от неустойчивой;

7) определить средние темпы прироста (снижения) результативного признака в результате действия изучаемых факторов для каждого объекта исследования (организации, предприятия и т. п.);

8) построить графическое изображение исследуемой зависимости (однофакторной и многофакторной).

Для выполнения расчетов необходимо:

1) отобрать количественные показатели, характеризующие результаты работы организаций и предприятий;

2) вычислить по отобранным показателям средние и относительные величины, дающие качественную характеристику хозяйственно-финансовой деятельности;

3) определить форму (линейную, криволинейную) и направление связи (прямую и обратную) между факторными и результативными признаками;

4) определить параметры однофакторных и многофакторных уравнений зависимости, соответствующие форме и направлению связи;

5) установить сумму отклонений между эмпирическими (У) и теоретическими (Ух) значениями результативного признака;

6) используя модели определения параметров уравнений однофакторной и многофакторной зависимости, вычислить коэффициенты устойчивости связи.

Коэффициент устойчивости связи показывает степень влияния одного или многих факторов на результативный признак. Его вычисляют путем отношения разности отклонений коэффициентов сравнения эмпирических и теоретических значений результативного признака к сумме отклонений коэффициентов сравнения результативного признака с последующим вычитанием от единицы.

Критериями выбора вида уравнения зависимости являются:

1) наименьшая сумма линейных отклонений эмпирических значений результативного признака от его теоретических значений;

2) совпадение значений коэффициента и индекса корреляции (их различие не должно превышать 0,01).

Минимизация суммы отклонений эмпирических значений результативного признака от его теоретических значений при использовании компьютеров осуществляется автоматически перебором четырнадцати (прямой линии, гиперболы, параболы, логической функции) видов и направлений однофакторной связи с выбором наилучшего уравнения зависимости, обеспечивающего минимум суммы отклонений.

Модели расчета параметров статистических уравнений однофакторной зависимости соответствующих видов и направлений связи являются исходными для расчета показателей тесноты связи (коэффициента и индекса корреляции). Их расчет осуществляется как с целью оценки тесноты связи, так и для подтверждения правильности выбора типа уравнения зависимости.

2. Метод комплексных статистических коэффициентов

Эффективное обеспечение политической и экономической безопасности страны и конкурентоспособности хозяйствующих субъектов требует своевременной и объективной комплексной их оценки. Сложность такой оценки заключается в поиске обобщающего показателя социально-экономического развития, с помощью которого можно было бы рациональным способом объединить разнородные показатели в один — комплексный. Для решения этой задачи можно применить метод комплексных статистических коэффициентов [1].

Применение метода комплексных статистических коэффициентов предполагает расчет комплексного коэффициента весомости отклонений уровней абсолютных, относительных и средних показателей социально-экономического развития страны (регионов) и хозяйственно-финансовой деятельности предприятий (организаций) по следующим направлениям [3]:

1) комплексную оценку значимости отклонений абсолютных относительных и средних величин показателей статики и динамики, стандартизированных размахом вариации:

; (1)

2) комплексную оценку весомости отклонений на основе стандартизации уровней показателей от среднего значения по совокупности стран (регионов):

а) при положительном значении росте показателя:

(2)

б) при отрицательном значении росте показателя:

(3)

3) комплексную оценку весомости отклонений относительных величин выполнения задач, планов и нормативов:

. (4)

Выбор формул 1-3 комплексного статистического коэффициента зависит от:

1) формы выражения показателей исходных данных (абсолютные, относительные и средние величины или относительные величины выполнения задач планов или нормативов);

2) наличия в исходных данных соответствующих средних значений показателей по совокупности стран (регионов) или предприятий (организаций).

Обеспечение принципа объективности требует также полноты исходных данных.

Первая формула комплексного статистического коэффициента весомости отклонений абсолютных, относительных и средних величин показателей, стандартизированных размахом вариации применяется в случаях отсутствия средних значений показателей по совокупности стран (регионов) или предприятий (организаций), оценки устойчивости курса валют и т. п. Формула состоит из двух частей, одна из которых применяется для показателей-стимуляторов социально-экономического развития региона (например, прирост объема инвестиций), а другая — для дестимуляторов (например, прирост индекса потребительских цен) [2]:

, (1)

где Квj — коэффициент весомости отклонений значений показателей объекта исследования;

хіj — значение показателя социально-экономического развития страны (региона);

xmax i хmin — соответственно максимальное и минимальное значение показателя социального и экономического развития.

С уменьшением размера отклонений показателя социально-экономического развития в отдельных странах (регионах) от максимального его уровня (при положительном значении рост показателя), минимального уровня (при отрицательном значении рост показателя), в совокупности стран (регионов) комплексный коэффициент весомости отклонений уменьшается. Чем ниже этот коэффициент, тем выше уровень социально-экономического развития страны (региона), что свидетельствует также о высоком месте этого региона в их совокупности.

Применение второй и третьей формулы предусматривает определение рейтинга стран (регионов) по показателям, характеризующим результаты социально-экономического развития, путем расчета отклонений индивидуальных значений показателей от их средних уровней по совокупности последующим формулам [3]:

а) при положительном значении росте показателя:

(2)

б) при отрицательном значении росте показателя:

(3)

где — комплексный коэффициент весомости отклонений абсолютных, относительных и средних величин статики и динамики развития региона (на основе отклонений от средних значений);

— значение показателя социально-экономического развития региона;

— соответственно минимальное и максимальное значение показателя социально-экономического развития региона;

— среднее значение показателя социально-экономического развития по стране;

— значение показателя социально-экономического развития региона, соответственно меньше или равно и более от среднего значения по совокупности регионов.

Уровень весомости отдельных отклонений значений относительных величин интенсивности регионального развития, превышающие средний уровень по совокупности объектов исследования () при положительном значении росте показателя, а также если значение показателя меньше или равно среднему уровню — для показателей-дестимуляторов, возводятся в квадрат. Этим уменьшается значимость отклонений показателя, при положительном росте значений превышает средний по совокупности уровень, а также для отдельного объекта исследования по показателю-дестимулятору, значение которого меньше или равно среднему уровню.

Несмотря на то, что регионы формируют среднее значение показателей социально-экономического развития с разной степенью интенсивности (одни регионы имеют показатели выше средних, другие — ниже среднего уровня), в формулу расчета комплексного коэффициента заложен механизм, который предусматривает улучшение рейтинговой оценки за превышение регионом среднего уровня показателя в их совокупности. Расчеты комплексного коэффициента весомости отклонений от среднего уровня показателей по предлагаемым формулам свидетельствуют: что чем он ниже, тем выше уровень социально-экономического развития региона и является свидетельством высокого места этого региона в их совокупности.

Определение рейтинга объектов комплексной оценки по показателям, выраженными относительными величинами выполнения задания, плана или норматива, осуществляется по четвертой формуле:

(4)

Кв — комплексный коэффициент весомости отклонений показателей выполнения задания, плана или норматива региона;

— значение показателя социально-экономического развития региона;

хmax — максимальное значение показателя.

Уровень весомости отдельных отклонений значения процента выполнения задания или планового (нормативного) показателя хозяйственно-финансовой деятельности, превышает 100 % (),от максимального значения этого показателя в совокупности регионов возвышается к квадрату. Этим уменьшается значимость отклонений процента выполнения показателя, превышает 100% от его максимального значения в совокупности регионов по сравнению с весомостью отклонений, полученных разницей от 100 %.

С уменьшением размера отклонений показателя по отдельным регионам от 100 %, максимального значения показателя при перевыполнении задания, плана или норматива хmax>100 в совокупности регионов комплексный коэффициент весомости отклонений уменьшается. Чем ниже этот коэффициент, тем выше уровень эффективности организационно-управленческой деятельности, что свидетельствует о высоком месте этого региона среди других.

По тем показателям, рост значений которых имеет отрицательный эффект (например, прирост уровня безработицы), следует принять обратные величины выполнения задания, плана или норматива.

Выводы. Оценка уровня социально-экономического развития районов области и городов областного значения проводится аналогично с комплексной оценкой регионов страны с использованием системы показателей по результатам работы местных государственных администраций.

Для разграничения основных и дополнительных показателей можно применить метод статистических уравнений зависимостей, который позволяет определить степень устойчивого или неустойчивого взаимосвязи показателей. При этом основными показателями будут те, для которых наблюдается стойкая зависимость, а дополнительными — ее отсутствие.

Комплексная территориальная оценка методом комплексных статистических коэффициентов результатов социально-экономического развития стран (регионов) предусматривает также осуществление:

1) оценки абсолютных, средних и относительных показателей хозяйственно-финансовой деятельности предприятий, фирм, организаций;

2) оценки выполнения задач (планов) производства (поставки) продукции или услуг;

3) оценки равномерности выполнения заданий (планов) производства (поставки) продукции или услуг;

4) оценки устойчивости курса валют, акций и ценных бумаг.

Комплексная оценка эффективности организационной и производственно-хозяйственной деятельности является действенным средством управления. Она предусматривает выбор и совершенствование методов конструирования обобщающих оценок, а также их использования в практической работе органов государственной статистики, менеджеров и экономистов-аналитиков как на государственном, так и на региональном уровне.

1. Кулинич оценка факторов хозяйственной деятельности заготовительных организаций. – М.: Финансы и статистика, 1983. – 192 с.

2. Кулинич О. І. Теорія статистики: [підруч.] / О. І. Кулинич, Р. О. Кулинич. — [5–тє вид., перероб. і доп.]. — К.: Знання, 20 с.

3. Кулинич Р. О. Статистичні методи аналізу взаємозв’язку показників соціально-економічного розвитку: [монограф.]. — К.: Формат, 20 с.

[1]Относительные величины сравнения определяют соотношением уровней одноименных величин явления за один и тот же период или момент времени по различным объектам (территориям), один из которых принимается за базу сравнения. Их использование позволяет устранить несравнимость в проведении статистических расчетов показателей, выраженных разноименными величинами (кг, шт, %, денежном выражении и т. п.)

Разностные уравнения

Содержание:

Разностные уравнения

Понятие разницы и разностного уравнения

Если для значений переменной x1, x2, x3, . функция f (x) принимает значения f (x1), f (x2), f (x3) . , то приращения функции составляют f (x2) – f (x1), f (x3) – f (x2), .

Приращение функции при переходе от значения xi к значению xi+1 будем обозначать: В частности можно взять в качестве значения независимых переменных x и x + 1 . Разность Δf (x) = f (x + 1) — f (x) называется первой разностью или разностью первого порядка. Она может рассматриваться в свою очередь как функция от x, а потому и для нее можно определить разницу:

Введем обозначения ΔΔf (x) = Δ 2 f (x), тогда Δ 2 f (x) = f (x + 2) — 2 f (x + 1) + f (x) и называется разностью второго порядка.

Аналогично можно найти разности третьего, четвертого и т. д. порядков.

Определим разности некоторых важнейших функций.

1) Если f (x) = С, где С — постоянная величина, то
Δf (x) = f (x + 1) – f (x) = С – С = 0.

Понятно, что и все разности следующих порядков будут также равняться нулю.

2) Если f (x) = ax + b, то
Δf = Δf (x + 1) — f (x) = a (x + 1) + b — ax — b = a.

Разница первого порядка линейной функции равна постоянной, а все остальные будут равны нулю.

3) Если f (x) = ax 2 + bx + c, то

Поскольку разница первого порядка является линейной функцией, то разница второго порядка — постоянная, а все последующие разности равны нулю.

4) Если f (x) = a x , то

В экономических исследованиях часто встречаются задачи, в которых время t является независимой переменной, а зависимая переменная определяется для времени t, t + 1, t + 2 и т. д.

Обозначим yt — значение функции y в момент времени t; yt+1 — значение функции в момент, сдвинутый на одну единицу, например, на следующий час, на следующую неделю и т. д., yt+2 — значение функции y в момент, сдвинутый на две единицы и т. д.

Очевидно, что

Откуда:

За разность второго порядка, имеем или
поэтому

Аналогично можно доказать, что

Итак, любую функцию

можно представить в виде: (7.50)
и наоборот.

Определение. Уравнение
(7.51)
называется разностным уравнением n-го порядка.

Решить разностное уравнение n-го порядка — это значит найти такую ​​функцию yt, которая превращает уравнение (7.50) или (7.51) в тождество.

Решение, в котором есть произвольная постоянная, называется общим; решение, в котором постоянная отсутствует, называется частным.

Определение. Уравнение
(7.52)
где a0, a1, . an — постоянные числа, называется неоднородным разностным
уравнением n-го порядка с постоянными коэффициентами.

Если в уравнении (7.52) f (t) = 0, то уравнение называется однородным разностным уравнением n-го порядка с постоянными коэффициентами:
(7.53)

Уравнение есть однородное разностное уравнение первого порядка с постоянными коэффициентами a и b, а уравнение неоднородное разностное уравнение второго порядка с постоянными коэффициентами a, b, c.

ТЕОРЕМА 1. Если решениями однородного разностного уравнения (7.53) является y1 (t) и y2 (t), то его решением будет также функция y1 (t) + y2 (t).

ТЕОРЕМА 2. Если y (t) является решением однородного разностного уравнения (7.53), то его решением будет также функция Ay (t), где А — произвольная постоянная.

ТЕОРЕМА 3. Если y (t) — частное решение неоднородного уравнения (7.52) и y (t, A1, A2, . An) — общее решение однородного уравнения (7.53), то общим решением неоднородного разностного уравнения будет функция: y (t) + y (t, A1, A2, . An).

Эти теоремы схожи с теоремами для дифференциальных уравнений, которые были приведены нами в предыдущем разделе.

Разностные уравнения первого порядка с постоянными коэффициентами

Рассмотрим неоднородное разностное уравнение
(7.54)

Соответствующее ему однородное уравнение будет:
(7.55)

Возьмем функцию и убедимся, что она будет решением уравнения (7.55). Поскольку , тогда . Подставим yt и yt-1 в уравнение (7.55):
Итак, является решением уравнения (7.55).

По теореме (2) общее решение однородного разностного уравнения (7.55) является функция , где А — произвольная постоянная.

Пусть — частное решение неоднородного разностного уравнения (7.54). По теореме (3) общим решением неоднородного разностного уравнения (7.54) будет функция

Частное решение найти нетрудно, если f (t) = α, где α — некоторая постоянная. На самом деле, если где u — постоянная. Подставим в уравнение (7.54), имеем: u — au = α, откуда
Итак, общее решение уравнения (7.54) запишем в виде: .

Разностные уравнения второго порядка с постоянными коэффициентами

Пусть задано неоднородное разностное уравнение второго порядка с постоянными коэффициентами:
(7.56)
и соответствующее ему однородное уравнение
(7.57)

Убедимся, что функция будет решением уравнения (7.58). Подставим в уравнение (7.57) (λ ≠ 0), получим Поскольку λ ≠ 0, то поделим на λ t-2 , имеем λ 2 + aλ + b = 0 (7.58)

Это уравнение называется характеристическим уравнением для уравнения (7.57).

Здесь могут иметь место следующие три случая:

1. D = a 2 – 4b > 0, тогда уравнение (7.58) будет иметь два действительных различных корня.
Общее решение уравнения (7.57) запишется в виде:

а общее решение неоднородного уравнения (7.56) запишется так:

2. D = a 2 – 4b = 0, тогда и и

В этом случае однородное уравнение (7.57) примет вид:
(7.59)
Тогда

Легко убедиться, что решением уравнения (7.59) является также функция
Поэтому общим решением уравнения (7.59) является функция а общим решением неоднородного уравнения (7.56) функция

3. D = a 2 – 4b 2 – 5λ + 6 = 0 будет иметь действительные разные корни (D = 25 – 24 = 1 > 0), λ1 =2, λ2 = 3.
Общим решением однородного уравнения является функция

Далее положим, что yt = y — частное решение неоднородного уравнения, тогда

Таким образом, общим решением неоднородного уравнения является функция Постоянные A1 и A2 определим из начальных условий: y0 = 5, y1 = 9. Тогда для t = 0 и t = 1 соответственно будем иметь:

Решим эту систему уравнений относительно A1 и A2:

Откуда

Итак, — общее решение заданного в условии разностного уравнения.

Примеры применения разностных уравнений в экономических задачах

Пример 1. Пусть некоторая сумма средств выдается под сложный процент p, то к концу t-го года ее размер будет составлять:
Это однородное разностное уравнение первого порядка. Его решением будет функция , где A — некоторая постоянная, которую можно найти из начальных условий.

Если положить y0 = F , то A = F, откуда

Это известная формула величины фонда F, который выдается под сложный процент.

Пример 2. Пусть величина предложения сельскохозяйственной продукции в t-м году есть функция цены прошлого года а спрос на эту продукцию есть функция цены в этом году. Следовательно, спрос: а предложение

Цена равновесия для данной продукции определяется равенством:
а это разностное уравнение первого порядка.

Положим, что функция спроса определяется формулой а функция предложения — формулой

Цена равновесия запишется: то есть Решением этого уравнения является функция Постоянная A определяется из начальных условий, для t = 0 цена составляет p0.

Тогда p0 = A и решением уравнения является функция
Если начальная цена p0 = 0, то pt = 0 для всех значений t.

Следовательно, цена не подлежит изменению.

Вообще говоря, функция предложения — возрастающая, а потому b > 0; а функция спроса — убывающая, и поэтому a

Присылайте задания в любое время дня и ночи в ➔

Официальный сайт Брильёновой Натальи Валерьевны преподавателя кафедры информатики и электроники Екатеринбургского государственного института.

Все авторские права на размещённые материалы сохранены за правообладателями этих материалов. Любое коммерческое и/или иное использование кроме предварительного ознакомления материалов сайта natalibrilenova.ru запрещено. Публикация и распространение размещённых материалов не преследует за собой коммерческой и/или любой другой выгоды.

Сайт предназначен для облегчения образовательного путешествия студентам очникам и заочникам по вопросам обучения . Наталья Брильёнова не предлагает и не оказывает товары и услуги.

Корреляция — определение и вычисление с примерами решения

Содержание:

Понятие о корреляции:

Марксистская философия учит, что каждое явление природы и общества не возникает само по себе, отдельно от других, а находится в связи с другими явлениями, причем каждое из них представляет собой единство составляющих его частей и свойств. Для того чтобы познать какое-либо явление, необходимо изучить его не только во всех сложных взаимоотношениях с окружающими явлениями-факторами, но также во взаимосвязи всех его сторон.

Если всеобщая связь и взаимозависимость явлений составляют один из наиболее общих законов, то основной задачей науки является изучение этой взаимосвязи.

В математической статистике взаимосвязь явлений изучается методом корреляции. Термин корреляция происходит от английского слова correlation — соотношение, соответствие. Особенность изучения связи явлений методом корреляции состоит в том, что нельзя изолировать влияние посторонних факторов либо потому, что эти факторы неизвестны, либо потому, что их изоляция невозможна. Поэтому метод корреляции применяется для того, чтобы при сложном взаимодействии посторонних влияний выяснить, какова была бы зависимость между результатом фактором, если бы посторонние факторы не изменялись и своим изменением не искажали основную зависимость. При этом небольшое число наблюдений не дает возможности обнаружить закономерность связи.

Первая задача корреляции заключается в выявлении на основе наблюдения над большим количеством фактов того, как изменяется в среднем результативный признак в связи с изменением данного фактора. Это изменение предполагает условие неизменности ряда других факторов, хотя искажающее влияние этих других факторов на самом деле имеет место. Вторая задача заключается в определении степени влияния искажающих факторов.

Первая задача решается нахождением уравнения связи.

Вторая задача решается при помощи различных показателей тесноты связи.

Такими показателями являются меры тесноты связи, найденные разными исследователями, а также коэффициент корреляции и корреляционное отношение.

Результативный и факториальный признаки

При изучении влияния одних признаков явлений на другие из цепи признаков, характеризующих данное явление, выделяются два признака — факториальный и результативный. Необходимо установить, какой из признаков является факториальным и какой результативным. В этом помогает прежде всего логический анализ.

Пример. Себестоимость промышленной продукции отдельного предприятия зависит от многих факторов, в том числе от объема продукции на данном предприятии. Себестоимость продукции выступает в этом случае как результативный признак, а объем продукции — как факториальный.

Другой пример. Чтобы судить о преимуществах крупных предприятий перед мелкими, рассмотрим, как увеличивается производительность труда рабочих крупных предприятий, и выявим зависимость производительности труда от увеличения размеров предприятия.

Таблица!

Группировка магазинов Министерства торговли по числу рабочих мест на 1 января 1960 г.1

Группы магазинов по числу рабочих мест Число магазинов Товарооборот в расчете на одного работника за квартал (в тыс. руб.)

Всего 68 375 117

Из них

с числом рабочих мест:

  • с 1 19 893 109
  • с 2 18 030 108
  • с 3—4 16 508 108
  • с 5—7 8 321 111
  • с 8—10 2 868 118
  • с 11 — 15 1 559 122
  • с 16 и более 1 196 139
  • J

Группировка показывает прямую зависимость производительности труда торговых работников, выражающуюся в товарообороте, приходящегося на одного работника, от размера магазина. Признак группировки — число рабочих мест — является факториальным, товарооборот — результативным признаком.

От размеров производства зависит также производительность оборудования, о чем свидетельствует следующая таблица:

Из таблицы ясно видна связь между размерами печей и их производительностью. Эта связь прямая: чем крупнее печь, тем она производительнее.

Однако зависимость результативного признака (суточного съема стали) от факториального носит не обязательный характер. Если в общей массе мы наблюдаем эту связь, то в отдельных группах бывают и отступления от общей закономерности. Такие отступления—характерная особенность статистической связи вообще, о которой будет рассказано ниже.

Группировки позволяют выявить и зависимость нескольких результативных признаков от одного факториального. Рассмотрим табл. 3.

В этой таблице мы видим зависимость двух результативных признаков: товарооборота на одного работника и товарных запасов—от размеров магазинов. Зависимость товарооборота от размеров магазина прямая, а зависимость товарных остатков от размеров магазина — обратная. В первом случае она растет с ростом размеров магазина, во втором уменьшается. Однако то и другое благоприятно.

Графическое изображение связи

Графическое изображение изучаемых явлений позволяет не только установить наличие или отсутствие связи между ними, но и изучить характер этой связи, иначе говоря изучить форму связи и ее тесноту.

Имея перед собой числовые характеристики факториального и результативного признаков одного и того же явления, можно каждую пару чисел изобразить в виде точки на плоскости. Для этого на плоскости берем две взаимно перпендикулярные линии и образуем систему координат. В этой системе по оси абсцисс откладываем значения факториального признака, а по оси ординат— значения результативного признака. Каждая пара чисел дает при этом точку на плоскости координатного поля.

Возьмем, например, группировку магазинов по числу рабочих мест, данную на стр. 239, и будем откладывать число рабочих мест по горизонтальной оси (оси Ох), а товарооборот в расчете на одного работника — по вертикальной оси (оси Оу). Будем иметь ряд точек, соединив которые получим ломаную линию, которая называется ломаной регрессии (см. график 1).

Как видно из графика, с ростом числа рабочих мест в магазине растет и товарооборот, приходящийся на одного работника, что говорит о связи между этими признаками, причем связи прямой. График подчеркивает эту зависимость ходом ломаной линии из нижнего угла в верхний правый угол.

Такого же рода зависимость будем наблюдать на графике 2, изучая связь между величиной мартеновских печей по площади пода и среднесуточным съемом стали с 1 пода. Как и в предыдущем примере, факториальный признак — величину площади пода — будем откладывать на оси абсцисс, а результативный — среднесуточный съем стали с 1 пода — на оси ординат.

Здесь также ясно выраженная прямая зависимость между результативным и факториальным признаками.

По-другому будет выглядеть график зависимости товарных запасов от размера товарооборота магазина.

Здесь мы наблюдаем ярко выраженную обратную связь между признаками: падение товарных запасов сопровождается ростом размера магазина по товарообороту.

Графический метод наглядно иллюстрирует зависимость, выявленную группировкой. Недостаток графического метода изучения связи заключается в том, что он позволяет выявить связь лишь между двумя признаками.

Функциональные и статистические связи

До сих пор говорилось о связях между явлениями и их признаками без объяснения формы и степени этих связей. В приведенных примерах связи носят логически обоснованный характер, но числовое выражение этих связей говорит о том, что они проявляются не всегда одинаково. В определенных случаях имеются отступления от наблюдаемых общих закономерностей. В приведенной на стр. 240 таблице о среднесуточном съеме стали с 1 пода печи наблюдается зависимость съема стали от размера печи по площади пода, но эта зависимость за 1955 г. искажена показателями 5-й группы, где съем стали значительно ниже, чем в 4-й группе. Если бы рассматривалась при этом каждая печь в отдельности, то это несоответствие установленному правилу зависимости проявлялось бы неоднократно. Но средние величины съема стали, вычисленные на основании данных довольно большого числа печей в группе, говорят о явно выраженной зависимости. Связи между явлениями, или их признаками. проявляющиеся в изменении в зависимости от одного признака характеристик распределения (из которых главная — средняя) другого признака, называются связями статистическими.

Статистические связи характеризуются тем, что в них результативный признак не полностью определяется влиянием признака факториального. Это влияние проявляется лишь в среднем, а в отдельных случаях получаются результаты, даже противоречащие установленной связи.

В отличие от статистических связей связи функциональные характеризуются тем, что при таких связях факториальный признак полностью определяет величину результативного признака.

Функциональные связи почти не встречаются в явлениях общественной жизни, отличающихся сложностью и многообразием существующих и проявляющихся взаимосвязей. Но во многих явлениях в основе статистических связей лежат функциональные связи. Связь функциональная может показывать зависимость между результативным признаком и несколькими аргументами. Так, площадь прямоугольника зависит от длины его двух сторон, путь, проходимый телом, зависит от скорости его движения и времени движения и т. д.

Уравнение связи

Наблюдая статистическую связь между двумя признаками, математическая статистика стремится придать этой связи форму функциональной, т. е. связи, выражаемой при помощи математической функции.

На помощь приходит ее графическое изображение при отыскании нужной функции связи. При этом необходимо стремиться найти такую функцию, которая давала бы наименьшее отклонение от полученных при наблюдении значений их признаков, которая выражала бы основную зависимость, проявляющуюся в эмпирическом материале. Уравнение этой функции будет уравнением связи между результативным и факториальным признаками.

Уравнение связи находится с помощью способа наименьших квадратов, который требует, чтобы сумма квадратов отклонений эмпирических значений от значений, получаемых на основании уравнения связи, была минимальной.

Применение способа наименьших квадратов позволяет находить параметры уравнения связи при помощи решения системы так называемых нормальных уравнений, различных для связи каждого вида.

Чтобы отметить, что зависимость между двумя признаками выражается в среднем, значения результативного признака, найденные по уравнению связи, обозначаются

Зная уравнение связи, можно вычислить заранее среднее значение результативного признака, когда значение факториального признака известно. Таким образом, уравнение связи является методом обобщения наблюдаемых статистических связей, методом их изучения.

Применение той или иной функции в качестве уравнения связи разграничивает связи по их форме: линейную связь и криволинейную связь (параболическую, гиперболическую и др.).

Рассмотрим уравнения связи для зависимостей от одного признака при разных формах связи (линейной, криволинейной параболической, гиперболической) и для множественной связи.

Линейная зависимость

Уравнение связи как уравнение прямой применяется в случае равномерного нарастания результативного признака с увеличением признака факториального. Такая зависимость будет зависимостью линейной (прямолинейной).

Параметры уравнения прямой линии находятся путем решения системы нормальных уравнений, получаемых по способу наименьших квадратов:

где n — число полученных при наблюдении пар взаимосвязанных величин; — сумма значений факториального признака;

— сумма квадратов значений факториального признака;

— сумма значений результативного признака; — сумма произведений значений факториального признака на значения результативного признака.

Примером расчета параметров уравнения и средних значений результативного признака может служить следующая таблица, являющаяся результатом группировки по факториальному признаку и подсчета средних по результативному признаку.

Группировка предприятий по стоимости основных средств и подсчет сумм необходимы для уравнения связи.

Из таблицы находим: 132,0. Строим систему двух уравнений с двумя неизвестными:

Поделив каждый член в обоих уравнениях на коэффициенты при получим:

Вычтем из второго уравнения первое: Подставив значения в первое уравнение найдем

Уравнение связи примет вид: Подставив в это уравнение соответствующие х, получим значения результативного признака, отражающие среднюю зависимость у от х в виде корреляционной зависимости.

Заметим, что суммы, исчисленные по уравнению и фактические, равны между собой. Изображение фактических и вычисленных значений на графике 4 показывает, что уравнение связи отображает наблюденную зависимость в среднем.

Параболическая зависимость

Параболическая зависимость, выражаемая уравнением параболы 2-го порядка имеет место при ускоренном возрастании или убывании результативного признака в сочетании с равномерным возрастанием факториального признака.

Параметры уравнения параболы вычисляются путем решения системы 3 нормальных уравнений:

Возьмем для примера зависимость месячного выпуска продукции (у) от величины стоимости основных средств (х). Оба показателя округлены до миллионов рублей. Расчеты необходимых сумм приведем в таблице 5.

По данным таблицы, составляем систему уравнений:

После деления всех уравнений на коэффициенты при получим:

Вычтя из второго уравнения первое и из третьего второе, получим два новых уравнения с двумя неизвестными:

Полученные уравнения снова разделим на коэффициенты при

Следовательно,

Запишем уравнение параболы, выражающей связь между х и у.

Графическое сопоставление опытных данных и данных расчета (см. график 5) показывает почти полное совпадение хода обеих линий, что говорит о хорошем воспроизведении опытных данных расчетными средними значениями результативного признака.

В практике изучения связи между признаками, кроме параболы 2-го порядка, применяются параболы и более высоких порядков. Чем выше порядок параболы, тем точнее он воспроизводит опытные данные.

Если уравнение связи представляет собой параболу 3-го порядка то система нормальных уравнений примет вид:

Имея соответствующие хну, можем составить Дополнительную расчетную таблицу по следующей схеме:

которая используется для нахождения нужных сумм. Решив систему 4 уравнений, найдем параметры и, следовательно, уравнение связи.

Уравнение гиперболы

Обратная связь указывает на убывание результативного признака при возрастании факториального. Такова линейная связь при отрицательном значении В ряде других случаев обратная связь может быть выражена уравнением гиперболы

Параметры уравнения гиперболы находятся из системы нормальных уравнений:

где — сумма величин, обратных значениям факториального признака, а — сумма их квадратов.

Примером расчета обратной связи по гиперболе может служить следующая таблица:

Составив по данным таблицы систему уравнений и разделив каждый член обоих уравнений на коэффициенты при а, получим:

Находим вычитанием из второго уравнения первого величину

Подставив вместо его значение, получим

Запишем уравнение связи в общем виде затем, подставив каждое значение х в уравнение, находим по любой строке таблицы. Строим ломаную по парам х и у и кривую по х и . Ломаная и кривая очень близки друг к другу.

Корреляционная таблица

При большом объеме наблюдений, когда число взаимосвязанных пар велико, парные данные легко могут быть расположены в корреляционной таблице, являющейся наиболее удобной формой представления значительного количества пар чисел.

В корреляционной таблице один признак располагается в строках, а другой — в колонка таблицы. Число, расположенное в клетке на пересечении графы и колонки, показывает, как часто встречается данное значение результативного признака в сочетании с данным значением факториального признака.

Для простоты расчета возьмем небольшое число наблюдений на 20 предприятиях за средней месячной выработкой продукции на одного рабочего (тыс. руб. — у) и за стоимостью основных производственных средств (млн. руб. — х).

В обычной парной таблице эти сведения располагаются так:

Сведем эти данные в корреляционную таблицу.

Итоги строк у показывают частоту признака итоги граф х — частоту признака Числа, стоящие в клетках корреляционной таблицы, являются частотами, относящимися к обоим признакам и обозначаются

Корреляционная таблица даже при поверхностном знакомстве дает общее представление о прямой и обратной связи. Если частоты расположены по диагонали вниз направо, то связь между признаками прямая (при увеличивающихся значениях признака в строках и графах). Если же частоты расположены по диагонали вверх направо, то связь обратная.

Для предварительного суждения о связи по корреляционной таблице можно для каждого столбца рассчитать средние значения Так, в первом столбце х = 9,9, а имеет лишь одно значение, равное 0,8. Найдем среднее значение для второго столбца. Оно будет равно:


Следовательно, при Выпишем все значения х и соответствующие им

Зависимость, выраженная в таблице, более ярко и убедительно выступит в «ломаной регрессии», когда каждую пару чисел нанесем на график (см. график 7).

По корреляционной таблице можно вести расчеты параметров уравнения связи, как уравнения прямой, так и уравнений параболы и гиперболы. При этом необходимо учитывать, что сочетание каждой пары значений может встречаться не один, а несколько раз. Сами значения хну необходимо взвешивать, т. е. умножать на соответствующие частоты. Для самого признака х частота будет обозначаться для признака Частоту сочетаний обозначим

Ввиду сказанного мы можем систему нормальных уравнений написать так, чтобы были учтены веса. Тогда для линейной зависимости система нормальных уравнений примет вид:

где N — число произведенных наблюдений (число пар). В приведенной корреляционной таблице N = 20. будет суммой произведений соответствующих х на их частоты. В данной таблице эта сумма составит:

9,9 +10,0 • 4 +10,1 • 4 + 10,2 • 4 +10,3 • 1 +10,4 • 3 +10,5 • 3 = 204.

—сумма произведений у на соответствующие частоты. В нашем примере она равна:

включает сумму произведений всех х на у и на для тех клеток корреляционной таблицы, в которых записаны частоты. Рассчитаем суммы произведений для 1-й и 2-й строки

  • Для 1 -и строки:
  • Для 2-й строки:

Нетрудно заметить, что в каждой строке у повторяется столько раз, сколько раз мы его суммируем, а, следовательно, у можно вынести за скобку.

  • Для 1-й строки: 0,8 (9,9 • 1 +10,0 • 2) =23,92.
  • Для 2-й строки:

Следовательно, сумма произведений может быть записана при постоянном у, как Заметим, что сумма произведений может быть записана и рассчитана как произведение

Продолжим расчет для последующих строк.

  • Для 3-й строки
  • Для 4-й строки
  • Для 5-й строки
  • Для 6-й строки

Общая сумма по всем строкам

Система нормальных уравнений может быть записана по результатам подсчета в таком виде:

Для расчета параметров уравнения линейной связи делим каждое из уравнений на коэффициенты при

Уравнение связи определяет среднюю зависимость выработки рабочего от стоимости основных средств. Вычислительная работа облегчается, если в самой корреляционной таблице путем записи дополнительных граф и строк производить нужные подсчеты для решения системы уравнений.

Число наблюдений N может быть подсчитано и по столбцу как его сумма. Она равна итогу по строке Для определения необходимо ввести новую строку Итог этой строки и дает искомую сумму.

Следующая дополнительная строка представляет возможность определить Далее, и может быть определена на основе расчета двух дополнительных граф:

В корреляционной таблице (см. табл. 8) в последних строках дается расчет для построения ломаной регрессии — для построения прямой (см. график 7).

Корреляционная таблица позволяет вычислять уравнение связи для любой формы: прямой, параболы, гиперболы и др. Однако в подобной таблице видна зависимость результативного признака лишь от одного факториального.

Зависимость результативного признака от двух или более факториальных признаков носит название множественной связи.

Множественная связь

Исследование зависимости результативного признака от двух или нескольких факториальных признаков возможно при помощи уравнения множественной связи.

В простейшем уравнении множественной связи предполагается, что зависимость между признаками линейная. Сначала рассмотрим линейную зависимость результативного признака (у) от двух факториальных (х, z). Уравнение связи в этом случае выразится формулой Параметры этого уравнения находятся при решении системы нормальных уравнений, получаемых для способа наименьших квадратов

где п — число одновременных наблюдений по трем признакам;

—суммы соответствующих значений по этим признакам.

Все расчеты удобно сосредоточить в специальной таблице, как это делается в приводимом ниже примере.

Рассмотрим зависимость средней урожайности ячменя (у) на равных участках от количества внесенных минеральных удобрений (х) и количества выпавших в период цветения осадков (z).

Средняя урожайность исчислялась по участкам с равным количеством внесенных удобрений и с равным количеством выпавших осадков.

Пользуясь данными таблицы, составляем систему трех уравнений:

Поделив все члены уравнений на коэффициенты при получим:

Вычитая из второго уравнения сначала первое, а затем третье, получим 2 уравнения с двумя неизвестными:

Делим каждый член обоих уравнений на коэффициенты при

Уравнение связи, определяющее зависимость результативного признака (у) от двух факториальных

Вычислив по этому уравнению при соответствующих х и z величины замечаем, что суммы опытных данных (y) и расчетных данных совпадают, а отдельные значения их мало отличаются друг от друга.

Найдем уравнение связи между урожайностью пшеницы на Безенчукской опытной станции и тремя факторами (х, z, v).

Статистические данные, полученные в результате наблюдения, и расчеты представлены в табл. 10, откуда возьмем необходимые данные для составления системы нормальных уравнений:

Следовательно,, корреляционное уравнение будет:

Расширив число факториальных признаков, можно найти уравнение множественной связи для 4, 5, 6 и т. д. признаков. При этом необходимо брать только такие признаки, которые оказывают существенное влияние на величину результативного признака, ибо учет несущественных, второстепенных признаков лишь увеличивает расчетную работу при нахождении уравнения связи, а не приближает к более полному изучению связи.

Если число факториальных признаков возрастает, возрастает и число членов уравнения связи. Так, для трех факториальных признаков линейное уравнение связи будет записано формулой:

где параметры уравнения находятся путем решения системы четырех нормальных уравнений:


Построив соответствующую таблицу, получим в ней необходимые суммарные данные для приведенной системы уравнений (см. табл. 10).

Мерой существенности влияния того или иного факториального признака на результативный являются показатели тесноты связи.

В настоящем издании мы рассмотрим эмпирические меры тесноты связи, полученные разными исследователями, и меры тесноты связи, основанные на измерении вариации.

Эмпирические меры тесноты связи

Эмпирические меры тесноты связи позволяют оценить степень связи между явлениями или факторами, находящимися в зависимости один от другого. Эмпирические меры получены различными исследователями, занимавшимися статистической обработкой фактического материала. Они получены ранее, чем был открыт метод корреляции. Практическое пользование эмпирическими показателями довольно удобно.

К эмпирическим мерам тесноты относятся:

  • а) коэффициент ассоциации:
  • б) коэффициенты взаимной напряженности;
  • в) коэффициент Фехнера;
  • Г) коэффициент корреляции рангов;

Рассмотрим каждый из них.

а) Коэффициент ассоциации. Коэффициент ассоциации как мера тесноты связи применяется для изучения связи двух качественных признаков, состоящих только из двух групп. Для его вычисления строится четырехклеточная таблица корреляции, которая выражает связь между двумя явлениями, каждое из которых, в свою очередь, должно быть альтернативным, т. е. состоящим только из двух видов, качественно отличных друг от друга. Например, при изучении зависимости урожая от количества внесенных в почву удобрений выделяем по урожайности и по количеству внесенных удобрений лишь по две группы. При этом условии можно построить следующую четырехклеточную таблицу.

Числа, стоящие на пересечении строк и граф — a,b,c,d, показывают, сколько участков встречается с тем и другим количеством удобрений, внесенным в почву, с той и другой урожайностью.

Мера тесноты связи — коэффициент ассоциации — исчисляется по формуле:

Заполнив клетки конкретными числовыми данными, получим следующую четырехклеточную таблицу, где числа, стоящие в клетках, — гектары посевов.

Коэффициент ассоциации равен:
что говорит о достаточно тесной прямой связи между урожайностью и степенью удобрения почв.

Коэффициент ассоциации может иметь и отрицательные значения, когда ad

При копировании любых материалов с сайта evkova.org обязательна активная ссылка на сайт www.evkova.org

Сайт создан коллективом преподавателей на некоммерческой основе для дополнительного образования молодежи

Сайт пишется, поддерживается и управляется коллективом преподавателей

Whatsapp и логотип whatsapp являются товарными знаками корпорации WhatsApp LLC.

Cайт носит информационный характер и ни при каких условиях не является публичной офертой, которая определяется положениями статьи 437 Гражданского кодекса РФ. Анна Евкова не оказывает никаких услуг.


источники:

http://natalibrilenova.ru/raznostnyie-uravneniya/

http://www.evkova.org/korrelyatsiya