Статистические методы изучения связей

Для количественного описания взаимосвязей статистические методы изучения связей экономическими переменными в статистике используют методы регрессии и корреляции. Регрессия - величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х. Уравнение регрессии выражает среднюю величину одного признака как функцию другого. Корреляция - величина, отражающая наличие связи между явлениями, процессами и характеризующими их показателями. Корреляционная зависимость - определение зависимости средней величины одного признака от изменения значения другого признака. Коэффициент корреляции величин х и у r xy свидетельствует о наличии или отсутствии линейной связи между переменными: где -1; 1. Коэффициент корреляции может служить мерой зависимости случайных величин. Чем ближе R к 1, тем теснее связь рассматриваемых признаков. Формы проявления корреляционной связи между признаками: 1 причинная зависимость результативного признака от вариации факторного признака; 2 корреляционная связь между двумя следствиями общей причины. Здесь корреляцию нельзя интерпретировать как связь причины и статистические методы изучения связей. Оба признака - следствие одной общей причины; 3 взаимосвязь признаков, каждый из которых и причина, и следствие. Каждый признак может выступать как в роли независимой переменной, так и в качестве зависимой переменной. Задачи корреляционно-регрессионного анализа: 1 выбор спецификации модели, т. Поэтому необходимо знать, какие остальные факторы предполагаются неизменными, так как в дальнейшем анализе их придется учесть в модели и от простой регрессии перейти к множественной; 4 исследовать, как изменение одного признака меняет вариацию другого. Предпосылки корреляционно-регрессионного анализа: 1 уравнение парной регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений; 2 в уравнении регрессии корреляционная связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией; 3 случайная величина Е включает влияние неучтенных в статистические методы изучения связей факторов, случайных ошибок и особенностей измерения; 4 определенному значению признака-аргумента отвечает некоторое распределение признака функции. Недостатки анализа: 1 невключение ряда объясняющих переменных: статистические методы изучения связей. Ошибки выборки возникают и в силу неоднородности данных в исходной статистической совокупности, что бывает при статистические методы изучения связей экономических процессов; статистические методы изучения связей ошибки измерения представляют наибольшую опасность. Если ошибки спецификации можно уменьшить, изменяя форму модели вид математической формулыа ошибки выборки - увеличивая объем исходных данных, то ошибки изме­рения сводят на нет все усилия статистические методы изучения связей количественной оценке связи между признаками. Корреляционные параметрические методы статистические методы изучения связей методы оценки тесноты свози, основанные на использовании, как правило, оценок нормального распределения, применяются в тех случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. Параметризация уравнения регрессии : установление формы зависимости; определение функции регрессии; оценка значений параметров выбранной формулы статистической связи Методы изучения связи - форму зависимости можно установить с помощью поля корреляции. Статистические методы изучения связей исходные данные значения переменных х и у нанести на график в виде точек в прямоугольной системе координат, то получим поле корреляции При этом значения независимой переменной x признак-фактор откладываются по оси абсцисс, а значения результирующего фактора у откладываются по оси ординат. Если зависимость у от статистические методы изучения связей функциональная, то все точки расположены на какой-то линии. При корреляционной связи вследствие влияния прочих факторов точки не лежат на одной линии. Расчет показателей силы и тесноты связей Линейный коэффициент корреляции - количественная оценка и мера тесноты связи двух переменных. Коэффициент корреляции принимает значения в интервале от -1 до +1. Считают, что если этот коэффициент не больше 0,30, то связь слабая: от 0,3 до 0,7 - средняя; больше 0,7 - сильная, или тесная. Когда коэффициент равен 1, то связь функциональная, если он равен 0, то говорят об отсутствии линейной связи между признаками. Коэффициент детерминации - квадрат линейного коэффициента корреляции, рассчитываемый для оценки качества подбора линейной функции. Корреляция для множественной регрессии. Значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата - коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или оце­нивает тесноту совместного влияния факторов на результат. В случае парной линейной зависимости строится регрессионная модель по уравнению линейной регрессии. Параметры этого уравнения статистические методы изучения связей с помощью процедур, наибольшее распространение получил метод наименьших квадратов. Метод наименьших квадратов МНК - метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции. Экономический смысл параметров уравнения линейной парной регрессии. Параметр b показывает среднее изменение результата у с изменением фактора х на единицу. Если х не может быть равен 0, то а не имеет экономического смысла. То есть МНК заключается в статистические методы изучения связей, чтобы определить а и а, так, чтобы сумма квадратов разностей фак­тических у и у. Если совокупность сгруппирована по признаку xдля каждой группы найдены средние значения другого признака у, то эти средние дают представление о том, как меняется в среднем у в зависимости от х. Поэтому группировка служит средством анализа связи в статистике. Но ряд групповых средних у x имеет тот недостаток, что он подвержен случайным колебаниям. Они создают колебания у x отражающие не закономерность данной зависимости, а затушевывающий ее «шум». Групповые средние хуже отражают закономерность связи, чем уравнение регрессии, но могут быть использованы в качестве основы для нахождения этого уравнения. Умножая численность каждой группы n статистические методы изучения связей на групповую среднюю уч мы получим сумму у в статистические методы изучения связей группы Суммируя эти суммы, найдем общую сумму у. Несколько сложнее с суммой ху. Если при сумме ху интервалы группировки малы, то можно считать значение x для всех единиц в статистические методы изучения связей группы одинаковым Умножив на него сумму у, получим сумму произведений x на у в рамках группы и, суммируя эти суммы, общую сумму x у. Численность n xздесь играет такую же роль, как взвешивание в вычислении средних. Множественная регрессия - регрессия между переменными у и статистические методы изучения связей 1x 2 ,…, статистические методы изучения связей m. Множественная регрессия применяется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах. Цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также их совокупное воздействие на моделируемый показатель. Отбор факторов при построении множественной регрессии. Включение в уравнение множественной регрессии того или иного набора факторов связано с представлением исследователя о природе взаимосвязи моделируемого показателя с другими эко­номическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией может привести к нежелательным последствиям - система нормальных уравнений может оказаться плохо обусловленной и повлечь статистические методы изучения связей собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Методы построения уравнения множественной регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Статистические методы изучения связей приводят построение уравнения множественной регрессии к разным методам: 1 метод исключения отсев факторов из полного его набора ; 2 метод включения дополнительное введение фактора ; 3 шаговый регрессионный анализ исключение ранее введенного фактора. Каждый из этих методов по-своему решает проблему отбора факторов, давая в целом близкие результаты. Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является простота вычислений. Непараметрические показатели связи Коэффициент ассоциации: Коэффициент контингенции: Коэффициент взаимной сопряженности Пирсона: Коэффициент Фехнера: Коэффициент корреляции рангов: Непараметрические показатели связи позволяет судить о степени и тесноте связи не только, для количественных, но и для атрибутивных признаков. Методы многомерного анализаоснованные на рассмотрении сочетания непараметрических взаимосвязанных признаков: 1 дискриминантный анализ состоит в установлении правила, на основании которого та или иная новая единица статистические методы изучения связей может быть отнесена к данной совокупности объектов, имея в виду значения рассматриваемых у нее признаков; 2 распознавание образов состоит в отнесении объекта на основании сочетания признаков в ту или другую из заранее определенных и охарактеризованных групп совокупности; 3 кластерный анализ таксономия состоит в разбиении совокупности на классы группы, типы, «кластеры», «таксоны»границы которых наперед не заданы. Число кластеров может быть при этом задано или статистические методы изучения связей 4 метод главных компонент - если признаки отобраны правильной в них действительно отражается качественная природа объектов в рассматриваемом отношении, то эти признаки оказываются друг с другом связанными; факторный анализ является дальнейшим развитием метода главных компонент. В нем охватываемая выделенными -главными компонентами» У вариация всех признаков X может затем между ними перераспределяться, причем между ними может быть допущена и корреляция.

После определения оценок параметров регрессии и , а также значений определим случайную переменную.

добавлено 40 комментария(ев)