Регрессионный анализ

В реальной действительности возможны такие зависимости, когда каждому элементу х соответствуют определенные значения только в среднем. Отклонения фактических значений у от среднего возможны в результате Действия множества случайных факторов, приводящих к существованию определенного закона распределения вероятностей указанных отклонений.

Вполне логично предположение также о том, что если значения аргумента в эксперименте не являются фиксированными и если они подвержены действию тех же случайных факторов, то существует закон распределения вероятностей отклонения аргумента от его среднего значения. Полученные в результате эксперимента числовые значения переменных х и у содержат две составляющие: средние значения известной функциональной связи и случайные отклонения от этих значений.

При этом под средними значениями Под теснотой связи между двумя переменными понимается относительное значение вариации функции, вызываемой аргументом х в общей вариации у. В математической статистике под вариацией величин понимают их среднеквадратическое отклонение.

По физическому смыслу она равна длинам (модулям) векторов, о которых шла речь ранее.

Из изложенного ясно, что по величине коэффициента корреляции можно судить о наличии и тесноте связи между переменными х и у, т. е. о близости векторов х и у к линейной зависимости и о удельном весе вариации, называемой фактором х, в общей вариации функции у. Количественной мерой тесноты связи является либо косинус угла между векторами (прямыми регрессии), либо отношение соответствующих среднеквадратических отклонений.

Заметим при этом, что границы, в которых может изменяться коэффициент корреляции (от -1 до +1), еще не содержат критерия существенности связи между переменными. Как видно из этих формул, угловой коэффициент прямой — определяется величиной коэффициента корреляции и среднеквадратическими отклонениями функции и аргумента.

Существуют два основных метода определения оценок коэффициентов Уравнения регрессии по множеству статистических данных — метод максимального правдоподобия и метод наименьших квадратов.