Модели линейной регрессии не показывают и не предсказывают связь между двумя переменными или факторами. Предсказываемый фактор (фактор, для которого уравнение решает) называется переменной . Факторы, которые не предсказывают ценность переменной, называются независимыми переменными.

В прямолинейной регрессии каждое наблюдение состоит из двух значений. Одно значение предназначено для переменной, а другое – для экспериментальной переменной . В этой простой модели линия аппроксимирует связь между переменной и, следовательно, экспериментальной переменной .1.

Когда в многомерном анализе используются две или более независимые переменные, модель уже не является простой линейной. Это часто называют множественной корреляцией .2.

Формула Для простой прямолинейной регрессионной модели

Два фактора, которые участвуют в простом прямолинейном регрессионном анализе, обозначены x и y. Уравнение, которое описывает, как y сказано x, понимается благодаря регрессионной модели.

Простая прямолинейная регрессионная модель представлена:

y = β0 +β1x+ε.

Прямолинейная регрессионная модель содержит ошибочный термин, который представлен ε. Ошибочный термин используется для учета изменчивости в y, которая не может быть объяснена линейной зависимостью между x и y. Если бы ε не присутствовал, это могло бы означать, что знание x дало бы достаточно информации, чтобы вычислить ценность y.

Существуют также параметры, представляющие исследуемую популяцию. Эти параметры модели представлены β0 и β1.

Простое уравнение прямолинейной регрессии граффитировано в виде линии , где:

β0 – это y-вход кривой регрессии .

β1 – это наклон.

Ε(y) – это среднее или арифметическое y для заданного значения x.

Кривая регрессии может показывать положительную линейную связь, отрицательную линейную связь или отсутствие связи3.

Отсутствие отношения: Графическая линия во время простой прямолинейной регрессии плоская (не наклонная). Между двумя переменными нет никакой связи.

Положительная связь: Кривая регрессии наклоняется вверх с нижним концом дороги на y-входе (оси) графика и, следовательно, с верхним концом дороги, простирающимся вверх в поле графика, вдали от x-входа (оси). между 2 переменными существует положительная линейная зависимость: поскольку значение 1 увеличивается, то увеличивается и значение противоположной величины.

Отрицательная зависимость: Кривая регрессии наклоняется вниз с верхним концом дороги на y-входе (ось) графика и, следовательно, с нижним концом дороги, простирающимся вниз в поле графика, в сторону x-входа (оси). между 2 переменными существует отрицательная линейная связь: поскольку значение 1 возрастает, то и стоимость противоположного уменьшается4.

Уравнение расчетной прямолинейной регрессии

Если бы параметры популяции были известны, то прямолинейное уравнение прямолинейной регрессии (показанное ниже) могло бы не вычислить среднее значение y для известного значения x.

Ε(y) = β0 +β1x+ε.

Однако на практике значения параметров, как правило, неизвестны, чтобы их можно было оценить по данным выборки населения. Параметры популяции оцениваются с использованием статистики выборки. Статистические данные выборки представлены в виде β0 и β1. При замене статистики выборки на параметры популяции производится оценочная регрессия y on x3.

Оценочная регрессия y on x равна:

(ŷ) = β0 +β1x+ε.

Примечание: (ŷ) произносится y hat.

График уравнения оценочной регрессии называется оценочной кривой регрессии .

β0 – это y-вход кривой регрессии .

β1 – это наклон.

(ŷ) является оценочным значением y для заданного значения x.

Пределы прямой прямолинейной регрессии

Даже самые простые данные не рассказывают целую историю.

Регрессионный анализ обычно используется в исследованиях для определения наличия корреляции между переменными. Но корреляция не является эквивалентом причинно-следственной связи: связь между двумя переменными не означает, что происходит обратное. Даже линия во время простой прямолинейной регрессии, хорошо совпадающая с информационными точками, может не гарантировать причинно-следственной связи.

Использование модели прямолинейной регрессии позволит определить, существует ли связь между переменными в наименьшей степени . Чтобы точно знать, что это за связь, и является ли одна переменная причиной другой, вам понадобятся дополнительные исследования и статистический анализ.