Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Ключевым результатом регрессионного анализа является определение коэффициента (обозначается R2). Он интерпретируется как пропорции дисперсии в зависимой переменной, которую может предсказать независимая переменная.

Этот коэффициент детерминации получается из квадрата корреляции (r) между ожидаемым и фактическим y баллами, таким образом, он находится в диапазоне от 0 до 1.

При линейной регрессии коэффициент детерминации также равен квадрату корреляции между баллами x и y.

R2 из 0 означает, что зависимая переменная не предсказуема независимой переменной.

R2 из 1 означает, что зависимую переменную можно безошибочно предсказать по независимой переменной.

R2 от 0 до 1 указывает на то, насколько зависимая переменная предсказуема. R2 из 0,10 означает, что 10% дисперсии Y предсказуема от X; R2 из 0,20 означает, что 20% предсказуема; и так далее.

Ниже приведена формула расчета коэффициента детерминации линейной регрессионной модели с использованием независимой переменной.

Коэффициент детерминации. Коэффициент детерминации (R2) для модели линейной регрессии с независимой переменной равен:

R2 = { ( 1 / N ) * Σ [ (xi – x ) * (yi – y ) ] / (σx * σy ) }2.

где N – количество наблюдений, используемых для соответствия модели, Σ – символ суммы, xi – значение x для наблюдения i, x – среднее значение x, yi – значение y для наблюдения i, y – среднее значение y, σx – стандартное отклонение x, а σy – стандартное отклонение y.