Что такое Р-квадрат?

R-квадрат (R2) – это статистическая мера, представляющая собой долю дисперсии для зависимой переменной, которая в регрессионной модели объясняется одной или несколькими независимыми переменными. В то время как корреляция объясняет силу связи между независимой и зависимой переменной, R-квадрат объясняет степень, в которой дисперсия одной переменной объясняет дисперсию второй переменной. Так, если R2 модели равен 0.50, то примерно половина наблюдаемой вариации может быть объяснена входами в модель.

Формула для R-квадрат

\begin{подпись} &\text{R}^2 = 1 – \frac{ \text{Объясненная вариация} }{ \text{Объясненная вариация} } \\ \end{подпись}R2=1Объясненная вариация Объясненная вариация

При инвестировании, R-квадрат обычно интерпретируется как процент движения фонда или ценной бумаги, который может быть объяснен движениями эталонного индекса. Например, R-квадрат для ценной бумаги с фиксированным доходом по сравнению с индексом облигаций определяет процентное изменение цены ценной бумаги, которое можно ожидать, основываясь на движении цены индекса. То же самое можно применить и к акции по отношению к индексу S&P 500 или любому другому соответствующему индексу.

Расчет R-квадрат

Фактический расчет R-квадрат требует нескольких шагов. Это включает в себя сбор точек данных (наблюдений) зависимых и независимых переменных и нахождение наиболее подходящей линии, часто из регрессионной модели. Оттуда вычисляются ожидаемые значения, вычитаются фактические значения и квадратируется результат. Таким образом, вы получаете список ошибок в квадрате, который затем суммируется и равняется объясненной дисперсии.

Для вычисления общей дисперсии вычитайте среднее реальное значение из прогнозируемых значений, заключите результат в квадрат и сложите его. Оттуда первую сумму ошибок (объясненная дисперсия) делим на вторую сумму (общая дисперсия), вычитаем результат из единицы и получаем квадрат R.

Что говорит R-квадрат?

Значения R-квадрат варьируются от 0 до 1 и обычно обозначаются как 0% до 100%. 100 % R-квадрат означает, что все движения ценной бумаги (или другой зависимой переменной) полностью объясняются движениями индекса (или независимой переменной (переменных), которые Вас интересуют).

При инвестировании, высокий R-квадрат, в диапазоне от 85% до 100%, означает, что результаты деятельности ценной бумаги или фонда движутся относительно в соответствии с индексом. Фонд с низким R-квадратным значением – 70% или меньше – указывает на то, что ценная бумага, как правило, не следует за движением индекса. Более высокое значение R-квадрат указывает на более полезное значение бета-версии. Например, если акции или фонды имеют R-квадрат, близкий к 100%, но бета-версия ниже 1, то, скорее всего, они предлагают более высокую доходность с поправкой на риск.

Разница между R-квадрат и скорректированным R-квадратным значением

R-Squared работает только так, как ожидается в простой линейной регрессионной модели с объясняющей переменной. При множественной регрессии, состоящей из нескольких независимых переменных, R-Squared должен быть скорректирован. Настроенный R-Squared сравнивает описательную силу регрессионных моделей, включающих разное количество предикторов. Каждый предиктор, добавленный в модель, увеличивает R-квадрат и никогда не уменьшает R-квадрат. Таким образом, модель с большим количеством членов может показаться более подходящей только потому, что у нее больше членов, в то время как скорректированный R-квадрат компенсирует добавление переменных и увеличивается только в том случае, если новый член улучшает модель выше, чем это было бы вероятно, и уменьшается, когда предиктор улучшает модель меньше, чем ожидалось случайно. В состоянии переподгонки вы получаете ошибочно высокое значение R-квадрат, что приводит к уменьшению возможности прогнозирования. В случае скорректированного R-квадратира это не так.

В то время как стандартный R-квадрат может быть использован для сравнения хороших двух или разных моделей, скорректированный R-квадрат не является хорошей метрикой для сравнения нелинейных моделей или множественных линейных регрессий.

Разница между R-квадрат и B

Бета и R-квадрат – это два взаимосвязанных, но разных корреляционных показателя, но бета – это показатель относительного риска. Паевой фонд с высоким R-квадратным значением сильно коррелирует с эталоном. Если бета также является высокой, то она может давать более высокую доходность, чем эталон, особенно на бычьих рынках. R-квадрат измеряет, насколько тесно каждое изменение цены актива коррелируется с бенчмарком. Бета-квадрат измеряет величину этих изменений цены по отношению к эталонному показателю. При совместном использовании R-квадрат и бета дают инвесторам полную картину работы управляющих активами. Бета с точностью до 1,0 означает, что риск (волатильность) актива идентичен риску (волатильности) его бенчмарка. По сути, R-квадрат – это метод статистического анализа для практического использования и надежности бет ценных бумаг.

Ограничения R-квадрат

R-квадрат даст Вам оценку отношения между движениями зависимой переменной, основанную на движениях независимой переменной. Она не скажет, является ли выбранная модель хорошей или плохой, а также не скажет, являются ли данные и прогнозы предвзятыми. Высокий или низкий квадрат R не обязательно является хорошим или плохим, так как он не передает надежность модели и не говорит вам, правильно ли вы выбрали регрессию. Вы можете получить низкий R квадрат для хорошей модели, или высокий R квадрат для плохо оснащенной модели, и наоборот.