Линейная регрессия – это исследование, в котором оценивается, проясняет ли хотя бы один индикаторный фактор зависимую (правило) переменную. Рецидив имеет пять ключевых презумпций:

Линейные отношения

Многомерная типичность

Нет или мало мультиколлинеарности

Нет автоотношений

Гомоскедастичность

Примечание о размере примера. В линейных соотношениях общее руководство по размеру примера заключается в том, что регрессионный анализ требует в любом случае 20 случаев по каждому свободному фактору в расследовании.

В нижней части продукта, его чрезвычайно просто направить рецидив и большая часть предположений предварительно загружены и переведены для вас.

Для начала при прямом рецидиве необходимо, чтобы связь между автономным и палатным факторами была прямой. Также важно проверить на предмет исключений, поскольку прямой рецидив чувствителен к воздействию аномалий. Предположение о линейности лучше всего можно попробовать на дисперсионных графиках, в двух сопутствующих моделях изображены два случая, когда линейности нет и имеется мало

Кроме того, исследование прямого рецидива требует, чтобы все факторы были многомерными типичными. Это предположение лучше всего проверить с помощью гистограммы или Q-Q-плота. Обычность можно проверить при помощи теста на пригодность, например, теста Колмогорова-Смирнова. В момент, когда информация обычно не циркулирует, непрямое изменение (например, смена лога) может исправить эту проблему.

В-третьих, при прямом рецидиве ожидается, что мультиколлинеарность информации практически отсутствует. Мультиколлинеарность происходит тогда, когда автономные факторы чрезмерно глубоко связаны друг с другом.

Мультиколлинеарность можно попробовать с тремя центральными критериями:

1) Матрица корреляции – при обработке сети Двумерной Связи Пирсона между каждой автономной переменной коэффициенты корреляции должны быть меньше 1.

2) Сопротивление – устойчивость оценивает влияние одного свободного фактора на все остальные автономные факторы; устойчивость определяется с помощью исследования прямого рецидива. Устойчивость характеризуется как T = 1 – R² для этих начальных этапов исследования рецидива. При T < 0,1 в информации может присутствовать мультиколлинеарность, а при T < 0,01 – несомненно.

3) FVariance Inflation Factor (VIF- переменная разности набухания прямого рецидива характеризуется как VIF = 1/T. При VIF > 5 это означает, что мультиколлинеарность может быть доступна; при VIF > 10 бесспорно существует мультиколлинеарность между факторами.

В случае, если в информации найдена мультиколлинеарность, фокусировка информации (т.е. вычитание среднего значения переменной из каждой оценки) может решить проблему. Как бы то ни было, наименее сложным подходом к решению проблемы является эвакуация автономных факторов с высокими значениями VIF.

В-четвертых, анализ линейной регрессии требует наличия в информации практически нулевой автокорреляции. Автокорреляция происходит, когда остатки не свободны друг от друга. Например, это обычно происходит в стоимости запасов, где стоимость не свободна от стоимости прошлых.

4) Индекс условий – индекс условий определяется для использования факторной экспертизы по автономным факторам. Оценки 10-30 показывают справедливую мультиколлинеарность в факторах прямого рецидива, значения > 30 показывают твердую мультиколлинеарность.

В случае, если в информации, ориентированной на информацию, найдена мультиколлинеарность, то есть вычитание среднего балла, может решить проблему. Различные варианты решения проблемы ведут к изучению факторов и повороту элементов, чтобы гарантировать свободу компонентов в расследовании прямого рецидива.

В-четвертых, анализ линейной регрессии требует, чтобы в информации практически отсутствовала автокорреляция. Автокорреляция происходит, когда остатки не автономны друг от друга. В конце дня, когда оценка y(x+1) не свободна от оценки y(x).

В то время как слот рассеяния позволяет проверить наличие автокорреляций, можно проверить модель прямого рецидива на наличие автокорреляций с помощью теста Дарбина-Ватсона. Durbin-Watson проверяет недействительную теорию о том, что остатки не являются непосредственно автокорреляциями. В то время как d может принимать значения где-то в диапазоне 0 и 4, значения около 2 не демонстрируют автокорреляцию. Как общие руководящие оценки 1.5 < d < 2.5 показывают, что в информации нет авто-связи. Тем не менее, тест Дарбин-Ватсон просто проверяет прямую автокорреляцию и только между прямыми соседями, которые являются ударами первого запроса.

Последнее подозрение при обследовании прямого рецидива – гомоскедастичность. График рассеяния является отличным подходом для проверки гомоскедастичности информации (т.е. остатки эквивалентны по линии рецидива). На сопровождающих дисперсионных графиках показаны примеры информации, не гомоскедастичной (т.е. гетероскедастичной):

Испытание Goldfeld-Quandt также может быть использовано для проверки гетероскедастичности. Испытание разбивает информацию на две части и проверяет, является ли разница остатков сравнительной по сравнению с соединениями. При наличии гомоскедастичности проблема может быть устранена не прямой ревизией.