Корреляция может быть статистическим методом, который покажет, связаны ли сильно выраженные пары переменных и каким образом. Например, рост и вес связаны между собой; более высокие люди, как правило, тяжелее, чем короткие. Связь не идеальна. Люди эквивалентного роста различаются по весу, и вы легко рассмотрите двух человек, которых вы узнаете, где более низкий человек тяжелее, чем высокий. Тем не менее, типичный вес людей 5’5” меньше, чем типичный вес людей 5’6”, а их средний вес меньше, чем у людей 5’7”, и т.д. Корреляция может сказать только о том, какая доля изменения веса людей сказана в их весе.

Несмотря на то, что эта корреляция достаточно очевидна, ваши данные могут содержать неожиданные корреляции. вы также будете подозревать, что есть корреляции, но не знаете, какие из них наиболее сильные. Интеллектуальный корреляционный анализ может привести к более глубокому пониманию ваших данных.

Методы определения корреляции

Существует несколько различных методов корреляции. Необязательный модуль статистики системы опросов включает в себя наиболее распространенный тип, называемый Пирсоном, или корреляцию “продукт- момент”. Модуль также включает вариацию этого типа, называемую корреляцией . Последняя является выгодной, если вы хотите казаться на связь между двумя переменными, удаляя эффект 1 или двух других переменных.

Как и все статистические методы, корреляция – это просто подходящий вид данных. Корреляция работает для поддающихся количественному измерению данных, в которых числа являются значимыми, обычно в каких-то количествах. Она не может быть использована для чисто категорических данных, таких как пол, купленные бренды или любимый цвет.

Шкалы рейтинга

Рейтинговые шкалы – спорное среднее дело. Числа в рейтинговых шкалах имеют значение, но это значение не является точным. Они не похожи на количества. С количеством (например, в долларах), разница между 1 и парой строго эквивалентна между 2 и 3 . При рейтинговой шкале это может быть не совсем так. Вы убедитесь, что ваши респонденты считают, что оценка “два” находится между оценкой “1” и оценкой “три”, но вы не можете сделать так, чтобы они считали, что она находится точно на полпути между ними. Это часто бывает очень верно, если вы отметили средние баллы вашей шкалы (вы не можете считать, что “хорошо” – это строго половина между “отлично” и “удовлетворительно”).

Большинство статистиков говорят, что нельзя использовать корреляции с рейтинговыми шкалами, потому что математика техники предполагает, что различия между числами точно равны. Тем не менее, многие исследователи используют корреляции с рейтинговыми шкалами, потому что результаты обычно отражают важный мир. Наша собственная позиция заключается в том, что вы просто можете использовать корреляции с рейтинговыми шкалами, но вы должны делать это с осторожностью. При работе с количествами, корреляции обеспечивают точные измерения. При работе с рейтинговыми шкалами, корреляции обеспечивают общие показатели.

Коэффициент корреляции

Основные результаты корреляции называются коэффициентом корреляции (или “r”). Он находится в диапазоне от -1.0 до +1.0. Чем ближе r к +1 или -1, тем ближе 2 переменные связаны между собой.

Если r находится на грани 0, это означает, что между переменными нет никакой связи. Если r положительна, значит вместе переменная становится больше, а противоположная – больше. Если r отрицательна, это значит, что вместе она становится больше, а наоборот – меньше (часто называют “обратной” корреляцией).

Если коэффициенты корреляции обычно сообщаются как r = (значение между -1 и +1), то их квадратурное деление облегчает понимание . Квадрат коэффициента (или r квадрат) адекватен проценту вариации в одной переменной, связанной с вариацией внутри другой. После выравнивания r игнорируем процентную точку . Квадрат r, равный .5, означает 25% вариации (.5 квадрат =.25). Значение r, равное .7, означает 49% дисперсии (.7 в квадрате =.49).

Корреляционный отчет также может показать второй результат каждого теста – статистическую значимость. В этом случае уровень важности скажет вам, какова вероятность того, что корреляции, о которых вы сообщаете, могут быть также благодаря случайности в пределах рода ошибки выборки. Если вы работаете с небольшими размерами выборки, выберите формат отчета с уровнем важности. Этот формат также сообщает размер выборки.

Ключевое, что следует помнить при работе с корреляциями, это не предполагать, что корреляция означает, что изменение в одной переменной приводит к изменению в другой. Продажи частных компьютеров и спортивной обуви сильно выросли за эти годы, и между ними существует высокая корреляция, но вы не можете предположить, что покупка компьютеров заставляет людей покупать спортивную обувь (или наоборот).

Вторая оговорка заключается в том, что метод корреляции Пирсона лучше всего работает с линейными отношениями: вместе переменная становится больше, противоположная – больше (или меньше) в прямой пропорции. Она плохо работает с криволинейными отношениями (в которых соединение не следует за прямой линией). Примером криволинейной зависимости является возраст и здоровье. Они связаны, но связь не следует за прямой. Маленькие дети и пожилые люди, как правило, пользуются гораздо большим объемом медицинской помощи, чем подростки или молодые люди. Множественные корреляции (также включенные в Статистический модуль) часто не рассматривают криволинейные отношения, но это выходит за рамки данного текста.