Что такое корреляция и причинно-следственная связь, и чем они отличаются друг от друга?

Две или более переменные, считающиеся связанными, в статистическом контексте, если их значения изменяются таким образом, что из-за того, что значение 1 переменной увеличивается или уменьшается, увеличивается или уменьшается и значение противоположной переменной (хотя она будет находиться в противоположном направлении).

Например, для 2-х переменных “часы отработанные” и “заработанный доход” существует связь между ними, если увеличение количества отработанных часов связано с увеличением заработанного дохода. Если рассматривать 2 переменные “цена” и “покупательная способность”, потому что цена товара увеличивает способность человека совершать покупки на эти товары, уменьшается (предполагая непрерывный доход).

Корреляция может быть статистической мерой (выраженной в виде числа), описывающей размеры и направление связи между двумя или более переменными. Корреляция между переменными, однако, не означает автоматически, что изменение одной переменной заключается в том, что объяснение изменения находится в пределах значений противоположной переменной.

Причина указывает на то, что одним событием является результат наступления противоположного события, т.е. существует причинно-следственная связь между двумя событиями. Это также часто упоминается как причина и следствие.

Теоретически, разница между 2 видами отношений легко обнаруживается – действие или событие может вызвать другое (например, курение вызывает повышение риска развития рака лёгких), или может коррелировать с другим (например, курение коррелирует с алкоголизмом, но не вызывает алкоголизма). На практике, однако, по-прежнему сложно установить причину и следствие, по сравнению с установлением корреляции.

Почему корреляция и причинно-следственная связь важны?

Цель многих исследований или научного анализа состоит в том, чтобы определить, в какой степени одна переменная соотносится с другой. Например:

Существует ли взаимосвязь между уровнем образования человека и его здоровьем?

Связано ли владение домашними животными с более длительной жизнью?

Увеличила ли маркетинговая кампания компании продажи своей продукции?

Эти и другие вопросы изучают, существует ли корреляция между двумя переменными, и если она существует, то это может послужить руководством для дальнейших исследований, чтобы выяснить, не приводит ли одно действие к противоположному. Понимание корреляции и причинно-следственных связей позволяет лучше ориентировать политику и программы, направленные на достижение желаемого результата.

Как измеряется корреляция?

Для двух переменных статистическая корреляция измеряется с помощью коэффициента корреляции, представленного символом (r), который может быть одним числом, описывающим степень взаимосвязи между двумя переменными.

Числовое значение коэффициента находится в диапазоне от +1,0 до -1,0, что является признаком прочности и направления связи.

Если коэффициент корреляции имеет отрицательное значение (ниже 0), то это указывает на отрицательную связь между переменными. Это говорит о том, что переменные движутся в противоположных направлениях (т.е. когда увеличивается противоположное, то уменьшается или когда уменьшается противоположное).

Если коэффициент корреляции имеет положительное значение (выше 0), это указывает на положительную связь между переменными, то есть обе переменные движутся в тандеме, т.е. когда переменная вместе уменьшает противоположное, то уменьшается и противоположное, или когда одна переменная увеличивает противоположное, то увеличивается и обратное.

Если коэффициент корреляции равен 0, это означает, что между переменными нет никакой связи (одна переменная может оставаться постоянной, в то время как противоположная тоже уменьшается, или когда одна переменная увеличивает противоположную тоже уменьшается).

Хотя коэффициент корреляции может быть полезной мерой, это его ограничения:

Коэффициенты корреляции обычно связаны с измерением линейной зависимости.

Например, если сравнивать отработанные часы и доход, заработанный трейдером, который берет почасовую ставку за свою работу, то существует линейная (или прямая) зависимость, поскольку с каждым отработанным дополнительным часом доход увеличивается на равномерную величину.

Однако, если бы плата за работу трейдера поддерживала первоначальную плату за вызов и почасовую плату, которая постепенно уменьшается, чем дольше длится работа, то связь между отработанными часами и доходом была бы нелинейной, где коэффициент корреляции также мог бы быть ближе к 0.

Требуется осторожность при интерпретации значения “r”. Можно искать корреляции между многими переменными, однако, часто эти связи обусловлены другими факторами и не имеют ничего, что можно было бы попробовать с 2 рассматриваемыми переменными.

Например, продажи мороженого и, следовательно, продажи солнцезащитного крема могут систематически увеличиваться и уменьшаться в течение года, но это может быть связь, которая может протекать от последствий сезона (т.е. в жаркую погоду люди, носящие солнцезащитный крем, также едят замороженный десерт), а не благодаря любой прямой связи между продажами солнцезащитного крема и мороженого.

Коэффициент корреляции не должен ничего говорить о причинно-следственной связи. Рассматривая значение ‘r’, можно сделать вывод, что две переменные взаимосвязаны, но значение ‘r’ не говорит нам, была ли одна переменная объяснением изменения внутри другой.

Как можно установить причинно-следственную связь?

Причинно-следственная связь заключается в том, что область статистики, которая обычно неправильно понимается и неправильно используется людьми в рамках ошибочного убеждения, что, поскольку информация показывает корреляцию, что обязательно существует лежащая в основе причинно-следственная связь.

Использование контролируемого исследования заключается в том, что лучший способ построения причинно-следственной связи между переменными. во время контролируемого исследования выборка или популяция разделены на две группы, при этом обе группы сопоставимы почти во всех отношениях. Затем две группы получают разное лечение, и поэтому результаты каждой группы оцениваются.

Например, в медицинском исследовании одна группа может получить плацебо, в то время как противоположная группа получает заменяющий вид лекарства. Если 2 группы имеют заметно различные исходы, то различные опыты могут причинить различные исходы.

В связи с этическими причинами, существуют ограничения на использование контролируемых студий.

Что такое корреляция и причинно-следственная связь, и чем они отличаются?

Две или более переменные, считающиеся связанными, в статистическом контексте, если их значения изменяются таким образом, что из-за того, что значение 1 переменной увеличивается или уменьшается, увеличивается или уменьшается и значение противоположной переменной (хотя она будет находиться в противоположном направлении).

Например, для 2-х переменных “часы отработанные” и “заработанный доход” существует связь между ними, если увеличение количества отработанных часов связано с увеличением заработанного дохода. Если рассматривать 2 переменные “цена” и “покупательная способность”, потому что цена товара увеличивает способность человека совершать покупки на эти товары, уменьшается (предполагая непрерывный доход).

Корреляция может быть статистической мерой (выраженной в виде числа), описывающей размеры и направление связи между двумя или более переменными. Корреляция между переменными, однако, не означает автоматически, что изменение одной переменной заключается в том, что объяснение изменения находится в пределах значений противоположной переменной.

Причина указывает на то, что одним событием является результат наступления противоположного события, т.е. существует причинно-следственная связь между двумя событиями. Это также часто упоминается как причина и следствие.

Теоретически, разница между 2 видами отношений легко обнаруживается – действие или событие может вызвать другое (например, курение вызывает повышение риска развития рака лёгких), или может коррелировать с другим (например, курение коррелирует с алкоголизмом, но не вызывает алкоголизма). На практике, однако, по-прежнему сложно установить причину и следствие, по сравнению с установлением корреляции.

Почему корреляция и причинно-следственная связь важны?

Цель многих исследований или научного анализа состоит в том, чтобы определить, в какой степени одна переменная соотносится с другой. Например:

Существует ли взаимосвязь между уровнем образования человека и его здоровьем?

Связано ли владение домашними животными с более длительной жизнью?

Увеличила ли маркетинговая кампания компании продажи своей продукции?

Эти и другие вопросы изучают, существует ли корреляция между двумя переменными, и если она существует, то это может послужить руководством для дальнейших исследований, чтобы выяснить, не приводит ли одно действие к противоположному. Понимание корреляции и причинно-следственных связей позволяет лучше ориентировать политику и программы, направленные на достижение желаемого результата.

Как измеряется корреляция?

Для двух переменных статистическая корреляция измеряется с помощью коэффициента корреляции, представленного символом (r), который может быть одним числом, описывающим степень взаимосвязи между двумя переменными.

Числовое значение коэффициента находится в диапазоне от +1,0 до -1,0, что свидетельствует о прочности и направлении связи.

Если коэффициент корреляции имеет отрицательное значение (ниже 0), то это указывает на отрицательную связь между переменными. Это говорит о том, что переменные движутся в противоположных направлениях (т.е. когда увеличивается противоположное, то уменьшается или когда уменьшается противоположное).

Если коэффициент корреляции имеет положительное значение (выше 0), это указывает на положительную связь между переменными, то есть обе переменные движутся в тандеме, т.е. когда переменная вместе уменьшает противоположное, то уменьшается и противоположное, или когда одна переменная увеличивает противоположное, то увеличивается и обратное.

Если коэффициент корреляции равен 0, это означает, что между переменными нет никакой связи (одна переменная может оставаться постоянной, в то время как противоположная тоже уменьшается, или когда одна переменная увеличивает противоположную тоже уменьшается).

Хотя коэффициент корреляции может быть полезной мерой, это его ограничения:

Коэффициенты корреляции обычно связаны с измерением линейной зависимости.

Например, если сравнивать отработанные часы и доход, заработанный трейдером, который берет почасовую ставку за свою работу, то существует линейная (или прямая) зависимость, поскольку с каждым отработанным дополнительным часом доход увеличивается на равномерную величину.

Однако, если бы плата за работу трейдера поддерживала первоначальную плату за вызов и почасовую плату, которая постепенно уменьшается, чем дольше длится работа, то связь между отработанными часами и доходом была бы нелинейной, где коэффициент корреляции также мог бы быть ближе к 0.

Требуется осторожность при интерпретации значения “r”. Можно искать корреляции между многими переменными, однако часто эти связи обусловлены другими факторами, и нечего пытаться делать с 2 рассматриваемыми переменными.

Например, продажи мороженого и, следовательно, продажи солнцезащитного крема могут систематически увеличиваться и уменьшаться в течение года, но это может быть связь, которая может протекать от последствий сезона (т.е. в жаркую погоду люди, носящие солнцезащитный крем, также едят замороженный десерт), а не благодаря любой прямой связи между продажами солнцезащитного крема и мороженого.

Коэффициент корреляции не должен ничего говорить о причинно-следственной связи. Рассматривая значение ‘r’, можно сделать вывод, что две переменные взаимосвязаны, но значение ‘r’ не говорит нам, была ли одна переменная объяснением изменения внутри другой.

Как можно установить причинно-следственную связь?

Причинно-следственная связь заключается в том, что область статистики, которая обычно неправильно понимается и неправильно используется людьми в рамках ошибочного убеждения, что, поскольку информация показывает корреляцию, что обязательно существует лежащая в основе причинно-следственная связь.

Использование контролируемого исследования заключается в том, что лучший способ построения причинно-следственной связи между переменными. во время контролируемого исследования выборка или популяция разделены на две группы, при этом обе группы сопоставимы почти во всех отношениях. Затем две группы получают разное лечение, и поэтому результаты каждой группы оцениваются.

Например, в медицинском исследовании одна группа может получить плацебо, в то время как противоположная группа получает заменяющий вид лекарства. Если 2 группы имеют заметно различные исходы, то различные опыты могут причинить различные исходы.

По этическим соображениям, использование контролируемых исследований ограничено; возможно, нецелесообразно использовать две сравнимые группы, и одна из них подвергается вредной деятельности, в то время как противоположная – нет. В качестве примера можно привести наблюдения, в которых часто не исследуется корреляция и причинно-следственная связь для интересующей популяции. Исследования могут проверить поведение и результаты групп и наблюдать любые изменения с течением времени.