Как посчитать корреляции в спсс

Корреляционный анализ

Глава 15. Корреляционный анализ

Если в качестве примера возьмём данные об уровне холестерина для первых двух моментов времени из исследования гипертонии (файл hyper.sav), то в данном случае следует ожидать довольно сильную связь: большие значения в исходный момент времени являются веским поводом для ожидания больших значений и через 1 месяц.

Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным. Каждая пара значений маркируется при помощи определенного символа. Такой график, называемый «диаграммой рассеяния» (Scatterplot) для двух зависимых переменных можно построить путём вызова меню Graphs. (Графики) / Scatter plots. (Диаграммы рассеяния) (см. гл. 22.8).

Образовавшееся скопление точек показывает, что обследованные пациенты с высокими исходными показателями, как правило, имеют высокие значения холестерина и при повторном опросе через месяц.

Если коэффициент корреляции отрицательный, это означает наличие противоположной связи: чем выше значение одной переменной, тем ниже значение другой. Сила связи характеризуется также и абсолютной величиной коэффициента корреляции. Для словесного описания величины коэффициента корреляции используются следуюшие градации:

ЗначениеИнтерпретация
до 0,2Очень слабая корреляция
до 0,5Слабая корреляция
до 0,7Средняя корреляция
до 0,9Высокая корреляция
свыше 0,9Очень высокая корреляция

Метод вычисления коэффициента корреляции зависит от вида шкалы, которой относятся переменные:

Типы шкалМера связи
Переменная XПеременная Y
Интервальная (или отношений)Интервальная (или отношений)Коэффициент Пирсона
Ранговая, интервальная (или отношений)Ранговая, интервальная (или отношений)Коэффициент Спирмена
РанговаяРанговаяКоэффициент Кендалла
ДихотомическаяДихотомическаяКоэффициент φ (фи), четырёхполевая корреляция
ДихотомическаяРанговаяРангово-бисериальный коэффициент

    Переменные с интервальной или с пропорциональной шкалойкоэффициент корреляции Пирсона.

    По меньшей мере, одна из двух переменных имеет порядковую шкалу, либо с интервальной шкалой, но не нормально распределённойранговая корреляция по Спирману или τ (тау-грого-соая) Кендала (реже).

    Одна из двух переменных является дихотомической – точечная двухрядная корреляция. Эта возможность в SPSS отсутствует. Вместо этого может быть применён расчёт ранговой корреляции по Спирману.

    Обе переменные являются дихотомическимичетырёхполевая корреляция. Данный вид корреляции рассчитываются в SPSS на основании определения мер расстояния и мер сходства (см. гл 15.4).

    Расчёт коэффициента корреляции между двумя недихотомическими переменными не лишён смысла только тогда, кода связь между ними линейна (однонаправлена). Если связь, к примеру, U-образная (неоднозначная), то коэффициент корреляции непригоден для использования в качестве меры силы связи: его значение стремится к нулю. В следующих разделах будут рассмотрены корреляции по Пирсону, Спирману и Кендалу. Ешё один раздел специально посвящён частной корреляции.

    Источник

    Иллюстрированный самоучитель по SPSS 10/11

    Корреляции

    В этой главе речь пойдет о связи (корреляции) между двумя переменными. Расчеты подобных двумерных критериев взаимосвязи основываются на формировании парных значений, которые образовываются из рассматриваемых зависимых выборок.

    Если в качестве примера мы возьмем данные об уровне холестерина для первых двух моментов времени из исследования гипертонии (файл hyper.sav), то в данном случае следует ожидать довольно сильную связь: большие значения в исходный момент времени являются веским поводом для ожидания больших значений и через 1 месяц.

    Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным. Каждая; пара значений маркируется при помощи определенного символа. Такой график, называемый «диаграммой рассеяния» для двух зависимых переменных можно построить путем вызова меню Graphs… (Графики) › Scatter plots… (Диаграммы рассеяния) (см. гл. 22.8).

    Образовавшееся скопление точек показывает, что обследованные пациенты с высокими исходными показателями, как правило, имеют высокие значения холестерина и при повторном опросе через месяц. Это, конечно же, не является неожиданностью; данный пример был выбран, чтобы продемонстрировать наличие явной связи.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс
    Рис. 15.1.Диаграммы рассеяния

    Если коэффициент корреляции отрицательный, это означает наличие противоположной связи: чем выше значение одной переменной, тем ниже значение другой. Сила связи характеризуется также и абсолютной величиной коэффициента корреляции. Для словесного описания величины коэффициента корреляции используются следующие градации:

    ЗначениеИнтерпретация
    до 0.2Очень слабая корреляция
    до 0.5Слабая корреляция
    до 0.7Средняя корреляция
    до 0.9Высокая корреляция
    свыше 0.9Очень высокая корреляция

    Метод вычисления коэффициента корреляции зависит от вида шкалы, которой относятся переменные.

    Расчет коэффициента корреляции между двумя недихотомическими переменными не лишен смысла только тогда, кода связь между ними линейна (однонаправлена). Если связь, к примеру, U-образная (неоднозначная), то коэффициент корреляции непригоден для использования в качестве меры силы связи: его значение стремится к нулю. В следующих разделах будут рассмотрены корреляции по Пирсону, Спирману и Кендалу. Еше один раздел специально посвящен частной корреляции.

    Источник

    Расчет КОРРЕЛЯЦИЙ в SPSS

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Корреляция (от лат. correlatio – соотношение):

    — мера степени и направления связи между значениями двух переменных;

    — статистический показатель вероятности связи между двумя переменными, измеренными в количественной шкале.

    Корреляционный анализ – это проверка гипотез о связях между переменными с использованием коэффициентов корреляции.

    Направление связи определяется прямым или обратным соотношением значений двух переменных: если возрастанию значений одной переменной соответствует возрастание значений другой переменной, то взаимосвязь называется прямой (положительной); если возрастанию значений одной переменной соответствует убывание значений другой переменной, то взаимосвязь является обратной (отрицательной). Показателем направления связи является знак коэффициента корреляции.

    Коэффициент корреляции (r):

    2. Мера прямой или обратной пропорциональности между двумя переменными.

    3. Двумерная описательная статистика, количественная мера взаимосвязи (совместимой изменчивости) двух переменных.

    Коэффициент Пирсона (r-Pearson). Мера корреляции, подходящая для двух непрерывных (метрических переменных), измеренных на одной и той же выборке.

    Коэффициент Спирмена (r-Spearman’s). Мера корреляции, подходящая для двух переменных, измеренных в ранговой шкале.

    Источник

    Как посчитать корреляции в спсс

    ; Скорость смены (1-255)

    ; Смена рисунков со спецэффектами («YES» или «NO»)

    ;Произвольный рисунок поверх апплета

    ;X смещение наложенного рисунка

    ;Y смещение наложенного рисунка

    ;Задержка освобождения памяти

    ;Приоритет задачи (1..10)

    Самоучитель по пакету SPSS

    В этой главе речь пойдёт о связи (корреляции) между двумя переменными. Расчёты подобных двумерных критериев взаимосвязи основываются на формировании парных значений, которые образовываются из рассматриваемых зависимых выборок.

    Если в качестве примера мы возьмём данные об уровне холестерина для первых двух моментов времени из исследования гипертонии (файл hyper.sav), то в данном случае следует ожидать довольно сильную связь: большие значения в исходный момент времени являются веским поводом для ожидания больших значений и через 1 месяц.

    Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным. Каждая; пара значений маркируется при помощи определенного символа. Такой график, называемый «диаграммой рассеяния» для двух зависимых переменных можно построить путём вызова меню Graphs. (Графики) Scatter plots. (Диаграммы рассеяния) (см. гл. 22.8).

    Образовавшееся скопление точек показывает, что обследованные пациенты с высокими исходными показателями, как правило, имеют высокие значения холестерина и при повторном опросе через месяц. Это, конечно же, не является неожиданностью; данный пример был выбран, чтобы продемонстрировать наличие явной связи.

    Если коэффициент корреляции отрицательный, это означает наличие противоположной связи: чем выше значение одной переменной, тем ниже значение другой. Сила связи характеризуется также и абсолютной величиной коэффициента корреляции. Для словесного описания величины коэффициента корреляции используются следуюшие градации:

    Очень слабая корреляция

    Очень высокая корреляция

    Метод вычисления коэффициента корреляции зависит от вида шкалы, которой относятся переменные.

    Переменные с интервальной шкалой: коэффициент корреляции Пирсона (корреляция моментов произведений).

    По меньшей мере, одна из двух переменных имеет порядковую шкалу либо не является нормально распределённой: ранговая корреляция по Спирману или т (тау-корреляция) Кендала.

    Одна из двух переменных является дихотомической: точечная двухрядная корреляция. Эта возможность в SPSS отсутствует. Вместо этого может быть применён расчёт ранговой корреляции.

    Обе переменные являются дихотомическими: четырёхполевая корреляция. Данный вид корреляции рассчитываются в SPSS на основании определения мер расстояния и мер сходства (см. гл 15.4).

    Расчёт коэффициента корреляции между двумя недихотомическими переменными не лишён смысла только тогда, кода связь между ними линейна (однонаправлена). Если связь, к примеру, U-образная (неоднозначная), то коэффициент корреляции непригоден для использования в качестве меры силы связи: его значение стремится к нулю. В следующих разделах будут рассмотрены корреляции по Пирсону, Спирману и Кендалу. Ешё один раздел специально посвящён частной корреляции.

    Все меры отличия и сходства для переменных, принадлежащих к интервальной шкале, будут рассмотрены в главе 20.3. Эти меры являются важным элементом кластерного анализа. Ниже приведены формулы для мер сходства между бинарными (дихотомическими) переменными, принадлежащими к интервальной шкале. Символами а, b, с и d обозначены частоты, находящиеся в ячейках таблицы 2×2 (четырёхполевой таблицы). В случае необходимости, более подробное объяснение этих формул Вы найдёте в главе 20.3.3.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 15.4: Диалоговое окно Distances. (Расстояния).

    Пример первый: сходства между дихотомическими переменными.

    Создайте сначала таблицу сопряженности для переменных item3 и item 14. Эти переменные соответствуют ответам на вопросы «Считаете ли Вы, что развитие космонавтики необходимо?» и соответственно «Согласились бы Вы предоставить себя в распоряжение учёным для научных экспериментов?» (с кодировками 1 = да и 2 = нет).

    Частоты в таблице 2×2 распределились следующим образом:

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 15.5: Частоты в таблице 2×2

    Внутриклассовый коэффициент корреляции (Intraclass Correlation Coefficient (ICC))

    Источник

    Корреляционный анализ

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Национальный институт общественного здоровья, г. Осло, Норвегия

    В статье рассматривается применение корреляционного анализа с расчетом коэффициентов корреляции Пирсона, Спирмена и Кендалла с использованием пакета статистических программ SPSS . Изложенный материал дает общие сведения об оценке степени тесноты взаимосвязи между переменными и призван вызвать интерес читателей журнала к прочтению специализированной литературы перед началом работы над будущими публикациями.

    Ключевые слова: корреляционный анализ, коэффициенты корреляции, SPSS .

    Корреляционный анализ встречается в отечественной биомедицинской литературе чаще, чем в зарубежной, вероятно, из-за его кажущейся простоты, однако целесообразность его применения во многих случаях остается сомнительной. Представление результатов далеко не всегда является корректным, а интерпретация их довольно часто ошибочно включает сообщения о причинно-следственных связях и даже обнаружении «достоверных различий между группами».

    На самом деле корреляционный анализ позволяет определить только силу и направление взаимосвязи между переменными.

    Коэффициент корреляции Пирсона используется наиболее часто, хотя его следует применять только при соблюдении следующих условий:

    · Обе переменные являются количественными и непрерывными

    · Как минимум один из признаков (а лучше оба) имеет нормальное распределение (поэтому расчет этого коэффициента является параметрическим методом оценки взаимосвязи признаков)

    · Зависимость между переменными носит линейный зарактер

    · Гомоскедастичность (вариабельность одной переменной не зависит от значений другой переменной)

    · Независимость участников исследования друг от друга (признаки Х и Y у одного участника исследования независимы от признаков Х и Y у другого)

    · Парность наблюдений (признак Х и признак Y изучаются у одних и тех же участников исследования)

    · Достаточно большой объем выборки, как минимум 25 наблюдений [12]

    · Для адекватной проекции расчетов на генеральную совокупность выборка должна быть репрезентативной.

    Таким образом, перед принятием решения о применении коэффициента корреляции Пирсона исследователям необходимо знать тип данных; распределение изучаемых признаков в генеральной совокупности (популяции), а если это неизвестно, то проверить распределение обеих переменных в выборке; построить скаттерограммы (графики разброса) для того, чтобы убедиться в том, что связь между переменными носит линейный характер, а также чтобы проверить условие гомоскедастичности (рис. 1). При соблюдении этого условия разброс данных переменной Y будет приблизительно одинаковым для всех значений переменной Х. Если вариабельность переменной Y меняется в зависимости от значений переменной Х (скаттерограмма имеет вид треугольника, трапеции и т. п.), то тогда коэффициент корреляции Пирсона не будет должным образом отражать взаимосвязи между переменными. В правой скаттерограмме на рис. 1 видно, что разброс значений переменной, отложенной по оси ординат, увеличивается по мере увеличения значений переменной, отложенной по оси абсцисс. Два последних необходимых условия применения коэффициента (достаточный объем и репрезентативность выборки) должны приниматься во внимание еще на этапе планирования исследования.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 1. Вид скаттерограммы при соблюдении (слева) и несоблюдении (справа) условия гомоскедастичности

    Для построения скаттерограммы в SPSS следует выбрать в выпадающем меню « Graph » меню « Interactive », в нем выбрать « Scatterplot », как показано на рис. 2. В результате появится окно « Create Scatterplot », в котором предлагается переменные переместить из левого поля в поля, располагающиеся около системы координат в правой части окна. Для нашего примера будем на оси абсцисс откладывать значения длины новорожденных, а по оси ординат значения их массы тела (рис. 3).

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 2. Окно « SPSS Data Editor » и выбор меню для построения скаттерограмм

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 3. Диалоговое окно « Create Scatterplot »

    SPSS также дает возможность построить нескольких скаттерограмм одновременно. Например, если бы мы хотели посмотреть взаимосвязь между длиной и весом новорожденных раздельно для мальчиков и девочек, то можно было бы перенести переменную « pol » в поле « Panel Variables », в результате чего SPSS создала бы две скаттерограммы – одну для мальчиков, другую для девочек. Если же необходимо представить обе скаттерограммы в одной системе координат, то группировочную переменную ( pol ) следует поместить в одно из полей в области « Legend Variables ».

    При помещении группировочной переменной в поле « Color » скаттерограммы для мальчиков и девочек будут построены разными цветами; при помещении переменной « pol » в поле « Style » условные обозначения для обоих полов будут различными (по умолчанию кружки и треугольники). Помещение переменной « pol » в поле « Size » приведет к тому, что обозначения для мальчиков и девочек будут разных размеров, что, однако, не очень удобно при визуальной оценке результатов. Помимо меню « Interactive » скаттерограммы можно строить, используя меню « Scatter / Dot » (рис. 4), которое можно найти в выпадающем меню « Graphs ».

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 4. Окно « Scatter / Dot »

    Для построения простой скаттерограммы следует выбрать « Simple Scatter », после чего появится окно « Simple Scatterplot » (рис. 5), в котором также можно переместить интересующие нас переменные из левого поля в одно из правых в зависимости от поставленной задачи. На рис. 5 показано, как выбрать переменные для построения скаттерограммы с длиной новорожденных, отложенной на оси абсцисс, и массой тела – на оси ординат, причем в пределах одной системы координат разными цветами будут показаны скаттерограммы для мальчиков и девочек.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 5. Окно « Simple Scatterplot »

    Для нашего примера при построении скаттерограммы четко видно, что зависимость носит линейный характер (дети обоих полов анализировались вместе), причем условие гомоскедастичности соблюдается, так как вариабельность массы тела новорожденных приблизительно одинакова для всех значений длины (рис. 6). Известно, что и длина, и масса тела новорожденных, родившихся в срок от одноплодных беременностей, в генеральной совокупности имеют нормальное распределение. В данное исследование каждая женщина была включена только один раз, то есть наблюдения можно с достаточной долей уверенности считать независимыми. Объем выборки составляет 869 человек; выборка является достаточно репрезентативной, так как исследование имело сплошной характер, то есть в него включались практически все беременные г. Северодвинска, вставшие на учет в женские консультации в 1999 году [14]. Таким образом, условия для применения коэффициента корреляции Пирсона соблюдены.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис 6. График корреляционной взаимосвязи между длиной и массой тела новорожденных в г. Северодвинске

    В ситуациях, когда все условия для применения коэффициента корреляции Пирсона соблюдаются, этот метод является наиболее подходящим для определения корреляционной зависимости между изучаемыми признаками. Однако если условия не соблюдаются, коэффициент корреляции Пирсона может дать искаженные результаты, а потому в таких ситуациях следует применять непараметрические коэффициенты корреляции (Спирмена или Кендалла).

    Для проведения корреляционного анализа нужно в меню « Analyze » выбрать меню « Correlate », в котором, в свою очередь, выбрать « Bivariate », как показано на рис. 7.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 7. « SPSS Data Editor » и выбор меню для проведения корреляционного анализа

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Представляя результаты корреляционного анализа, рекомендуется показывать абсолютное значение коэффициента корреляции, достигнутый уровень значимости и количество наблюдений, на основании которых был получен данный коэффициент. Для нашего примера: r = 0,83, p n = 869. Если задачей исследования ставится определение генерального параметра (коэффициента корреляции для генеральной совокупности), то необходимо представить доверительный интервал для полученного коэффицента.

    SPSS не рассчитывает доверительные интервалы для коэффициентов корреляции, однако это не должно считаться поводом для их игнорирования, так как интервальная оценка любого генерального параметра всегда более информативна, чем точечная. Доверительные интервалы для коэффициента корреляции Пирсона можно рассчитать, используя онлайн-калькулятор на веб-странице http://faculty. vassar. edu/lowry/rho. html (рис. 11). В верхнее поле следует ввести рассчитанный коэффициент корреляции Пирсона ( r ), а в нижнее – объем выборки ( n ). В качестве разделительного знака используется точка, а не запятая.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    где ln обозначает натуральный логарифм, а n – объем выборки. Само же значение коэффициента корреляции для генеральной совокупности, рассчитанное по данным выборки, будет в 95 % случаев находиться в интервале

    от Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссдо Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    где е – число Эйлера (е ≈ 2,7). В рассматриваемом примера коэффициент корреляции Пирсона для взаимосвязи между длиной и массой тела новорожденных в г. Северодвинске был равен 0,83 и статистически значимо отличался от 0 ( p ZL и ZU :

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссКак посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    что соответствует следующим нижней и верхней границам 95 % доверительного интервала:

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсси Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс.

    Использование онлайн-калькулятора на странице http://faculty. vassar. edu/lowry/rho. html дает аналогичный результат (рис. 12), причем автоматически рассчитывается не только 95 %, но и 99 % доверительный интервал для коэффициента корреляции. Для «ручных» вычислений 99 % доверительного интервала 1,96 в формуле следует заменить на 2,58.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 12. Рассчитанные с помощью онлайн-калькулятора 95 % и 99 % доверительные интервалы для коэффициента корреляции Пирсона

    Помимо доверительных интервалов с помощью преобразования Фишера и онлайн-калькуляторов можно рассчитать, отличается ли полученный коэффициент корреляции от известного или предполагаемого популяционного значения коэффициента корреляции (ρ). В основе расчетов лежит формула

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    в которой r – значение коэффициента корреляции, рассчитанное по данным выборочной совокупности, а ρ – популяционное значение, с которым проводится сравнение. Рассчитанное значение z сравнивается с табличными значениями. Для статистически значимых различий на уровне доверительной вероятности 95 % z = 1,96. Вышеприведенная формула используется в онлайн-калькуляторе на странице http://faculty. vassar. edu/lowry/VassarStats. html. На рис. 13 представлен пример ввода данных для сравнения коэффициента корреляции из данного примера с фиксированным значением 0,8. Расчет осуществляется путем нажатия на кнопку « Calculate ».

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 13. Внешний вид онлайн-калькулятора (http://faculty. vassar. edu/lowry/VassarStats. html) для сравнения коэффициента корреляции Пирсона с фиксированным значением

    Результаты расчетов представлены на рис. 14, из них видно, что выборочный коэффициент корреляции статистически значимо отличается от 0,8 (р = 0,009 для двустороннего теста), что неудивительно, так как рассчитанный ранее 95 % доверительный интервал (0,81–0,85) не включал в себя значение 0,8.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 14. Результаты сравнения выборочного коэффициента корреляции Пирсона с фиксированным значением с помощью онлайн-калькулятора (http://faculty. vassar. edu/lowry/VassarStats. html)

    Описание методов и примеров сравнения коэффициентов корреляции Пирсона для двух независимых выборок (на примере оценки зависимости между индексом массы тела (ИМТ) и чувствительностью к инсулину для групп с наличием и отсутствием гипертиреоза) и для ситуаций, когда нужно сравнить степень тесноты взаимосвязи одной и той же переменной с двумя другими, представлены в [13].

    Как интерпретировать коэффициент корреляции Пирсона и что он означает? Во многих учебных пособиях, например в [5], сообщается, что r ≥ 0,7 говорит о наличии сильной связи между признаками, 0,3 r r r 2), который, как следует из его обозначения, рассчитывается путем возведения коэффициента корреляции Пирсона во вторую степень. Коэффициент детерминации показывает, какую долю вариабельности одного из изучаемых признаков способен объяснить другой признак. Таким образом, видно, что приведенная выше классификация подразумевает под сильной связью ситуацию, когда одна из переменных способна объяснить от 49 % вариабельности другой переменной. Естественно, возникают сомнения в наличии сильных связей, если одна переменная способна объяснить лишь половину вариабельности другой. Еще один пример: коэффициент корреляции между ИМТ и систолическим артериальным давлением (САД) в некоторых странах Африки и Юго-Восточной Азии составляет в среднем 0,25 при уровне значимости p Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 15. Значения коэффициента корреляции Пирсона для определения взаимосвязи между двумя признаками, изображенные в виде скаттерограмм (Источник: http://upload. wikimedia. org/wikipedia/ru/3/3f/Corr-example2.png)

    Еще одним стимулом для использования скаттерограмм для графического представления данных перед принятием решения о применении коэффициента корреляции Пирсона является высокая чувствительность этого коэффициента к наличию выскакивающих величин (выбросов). Так, на рис. 16 слева изображена скаттерограмма взаимосвязи двух признаков для выборки объемом 25 человек. Рассчитанный коэффициент корреляции Пирсона составил 0,9. После включения всего лишь одного одного «нетипичного» случая (в левом верхнем углу правой скаттерограммы) r уменьшился до 0,5. Более существенные выбросы могут полностью «уничтожить» зависимость, однако всегда следует разбираться, является ли выброс следствием ошибки регистрации данных, или же это истинные значения переменных.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссКак посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Из ошибок и неточностей, встречающихся при применении коэффициента корреляции Пирсона в отечественной медицинской периодике, можно упомянуть следующие:

      Применение метода при несоблюдении необходимых условий Интерпретация корреляционной связи как причинно-следственной Расчет коэффицентов корреляции для всех пар переменных по принципу «сравним все со всем, авось что и найдем» Неполное представление результатов корреляционного анализа (в некоторых работах авторы сообщают в разделе «Методы» о применении корреляционного анализа, однако не удается найти даже коэффициентов корреляции) Представление только точечных оценок (игнорирование доверительных интервалов) Использование шаблонной фразы об использовании «корреляционно-регрессионного анализа» в случаях, когда использовался только корреляционный анализ Отождествление статистически значимых коэффициентов корреляции с клинически важными Отсутствие обсуждения, почему были получены те или иные коэффициенты корреляции (истинная зависимость? ложная зависимость? наличие других переменных, тесно коррелирующих с обеими изучаемыми переменными?) Заключения о полном отсутствии взаимосвязи между признаками при r близком к 0 при наличии нелинейной взаимосвязи Редкое применение скаттерограмм.

    Зарубежные исследователи, проводившие анализ применения корреляционного анализа в наиболее престижных медицинских журналах США и Великобритании, наиболее часто встречающимися проблемами называли игнорирование доверительных интервалов, неполное представление результатов, а именно отсутствие данных об объеме выборки, а также придание слишком большого значения статистической значимости при оценке важности коэффициентов [19, 22].

    Всегда следует помнить, что в результате корреляционного анализа невозможно установить причинно-следственные связи, поэтому выводов о том, что один из изучаемых признаков вызывает другой лишь на основании корреляционного анализа, делать нельзя. Установленные корреляционные связи являются лишь статистическими, хотя некоторые из них могут быть и функциональными. В одном из часто используемых в качестве примера исследований была установлена сильная положительная корреляционная взаимосвязь между количеством гнезд аистов и количеством новорожденных в Копенгагене в ранние послевоенные годы, однако этот результат сложно считать доказательством того, что детей приносят аисты [цит. по 9]. Данная взаимосвязь авляется лишь статистической. Статистические взаимосвязи могут быть вызваны наличием третьей переменной, которая тесно связана с обеими изучаемыми в ходе корреляционного анализа переменными. Так, например, вероятность рождения ребенка с синдромом Дауна тесно коррелирует с количеством родов у матери до настоящей беременности. Эта взаимосвязь, как нетрудно догадаться, обусловлена тем, что возраст матери тесно связан с обеими переменными, что и приводит к обнаружению корреляционной, но никак не причинно-следственной связи между переменными.

    При скошенных распределениях, а также при наличии истинных выбросов (если исследователи решают их оставить для анализа) лучше использовать непараметрические коэффициенты корреляции Спирмена или Кендалла, первый из которых в зарубежной литературе применяется значительно чаще [21]. В российской биомедицинской литературе коэффициент Кендалла применяется настолько редко, что складывается впечатление, будто отечественные исследователи с ним просто незнакомы.

    Для расчета обоих непараметрических коэффициентов характерно использование не исходных значений признаков, а их рангов, что позволяет применять их для распределений, отличающихся от нормального. Использование рангов также позволяет применять непараметрические коэффициенты корреляции не только для количественных, но и для порядковых (ранговых, ординальных) данных. Технические подробности расчета коэффициента корреляции Спирмена в статье не приводятся, так как они описываются практически во всех пособиях по основам статистики.

    Коэффициент корреляции Спирмена также является безразмерной величиной, принимающей значения от –1 до 1. Значение 1 говорит о наличии полного совпадения между рангами изучаемых переменных, –1 – о том, что ранги полностью противоположны. При полном отсутствии взаимосвязи между рангами переменных коэффициент корреляции Спирмена будет равен 0. Возведеный в квадрат, он также называется коэффициентом детерминации, который можно обозначить как ρ2. Его можно интерпретировать как долю вариабельности рангов одной переменной, которую можно объяснить с помощью рангов другой переменной. Данная интерпретация достаточно громоздка и не совсем понятна с практической точки зрения, поэтому, несмотря на большую популярность коэффициента Спирмена, многие авторы склонны считать его менее практичным, чем коэффициент Кендалла [10, 11, 20, 21]. Для нашего примера с длиной и массой тела новорожденных ρ2 = 0,822 = 0,67. Поскольку распределение обеих переменных в данном примере близко к нормальному, различия между коэффициентами корреляции Пирсона и Спирмена, а также их коэффициентами детерминации незначительны. В подобных ситуациях всегда лучше применять коэффициент корреляции Пирсона, так как он обладает большей статистической мощностью и его значительно проще интерпретировать.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс
    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    после чего полученные значения следует подставить в уже известную формулу для расчета верхней и нижней границ 95 % доверительного интервала:

    от Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссдо Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс
    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    а значение коэффициента корреляции для генеральной совокупности с 95 % надежностью будет располагаться в пределах

    от Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссдо Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс.

    Многие авторы считают, что из непараметрических коэффициентов корреляции наиболее просто интерпретировать коэффициент корреляции Кендалла [10, 11, 20, 21]. Учитывая, что этот коэффициент реже всего представлен в отечественной биомедицинской литературе, остановимся на нем несколько подробнее.

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссКоэффициент корреляции Кендалла рассчитывается по формуле [16, 18]:

    Если С представляет собой количество конкордантных пар из возможных в выборочной совокупности n ( n – 1)/2 пар, то оценить вероятность того, что пара наблюдений будет конкордантной (πс), можно с помощью формулы:

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Аналогично вероятность того, что пара наблюдений будет дискордантной ( Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс), можно оценить с помощью формулы:

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Таким образом, для любой пары наблюдений, отобранных случайно, τ a Кендалла может интерпретироваться как разность между вероятностью того, что пара будет конкордантной, и того, что она будет дискордантной, то есть

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Рис. 17. Графическое представление рангов для двух изучаемых признаков ( X и Y ) для 6 участников исследования.

    Из рисунка видно, что некоторые линии, соединяющие ранги, пересекаются. Если посчитать количество пересечений и обозначить его как к, то коэффициент корреляции Кендалла можно рассчитать по формуле:

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    Доверительный интервал для τ a также можно рас c читать с помощью преобразования Фишера, которое дает достаточно адекватную интервальную оценку коэффициента корреляции Кендалла для генеральной совокупности при объеме выборки не менее 10 наблюдений и значении τ не более 0,8. Отличие будет заключаться в расчете вспомогательных значеий ZL и ZU :

    Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссКак посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс

    которые затем подставляют в формулу для расчета 95 % доверительного интервала:

    от Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спссдо Как посчитать корреляции в спсс. Смотреть фото Как посчитать корреляции в спсс. Смотреть картинку Как посчитать корреляции в спсс. Картинка про Как посчитать корреляции в спсс. Фото Как посчитать корреляции в спсс.

    Следует помнить, что вышеописанный коэффициент корреляции Кендалла (τ a ) применяется для определения степени тесноты связи между переменными без учета равных (связанных) рангов. При наличии таковых, то есть когда два или более наблюдений по любой из переменных имеют одинаковые ранги, лучше применять другие разновидности коэффициента корреляции Кендалла, которые при расчете равные ранги учитывают. Такие ситуации неибезжны при изучении порядковых признаков, таких как, например, образование, степень тяжести заболевания и т. п.

    Помимо представленных в данной статье существует еще много других разновидностей корреляционного анализа как для количественных, так и для качественных переменных, как для двух, так и для нескольких переменных одновременно, с которыми можно ознакомиться в специализированной статистической литературе. Интересный обзор применения корреляционного анализа в медицинских исследований для различных типов переменных был недавно опубликован Н. Kraemer [17]. В следующем выпуске будут кратко представлены основы линейного регрессионного анализа.

    1. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей / А. Бююль, П. Цёфель. – Минск : ДиаСофт, 2005. – 608 с.

    National Institute of Public Health, Oslo, Norway

    The article gives a brief introduction about correlation analysis and calculations of Pearson, Spearman and Kendall correlation coefficients using SPSS software. The paper provides only general introduction about the analysis of the strength of statistical association between variables. The readers are encouraged to consult statistical literature prior to analysing own data and preparing manuscripts.

    Key words: correlation analysis, correlation coefficients, SPSS.

    старший советник Национального института общественного здоровья, г. Осло, Норвегия

    Адрес: Nasjonalt folkehelseinstitutt, Pb 4404 Nydalen, 0403 Oslo, Norway

    Источник

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *