Взаимодействия и почему мы все ошибаемся?


Откуда исходит интерпретация взаимодействия? Предположим, что у нас есть пациенты в нашей выборке и линейной модели (простой или смешанной).

Для линейной модели имеем уравнение вида:

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2,

где A0 - точка пересечения, а A1 и A2 - основные эффекты X1 и X2 соответственно.

Скажем, X1 - это фактор: Группа 1 по сравнению с Группой 2. Затем статистическая программа кодирует его как Группа 1 X1 = 0 и для Группы 2 X2 = 1.

Затем предположим, что X2 - непрерывная ковариата, такая как возраст.

Что именно означают A1, A2 и A3?

Предположим, что все оценки A1, A2 и A3 значимы. Это означает, что они существенно отличаются от нуля, и мы можем их интерпретировать. Другими словами, если мы повторим наш эксперимент с той же моделью и с другой выборкой того же размера из совокупности, то A1, A2 и A3 будут отличаться от оценок, которые у нас есть сейчас, но они все равно будут отличаться от нуля. Вот что означает значение.

Итак, давайте вернемся к смыслу A1, A2 и A3.

Посмотрите, как выглядит уравнение:

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2

Если бы у нас не было термина взаимодействия, интерпретация A1 и A2 была бы легкой. Давайте разберемся.

Y = А0 + А1 * Х1 + А2 * Х2.

X1 кодируется как 0 для группы и 1 для группы 2, потому что группа 1 является контрольной группой. Вы всегда можете изменить контрольную группу, но предполагайте, что группа 1 является контрольной. Обратите внимание, что как только вы спросите статистическую программу, в противном случае она выберет для символьной переменной в качестве контрольной группы первую в алфавитном порядке. Так, для кодировки «А», «В» это будет группа «А».

Допустим, у нас есть два пациента. Пациент 1 из группы 1, возраст Age1. Каков его ответ Y тогда?

Y1 = A0 + A1 * 0 + A2 * Возраст1

Допустим, Пациент 2 из группы 2 и его / ее возраст Age2.

Тогда его / ее ответ:

Y2 = A0 + A1 * 1 + A2 * Возраст2.

В чем разница между Y2 и Y1?

Y2-Y1 = A0 + A1 * 1 + A2 * Age2- (A0 + A1 * 0 + A2 * Age1) = A1 + A2 (Age2-Age1).

А что, если оба они одного возраста? Потом:

Y2-Y1 = A1.

Вот откуда взялась наша интерпретация A1! A1 - это изменение ответа Y между двумя разными пациентами из групп 1 и 2, которые имеют одинаковый возраст (когда нет условий взаимодействия!)

Другими словами, когда мы меняем группу с 1 на 2, Y меняется на A1. Углубляясь от знака A1, он увеличивается или уменьшается.

А как насчет А2? X2 - непрерывная переменная. Следовательно, у нас сейчас нет эффекта «смена групп». У нас есть эффект «увеличения на 1 единицу в X2».

Допустим, у нас есть два таких же пациента из группы 1 и Age = Age1 и пациент 2 из группы 2 и Age2, как и раньше, но теперь дополнительно предположим, что Age2 = Age + 1. Таким образом, разница в возрасте между ними составляет 1 год.

В чем разница между Y2 и Y1 для этих пациентов сейчас?

Y2-Y1 = A0 + A1 * 1 + A2 * Age2- (A0 + A1 * 0 + A2 * Age1) = A1 + A2 (Age2-Age1) = A1 + A2 (Age1 + 1-Age1) = A1 + A2.

А если они из одной группы? Тогда, если они оба из группы 1:

Y2-Y1 = A2

И если они оба из Группы 2:

Y2-Y2 = A1 (1-1) + A2 = A2

И это интерпретация A2! A2 - это изменение ответа Y между двумя разными пациентами из одной группы, когда разница между их возрастом составляет 1 год (когда нет условий взаимодействия!). Другими словами, мы можем сказать, что A2 - это изменение ответа Y, когда X2 увеличивается на 1 единицу, а X1 остается неизменным.

Итак, теперь мы знаем, как интерпретировать коэффициенты в модели без условий взаимодействия. Давайте теперь добавим термин взаимодействия и посмотрим, что изменится.

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2

Попробуем интерпретировать коэффициент A1, как мы делали раньше, в модели без члена взаимодействия.

Давайте вычислим разницу между двумя людьми из Группы 1 и Группы 2 и одного возраста:

Y2-Y1 = A0 + A1 * 1 + A2 * Возраст + A3 * Возраст * 1 - (A0 + A1 * 0 + A2 * Возраст + A3 * 0 * Возраст) = A1 + A3 Возраст

Хорошо… так что это не совсем А1, как раньше. Как сделать это А1? Мы должны предположить, что возраст равен нулю, даже если это нереально, поскольку у нас нет людей с нулевым возрастом.

Следовательно, интерпретация A1 следующая:

A1 - это изменение Y при сравнении двух людей из группы 2 и группы 1 с одинаковым возрастом, равным 0. Чтобы избежать нежелательной интерпретации A1 в этой модели, мы можем использовать вместо Age X2 переменную X2 '= X2-mean (X2), которая называется средний центр. В этом случае у вас будет следующая интерпретация A1:

A1 - это изменение Y, когда мы сравниваем двух людей из группы 2 и группы 1 с одинаковым возрастом = средний возраст.

Аналогично сделаем интерпретацию A2.

Давайте посчитаем разницу между двумя людьми из одной группы и возрастом, различающимся на 1 год.

Если они из обеих групп 2:

Y2-Y1 = A0 + A1 * 1 + A2 * Age1 + A3 * Age1 * 1 - (A0 + A1 * 1 + A2 * (Age1 + 1) + A3 * 1 * (Age1 + 1)) = A2 + A3

И если они оба из группы 1:

Y2-Y1 = A0 + A1 * 0 + A2 * Age1 + A3 * Age1 * 0 - (A0 + A1 * 0 + A2 * (Age1 + 1) + A3 * 0 * (Age1 + 1)) = A2.

Итак, последнее дает нам интерпретацию A2! Это изменение Y, когда возраст увеличивается на 1 единицу, и группа не только фиксирована, но и должна быть контрольной группой 1!

И последнее, но не менее важное, какова интерпретация A3?

Ну, это уже было раньше:

Y2-Y1 = A0 + A1 * 1 + A2 * Age1 + A3 * Age1 * 1 - (A0 + A1 * 1 + A2 * (Age1 + 1) + A3 * 1 * (Age1 + 1)) = A2 + A3

Это модификация эффекта A2, оцененного для группы 1, рассчитанного для пациентов из группы 2. Таким образом, общий эффект увеличения возраста на 1 для группы 2 равен A2 + A3, и именно так мы должны интерпретировать эффект A3. Эффект увеличения X2 на 1 для группы 2 больше на A3 по сравнению с таким же эффектом для группы 1.

Еще одно последнее слово. Что, если бы в уравнении не было непрерывных переменных:

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2

 Как это изменит нашу предыдущую интерпретацию?

Так что X2 стал еще одним фактором. Скажем, Пол. Поскольку он кодируется как «Женщины» и «Мужчины», если вы не спросите иначе, он будет закодирован как «Женский» = 0 (эталонный) и «Мужской» = 1.

Тогда интерпретация A1 такова:

A1 - это изменение Y, когда мы сравниваем двух людей из группы 2 и группы 1 с одинаковым полом = женский. Итак, это эффект группы для женщин.

А для A2:

Это изменение Y, когда мы сравниваем мужчин и женщин из той же группы 1.

А для A3:

Это модификация эффекта A2, оцененного для группы 1, рассчитанного для пациентов из группы 2. Таким образом, общий эффект сравнения мужчин и женщин для группы 2 равен A2 + A3. Влияние пола для группы 2 на A3 больше, чем такое же влияние пола для группы 1.

Домашнее задание:

Напишите интерпретацию A1 и A2 для модели без взаимодействия:

Y = A0 + A1 * X1 + A2 * X2,

 когда X1 - группа, а X2 - пол.

5 мысли о «Interactions and why we all get them wrong?»

  • Замечательный блог! Есть ли у вас какие-нибудь советы для начинающих писателей?
    Я планирую вскоре создать свой собственный сайт, но я немного запутался во всем.
    Вы бы предложили начать с бесплатной платформы, такой как WordPress
    или выбрать платный вариант? Существует так много вариантов, что я совершенно ошеломлен.
    .. Есть идеи? Большое спасибо!

  • Не возражаете, если я процитирую несколько ваших статей при условии, что я
    предоставлять кредит и источники обратно на ваш веблог?
    Мой блог находится в той же нише, что и ваш, и мои посетители действительно выиграли бы от некоторой информации, которую вы здесь представили.
    Пожалуйста, дайте мне знать, если вы не против.
    Большое спасибо!

Добавить комментарий для Аноним Отменить ответ

Ваш e-mail не будет опубликован. Обязательные поля помечены *


ru_RURussian