Interacties en waarom begrijpen we ze allemaal verkeerd?


Waar komt de interpretatie van de interactie vandaan? Laten we aannemen dat we patiënten in onze steekproef hebben en een lineair model (eenvoudig of gemengd).

Voor het lineaire model hebben we een vergelijking van de vorm:

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2,

waarbij A0 het snijpunt is en A1 en A2 de hoofdeffecten van respectievelijk X1 en X2.

Laten we zeggen dat X1 de factor is: Groep 1 versus Groep 2. Vervolgens wordt het door de statistische software gecodeerd als Groep 1 X1 = 0 en voor Groep2 X2 = 1.

Laten we dan aannemen dat X2 een continue covariaat is, zoals leeftijd.

Wat betekenen de A1, A2 en A3 precies?

Stel dat alle schattingen A1, A2 en A3 significant zijn. Dat betekent dat ze significant verschillen van nul en dat we ze kunnen interpreteren. Met andere woorden, als we ons experiment zouden herhalen met hetzelfde model en de verschillende steekproef van dezelfde grootte uit de populatie, zouden de A1, A2 en A3 anders zijn dan de schattingen die we nu hebben, maar ze zullen nog steeds verschillen van nul. Dit is wat de betekenis betekent.

Laten we dus terugkomen op de betekenis van A1, A2 en A3.

Kijk hoe de vergelijking eruitziet:

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2

Als we de interactieterm niet hadden, dan zou de interpretatie van A1 en A2 gemakkelijk zijn. Laten we het uitzoeken.

Y = A0 + A1 * X1 + A2 * X2.

X1 is gecodeerd als 0 voor groep en 1 voor groep 2 omdat groep 1 een referentiegroep is. U kunt de referentiegroep altijd wijzigen, maar ga ervan uit dat Groep 1 de referentiegroep is. Merk op dat als je het eenmaal aan het statistische programma vraagt, het anders de tekenvariabele als referentiegroep kiest, de eerste in alfabetische volgorde. Dus voor "A", "B" codering is het "A" -groep.

Laten we nu zeggen dat we twee patiënten hebben. Patiënt 1 komt uit groep 1 en zijn / haar leeftijd is leeftijd 1. Wat is dan zijn / haar antwoord Y?

Y1 = A0 + A1 * 0 + A2 * Leeftijd1

Stel dat patiënt 2 uit groep 2 komt en dat zijn / haar leeftijd Age2 is.

Zijn / haar antwoord is dan:

Y2 = A0 + A1 * 1 + A2 * Leeftijd2.

Wat is het verschil tussen Y2 en Y1?

Y2-Y1 = A0 + A1 * 1 + A2 * Age2- (A0 + A1 * 0 + A2 * Age1) = A1 + A2 (Age2-Age1).

En als ze allebei even oud zijn? Vervolgens:

Y2-Y1 = A1.

Dus hier komt onze interpretatie van A1 vandaan! A1 is de verandering in de respons in Y tussen twee verschillende patiënten uit groep 1 en 2 die dezelfde leeftijd hebben (als er geen interactietermen zijn!)

Met andere woorden, wanneer we de groep veranderen van 1 naar 2, verandert de Y met A1. Dieper op het bord van A1 neemt het toe of af.

Hoe zit het met A2? X2 is een continue variabele. Daarom hebben we nu geen “de groepen veranderen” -effect. We hebben het effect "de verhoging met 1 eenheid in X2".

Laten we zeggen dat we twee dezelfde patiënten hebben uit groep 1 en leeftijd = leeftijd1 en patiënt 2 uit groep 2 en leeftijd2 als voorheen, maar laten we nu bovendien aannemen dat leeftijd2 = leeftijd + 1. Het verschil tussen deze twee in leeftijd is dus 1 jaar.

Wat is het verschil tussen Y2 en Y1 voor die patiënten nu?

Y2-Y1 = A0 + A1 * 1 + A2 * Age2- (A0 + A1 * 0 + A2 * Age1) = A1 + A2 (Age2-Age1) = A1 + A2 (Age1 + 1-Age1) = A1 + A2.

En wat als ze uit dezelfde groep komen? Als ze dan allebei uit groep 1 komen:

Y2-Y1 = A2

En als ze allebei uit groep 2 komen:

Y2-Y2 = A1 (1-1) + A2 = A2

En dit is de interpretatie van A2! A2 is de verandering in de respons in Y tussen twee verschillende patiënten uit dezelfde groep als het verschil tussen hun leeftijd 1 jaar is (als er geen interactietermen zijn!). Met andere woorden, we kunnen zeggen dat A2 de verandering in het antwoord Y is wanneer X2 met 1 eenheid toeneemt en X1 vast blijft.

Oké, dus nu weten we hoe we de coëfficiënten in een model moeten interpreteren zonder interactietermen. Laten we nu de interactieterm toevoegen en kijken wat er verandert.

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2

Laten we proberen de A1-coëfficiënt te interpreteren zoals we eerder deden, in het model zonder de interactieterm.

Laten we het verschil berekenen tussen de twee mensen uit groep 1 en groep 2 en dezelfde leeftijd:

Y2-Y1 = A0 + A1 * 1 + A2 * Leeftijd + A3 * Leeftijd * 1 - (A0 + A1 * 0 + A2 * Leeftijd + A3 * 0 * Leeftijd) = A1 + A3 Leeftijd

Ok ... dus dit is niet precies A1 zoals voorheen. Hoe maak je er A1 van? We moeten aannemen dat leeftijd nul is, zelfs als dit onrealistisch is, aangezien we geen mensen hebben met een leeftijd van nul.

Daarom is de interpretatie van A1 als volgt:

A1 is de verandering in Y wanneer we twee mensen uit groep 2 en groep 1 met dezelfde leeftijd gelijk aan 0 vergelijken. Om de ongewenste interpretatie van A1 in dat model te vermijden, kunnen we in plaats van Age X2 variabele X2 '= X2-mean (X2) gebruiken die wordt genoemd gemiddelde centrering. In dat geval heeft u de volgende interpretatie van A1:

A1 is de verandering in Y wanneer we twee mensen uit groep 2 en groep 1 met dezelfde leeftijd = gemiddelde leeftijd vergelijken.

Laten we analoog de interpretatie van A2 maken.

Laten we het verschil berekenen tussen de twee mensen uit dezelfde groep en de leeftijd die 1 jaar verschilt.

Als ze uit beide groepen 2 komen:

Y2-Y1 = A0 + A1 * 1 + A2 * Leeftijd1 + A3 * Leeftijd1 * 1 - (A0 + A1 * 1 + A2 * (Leeftijd1 + 1) + A3 * 1 * (Leeftijd1 + 1)) = A2 + A3

En als ze allebei uit Groep1 komen:

Y2-Y1 = A0 + A1 * 0 + A2 * Leeftijd1 + A3 * Leeftijd1 * 0 - (A0 + A1 * 0 + A2 * (Leeftijd1 + 1) + A3 * 0 * (Leeftijd1 + 1)) = A2.

Dus de laatste geeft ons de interpretatie van A2! Dit is de verandering in Y wanneer de leeftijd met 1 eenheid toeneemt en de groep niet alleen vast is, maar het moet de referentiegroep 1 zijn!

En als laatste, maar niet de minste, wat is de interpretatie van A3?

Nou, we hebben het al eerder:

Y2-Y1 = A0 + A1 * 1 + A2 * Leeftijd1 + A3 * Leeftijd1 * 1 - (A0 + A1 * 1 + A2 * (Leeftijd1 + 1) + A3 * 1 * (Leeftijd1 + 1)) = A2 + A3

Dit is de wijziging van het geschatte A2-effect voor groep 1, berekend voor patiënten uit groep 2. Het totale effect van het verhogen van de leeftijd met 1 voor groep 2 is dus gelijk aan A2 + A3 en dat is hoe we het effect van A3 moeten interpreteren. Het effect van het verhogen van X2 met 1 voor Groep 2 is groter met A3 in vergelijking met hetzelfde effect voor Groep 1.

Nog een laatste woord. Wat als er geen continue variabelen in de vergelijking zouden zijn:

Y = A0 + A1 * X1 + A2 * X2 + A3 * X1 * X2

 Hoe zou dat onze vorige interpretatie veranderen?

Dus X2 is nu een andere factor. Laten we zeggen geslacht. Omdat het is gecodeerd als Vrouwtjes en Mannetjes, tenzij je iets anders vraagt, wordt het gecodeerd als Vrouw = 0 (referentie) en Man = 1.

Dan is de interpretatie van A1:

A1 is de verandering in Y wanneer we twee mensen uit groep 2 en groep 1 met hetzelfde geslacht = vrouw vergelijken. Dit is dus het effect van Group for Females.

En voor A2:

Dit is de verandering in Y wanneer we mannetjes versus vrouwtjes uit dezelfde groep 1 vergelijken.

En voor A3:

Dit is de modificatie van het geschatte A2-effect voor groep 1 berekend voor patiënten uit groep 2. Het totale effect van het vergelijken van mannen en vrouwen voor groep 2 is dus gelijk aan A2 + A3. Het effect van Gender voor Groep 2 is groter met A3 in vergelijking met hetzelfde effect van Gender voor Groep 1.

Huiswerk:

Schrijf de interpretatie van A1 en A2 voor het model zonder interactie:

Y = A0 + A1 * X1 + A2 * X2,

 wanneer X1 een groep is en X2 een geslacht is.

Dit bericht is geplaatst in Blog. Maak een bladwijzer van de permalink .

3 gedachten over "Interactions and why we all get them wrong?"

  • Prachtige blog! Heb je nog tips voor aspirant-schrijvers?
    Ik ben van plan om binnenkort mijn eigen site te beginnen, maar ik ben een beetje verloren op alles.
    Zou je voorstellen om te beginnen met een gratis platform zoals WordPress
    of voor een betaalde optie gaan? Er zijn zoveel opties dat ik volledig overweldigd ben
    .. Iemand een idee? Hartelijk dank!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd.

nl_NLDutch
Gratis WordPress-thema's