Zmienna zakłócająca

Ilustracja przedstawia graf zawierający przyczynę, skutek, mediator, zmienną zakłócającą i collider.
Przykład grafu systemu przyczynowego, w którym badanemu związkowi przyczyny ze skutkiem towarzyszy mediator zmienna zakłócająca i kolider Typowy problem pominiętej zmiennej polega na nieuwzględnieniu w modelu czynników typu Dla kontrastu, statystyczne kontrolowanie zmiennych typu i jest jednak także niepożądane, i również zwiększa błąd oszacowania.

Zmienna zakłócająca (ang. confounder, także: czynnik zakłócający) – zewnętrzny czynnik wpleciony w badany związek przyczynowo-skutkowy, który wpływając zarówno na zmienną objaśniającą i zmienną objaśnianą, zmienia ich obserwowaną współzmienność (prawdopodobieństwo warunkowe), w skrajnym przypadku tworząc całkowicie pozorną korelację.

Przykładowo, w ilustracyjnej symulacji Ioannidisa i in. zależnie od czynników uwzględnionych w modelu wpływ spożycia witaminy E na śmiertelność może być estymowany zarówno jako silnie pozytywny i silnie negatywny[1].

Jest to zagadnienie leżące w dziedzinie wnioskowania przyczynowego, i jako takie, nie da się go opisać wyłącznie w języku korelacji statystycznych. W języku modelu przyczynowego Pearla, zmienne zakłócające należy starannie odróżniać od mediatorów i koliderów, ponieważ w ich przypadku kontrolowane statystycznie jest – inaczej niż przy zmiennych zakłócających – niewłaściwe, i to ono wprowadza do oszacowania błąd (nieprzyczynowe prawdopodobieństwo warunkowe)[2][3].

Zmienna zakłócająca może być na przykład ważnym czynnikiem ryzyka lub łagodzenia danego zjawiska. Jeśli jest przeoczona i nierówno rozłożona w grupie eksperymentalnej i porównawczej, zakłóca oszacowanie prawdziwego bezpośredniego związku badanych zmiennych. Wynikający z tego błąd m.in. w ekonometrii nazywa się problemem pominiętych zmiennych.

Prawidłowa ocena wielkości efektu przyczynowego jest możliwa poprzez kontrolowanie występowania zmiennych zakłócających, na przykład poprzez staranne modelowanie przyczynowe, zaplanowanie odpowiednich badań (randomizację, parowanie, restrykcję), i odpowiednią analizę statystyczną (parowanie, stratyfikację, standaryzację, modelowanie statystyczne).

Przypisy

  1. Chirag J. Patel, Belinda Burford, John P.A Ioannidis, Assessment of vibration of effects due to model specification can demonstrate the instability of observational associations, „Journal of clinical epidemiology”, 68 (9), 2015, s. 1046–1058, DOI10.1016/j.jclinepi.2015.05.029, ISSN 0895-4356, PMID26279400, PMCIDPMC4555355 [dostęp 2019-03-30].
  2. 4. Confounding and Deconfounding: Or, Slaying the Lurking Variable, [w:] Judea Pearl, Dana Mackenzie, The book of why: the new science of cause and effect, wyd. First edition, New York, NY 2018, ISBN 978-0-465-09760-9, OCLC 1003311466 [dostęp 2019-03-11].
  3. Judea Pearl, James M. Robins, Sander Greenland, Confounding and Collapsibility in Causal Inference, „Statistical Science”, 14 (1), 1999, s. 29–46, DOI10.1214/ss/1009211805, ISSN 0883-4237 [dostęp 2019-03-11] (ang.).

Bibliografia

Media użyte na tej stronie

Judea Pearl graph style illustration of variable types relevant for omitted variable bias.svg
Autor: Jaszczuroczłek, Licencja: CC BY-SA 4.0
Illustration of a causal system containing a mediator, confounder and collider.

Reproducible code in the DOT language:

digraph {

splines = false; ratio = 1; X,Y [style=filled, color=black, fontcolor=white];
X -> Y [style=bold]                    // IV & DV / objaśniająca i objaśniana
Z -> {X Y}                             // confounder / zakłócająca
X -> M -> Y [minlen=1]                 // mediator
K -> {X Y} [minlen=2, dir=back]        // collider / kolider
{rank = same; X; Y;}

}

Command line processed with:

dot test.gv -Tsvg > test.svg