Jak se kauzalita volá, tak se korelace ozývá

Tomáš Fürst, Arnošt Komárek, Zuzana Krátká, Jaroslav Janošek a Ondřej Vencálek

Před rokem 1900 byla rakovina plic tak vzácná, že ji běžný doktor viděl tak jednou za svoji kariéru. V roce 1990 již na ni umíral téměř jeden z tisíce amerických mužů ročně. Tento vrchol mortality nastal asi 20 let po vrcholu spotřeby cigaret. Dnes již nikdo nepochybuje o tom, že kouření cigaret způsobuje rakovinu plic. Ale cesta k tomuto kauzálnímu závěru byla mimořádně trnitá a trvala půl století. Hypotézu, že kouření způsobuje rakovinu plic, poprvé vyslovil jistý Isaac Adler, ale za všeobecně přijatou se tato hypotéza začala považovat až v roce 1964, kdy hlavní hygienik Spojených států amerických vydal zprávu, ve které tuto kauzální souvislost potvrzuje.

Proč to trvalo tak dlouho? Protože statistici dodnes mají pouze značně omezené možnosti, jak odlišit kauzalitu (tedy příčinnou souvislost) od korelace (asociace). Začněme jednoduchým příkladem: Když dáte dětem na základní škole test z matematiky (ve všech ročnících stejný), tak vám vyjde velmi silná korelace mezi výsledkem testu a číslem boty testovaného. Jasně, čím starší dítě, tím lépe umí počítat a tím má větší nohu. Ale každý (krom některých tzv. matematických modelářů či klimatologů) chápe, že nemá cenu všem dětem pořídit o číslo větší boty a doufat, že to způsobí nárůst jejich matematické gramotnosti. Tohle je ve zkratce rozdíl mezi korelací a kauzalitou. Kauzální vztah se dá použít k řízenísystému (stoupnu na brzdu, auto zpomalí). Nekauzální korelace (výsledky z testu a číslo boty) k řízení systému použít nejde.

A právě experiment je nejjistější cestou, jak odlišit kauzální korelaci od nekauzální – stačí si vyzkoušet, jestli lze pozorovanou asociaci využít k řízení systému. Dejte studentům o číslo větší boty a vyzkoušejte další test z matematiky. A bude jasno. Co když bude ale ten druhý test jednodušší a oni se vážně v průměru zlepší? Rozumnější nápad je proto rozdělit studenty náhodně na dvě skupiny, jedné vyměnit boty za větší, druhé nikoliv, a pak dát všem stejný test. Pokud se ti přezutí zlepší, ale nepřezutí nikoliv, odhalili jsme kauzální efekt. Tímto jsme vysvětlili princip prospektivní randomizované studie, která je dodnes zlatým standardem kauzální inference.

Jsou ovšem případy, kdy prospektivní randomizovanou studii provést nelze. Například v otázce vlivu oxidu uhličitého na teplotu planety. Kde vzít jiné planety, na kterých budeme držet CO2 na předindustriální hodnotě a pozorovat teplotu? A pak jsou případy, kdy by prospektivní studii sice udělat šlo, ale bylo by to neetické. Nemůžeme skupině lidí nařídit, aby dalších 20 let kouřili. V takových případech jsme odkázáni na studie observační, při kterých pozorujeme, jak se daří lidem, kteří se rozhodli kouřit, a jak těm, kteří se rozhodli nekouřit. Samozřejmě vypozorujeme velmi silnou asociaci mezi kouřením a rakovinou plic. A v té chvíli nastoupí různí vykukové (někdy placení tabákovým průmyslem, jindy jen přesvědčeni o neškodnosti svého zlozvyku), kteří budou do omrzení tvrdit, že chuť na cigarety a predispozice k rakovině plic jsou možná způsobeny nějakým genem, o kterém nevíme. 

Na druhé straně myšlenkové barikády však stál jeden z velikánů vědy dvacátého století – samotný otec moderní prospektivní randomizované studie, sir Austin Bradford Hill. V šedesátých letech zahájil obrovskou prospektivní studii desítek tisíc amerických lékařů, která ukázala, že kouření je asociováno s 24násobně vyšším rizikem rozvoje rakoviny plic. Vykukové ale dál vedli svou o „genu pro kouření“. Během jednání komise amerického hlavního hygienika, která nakonec vydala autoritativní verdikt o kauzalitě, proto vznikl jistý „checklist“, který vstoupil do dějin jakožto Bradford Hillova kritéria. Jedná se seznam kritérií, která by měla být splněna, aby bylo možné prohlásit pozorovanou asociaci za kauzální. Tato kritéria nejsou založena na žádné hluboké teorii – ke každému lze najít protipříklad a ani splnění všech kauzalitu nezaručuje. V rámci observačních studií, kdy experiment není možný, se však jedná o sadu všeobecně uznávaných principů.

Tento slavný checklist má následující podobu: Aby bylo možno interpretovat pozorovanou asociaci jako kauzální, měly by být splněny následující podmínky:

  1. Velikost efektu: Čím silnější je asociace mezi dvěma proměnnými, tím pravděpodobnější je, že se jedná o kauzální efekt. Například pozorovaná (pořadová) korelace mezi intenzitou sešlápnutí brzdy a snížením rychlosti auta je téměř dokonalá, což svědčí ve prospěch kauzality.
  2. Opakovatelnost: Pokud mnoho různých studií od různých autorů na různých místech potvrdí asociaci na různých souborech dat, je větší šance, že se jedná o kauzální efekt. Například všechny možné kompasy na mnoha různých místech planety vytrvale ukazují na to samé místo. Na tom něco musí být!
  3. Specificita: Kauzalita je pravděpodobnější, pokud je asociace pozorovaná pro konkrétní předpoklad (například „kouření“, nikoliv vágně určený „nezdravý životní styl“) a konkrétní výsledek (například „rakovina plic“, nikoliv „těžký život“).
  4. Absence jiného mechanismu: Pokud se nenabízí jiné realistické vysvětlení, roste šance, že námi pozorovaná asociace je kauzální. Vzpomeňte na výše uvedený příklad s velikostí bot – zde je jiné vysvětlení nabíledni.
  5. Časová souslednost: Pokud je asociace kauzální, musí důsledek následovat až po příčině.
  6. Závislost na dávce: U kauzálních vztahů obecně platí, že čím větší expozice (například čím víc cigaret denně), tím větší incidence následku (tím častější rakovina plic). Efekt může být samozřejmě i opačný v případě protektivních prostředků (čím více vitaminu D, tím méně virových onemocnění).
  7. Plausibilita: Pro kauzální interpretaci asociace by měl být znám mechanismus, který ji zprostředkovává. Například u oblíbené růžovky (aka ibuprofen) je známo, že protizánětlivé účinky jsou zprostředkovány reverzibilní inhibicí cyklo-oxygenázy.
  8. Koherence: Shoda mezi epidemiologickým pozorováním (v populaci) a laboratorním zkoumáním zvyšuje pravděpodobnost, že se jedná o kauzální asociaci. Například snižuje-li heparin koagulaci krve u pacientů a zároveň ji snižuje u krve ve zkumavce, je větší šance, že efekt je kauzální.
  9. Experiment: Kdykoliv je to možné, experimentální evidence je vítanou podporou kauzální interpretace pozorované asociace. Ovšem kouzlo Bradford-Hillových kritérií je právě v tom, že se aplikují na situace, kdy řádný experiment možný není.

Tolik tedy slavná Bradford-Hillova kritéria. Je pozoruhodné, že česká wikipedická stránka s tímto tématem neexistuje. Na rozdíl od zákona zachování hybnosti nejsou Bradford-Hillova kritéria žádným „tvrdým“ přírodním zákonem, v odborné komunitě však panuje poměrně široká shoda, že jejich naplnění významně zvyšuje pravděpodobnost, že pozorovaná asociace je kauzální. Ještě jinak řečeno: Pokud zpochybníte Bradford-Hillova kritéria, musíte začít pochybovat i o kauzálním vztahu mezi kouřením a rakovinou plic.

A proč tohle všechno píšeme? To vám prozradíme zanedlouho v druhém díle tohoto textu.

Sdílejte