Rozjímání nad britskými daty

Tomáš Fürst

Velká Británie zveřejňuje jednu z nejlepších koronavirových datových sad (i když vím, že dost důležitých lidí by se mnou nesouhlasilo). Data jsou k dispozici zde:

https://www.ons.gov.uk/peoplepopulationandcommunity/birthsdeathsandmarriages/deaths/datasets/deathsbyvaccinationstatusengland

Zaměříme se na Tabulku 2, která obsahuje Monthly age-standardised mortality rates by vaccination status by age group for all cause deaths, deaths involving COVID-19 and deaths not involving COVID-19, per 100,000 person-years, England, deaths occurring between 1 January 2021 and 31 May 2022“.

Z těchto dat jsem vytvořil sadu grafů. Abychom se vyhnuli sporům ohledně toho, která úmrtí jsou „s covidem“ a která „kvůli covidu“, budu vizualizovat „All-cause mortality“, což je nejspolehlivější údaj popisující celou populaci. Protože je mortalita řádově větší u starších, vyrobil jsem dvě sady animací. V té první (starsi) je měřítko takové, aby bylo vidět, co se dělo u lidí nad 70 let věku. V té druhé (mladsi) naopak vynikne, co se děje u lidí mladších než 70 let. Ve všech obrázcích je na horizontální ose „Age-standardised mortality rate / 100,000 person-years“. Do grafu nevynáším indikátory nejistoty, ať není příliš nepřehledný, už tak ukazují dat více než dost. Nezobrazuji ani žádné údaje, které jsou v původních datech označeny jako „nespolehlivé“, což jsou ty, které byly spočteny z příliš malého vzorku (tedy mají příliš široké nejistoty). Zde si můžete stáhnout obě sady obrázků, proklikejte si je jako film několikrát tam a zpět a potom teprve čtěte dál.

Svá následující pozorování se snažím uvádět v pořadí, jak jsem si jich všiml, což by mohlo odpovídat pořadí zajímavosti.

  1. V lednu—březnu 2021 byla u starších neočkovaných lidí úmrtnost mnohem větší než v ostatních skupinách. Tohle je pravděpodobně kombinace dvou efektů: První efekt je covid samotný. Očkování tehdy skutečně chvíli chránilo před těžkým průběhem a úmrtím, epidemie navíc v té době vrcholila. Když se podíváme zvlášť na „covid deaths“ (není zobrazeno v grafech, tato čísla jsou jen v původních datech zde), uvidíme v těchto měsících skutečně mnohem vyšší čísla u neočkovaných než u očkovaných. Druhý efekt, který k tomu prvnímu přistupuje, je tzv. selection bias, tedy systematická chyba vzniklá nestejnou skladbou obou skupin. Umírající a lidé s velmi špatným zdravotním stavem nebyli mezi těmi, kteří v době nedostatku vakcín byli prioritou pro očkování, není tedy divu, že celková mortalita neočkovaných je vyšší – a to platí i o necovidových úmrtích. Pohled na „non-covid deaths“ to potvrzuje, v těchto měsících bylo mezi neočkovanými mnohem více úmrtí. Tento efekt (selection bias) se zopakoval v březnu a dubnu u věkové kohorty 60–70 a v dubnu a květnu u věkové kohorty 50–60. To odpovídá pořadí, v jakém byly tyto věkové kohorty očkovány.
  2. Od května 2021 až do konce roku 2021 je velmi nápadná vysoká mortalita lidí, kteří jsou více než 21 dnů od očkování první dávkou (a nedostali další dávky). Tato mortalita je převážně necovidová a násobně přesahuje mortalitu neočkovaných. Tento efekt opět „nabíhá“ v čase, nejprve se objeví u 90+ (duben), potom 70+ (květen), a tak dále po měsících, až v říjnu začne být patrný i u nejmladších. Úmrtnost lidí „více jak 21 dnů po první dávce“ se drží vysoko nad úmrtností neočkovaných pro skoro všechny věkové kohorty od května 2021 až do května 2022.

    Dle mého názoru jde o následující efekt: Jsou lidé, jejichž zdravotní stav se po vakcíně zhoršil, a to buď v důsledku vakcíny, nebo z jiných důvodů. Mnozí z nich už na další dávku vakcíny nešli – ať už proto, že byli přesvědčeni, že za zhoršení jejich stavu může první dávka, proto, že se u nich objevily nepříjemné nežádoucí účinky, nebo proto, že se dostali do kategorie „umírající, kterým už vakcíny nemá cenu podávat“. Tato kohorta se zhoršeným zdravotním stavem tedy zůstane se statutem „více jak 21 dní po první dávce“ a samozřejmě u ní budeme pozorovat mnohem vyšší mortalitu – a přesně to vidíme v datech. Bez podrobnějších analýz (zejména časová provázanost mezi datem očkování a datem úmrtí, jejich zdravotního stavu před vakcinací a četnosti zásadního zhoršení zdravotního stavu v běžné populaci) však těžko zjistíme, jestli zhoršení u nich nastalo „kvůli první dávce“ nebo jen časově „po první dávce“, tedy jestli je souvislost příčinná, nebo se opět jedná o „selection bias“.
  3. Podobný efekt začne nabíhat od října 2021 ohledně druhé dávky. Lidé, kteří zůstanou v kohortě „více jak 21 dnů po druhé dávce“ začnou mít vyšší úmrtnost než neočkovaní. Efekt opět postupuje od vyšších věků k nižším. Úmrtnost lidí „více jak 21 dnů po druhé dávce“ se opět drží nad úmrtností neočkovaných pro skoro všechny věkové kohorty od ledna 2022 až do konce sledovaného období v květnu 2022. Vysvětlení je dle mého názoru stejné jako výše.
  4. Od dubna 2021 se už nikdy nestane, aby mortalita lidí 70+ byla nejvyšší u neočkovaných. Od června 2021 se to nestane v žádné věkové kohortě. To je podivuhodné, protože během dalších vln epidemie (podzim 2021 – jaro 2022) by člověk čekal, že neočkovaní na tom budou nejhůř. Překvapivě ale nejsou. Vakcinační roztleskávači se celou dobu drží tvrzení A, tedy že mortalita čerstvě očkovaných (první, druhou, třetí, čtvrtou, …) dávkou je nižší než mortalita neočkovaných. To je sice pravda, ale na druhé straně této mince je tvrzení B, že mortalita dávno očkovaných (například déle než 21 dnů) je vyšší než mortalita neočkovaných. Jestli budeme chtít fakt B vysvětlit pomocí selection bias (tedy například tím, že vážně nemocných bylo v daných měsících více v očkované skupině, neboť neočkovaní vážně nemocní zemřeli již v předchozích vlnách), pak ale nemůžeme selection bias zuřivě odmítat jako vysvětlení faktu A. Proto tvrdím, že o skutečné účinnosti mRNA vakcín proti jakémukoliv endpointu od nástupu varianty delta nevíme vůbec nic v žádné věkové kohortě. Účinnost může být kladná, záporná nebo nulová. Bez informace o účinnosti nelze provést žádnou cost-benefit analýzu, a to ani v případě, že bychom znali prevalenci a závažnost nežádoucích účinků.
  5. Opět je zde ten zajímavý efekt, známý od nás, že během léta, kdy covidových úmrtí bylo málo, mají neočkovaní oproti očkovaným asi dvojnásobnou úmrtnost. Podívejte se na květen–září 2021 a srovnejte tmavě modrý a žlutý sloupec (tedy neočkované a očkované dvěma dávkami déle než 21 dnů). V těchto kategoriích je zdaleka nejvíc lidí (a tedy i úmrtí) a efekt je zcela jasný – modrý sloupec je asi dvojnásobný proti žlutému, přestože podíl covidových úmrtí na celkové mortalitě v těchto měsících byl v Británii nízký. Tento efekt může mít mnoho příčin, o některých spekulujeme zde.
  6. Kouzlem nechtěného se stalo, že v dubnu a květnu 2022 (poslední dva měsíce, za které máme data) je mortalita u nejstarších u skupiny neočkovaných nejnižší. Všechny ostatní vakcinační statuty jsou asociovány s větší mortalitou. Když uvážíme, že vakcína měla chránit zejména před smrtí, a to zejména starší lidi, je to na pováženou.
  7. Je zajímavé, že obě výše zmíněné „problematické“ kategorie (víc jak 21 dnů po první nebo druhé dávce) mají podobnou dynamiku. V jedné chvíli (třeba pro 70+ je to mezi dubnem a květnem) mortalita najednou „vyskočí“ na dvoj- až trojnásobek mortality v předchozích měsících a následně zvolna klesá. Lidí v této kategorii není mnoho, ale efekt je to zajímavý.

V této chvíli si prosím znovu proklikejte obě složky obrázků. Na závěr připomínám staré úsloví z Data Science: Data nejsou informace, informace nejsou znalosti a znalosti nejsou porozumění. I po dvou a půl letech od začátku epidemie stále platí, že dat máme hodně, ale porozumění málo.

Sdílejte