Model Foresight: Generativní AI pro predikci rizika onemocnění u 57 milionů pacientů ve Spojeném království
Spojené království provedlo významný krok v oblasti umělé inteligence ve zdravotnictví. Vyvinulo generativní AI model s názvem Foresight, který byl trénován na anonymizovaných zdravotních záznamech téměř celé populace, konkrétně 57 milionů pacientů. Cílem tohoto modelu je predikovat více než tisíc budoucích diagnóz, včetně hospitalizací, komplikací a závažných událostí, jako je například infarkt myokardu.
Tato rozsáhlá datová sada, zahrnující návštěvy u praktických lékařů, interakce s nemocnicemi, očkování a národní registr úmrtí z let 2018 až 2023, představuje více než 10 miliard zdravotních událostí. Tato šíře dat činí z projektu Foresight unikátní experiment v měřítku a soudržnosti. Žádný jiný zdravotnický systém, zejména ne tak rozsáhlý a komplexní jako NHS (Národní zdravotní služba Spojeného království), se dosud nepokusil trénovat generativní AI tímto způsobem.
Projekt vedou výzkumníci z University College London a King’s College London ve spolupráci s NHS England, British Heart Foundation (BHF) Data Science Centre a Health Data Research UK. Model je postaven na architektuře LLaMA 2 společnosti Meta a trénink probíhá v zabezpečeném datovém prostředí NHS England s využitím cloudové infrastruktury poskytované společnostmi Amazon a Databricks. Zatímco mnoho AI modelů je testováno na kurátorských nebo syntetických datech, výjimečnost Foresight spočívá v jeho reálném základu – je trénován na klinických datech z celostátního zdravotnického systému.
Tento projekt představuje významný okamžik pro medicínu založenou na datech a odvážný krok směrem k preventivní péči v celonárodním měřítku. Trénování generativní AI na anonymizovaných zdravotních záznamech 57 milionů lidí je logisticky náročný úkol a zároveň unikátní britský ambiciózní projekt, umožněný centralizovanou strukturou NHS. Foresight je ambiciózní jak svým rozsahem, tak metodou: AI v populačním měřítku, vytvořená k předpovídání individuálního rizika napříč tisíci potenciálních onemocnění, a to s úrovní granularity a dosahem, které jsou bezprecedentní. Naznačuje budoucnost, ve které prediktivní modely fungují jako diagnostické systémy počasí – identifikují rizikové pacienty dlouho předtím, než se objeví příznaky.
Nicméně, samotné měřítko nestačí. Bez možnosti odhlášení, bez možnosti nápravy pro pacienty a bez zveřejněných metrik se projekt pohybuje na tenké hranici mezi vizionářskou vědou a etickým překročením. Důvěra veřejnosti ve zdravotnickou AI bude záviset nejen na tom, co tyto modely dokážou, ale také na tom, jak transparentně a zodpovědně to dělají.
Výzkumníci v současné době vyhodnocují prediktivní schopnosti modelu – konkrétně, zda dokáže retrospektivně předpovídat výsledky v roce 2023 na základě dat z let 2018 až 2022. Pokud bude tento přístup úspěšný, může to znamenat posun ve strategii zdravotní péče: od retrospektivní analýzy k anticipační intervenci. Nicméně, vyvstávají také otázky ohledně vztahu mezi souhlasem, kontrolou a užitečností – zejména když datové sady tohoto rozsahu ponechávají jednotlivcům nemožnost odhlášení a odstranění záznamů, jakmile jsou do modelu zahrnuty.
Dr. Chris Tomlinson, vedoucí výzkumník z UCL Institute of Health Informatics, zdůraznil hodnotu inkluzivity při využití rozsáhlých dat. „AI modely jsou jen tak dobré, jak dobrá jsou data, na kterých jsou trénovány. Pokud tedy chceme model, který může prospět všem pacientům se všemi stavy, pak to AI musela během tréninku vidět.“
„Využití dat v národním měřítku nám umožňuje reprezentovat kaleidoskopickou rozmanitost anglické populace, zejména pro menšinové skupiny a vzácná onemocnění, která jsou často vyloučena z výzkumu [1].“
Pro výzkumníky zaměřené na biologii stárnutí a její klinický překlad mohou modely jako Foresight poskytnout zásadní rámec pro stratifikaci rizika a včasnou detekci. Identifikace jedinců vstupujících do pre-frailty nebo vykazujících subtilní známky kognitivního či metabolického úpadku – dlouho před konvenční diagnostikou – by mohla umožnit včasné, cílené intervence, které pomohou zachovat funkci a prodloužit délku života ve zdraví.
Výzkumný tým si je vědom, že technický úspěch a důvěra veřejnosti musí jít ruku v ruce. Přestože data byla pečlivě anonymizována, nejsou zcela anonymní – a aplikace GDPR na taková data zůstává nejistá. Projekt funguje na základě výzkumných ustanovení z období pandemie, která umožňují širší využití dat než obvykle, ale tato povolení nejsou neomezená. V tomto kontextu se transparentnost stává více než jen osvědčenou praxí – je předpokladem legitimity.
Samotný technický výkon byl značný. „Spojení výpočetních zdrojů potřebných pro AI s daty NHS bylo vždy náročné,“ řekl Simon Ellershaw, doktorand na UCL. „Ale díky podpoře našich partnerů jsme byli schopni bezpečně a spolehlivě aplikovat nejmodernější metody AI na data NHS v bezprecedentním měřítku [1].“
Toto není první výskyt Foresightu; dřívější verze modelu byla testována na datech ze dvou trustů NHS, kde prokázala potenciál v mapování zdravotních trajektorií. Pilotní projekt v národním měřítku představuje přirozený, byť ambiciózní, pokrok.
„Tento pilotní projekt staví na předchozím výzkumu, který prokázal schopnost Foresightu předpovídat zdravotní trajektorie z dat ze dvou trustů NHS,“ řekl profesor Richard Dobson, působící na UCL i King’s College London. „Možnost jeho využití v národním měřítku je velmi vzrušující, protože potenciálně ukáže silnější predikce, které mohou informovat služby na národní i lokální úrovni.“
„V současné době jsou data v tomto pilotním projektu široká, ale povrchní, a nakonec bychom chtěli využít odborné znalosti a AI platformy za Foresightem zahrnutím bohatších zdrojů informací, jako jsou poznámky lékařů nebo výsledky vyšetření, jako jsou krevní testy a skeny, pokud budou k dispozici [1].“
Toto doplnění – krevní markery, zobrazování, klinické narativy – by model ještě více přiblížilo metrikám biologického stárnutí. Takové typy dat by mohly podpořit integraci epigenetického věku, zánětlivých profilů nebo ukazatelů odolnosti, a posunout tak model za predikci onemocnění do oblasti analýzy stárnutí na systémové úrovni.
Zapojení pacientů bylo začleněno do procesu řízení. Osoba z veřejnosti spolupracující s BHF Data Science Centre, která se podílela na revizi projektu, uvedla: „Jako pacienta mě zajímá, jak by tento výzkum mohl pomoci identifikovat související zdravotní stavy, snížit riziko vzniku nových a podpořit ty, kteří mají potíže s přístupem ke zdravotní péči. Je důležité, aby lidé věděli, jak jsou jejich zdravotní data využívána, takže je povzbudivé vidět zaměření na transparentnost a zajištění toho, aby byla AI v NHS využívána bezpečným, etickým způsobem s veřejným prospěchem v centru [2].“
Tato otázka – jak sladit individuální práva s veřejným prospěchem – není jedinečná pro NHS ani pro tento projekt. Ale Foresight může být nejviditelnějším ukazatelem svého druhu: prototypem prediktivní, preventivní zdravotní péče v národním měřítku, jakou by se jednoho dne mohla stát.
Dr. Vin Diwakar, národní ředitel pro transformaci v NHS England, zdůraznil roli infrastruktury při umožnění takového výzkumu. „AI má potenciál transformovat způsob, jakým předcházíme a léčíme nemoci, pokud je trénována na rozsáhlých datových sadách a bezpečně testována. Zabezpečené datové prostředí NHS bylo pro tento průkopnický výzkum zásadní a formuje budoucnost, ve které jsou dřívější léčby a intervence cíleny na ty, kteří z nich budou mít prospěch, a předchází se tak budoucímu zhoršení zdraví. To posílí naši schopnost rychle směřovat k personalizované, preventivní péči [1].“
S pokrokem vědy o stárnutí bude schopnost operativně využívat riziková data v měřítku stále důležitější. To, co Foresight nabízí, není jen technický precedens, ale i pohled na to, jak by celopopulační predikce zdraví mohla sloužit jako páteř strategie dlouhověkosti 21. století.
Fotografie: iLexx/Envato
[1] https://www.ucl.ac.uk/news/2025/may/ai-model-trained-de-identified-data-57-million-people [2] https://www.kcl.ac.uk/news/ai-to-predict-healthcare-needs
Příspěvek UK NHS trains AI on entire population’s health data se poprvé objevil na Longevity.Technology – Latest News, Opinions, Analysis and Research.