V prvním díle jsme viděli umělou inteligenci jako tichého pomocníka, který lékaři vrací čas — přepisuje konzultace, zve pacienty na prevenci, píše srozumitelné zprávy. To je vrstva, kterou pacient skoro nevidí. Teď vstupujeme přímo do ordinace a laboratoře: k AI, která se dívá na váš rentgen, počítá riziko z vašeho EKG a hledá molekulu, jež by zabila bakterii odolnou vůči všem dnešním antibiotikům. Je to oblast s největšími sliby — a proto i s největším rozdílem mezi tím, co se píše, a tím, co je doloženo. Projdeme ji od nejpevnějších důkazů k nejvzdálenějším příslibům a u každého kroku si řekneme jednu věc: na jaké úrovni důkazu vlastně stojíme.
Zdroje: mamografie z randomizované studie MASAI (Lancet, 2023–2026); úmrtí na rezistenci z globální analýzy (Lancet, 2022); stav schvalování AI léků z odborného tisku (2025). Plné citace s DOI v sekci Zdroje.
Čtení snímků: kde má AI nejlepší vysvědčení
Začněme tam, kde jsou důkazy nejpevnější — u obrazové diagnostiky. Umělá inteligence pro čtení snímků je hluboká neuronová síť natrénovaná na statisících obrázků (mamografů, rentgenů, snímků sítnice, digitalizovaných vzorků tkáně). Z obrazu počítá skóre rizika nebo vyznačuje podezřelá místa. Pracuje ve třech režimech: jako triáž (seřadí nálezy podle naléhavosti), jako druhé čtení (asistuje lékaři) a vzácně jako autonomní diagnóza (rozhodne sama). Že je radiologie pro AI doménou číslo jedna, ukazuje i regulační statistika: z více než 1 400 nástrojů s umělou inteligencí, které k závěru roku 2025 schválil americký úřad FDA, jsou zhruba tři čtvrtiny právě z radiologie.
Korunním důkazem celého oboru je švédská studie MASAI — vůbec první velký randomizovaný test AI v mamografickém screeningu, tedy zlatý standard, který obvykle u diagnostických nástrojů chybí. Zařadila přes sto tisíc žen a srovnávala obvyklé čtení dvěma radiology s postupem, kde jeden odečet provádí AI. Výsledky vycházely postupně a jsou pozoruhodně konzistentní: AI-podpořené čtení zachytilo na plné kohortě 6,4 nádoru na tisíc žen oproti 5,0 u standardního postupu (tedy zhruba o 29 procent víc), a to bez nárůstu falešně pozitivních nálezů. Klíčové je, že v hlavní analýze, zveřejněné na začátku roku 2026, AI nezhoršila to nejdůležitější — počet rakovin přehlédnutých mezi screeningy (tzv. intervalové karcinomy) — a přitom dosáhla vyšší citlivosti (80,5 procenta proti 73,8). A vedlejší přínos je provozně zásadní: čtecí zátěž radiologů klesla o 44 procent, protože druhý lidský odečet u většiny snímků nahradila AI.
Zdroj: studie MASAI — plná kohorta (Lancet Digital Health, 2025) a hlavní analýza intervalových karcinomů (Lancet, 2026). Vedle vyššího záchytu přinesla AI pokles čtecí zátěže radiologů o 44 %. Jde zatím o jeden region a jeden software — dopad na úmrtnost se teprve sleduje.
Mamografie ale není jediný úspěch. Jediným plně autonomním diagnostickým systémem, který kdy americký regulátor povolil — tedy takovým, který vydá výsledek bez lékaře — je nástroj na záchyt diabetické retinopatie (poškození sítnice u cukrovkářů) z fotografie oka. V registrační studii dosáhl citlivosti 87,2 a specificity 90,7 procenta a běží přímo v ordinacích praktiků, kde dřív pacient musel k očnímu specialistovi. V patologii zase první schválený systém zvýšil záchyt karcinomu prostaty ve vzorcích tkáně, u cévní mozkové příhody umí AI na CT během minut upozornit na uzávěr velké tepny a zrychlit cestu pacienta k zákroku, a u tuberkulózy Světová zdravotnická organizace už v roce 2021 podmíněně doporučila počítačové čtení rentgenů hrudníku jako alternativu k lidskému odečtu.
Asistent, ne soudce: rizika diagnostické AI
Tady je ale nutné zchladit nadšení dvěma střízlivými fakty. Za prvé: MASAI je výjimka, ne pravidlo. Drtivá většina diagnostických nástrojů s AI byla ověřena jen retrospektivně — tedy na starých, archivních datech, kde už se ví, jak to dopadlo. To je mnohem slabší důkaz než prospektivní test na živých pacientech, natož randomizovaná studie. Mezi „náš model měl na archivu 95procentní úspěšnost“ a „v reálném provozu to pacientům pomohlo“ je velká propast a marketingová čísla bývají z té první kategorie.
Za druhé: AI v diagnostice má své typické poruchy. Výkon modelu padá, jakmile narazí na data z jiného přístroje, jiné nemocnice nebo jiné populace, než na jakých se učil (odborně „dataset shift“) — síť skvělá v jedné nemocnici může být průměrná o ulici dál. A je tu zákeřnější riziko, automation bias: člověk má sklon přebírat odpověď stroje i tehdy, když je špatná. V kontrolovaném pokusu chybná rada AI prokazatelně zhoršila přesnost radiologů — a to na všech úrovních zkušenosti, od rezidentů po veterány. Právě proto je dnešní léčebná AI v drtivé většině případů asistent, ne soudce: nejlépe funguje jako druhý pár očí pod dohledem člověka, ne jako náhrada jeho úsudku.
Laboratoře a EKG: tichá výstraha — a odstrašující příklad
Mimo obraz se AI nejvíc osvědčila u dat, která jsou sama o sobě čísla nebo křivky — typicky EKG. Tým z americké Mayo Clinic ukázal, že neuronová síť dokáže z běžného elektrokardiogramu odhalit skrytou slabost srdce (sníženou funkci levé komory), kterou by lékař z křivky pouhým okem nevyčetl, s rozlišovací schopností (AUC) 0,93. Jiný jejich model předpoví z EKG natočeného v normálním rytmu zvýšené riziko fibrilace síní. To je AI v nejlepší roli: vytáhne z rutinního vyšetření signál, který by jinak zůstal skrytý.
Jenže stejná oblast dala medicíně i nejslavnější varování. Epic Sepsis Model — komerční nástroj na včasnou předpověď sepse (život ohrožující reakce na infekci) — byl nasazený ve stovkách amerických nemocnic, často s důvěrou v dodavatelem uváděnou přesnost. Když ho ale v roce 2021 nezávisle prověřili na téměř 28 tisících pacientů, výsledek byl tristní: rozlišovací schopnost jen AUC 0,63 (málo nad náhodou), model nezachytil 67 procent skutečně septických pacientů a zároveň spustil planý poplach u 18 procent všech hospitalizovaných. Marketingové AUC 0,76–0,83 se v reálu nepotvrdilo. Je to učebnicový rozdíl mezi „číslem od výrobce“ a nezávislou validací — a důvod, proč by žádná nemocnice neměla AI nasazovat jen na základě brožury.
| Oblast | Co AI dělá | Úroveň důkazu | Příklad |
|---|---|---|---|
| Mamografie | druhé čtení screeningu | randomizovaná studie (nejvyšší) | MASAI (Švédsko) |
| Sítnice (cukrovka) | autonomní diagnóza | prospektivní studie + schválení FDA | IDx-DR |
| EKG | odhalí skrytou slabost srdce | velké kohorty | Mayo Clinic |
| Mrtvice (CT) | triáž, urychlení zákroku | většinou pozorovací | Viz.ai |
| Sepse | včasná výstraha | selhala v nezávislém testu | Epic Sepsis Model |
| Klinické uvažování (text) | diagnóza a plán léčby z popisu případu | srovnání na případech + RCT (zatím ne v reálném provozu) | o1-preview, GPT-4 |
Čtení tabulky: „úroveň důkazu“ stoupá od pozorovacích dat (slabší) k randomizované studii (nejsilnější). Stejná technologie (AI) může mít v různých oblastech naprosto odlišnou kvalitu důkazu — proto nelze mluvit o „AI“ paušálně.
Druhý názor: AI, která uvažuje jako lékař
Zatím jsme mluvili o AI, která čte obrázky a křivky. Jiná otázka je, jestli umí uvažovat jako lékař — z popisu případu navrhnout diagnózu a rozhodnout, co dál. Právě sem dopadla studie, o které se v roce 2026 hodně psalo: tým z Harvardu a Stanfordu otestoval pokročilý „uvažovací“ model OpenAI (o1-preview) na úlohách klinického uvažování a výsledky zveřejnil v časopise Science. Jsou působivé — a právě proto si zaslouží číst pozorně, ne jen v titulcích.
Zdroje: Brodeur et al., Science (2026) pro o1-preview; Goh et al., Nature Medicine (2025) pro randomizovaný test „lékař + AI“. Plné citace s DOI v sekci Zdroje.
Čísla z té studie v Science jsou opravdu silná. Na publikovaných „záludných“ klinických případech dosáhl o1-preview úspěšnosti 88,6 procenta (předchozí model GPT-4 měl 72,9). Při vstupní triáži na urgentu — kdy byly k dispozici jen vitální funkce, základní údaje a krátká poznámka sestry — určil správnou diagnózu častěji (67,1 procenta) než dva atestovaní lékaři (55,3 a 50,0). A nejvíc překvapil v „management reasoning“, tedy v rozhodování, co s pacientem po diagnóze (jaké testy, jaká antibiotika, jak vést rozhovor o konci života): tam dosáhl mediánu kolem 89 procent, zatímco lékaři s běžnými pomůckami včetně Googlu jen 34. Zaslepení hodnotitelé navíc často nepoznali, jestli úvahu sepsal člověk, nebo stroj.
Než ale prohlásíme, že „debata skončila“, patří sem dvě věci, které se do nadšených titulků obvykle nevejdou. Za prvé: jde o uzavřené, textové úlohy, ne o skutečnou ordinaci. Sami autoři upozorňují, že testovali pouze práci s textem — a reálná medicína je plná netextových signálů: jak pacient vypadá, jak mluví, jak je vyděšený. Výborné skóre na sadě připravených případů není totéž co lepší výsledek u lůžka, a počty případů byly malé (desítky). Mezi „uměl to na testu“ a „pomohlo to pacientům“ je stejná propast, jakou jsme viděli u zobrazovací AI.
Za druhé — a to je možná nejdůležitější zjištění celé oblasti: dát lékaři chatbota automaticky nezlepší výsledek. Randomizovaná studie zveřejněná v Nature Medicine (2025) rozdala 92 lékařům buď GPT-4 navíc k běžným zdrojům, nebo jen běžné zdroje. Lékaři s AI si vedli lépe (o 6,5 procentního bodu) — ale nebyli lepší než samotná AI (rozdíl −0,9 bodu, statisticky nevýznamný). Úzkým hrdlem tedy není schopnost modelu, ale to, jak ho člověk umí zapojit do vlastní úvahy. To je klíčový vzkaz pro každého, kdo chce AI nasadit jako „druhý názor“: nestačí ji lékaři dát do ruky, je potřeba promyslet celý postup.
A pozor na jeden rozdíl: tohle je úplně jiná liga než spotřebitelské „symptom checkery“ z prvního dílu, kterým příznaky popisuje laik a které v testech opakovaně selhávají. Tady jde o špičkový model pracující se strukturovaným lékařským popisem případu. Schopnost je tedy reálná a recenzovaná ve špičkovém časopise; co chybí, je důkaz z reálného provozu, bezpečně navržený postup „druhého názoru“ a jasná odpovědnost za výsledek — přesně to, co řeší evropský AI Act, který diagnostickou AI řadí mezi vysoce rizikové systémy. Jinými slovy: ano, modely jsou nečekaně dobré v uvažování; ne, neznamená to, že zítra budou samostatně řídit léčbu.
Tiché riziko: deskilling, když se na AI spolehneme až moc
A tím se dostáváme k riziku, které je možná nejzávažnější právě proto, že je tiché a pomalé: deskilling — oslabení vlastní dovednosti, když ji za nás začne dělat stroj. A nejde jen o obavu na papíře. Polská pozorovací studie zveřejněná v roce 2025 v Lancet Gastroenterology & Hepatology sledovala endoskopisty ve čtyřech centrech, která zavedla AI na hledání polypů při kolonoskopii. Když pak tíž lékaři dělali kolonoskopii bez AI, jejich záchyt adenomů (přednádorových polypů) byl nižší než před zavedením AI — 22,4 oproti 28,4 procenta, tedy o šest procentních bodů. Autoři z toho opatrně usuzují, že trvalé spoléhání na AI může zhoršit návyky endoskopisty. Jde o porovnání „před a po", které samo o sobě příčinu nedokáže (do hry mohou vstoupit i další vlivy) — ale je to varovný signál, který stojí za další ověření.
Druhou tváří téhož problému je „never-skilling“ — pojem, který v roce 2026 zavedli autoři v Nature Medicine: u mediků a začínajících lékařů, kteří se na AI spolehnou hned na začátku, hrozí, že si základní klinické uvažování nikdy nevybudují. K tomu se přidává „mis-skilling“, kdy člověk nekriticky převezme i chybu AI jako fakt. Žádný z těchto jevů neznamená, že je AI špatná — znamenají, že o tom, jestli lékaře povýší, nebo postupně vyřadí, rozhoduje způsob a načasování jejího nasazení.
Tohle je potřeba číst společně s předchozí kapitolou. Ano, špičkový model může uvažovat na úrovni lékaře i nad ní — ale právě proto je pokušení přenechat mu úsudek největší a deskilling nejrychlejší. A protože AI občas tiše selže (vzpomeňme na model na sepsi nebo na pokles výkonu na cizích datech), potřebujeme lékaře, kteří si udrželi schopnost ji zkontrolovat a v případě potřeby převzít otěže. Pokud se o tuhle schopnost připravíme, vyměníme dnešní omyly jednotlivého lékaře za zítřejší systémovou slepou skvrnu — a ta se napravuje mnohem hůř.
Hon na nová antibiotika: naděje, která zatím běhá po myších
Teď se dostáváme k nejvzrušující — a nejméně doložené — části. Svět zoufale potřebuje nová antibiotika. Bakterie odolné vůči stávajícím lékům způsobily v roce 2019 odhadem 1,27 milionu úmrtí přímo a podílely se na dalších bezmála pěti milionech. Přitom desítky let nevznikla žádná zásadně nová třída antibiotik — vyvíjet je je drahé a pro farmaceutické firmy málo výnosné. A právě sem vkládá medicína velkou naději do umělé inteligence.
Jak to funguje? Model se naučí na tisících změřených molekul, které bakterie zabíjejí nebo nezabíjejí, a pak dokáže předpovědět účinek pro miliony dalších, netestovaných sloučenin — během dní, ne let. Lidé pak v laboratoři ověří jen malý vybraný zlomek. Příbuznou revolucí je AlphaFold od DeepMindu: program, který z pořadí aminokyselin předpoví trojrozměrný tvar bílkoviny — a tvar určuje funkci i to, kam může lék zapadnout. Jeho databáze dnes pokrývá přes 200 milionů struktur a v roce 2024 za něj jeho tvůrci dostali Nobelovu cenu za chemii. To je skutečný, oceněný vědecký nástroj, ne hype.
-
Model se učí na známých molekulách
Síť dostane tisíce sloučenin s informací, zda bakterii zabíjejí. Naučí se vzory, které lidské oko nevidí.
-
Proskenuje stovky milionů kandidátů
Antibiotikum halicin vzešlo z předpovědi přes 107 milionů molekul — to by žádná laboratoř ručně nestihla.
-
Vybere hrstku nadějných látek
Z milionů zůstanou desítky kandidátů, které stojí za fyzické otestování v laboratoři.
-
Účinek v misce a u myší
Halicin, abaucin i nová třída proti MRSA zabíjejí bakterie in vitro a léčí infekce u myší. Tady končí dnešní důkazy.
-
Klinické testy na lidech — ZATÍM NE
Aby z molekuly byl lék, musí projít třemi fázemi testů na lidech. Žádné AI-objevené antibiotikum jimi zatím neprošlo.
Pozn.: mezi účinkem „u myši“ a schváleným lékem je propast, kterou překoná jen zlomek látek. Hype často mlčí o tom, že nadějná molekula je teprve na začátku cesty.
Konkrétní výsledky znějí jako z titulků — a jsou skutečné. Halicin, objevený na MIT díky předpovědi přes 107 milionů molekul, je strukturně nové antibiotikum účinné proti řadě bakterií. Abaucin cílí na Acinetobacter baumannii, jednu z nejobávanějších nemocničních bakterií. A v roce 2023 našla „vysvětlitelná“ neuronová síť úplně novou strukturní třídu látek proti zlatému stafylokoku odolnému na meticilin (MRSA). Všechny tři jsou reálné vědecké úspěchy. A u všech tří platí totéž zásadní „ale“: fungují zatím jen v laboratorní misce a u myší. Žádné z nich nedostal jediný člověk jako léčbu.
Proč zatím žádný „AI lék“ nekoupíte
Tady je potřeba být úplně přímý, protože právě v téhle oblasti je propast mezi sliby a realitou největší. K polovině roku 2026 není schválen žádný lék, který by navrhla umělá inteligence — ani jedno antibiotikum, ani nic jiného. Nejdál postoupila molekula proti plicní fibróze od firmy Insilico Medicine, a i ta je teprve ve druhé ze tří klinických fází. Některé hvězdy oboru přitom couvají: firma Exscientia, donedávna vlajková loď „AI návrhu léků“, v roce 2024 propouštěla, zúžila projekty a nakonec ji pohltil konkurent, který pak několik programů ukončil.
Neznamená to, že je AI v objevu léků slepá ulička — spíš že je na začátku dlouhé cesty. Vývoj léku trvá typicky deset let a stojí miliardy; i kdyby AI dramaticky zrychlila první kroky (a leccos naznačuje, že může), čekání na klinické důkazy zkrátit nedokáže — testy bezpečnosti a účinnosti na lidech prostě trvají. Rozumný postoj tedy zní: brát objev nových molekul jako reálný a vzrušující směr, ale každé tvrzení o „zázračném AI léku“ poměřovat jednoduchou otázkou — v jaké je fázi testů na lidech? Když je odpověď „zatím v žádné“, je to věda, ne ještě medicína.
Co to znamená pro Česko
Pro Česko má tahle vrstva dvě roviny — co se tu reálně používá a proč na výzkumu antibiotik záleží zrovna u nás. Začněme nasazením: v diagnostice už AI v českých nemocnicích není exotikou. Domácí systém Carebot na čtení rentgenů hrudníku má evropskou certifikaci zdravotnického prostředku a podle ministerstva zdravotnictví analyzoval přes 16 tisíc snímků v devíti nemocnicích a pomohl odhalit 56 nových nádorů. Český Kardi AI hlídá srdeční rytmus z EKG, fakultní nemocnice Motol nasadila AI ke zrychlení vyšetření na magnetické rezonanci. To přesně odpovídá světovému vzorci, kde AI vede radiologie a kardiologie.
Druhá rovina je naléhavější, než se zdá. Hon na nová antibiotika není akademická hra ani pro Česko — a dashboard HSPA Monitoru to ukazuje černé na bílém. Rezistence bakterie Acinetobacter na karbapenemy, tedy na „záložní“ antibiotika posledních linií, dosahuje v ČR 25,5 procenta — a je to přesně ten druh bakterie, na kterou míří AI-objevený abaucin. U zlatého stafylokoka je odolnost vůči meticilinu (MRSA) na 9,3 procenta, u klebsiely na karbapenemy zatím na nižších 2,2 procenta. Česko má přitom v mezinárodním srovnání rozumnou spotřebu antibiotik — jak v humánní medicíně, tak ve veterině — což rezistenci brzdí. Ale i tak platí: každé nové antibiotikum, ať z laboratoře, nebo z počítače, se bude jednou počítat i tady.
A nakonec peníze a pravidla, která platí pro obě roviny stejně jako pro vstřícnou AI z prvního dílu. Diagnostická AI je v Evropské unii „vysoce rizikový“ systém s tvrdými povinnostmi — co to znamená pro výrobce i nemocnice, rozebírá náš text o evropském AI Actu ve zdravotnictví. A jako u všeho v českém zdravotnictví nakonec rozhoduje úhrada: dokud nezačne pojišťovna AI platit (pilot VZP startuje teprve v polovině roku 2026), zůstane i ta nejlépe doložená diagnostika spíš v pilotech než v plošném provozu.
Tečka: prokázané, slibované, vymyšlené
Když celou sérii zúžíme do jediné myšlenky, zní takto: o umělé inteligenci v medicíně se nedá mluvit paušálně, protože pod jedním slovem se skrývají tři velmi rozdílné světy. Je tu AI prokázaná — tichý pomocník, který vrací lékaři čas, a druhé čtení mamografů, kde existuje randomizovaný důkaz. Je tu AI slibovaná — antibiotika z počítače a nové léky, které fungují u myší a čekají na první pacienty. A je tu AI, jejíž čísla jsou vymyšlená v doslovném smyslu — halucinace v přepisu i marketingová přesnost, která se v nezávislém testu rozplyne.
Dobrý zdravotní systém — a dobrý čtenář — pozná, ve kterém z těch tří světů se zrovna pohybuje. Nejde o to být nadšenec, ani skeptik. Jde o to u každého nového nástroje položit tři otázky: Co přesně dělá? Na jaké úrovni důkazu to stojí? A kdo nese odpovědnost, když se splete? Umělá inteligence medicínu nezachrání ze dne na den, ale na pár konkrétních místech jí už dnes prokazatelně pomáhá. Zbytek je práce — a u léků ještě roky testů. A nad celou debatou by mělo viset jedno varování: největším rizikem nemusí být to, že je AI příliš slabá, ale to, že se na ni spolehneme natolik, až ztratíme vlastní schopnost ji zkontrolovat. Kdo začal prvním dílem, ví, že ten nejjistější přínos je zatím překvapivě skromný: lékař, který se vám zase dívá do očí.