AI a strojové učení jako zdravotnický prostředek: MDR, MDCG 2021-24 a AI Act
Proč AI/ML vytváří jiný problém shody
Většina otázek shody s MDR pro software má poměrně ustálené odpovědi — klasifikace se řídí Pravidlem 11, klinické hodnocení Článkem 61, kybernetická bezpečnost GSPR 17.2. AI a strojové učení přidávají vrstvu složitosti, kterou autoři nařízení plně nepředvídali: co dělat, když se software v čase mění?
Tradiční software má definovanou verzi. Ověřujete verzi 1.0, vydáte ji, a pokud provedete změny, projdete kontrolou změn. Model strojového učení, který se dál učí z reálných dat nebo se přetrénuje na nových datech, stírá hranici mezi pevným produktem a vyvíjejícím se. To je klíčová výzva, kterou MDCG 2021-24 řeší — a hlavní důvod, proč práce na shodě AI/ML SaMD není přímočará.
Co MDCG 2021-24 skutečně pokrývá
MDCG 2021-24 bylo vydáno v roce 2021 a je primárním pokyn EU pro software zdravotnických prostředků na bázi AI/ML. Řeší konkrétní otázku: vzhledem k tomu, že MDR bylo napsáno dřív, než se rozšířila současná generace nástrojů AI/ML, jak by výrobci a regulátoři měli aplikovat stávající rámec?
Pokyn nevytváří nové požadavky — interpretuje stávající povinnosti MDR v kontextu AI/ML. Klíčové pozice:
Rozlišení „uzamčeného" vs. „adaptivního" algoritmu je důležité pro správu životního cyklu. Uzamčený algoritmus — který se po trénování nemění — je považován za konvenční software. Platí životní cyklus vývoje softwaru IEC 62304 a změny algoritmu procházejí standardní kontrolou změn. Adaptivní algoritmus — který se dál aktualizuje na základě nových dat — vyžaduje zdokumentované kontroly: kdy k aktualizacím dochází, jak jsou validovány a jak jsou řízeny podstatné změny. Pokud aktualizace podstatně mění klinický výkon, může spustit nové posouzení shody.
Transparentnost a vysvětlitelnost jsou řešeny nepřímo. GSPR vyžaduje, aby návod k použití prostředku umožnil uživatelům pochopit jeho výkon a omezení. Pro AI/ML software to znamená, že IFU musí vysvětlit, co model dělá, na jakých populacích pacientů a typech dat byl trénován a validován, jaká jsou jeho známá omezení a jaké výstupy by uživatelé měli interpretovat opatrně. „Černá skříňka" není z hlediska GSPR obhajitelná pozice.
Kvalita trénovacích dat je součástí klinických a technických důkazů. Data použitá k trénování diagnostického AI modelu jsou přímo relevantní pro jeho klinickou platnost. Technická dokumentace by měla popisovat trénovací datovou sadu: velikost, klinický zdroj, demografické složení, metodologii označování, kritéria vyloučení. Model trénovaný na úzké populaci, který je pak nasazen v širší, má známou mezeru platnosti, kterou je třeba řešit v CER a plánu PMCF.
Metodologie validace pro AI/ML se řídí stejnými principy klinického hodnocení jako jiný software — studie výkonu, srovnání s referenčními standardy, hodnocení na klinicky reprezentativních datech — ale metodologie musí být navržena tak, aby odhalila selhání specifická pro AI: distribuční posun, nepříznivé vstupy, degradaci výkonu na podreprezentovaných podskupinách.
Klasifikace podle Pravidla 11 — jak AI/ML mění analýzu
Logika klasifikace Pravidla 11 se na AI/ML software vztahuje stejně jako na jakýkoli jiný SaMD: třída je určena závažností újmy, která by mohla nastat v případě, že software poskytne nesprávnou informaci. S AI/ML se mění rizikový profil.
Několik věcí k uvědomění při klasifikační analýze:
Diagnostické AI nástroje formulující tvrzení o závažných stavech — detekce rakoviny, predikce sepse, třídění mrtvice — budou téměř vždy třídy IIb nebo III. Kombinace potenciálu vysoké závažnosti újmy a klinické váhy, která je přikládána výstupu softwaru, to řídí.
AI nástroje, které klinická rozhodnutí „informují" spíše než „řídí", mohou být někdy argumentovány do nižší třídy, ale to vyžaduje pečlivou analýzu toho, jak klinikové výstup skutečně využívají. Pokud v praxi klinikové pravidelně jednají podle doporučení bez nezávislého ověření, MDCG 2021-24 jasně říká, že to přispívá k vyšší třídě.
Nástroje AI třídy IIa existují — typicky software podporující klinický pracovní postup bez rozhodnutí s vysokými vsázkami. Ale pokud vytváříte AI diagnostický software nebo software pro podporu terapeutických rozhodnutí, předpokládejte třídu IIb a plánujte podle toho, pokud nemáte silný zdokumentovaný základ pro nižší klasifikaci.
Průnik s EU AI Act
EU AI Act vstoupil v platnost v roce 2024 s postupnými aplikačními termíny do roku 2026 a 2027. Pro vývojáře SaMD je nejdůležitější průnik tento: systémy AI určené k použití v lékařské diagnostice nebo monitorování léčby, které by byly podle MDR klasifikovány jako vysoce rizikové, jsou také klasifikovány jako vysoce rizikové podle Přílohy III AI Actu.
Co to v praxi znamená: pokud je váš AI/ML SaMD třídy IIa nebo vyšší a zahrnuje podporu klinického rozhodování, máte téměř jistě povinnosti podle MDR i AI Actu. Oba rámce jsou navrženy jako komplementární — posouzení shody podle MDR se započítává do shody s AI Actem pro zahrnuté požadavky — ale AI Act má specifické požadavky, které MDR neřeší:
Dokumentace modelů pro obecné účely — pokud váš systém používá základní model nebo komponentu velkého jazykového modelu, AI Act má specifické požadavky na dokumentaci původu modelu, trénovacích dat a zamýšleného použití.
Požadavky na lidský dohled — AI Act má explicitní požadavky na to, aby vysoce rizikové systémy AI byly navrženy tak, aby umožňovaly lidský dohled. To se překrývá s inženýrstvím použitelnosti a zamýšleným účelem, ale má vlastní požadavky na dokumentaci.
Postmarketingový monitoring — AI Act vyžaduje plány postmarketingového monitorování pro vysoce rizikové systémy AI, které sbírají data o výkonu. To se podstatně překrývá s požadavky MDR PMS pro SaMD, ale formulace a požadavky na dokumentaci AI Actu jsou odlišné.
Zakázané praktiky — AI Act zakazuje určité techniky AI bez ohledu na třídu prostředku. Přezkumejte tento seznam brzy ve vývoji, ne pozdě.
Praktický dopad: pokud vytváříte AI/ML SaMD, váš tým pro regulační záležitosti musí sledovat oba rámce — MDR i AI Act — a dokumentace systému managementu kvality by měla řešit oba. Jde o pohyblivý cíl — prováděcí akty AI Actu jsou stále vyvíjeny a pokyn specifický pro sektor zdravotnických prostředků se očekává.
Správa změn pro adaptivní AI/ML — nejtěžší část
Nejobtížnější otázka shody pro AI/ML SaMD je správa změn: kdy změna modelu vyžaduje nové posouzení shody?
Odpověď závisí na povaze změny a jejím dopadu na klinický výkon. MDCG 2021-24 to rámcuje kolem toho, zda je změna v rámci „předem stanoveného plánu kontroly změn" — koncept, který umožňuje plánované aktualizace modelu v rámci definovaných hranic bez spuštění plné recertifikace, pokud jsou hranice definovány předem a aktualizace je v jejich rámci validována.
V praxi: pokud plánujete pravidelně přetrénovat svůj model, definujte předem, co tvoří přijatelnou obálku výkonu. Pokud přetrénovaný model zůstane v této obálce, zdokumentujete to prostřednictvím kontroly změn. Pokud z ní vychází — nebo pokud přetrénování zásadně mění chování modelu — zacházíte s tím jako s podstatnou změnou vyžadující aktualizaci klinického hodnocení a potenciálně nový přezkum Notifikovanou osobou.
Budujte svůj proces kontroly změn pro AI/ML od prvního dne. Dodatečné zavedení po spuštění je výrazně obtížnější.
Zapojení AI a regulační upozornění
Obsah této stránky je vytvářen s asistencí umělé inteligence (AI) za účelem zvýšení čitelnosti a zajištění srozumitelnosti.
Ačkoli náš tým veškerý obsah pečlivě kontroluje, mějte prosím na paměti:
- Přesnost: Interpretace s podporou AI mohou obsahovat nuance, které se liší od oficiálních pokynů MDCG.
- Aktuálnost: Nařízení o zdravotnických prostředcích (MDR) podléhají neustálým změnám. Vždy si ověřte kritické informace v oficiální databázi EUR-Lex.
- Odpovědnost: MDR Academy poskytuje tyto zdroje výhradně pro vzdělávací účely. Nepředstavují právní poradenství.