Een slim taalmodel signaleert infectie-uitbraken zoals COVID-19 en RSV al weken voordat laboratoria of surveillance het opmerken. ERNIE doet dat zonder vooraf ingestelde ziektelabels of laboratoriumtests. Het AI-model spoort vroegtijdig afwijkende ziektebeelden op op basis van patronen in huisartsendossiers.
Dankzij deze ‘ziekte-agnostische’ aanpak kunnen onbekende of atypische infectie-uitbraken in een vroeg stadium worden herkend, puur op basis van wat huisartsen dagelijks noteren in het dossier, vertelt computationeel taalkundige Gijs Danoe van het UMCG. “Huisartsen leggen consultgegevens gedetailleerd vast, inclusief klachten en observaties. Deze vrije tekst wordt zelden gebruikt voor infectieziektesurveillance, terwijl het een rijke bron van informatie vormt.”
Bert en Ernie
Het model ERNIE (Early Recognition using Neural Information Encoding), gebouwd op het taalmodel BERT (Bidirectional Encoder Representations from Transformers),2 analyseert vrije tekst uit huisartsgegevens via 4 stappen: 1) signaleren van afwijkende consultpatronen, 2) groeperen van soortgelijke consulten, 3) extraheren van kenmerkende trefwoorden en 4) geografisch en demografisch visualiseren van de uitbraak.
Goed getraind
Het model is getraind op consultgegevens van ruim 480.000 patiënten uit 71 huisartsenpraktijken in Noord-Nederland (AHON-database). Danoe: “Daarna hebben we het model extern gevalideerd met data uit andere regio’s. In retrospectieve analyses toonde het model al weken voor de eerste bevestigde gevallen van COVID-19 een cluster van patiënten met symptomen als hoesten, hoofdpijn en ‘metaalsmaak’. Ook een atypische RSV-uitbraak in de zomer van 2021 wist het model al te signaleren, terwijl het RIVM nog geen trend constateerde.”
Schaalbaar
Voordelen van deze methode zijn dat labdiagnostiek en menselijke supervisie niet nodig zijn. Omdat het model werkt op consultniveau, zijn uitbraken vroeg te signaleren. Verder is het model ‘ziekte-agnostisch’: het is breed inzetbaar en ook geschikt voor atypische of nieuwe infecties. Bovendien is het model schaalbaar: van monitoring op praktijkniveau tot landelijke inzet. Gijs Danoe: “Dit model kan de infectieziektebewaking verbeteren door realtime signalering van uitbraken.”
Bronnen:
- Danoe G. AI-driven early infectious disease detection in Dutch primary care: leveraging bidirectional encoder representations from transformers (BERT) and early recognition using neural information encoding (ERNIE). ESCMID Global 2025, oral presentation O0383.
- Homburg M, Meijer E, Berends M, et al. A Natural language processing model for covid-19 detection based on Dutch general practice electronic health records by using bidirectional encoder representations from transformers: development and validation study. J Med Internet Res. 2023;25:e49944.