Grote taalmodellen (large language models; LLM) zoals ChatGPT, Claude, Gemini en Opus geven behoorlijk accuraat antwoord op de meest voorkomende vragen die ouders hebben over het astma van hun kinderen. Dat blijkt uit een Frans onderzoek dat werd gepresenteerd op ERS 2025.1,2
Tot een aantal jaar geleden zochten patiënten vooral in online zoekmachines naar informatie over hun ziekte. Sinds de komst van LLM, een toepassing van kunstmatige intelligentie, in 2022 maken ze steeds vaker gebruik van deze bronnen om antwoord op hun vragen te krijgen. Franse onderzoekers gingen na hoe accuraat de antwoorden van deze taalmodellen zijn.
In juli 2024 vroegen ze de ouders van kinderen met astma, die met hun kind in het ziekenhuis op consult kwamen, om op een computer alle vragen die ze hadden over het astma van hun kind te stellen aan ChatGPT. Op deze manier verzamelden de onderzoekers in totaal 100 vragen van ouders, waaruit ze de 10 meest gestelde vragen selecteerden. Deze stelden ze aan 10 verschillende AI-taalmodellen. Het betrof de gratis en betaalde modellen van ChatGPT (versie 3.5*, 4# en 4o#), Claude (Haiku*, Sonnet# en Opus#), Gemini*,# en Opus*,# (* gratis versie, # betaalde versie).
In totaal kregen ze hierop 100 antwoorden (10 vragen x 10 taalmodellen). Deze lieten ze door 5 verschillende kinderlongartsen op medische accuraatheid beoordelen. Daarnaast vroegen ze 100 ouders van andere kinderen met astma om te beoordelen of ze de antwoorden begrijpelijk en toepasselijk vonden.
De artsen en ouders beoordeelden de antwoorden op een schaal van 1 (erg slecht) tot 5 (erg goed). Wat betreft de medische accuraatheid beoordeelden de artsen 33 van de 100 antwoorden als zeer goed, 58 als goed, 33 als acceptabel, 1 als slecht en 1 als zeer slecht. Ook de ouders beoordeelden het merendeel van de antwoorden als (zeer) goed wat betreft begrijpelijkheid en toepasselijkheid.
De onderzoekers concluderen dat AI-taalmodellen goede antwoorden geven op veelvoorkomende vragen over astma, een resultaat dat ook naar voren komt in andere recente studies naar AI-taalmodellen.3 In de Franse studie presteerden de betaalde versies van de taalmodellen iets beter dan de gratis versies.
Bronnen:
- Drummond D, et al. ChatGPT and other large language models for parents’ questions about childhood asthma: a comparative study. ERS 2025, presentation OA2344.
- Girault A, et al. ChatGPT and other large language models for parents’ questions about childhood asthma: a comparative study. Eur Respir J. 2025;65:2500254.
- Drummond D, et al. ChatGPT and other language models for childhood asthma. Paediatr Respir Rev. 2025 (accepted for publication).