ChatGPT-4 kan dermatologen helpen bij het beoordelen van huidbeelden in de teledermatologie. Het taalmodel genereerde uitgebreide beschrijvingen van ingezonden foto’s. Dit hielp dermatologen in de meerderheid van de gevallen aan een correctie diagnose.1
Teledermatologie maakt al een tijdje een voorzichtige opmars, maar de kwaliteit en volledigheid van beeldbeschrijvingen is vaak inconsistent. Deze onderzoeksgroep heeft gekeken of AI deze beperkingen kan opheffen door gedetailleerde en gestandaardiseerde beschrijvingen te maken om dermatologen te ondersteunen.
Er zijn 154 teledermatologie-consulten geanalyseerd tussen december 2023 en februari 2024. Voor elke casus is een klinische afbeelding geüpload naar ChatGPT-4. Het taalmodel genereerde dan een beschrijving en differentiaaldiagnose. Deze beelden zijn beoordeeld door 2 ervaren dermatologen die onafhankelijk van elkaar naar de beschrijvingen keken en zelf tot een differentiaaldiagnose kwamen. De diagnosen zijn vergeleken met de oorspronkelijke diagnose van de teledermatoloog. Diagnostische overeenstemming is gecategoriseerd als top-1 (exacte match), top-3 (gedeeltelijk) of geen overeenstemming.
Opvallend was dat de AI-beschrijvingen gemiddeld 10 keer langer waren dan die van teledermatologen (75 versus 7 woorden). Van de 154 AI-beschrijvingen waren er 130 bruikbaar (84,4%). In 63,1% van de gevallen kwamen de differentiaaldiagnosen van ChatGPT volledig overeen met de beschrijving van de teledermatoloog en in 69,2% bij het interpreteren van zijn notities. Gedeeltelijke overeenstemming was er in respectievelijk in 77,7% en 82,3% van de gevallen. Wanneer ervaren dermatologen de AI-teksten gebruikten, liep die overeenstemming op tot 70,0 (top-1) en 86% (top-3). De overeenstemming tussen AI en artsen bleek uiteindelijk matig (Cohen’s kappa 0,47-0,56).
De onderzoekers zien in dit eerste onderzoek dat AI-tekstgeneratie een aanvulling kan zijn voor teledermatologie, bijvoorbeeld door het verrijken en standaardiseren van documentatie in het elektronisch patiëntendossier. Maar, zo benadrukken ze ook: menselijke validatie blijft noodzakelijk, want een deel van de AI-beschrijvingen is incorrect of misleidend.
Bron:
- Shapiro J, Greenfield B, Khamaysi Z, et al. Enhancing teledermatology diagnosis: a cross-sectional explorational comparative study of AI-generated clinical image descriptions. EADV 2025, abstract 5656.