n der Studie wurden drei große Sprachmodelle (ChatGPT, DeepSeek, Le Chat Mistral) mit international renommierten Thromboseexpert:innen verglichen. Ärzt:innen aus 18 Ländern beurteilten in einer verblindeten Bewertung sowohl Antworten zu häufigen Fragen in der Patient:innenaufklärung als auch Handlungsempfehlungen zu drei komplexen klinischen Fallvignetten.
„Besonders im Bereich der Patient:innenaufklärung konnte die KI mit klaren, verständlichen und strukturierten Antworten überzeugen und wurde von den unabhängigen Gutachter:innen besser bewertet als die Antworten der Expert:innen“, erklärt Studienerstautor Nikola Vladic.
Bei den klinischen Fallbeispielen – darunter die Behandlung einer tiefen Beinvenenthrombose bei einer jungen Frau, einer Lungenembolie bei einem jungen Mann ohne Risikofaktoren sowie eines Tumorpatienten mit Blutungskomplikation – lieferten die Sprachmodelle vergleichbare Ergebnisse zu jenen der Expert:innen.
„Unsere Ergebnisse zeigen, dass KI-Sprachmodelle das ärztliche Handeln sinnvoll ergänzen können – vorausgesetzt, es gibt klare Rahmenbedingungen für ihren Einsatz. Datenschutz, Aktualität der Evidenz und die Verantwortung in der Entscheidungsfindung bleiben zentrale Herausforderungen“, betont Studienletztautor Cihan Ay.
Die Autor:innen weisen darauf hin, dass eine unkritische Nutzung Risiken birgt, etwa im Hinblick auf Wissensverlust bei jungen Mediziner:innen. Artificial Intelligence kann Ärzt:innen nicht ersetzen, sie aber in ihrer Entscheidungsfindung unterstützen und entlasten.
Publikation: Journal of Thrombosis and Haemostasis
Large language models versus thrombosis experts: A comparative study on patient education and clinical decision-making in venous thromboembolism.
Vladic N, Nopp S, Pabinger I, Ageno W, Connors JM, Eichinger S, Ay C, on behalf of the ClotGPT study group.
https://doi.org/10.1016/j.jtha.2025.09.004