Background: We aimed to develop a convolutional neural network (CNN) model for detecting neoplastic lesions during real-time digital single-operator cholangioscopy (DSOC) and to clinically validate the model through comparisons with DSOC expert and nonexpert endoscopists. Methods: In this two-stage study, we first developed and validated CNN1. Then, we performed a multicenter diagnostic trial to compare four DSOC experts and nonexperts against an improved model (CNN2). Lesions were classified into neoplastic and non-neoplastic in accordance with Carlos Robles-Medranda (CRM) and Mendoza disaggregated criteria. The final diagnosis of neoplasia was based on histopathology and 12-month follow-up outcomes. Results: In stage I, CNN2 achieved a mean average precision of 0.88, an intersection over the union value of 83.24 %, and a total loss of 0.0975. For clinical validation, a total of 170 videos from newly included patients were analyzed with the CNN2. Half of cases (50 %) had neoplastic lesions. This model achieved significant accuracy values for neoplastic diagnosis, with a 90.5 % sensitivity, 68.2 % specificity, and 74.0 % and 87.8 % positive and negative predictive values, respectively. The CNN2 model outperformed nonexpert #2 (area under the receiver operating characteristic curve [AUC]-CRM 0.657 vs. AUC-CNN2 0.794, P < 0.05; AUC-Mendoza 0.582 vs. AUC-CNN2 0.794, P < 0.05), nonexpert #4 (AUC-CRM 0.683 vs. AUC-CNN2 0.791, P < 0.05), and expert #4 (AUC-CRM 0.755 vs. AUC-CNN2 0.848, P < 0.05; AUC-Mendoza 0.753 vs. AUC-CNN2 0.848, P < 0.05).

graphic

Abstract aus Robles-Medranda C, Baquerizo-Burgos J, Alcivar-Vasquez J, Kahaleh M, Raijman I, Kunda R, Puga-Tejada M, Egas-Izquierdo M, Arevalo-Mora M, Mendez JC, Tyberg A, Sarkar A, Shahid H, Del Valle-Zavala R, Rodriguez J, Merfea RC, Barreto-Perez J, Saldaña-Pazmiño G, Calle-Loffredo D, Alvarado H, Lukashok HP. Artificial intelligence for diagnosing neoplasia on digital cholangioscopy: development and multicenter validation of a convolutional neural network model. Endoscopy. 2023 Aug;55(8):719-727.

Hintergrund

In Deutschland wurden im Jahr 2020 etwa 5 130 neue Fälle von bösartigen Tumoren der Gallenblase (ca. 28 Prozent) und der extrahepatischen Gallenwege (72 Prozent) diagnostiziert. Die aktuelle S3-Leitlinie «Hepatozelluläres Karzinom und biliäre Karzinome» empfiehlt diagnostisch eine Trias aus Sonografie, Endoskopie und Schnittbilddiagnostik. Bezüglich der Endoskopie kommen hier die Endosonographie, die endoskopische retrograde Cholangiographie (ERC) sowie die Cholangioskopie zur Anwendung. Endosonographie und ERC können durch Feinnadelpunktion oder Bürstenzytologie ergänzt werden.

Trotz dieser mittlerweile sehr gut ausdifferenzierten Verfahren stellt die Diagnostik eines Gallenwegstumors hohe Anforderungen an den Untersucher, so dass hier bei negativer Diagnostik aber fortbestehendem Verdacht von der Leitlinie neben einer Wiederholung der Untersuchungen auch die chirurgische Exploration formuliert wird. Bei letzterer muss dann in aller Regel auch reseziert werden, sofern nicht Irresektabilität gefunden wird, da kleine Tumoren sich intraoperativ nicht von potentiell benignen Läsionen unterscheiden lassen.

Insofern kommt einer optimierten Diagnostik aus zwei Argumentationslinien eine hohe Bedeutung zu: einerseits zur Detektion operationsbedürftiger Präkanzerosen bzw. maligner Tumoren und andererseits aber eben dem Ausschluss operationsbedürftiger Befunde und damit der Vermeidung komplexer und risikobehafteter Eingriffe.

In anderen Bereichen der medizinischen Diagnostik haben KI-basierte Systeme bereits ihre Leistungsfähigkeit unter Beweis gestellt, beispielsweise in der Dermatologie bzw. Pathologie. Die Stärken liegen insbesondere in der Mustererkennung, daher ist die hier untersuchte Forschungsfrage absolut nachvollziehbar und klinisch relevant.

Ergebnisse der Studie

Die Studie zeigt, dass eine KI-gestützte Analyse von Videodaten der Cholangioskopie in Echtzeit möglich ist. Das Modell CNN2 erreichte signifikante Genauigkeitswerte für die neoplastische Diagnose mit einer Sensitivität von 90,5 %, einer Spezifität von 68,2 % und 74,0 % bzw. 87,8 % positiven und negativen Vorhersagewerten. Das CNN2-Modell übertraf neben zwei Nichtexperten auch einen Experten.

Fazit für die Praxis

Die in der Studie zur Anwendung gebrachten Modelle sind interessant und stellen eine spannende Weiterentwicklung der Cholangioskopie dar. Der Schluss, dass ein Nicht-Experten mit KI-gestützten Systemen eine Untersuchung machen könne, ist nicht die richtige Ableitung aus der Studie. Denn nicht nur die Interpretation der Bilder, auch die Untersuchung selbst erfordert ein hohes Maß an Erfahrung und manueller Fertigkeit. Aber die technische Innovation verbessert das Verfahren und schafft zukünftig möglicherweise eine therapieentscheidende Klarheit in Situationen, in denen eine Absicherung mit zytologischen Resultaten nicht gelingt. Es kann durchaus erwartet werden, dass die KI-Unterstützung sich zum Standard in der Cholangioskopie entwickelt.

Disclosure Statement

Der Autor erklärt, dass kein Interessenskonflikt besteht.