Künstliche Intelligenz und Endodontie: eine Standortbestimmung

Künstliche Intelligenz (KI) kann komplexe Datenmengen analysieren und wird bereits seit einigen Jahren erfolgreich in der medizinischen Diagnostik und Behandlung angewendet. In der Endodontie werden vielfältige Befunde erhoben, auf deren Basis komplexe Entscheidungen getroffen werden müssen. Eine Implementierung der KI in der Endodontie zur Diagnostik und Behandlungsplanung erscheint vielversprechend – u.a., weil vor und während der endodontischen Behandlung große Datenmengen generiert werden, die zum Training einer KI genutzt werden können. In diesem Artikel wird die aktuelle Studienlage zum Thema künstliche Intelligenz in der Endodontie kritisch diskutiert und mögliche zukünftige Anwendungsgebiete aufgezeigt.
Mithilfe von Künstlicher Intelligenz (KI) soll die Funktionsweise des menschlichen Gehirns nachgeahmt werden mit dem Ziel, dass Aufgaben, die vornehmlich mit menschlichen Denkprozessen assoziiert sind, durch Computer erledigt werden können. KI wird bereits in vielen Bereichen des alltäglichen Lebens angewendet und hat zahlreiche Prozesse vereinfacht. Hierbei umfasst der Begriff KI u.a. Techniken des maschinellen und tiefen Lernens (Abb. 1).
Künstliche neuronale Netzwerke sind ein abstrahiertes Modell von menschlichen Neuronen und weisen analog dazu eine Eingabeschicht für Daten, eine verborgene Schicht für die Datenprozessierung und eine Ausgabeschicht für den Endpunkt der Datenauswertung auf. Im Gegensatz zu regelbasierten Computerprogrammen und konventioneller Statistik können diese Ansätze große Datenmengen hocheffizient prozessieren und komplexe Muster innerhalb der Datenstruktur erkennen, die wiederum für Vorhersagen genutzt werden können.
In den letzten Jahren konnten zahlreiche Anwendungsgebiete von KI im Bereich der Medizin und Zahnheilkunde identifiziert werden; erste Softwarelösungen sind bereits auf dem Markt erhältlich. Dabei ist KI generell nicht zwingend ein neues Phänomen in der Zahnmedizin; die erste Anwendung von KI in der Endodontie erfolge 1983 durch Hyman et al. [1] zur Pulpadiagnostik. Auch in der Medizin konnten zu dieser Zeit bereits Computerprogramme zur Schilddrüsen- und Glaukomdiagnostik entwickelt werden, welche eine ähnliche Genauigkeit wie Fachärzte aufwiesen [2,3].
In der Endodontie hat KI das Potenzial, die Art, wie Zahnärzte und Zahnärztinnen diagnostizieren, behandeln und Fallplanungen durchführen, grundlegend zu verändern. Im besten Fall kann die Behandlungsqualität bei erhöhter Effizienz steigen und Gesundheitskosten, u.a. durch vermiedene Nachbehandlungen, sinken. Vor, während und nach einer endodontischen Therapie wird eine hohe Zahl an Bild- und Textdaten routinemäßig erhoben.
Diese Daten werden nahezu bei jedem relevanten Behandlungsschritt generiert, in der Regel existieren ein diagnostisches Einzelbild, mindestens eine verifizierende Zwischenaufnahme, ein Abschlussröntgenbild sowie Röntgenbilder im Rahmen von Nachkontrollen. Zudem findet eine ausführliche Behandlungsdokumentation statt; in einigen Fällen werden Fotos während der Behandlung angefertigt. Somit liegen Röntgenbilder, Befunddaten sowie klinische Bilder zur Diagnostik, Behandlungsplanung/-durchführung und Ergebnisbewertung vor, die durch komplexe Algorithmen ausgewertet werden können.
In diesem Artikel wird der aktuelle Stand der Literatur in Bezug auf KI in der Endodontie vorgestellt und kritisch diskutiert. Zudem werden aktuelle Herausforderungen sowie zukünftige Perspektiven herausgearbeitet.
Aktuelle Anwendungsgebiete
Generell sind bei der Anwendung von KI die Begriffe Klassifikation, Objekterkennung und Segmentierung zu unterscheiden. Bei der Klassifikation wird einem Bild oder einem Datenpunkt eine „Klasse“ zugeordnet, in der Regel ein Befund.
Der Nachteil bei der Klassifizierung von Bilddaten ist, dass nicht direkt ersichtlich ist, in welchem Bereich der Befund detektiert wurde. Hier ist die Objekterkennung etwas präziser und rahmt den auffälligen Bereich ein, zeigt jedoch nicht die exakte Ausdehnung.
Bei der Segmentierung werden die auffälligen Pixel farblich hervorgehoben, wodurch direkt ersichtlich ist, welche Bereiche durch die KI als potenziell betroffen oder relevant identifiziert worden sind (Abb. 2). Für die Anwendung in der täglichen Praxis und Patientenaufklärung sind Anwendungen, die mit Objekterkennungs- bzw. Segementierungstechniken arbeiten, aufgrund der visuellen Darstellung häufig zu bevorzugen. Die meisten Studien in Bezug auf KI und Endodontie beziehen sich auf die Diagnostik und Therapieplanung und zeigen teils vielversprechende Ergebnisse.
Die Schwierigkeitseinschätzung und die Vorhersage von Therapieergebnissen wurden ebenfalls untersucht, jedoch sind die Ergebnisse heterogen und weisen auf die Herausforderungen in dem Feld hin. Im Folgenden werden die Studienergebnisse detaillierter vorgestellt.
Apikale Läsionen
Apikale Läsionen (AL) sind in den meisten Fällen die röntgenologische Entsprechung einer endodontischen Infektion und können unbehandelt zum Zahnverlust führen und einen Einfluss auf die Allgemeingesundheit der Patienten/-innen haben [4]. Daher ist die frühe Detektion von AL für Patienten/-innen von hoher Relevanz.
Dementsprechend wurde die Anwendung zur Diagnostik von AL durch KI auf Einzelbildern (EB), Panoramaschichtaufnahmen (PSA) und digitalen Volumentomogrammen (DVT) untersucht (Abb. 2). In einer aktuellen Meta-Analyse wurde die diagnostische Aussagekraft bisheriger KI-Anwendungen (meist verschiedene Architekturen von künstlichen neuronalen Netzen) in Bezug auf die Detektion von AL untersucht.
Bei den 6 eingeschlossenen Studien (die unterschiedliche Bildmodalitäten untersuchten) konnten eine gepoolte Sensitivität von 92,5% (95%-Konfidenzintervall 86,2–96,0%) und eine Spezifität von 85,2% (81,0–88,5%) ermittelt werden [5] (Tabelle 1 gibt einen Überblick über die genannten Metriken). Demnach sind die beschriebenen Anwendungen vermutlich in der Lage, den Behandelnden bei der Diagnostik von AL auf Röntgenbildern zu unterstützen. Zudem können Algorithmen des maschinellen Lernens auf der Basis von Risikofaktoren (z.B. Restaurationsgrad, Vorhandensein einer Wurzelfüllung) die Wahrscheinlichkeit des Auftretens von AL auf PSA abschätzen.
-
Tab. 1: Übersicht der verwendeten Metriken zur Bewertung der KI (RP: richtig positiv, FP: falsch positiv, FN: falsch negativ, RN: richtig negativ, ROC: Receiver Operator
Characteristic, ROC-AUC: Area under the Receiver Operator Characteristic Curve).
© die Autoren
In einer aktuellen Studie wurden 1071 PSA zum Trainieren und Validieren von Algorithmen des maschinellen Lernens (logistische Regression, K-Nächste-Nachbarn-Algorithmus, Entscheidungsbaum, Zufallswald, Stützvektormaschine, adaptives und gradientenverstärktes Lernen) verwendet [6]. Hierbei erzielte der Entscheidungsbaum die besten Vorhersagewerte; der positive Vorhersagewert bzw. die Spezifität lagen bei 90% bzw. 92%. Eine Kombination aus Objekterkennungsalgorithmen und Algorithmen des maschinellen Lernens auf Basis von bestimmten Risikofaktoren könnte in der Zukunft eine präzisere Detektion von AL erlauben und den Zahnarzt bei der Diagnostik unterstützen.
Wurzellängsfrakturen
Die Wurzellängsfraktur stellt aufgrund der vielfach uneindeutigen klinischen und/oder röntgenologischen Befundlage eine diagnostische Herausforderung dar [7]. In einer klinischen Pilotstudie konnten Wurzellängsfrakturen im DVT mit einer Sensitivität und Spezifität von 88% und 75% von Zahnärzten/-innen diagnostiziert werden [8] – auf EB hingegen lag die Sensitivität in einer Ex-vivo-Studie bei nur 5% [7]. Da jedoch nicht grundsätzlich ein DVT für die Diagnostik verfügbar ist, haben 3 Studien eine mögliche Anwendung von KI zur Unterstützung des Diagnoseprozesses auf EB untersucht: 2 Studien haben einen In-vitro-Versuchsaufbau gewählt; 1 Studie nutzte retrospektive klinische Daten.
Beide In-vitro-Studien verwendeten ein probabilistisches neuronales Netzwerk und berichteten über Sensitivitäten und Spezifitäten von 98% und 67,7–90,5% [9,10]. Somit liegen die Werte nah an denen der klinischen Pilotstudie zur Detektion von Längsfrakturen im DVT, jedoch ist das In-vitro-Szenario nicht auf die klinische Situation übertragbar. In dem gewählten Versuchsaufbau wurde auf anatomische Begleitstrukturen verzichtet und es wurde nur 1 Zahntyp untersucht.
In der retrospektiven Studie wurden 300 PSA mit jeweils 330 Zähnen, die eine Längsfraktur aufwiesen, zum Trainieren eines neuronalen Netzwerkes verwendet. Die Vorhersageleistung des Netzwerkes betrug für die Sensitivität und den positiven Vorhersagewert 75% und 93%. Die Autoren beurteilten die Ergebnisse kritisch und schlussfolgerten, dass ein solches neuronales Netzwerk noch nicht für die klinische Anwendung geeignet ist.
Darstellung und Identifizierung von Wurzelkanalstrukturen im DVT
Die Anwendung des DVT führt einerseits zu einer Erhöhung der zur Befundung vorliegenden Daten, andererseits müssen diese auch adäquat durch den Behandler interpretierbar sein, damit tatsächlich ein klinischer Nutzen für die Patienten/-innen entsteht und die erhöhte Strahlenexposition gerechtfertigt ist. Bei der Analyse eines DVT ohne weitere Analysesoftware hängt die Interpretation stark von dem räumlichen Vorstellungsvermögen und der Erfahrung des Behandelnden ab. Hierbei kann KI unterstützend eingesetzt werden.
Bisherige Softwarelösungen zur 3D-Darstellung der Wurzelkanalanatomien stützen sich basierend auf festen Regeln wie vordefinierte Grauwertunterschiede oder Ähnlichkeiten in den Pixelstrukturen auf Rekonstruktionen. Jedoch stoßen diese regelbasierten Modelle an ihre Grenzen bei Artefakten oder reduzierten Kontrasten bei Low-Dose-DVT. Auch hier kann die Anwendung von KI einen Beitrag zur Problemlösung leisten.
Hierbei ist das Grundprinzip ähnlich wie bei den zuvor beschriebenen Anwendungen: Die anatomischen Strukturen im DVT werden markiert und ein neuronales Netzwerk lernt die Muster, die nicht zwingend den zuvor genannten Regeln folgen müssen. Dadurch sind die so generierten Rekonstruktionen in der Theorie weniger fehleranfällig als die konventionellen regelbasierten Softwarelösungen.
Die meisten Studien verwenden hierbei durch einen oder mehrere Experten manuell markierte DVTs (Datensatzgrößen zwischen 29 und 180 DVTs) als Grundwahrheit, jedoch resultieren auch hierbei abweichende Übereinstimmungen durch Artefakte und geringe Kontraste. Eine Studie hat diesen Nachteil erkannt und verwendet zum Training der neuronalen Netzwerke Mikrocomputertomografie-Daten, welche als Goldstandard in der Röntgendiagnostik gelten.
In diesem Versuchsaufbau wurden 30 Zähne verwendet, die vor der Extraktion in einem DVT dargestellt worden sind. Nach der Extraktion erfolgte ein Mikrocomputertomografie-Scan der Zähne, und die Daten konnten miteinander verglichen werden und zu einer Qualitätssteigerung der Grundwahrheit führen. Allerdings ist die Fallzahl extrem klein, und die Robustheit der Studie ist möglicherweise begrenzt.
Vorhersage von komplexen anatomischen Strukturen Die präoperative Identifikation und Lokalisierung von anatomischen Strukturen stellen eine klinische Herausforderung dar und sind ebenfalls abhängig von der Erfahrung des Behandelnden. Da nicht grundsätzlich ein DVT vor der Behandlung angefertigt werden kann, zielt die Anwendung von KI bei der Röntgendiagnostik darauf ab, die in 2D-Bildern enthaltenen Informationen möglichst so auszuwerten, dass ein Verständnis für die dreidimensionale Struktur abgeleitet werden kann. Studien haben hierbei die Vorhersage von zweiten distalen Wurzeln in Unterkiefermolaren, c-förmigen Kanalsystemen und taurodonten Zähnen mittels KI untersucht.
Die Prävalenz von zweiten distalen Wurzeln in Unterkiefermolaren kann in einigen Populationen bis zu 22% betragen [11], weshalb die Detektion von zweiten distalen Wurzeln bei Unterkiefermolaren eine hohe Relevanz aufweist. In einer Studie wurde die Anwendung von neuronalen Netzen zur Detektion von zweiten distalen Wurzeln in Unterkiefermolaren auf PSA untersucht. Hierbei konnten gute Ergebnisse erzielt werden, und das trainierte neuronale Netzwerk (AlexNet) zeigte signifikant bessere Spezifitäts- und ROC-AUC-Werte als ein/-e Radiologe/-in (AlexNet 97,1% und 0,87% vs. 82,0% und 0,74%), bei der Sensitivität lagen keine signifikanten Unterschiede vor (77,3% vs. 80,2%).
Ähnlich vielversprechend schnitten neuronale Netzwerke in 2 Studien zur Identifikation von c-förmigen Kanälen ab (Sensitivität und Spezifität neuronales Netzwerk versus Endodontologe/-in auf PSA: 92,7% und 97,0% versus 91,5% und 85,5%) [12]. Auch gegenüber allgemeinpraktizierenden Zahnärzten/-innen war das KI-Modell überlegen (Genauigkeit neuronales Netzwerk vs. Zahnarzt/-ärztin auf EB: 95% vs. 89%) [13]. Bei den aufgeführten Studien wurde ein DVT als Grundwahrheit zur Bewertung hinzugezogen.
Eine weitere Studie trainierte ein neuronales Netzwerk (U-Net) zur Detektion von taurodonten Zähnen auf einem Datensatz von 305 PSA. Die Vorhersageleistung wurde auf einem Testdatensatz von 43 PSA getestet und erzielte für die Sensitivität, den positiven Vorhersagewert und den F1-Wert jeweils 87,0%, 79,0% und 83,0%. Die Autoren bewerteten die Ergebnisse als zufriedenstellend.
Präoperative Abschätzung von vorliegenden Komplikationen
Bei der Planung einer erneuten Wurzelkanalbehandlung ist das Wissen um vorliegende Behandlungskomplikationen wie übersehene zweite mesiobukkale Kanäle oder frakturierte Instrumente relevant, da diese einen Einfluss auf den Behandlungsablauf und die Prognose haben können. Auch hier könnte die Anwendung von KI den Befundungsprozess unterstützen.
Eine Studie untersuchte die Anwendung neuronaler Netzwerke zur Detektion von frakturierten Wurzelkanalinstrumenten auf PSA [14]. Insgesamt wurden 905 PSA verwendet, wovon 417 ein frakturiertes Instrument bei mindestens einem Zahn ohne Stiftrestauration aufwiesen. Die Sensitivität und Spezifität des trainierten neuronalen Netzwerks lagen bei 81,3% und 87,2%.
Nach Meinung der Autoren kann das vorgestellte neuronale Netzwerk hilfreich sein bei der Detektion von frakturierten Instrumenten auf PSA. Jedoch ist hierbei anzumerken, dass die Prävalenz von frakturierten Instrumenten im Praxisalltag deutlich geringer (0,14%–7,4% [15]) ist als in dem verwendeten Trainingsdatensatz (46,1% [14]), weshalb die Generalisierbarkeit der Ergebnisse fraglich erscheint. Auch wenn das DVT die höchste Zuverlässigkeit bei der Erkennung komplexer Anatomie zeigt, kann die Identifikation von zweiten mesiobukkalen Kanälen in Oberkiefermolaren durch Artefakte (bedingt durch metallische Restaurationen oder Wurzelkanalfüllungen) eine Herausforderung darstellen.
Eine Studie untersuchte die Anwendung eines neuronalen Netzwerkes (U-Net) für die beschriebene Situation [16]. Der gesamte Datensatz umfasst 58 DVT mit 102 mesiobukkalen Wurzeln (51 Wurzeln wiesen eine Wurzelfüllung auf), wobei 10 Wurzeln (5 mit Wurzelfüllung) für die Modellevaluation verwendet worden sind. Aufgrund der Artefakte war die Etablierung einer Grundwahrheit eingeschränkt möglich, da in 44 von 102 Fällen eine Uneinigkeit bei den beiden Hauptuntersuchern vorlag, die durch einen dritten Bewerter aufgelöst werden musste.
Auf dem so etablierten Datensatz erzielte das neuronale Netzwerk eine Sensitivität von 80% und eine Spezifität von 100%. Aufgrund der fraglichen Grundwahrheit und geringen Datensatzgröße sind die Vorhersagewerte nur eingeschränkt interpretierbar.
Vorhersage der technischen Behandlungsqualität und Behandlungsergebnisse
Endodontische Behandlungen weisen unterschiedliche Schwierigkeitsgrade auf, die variierende Ansprüche an die Erfahrung der Behandelnden stellen. Endodontische Fachgesellschaften und Forschungsgruppen haben dementsprechend Risikoerfassungsmethoden entwickelt, die Fällen einen „geringen“, „moderaten“ oder „hohen“ Schwierigkeitsgrad zuordnen [17]. Die Zuordnung basiert auf diversen Kriterien wie z.B. der Wurzelkanalkrümmung oder der Kanalsichtbarkeit.
Die Bögen sind in einigen Studien bewertet worden, und es konnte eine Korrelation zwischen dem ermittelten Schwierigkeitsgrad und auftretenden Behandlungskomplikationen gezeigt werden; es lagen mehr Behandlungskomplikationen bei einem „hohen“ Schwierigkeitsgrad vor als bei Fällen mit einem „geringen“ Schwierigkeitsgrad [18]. Fraglich ist jedoch bisher, ob ebenfalls eine Korrelation zwischen dem Schwierigkeitsgrad und dem technischen Behandlungserfolg einer Wurzelkanalbehandlung vorliegt. Auf Basis der Risikofaktoren, die im Risikoerfassungsbogen der American Association of Endodontists aufgeführt sind, konnte in einer Studie das technische Behandlungsergebnis (optimale/suboptimale Wurzelfüllungslänge) durch Algorithmen des maschinellen Lernens nicht adäquat vorhergesagt werden.
In dieser Studie wurden 555 Wurzelkanalbehandlungen retrospektiv ausgewertet, und der beste Algorithmus zeigte eine Sensitivität und Spezifität von 63,9% und 60,8% [19]. Ein weiteres potenzielles Anwendungsgebiet für die KI in der Endodontie wäre die Vorhersage des Heilungsergebnisses anhand präoperativer Befunddaten. Hierdurch ließen sich sowohl die Patientenaufklärung als auch die Behandlungsplanung optimieren.
In einer Studie wurde versucht, das Heilungsergebnis (Heilung/keine Heilung) von 591 retrospektiv ausgewerteten Behandlungsfällen (Kriterien auf Patienten- und Zahnebene) durch Algorithmen des maschinellen Lernens vorherzusagen. Hierbei lagen die Sensitivität und die Spezifität des besten Algorithmus bei 21,0% und 87,6% [20], weshalb auch hier keine reliablen Vorhersagen möglich waren.
In einer weiteren Studie wurde ein anderer Ansatz zur Vorhersage des Heilungsergebnisses gewählt: Hierbei wurde untersucht, ob das Heilungsergebnis von endodontisch behandelten einwurzligen Prämolaren auf der Basis von präoperativen Einzelbildern durch neuronale Netzwerke vorhergesagt werden kann [21]. Die 598 Behandlungsfälle zeigten Nachkontrollen von mindestens 3 Jahren, und die mittlere Genauigkeit der Vorhersagen lagen bei dem besten neuronalen Netzwerk bei 67,0%. Die Autoren merkten an, dass die Interpretation der Werte schwierig sei, da keine vergleichbaren Studien vorliegen.
Generell konnten die Studien zur Vorhersage von Behandlungsqualität und -ergebnissen bisher keine reliablen Vorhersageleistungen zeigen. Ein Grund könnte sein, dass einzelne Algorithmen komplexe menschliche Behandlungsschritte anhand von Datenstrukturen nur schwer erlernen und abschätzen können. Zudem sind die Datensätze für die umfangreiche Aufgabenstellung als zu klein anzusehen.
Herausforderungen
Was lernen die Modelle?
Grundsätzlich müssen die Modelle trainiert und validiert werden, bevor Vorhersagen getroffen werden können. Wie beschrieben, erfolgt dieser Prozess auf Datensätzen, die vorher definiert worden sind. Diese Daten müssen vorher mit einem Label versehen werden, z.B. „apikale Läsion vorhanden“, und werden anschließend als Grundwahrheit bezeichnet.
Diese Grundwahrheit sollte idealerweise aus dem diagnostischen „Goldstandard“ (also z.B. der histologischen Analyse des periapikalen Gewebes) beruhen – was allerdings oft unrealistisch ist, da histologische Daten aus diversen (ethischen und praktischen) Gründen nicht in ausreichender Zahl vorliegen können. Die Grundwahrheit muss daher durch alternative Verfahren, z.B. die Befundung durch mehrere Experten/-innen, hergestellt werden – wobei vermutlich auch beim Einsatz eines solchen Expertenpanels eine Unschärfe verbleibt.
Generalisierbarkeit
Die ganz überwiegende Zahl der Studien trainiert und testet KI-Modelle auf Datensätzen aus einer Klinik und Population (die Daten stammen dann oft alle von demselben Röntgengerät etc.). Idealerweise werden die trainierten Modelle jedoch auch auf einem komplett anderen Datensatz (z.B. aus einer anderen geografischen Region) getestet.
Weist ein Trainingsdatensatz aus Südkorea beispielsweise eine Prävalenz von 43,9% an c-förmigen Kanälen auf [13], ist fraglich, ob die Ergebnisse auf einem Datensatz mit einer anderen Prävalenz (z.B. 8,9% wie in der Türkei [22]) reproduziert werden können. Auch die Bewertung nur bestimmter Zahntypen in einigen Studien kann die Generalisierbarkeit einschränken [21]. Wenn diese Modelle wirklich extern getestet werden, fällt die Vorhersagefähigkeit teilweise dramatisch ab [16,19].
Zukünftig werden Kollaborationen zwischen den Forschungsstandorten notwendig werden, damit sowohl die Größe der Datensätze als auch die Generalisierbarkeit erhöht werden. Nur dadurch wird es langfristig möglich sein, Modelle aus verschiedenen Regionen zu validieren und untereinander zu vergleichen sowie die Reproduzierbarkeit der Forschung zu gewährleisten.
Anwendung in der Praxis
Die aktuelle Studienlage hat die vielfältigen Anwendungsmöglichkeiten der KI in der Endodontie aufgezeigt. Allerdings ist die Evaluation von KI-Anwendungen in der klinischen Realität bisher die Ausnahme; nur eine Studie (zur Detektion von Karies mit und ohne KI-Unterstützung) testete KI in einem randomisierten Ansatz, bei dem Zahnärzte/-innen wirklich ein Softwareprodukt einsetzten [23]. Die wirkliche Wirksamkeit, aber auch der Einfluss auf den diagnostischen Workflow, die resultierenden Kosten oder die Patientenkommunikation sollten idealerweise in solchen der Realität angelehnten Studien bewertet werden.
Wer trägt die Verantwortung?
Eine weitere Hürde stellt die Erklärbarkeit der KI-Algorithmen dar, die oft als „Black Box“ bezeichnet werden, da nicht erklärt werden kann, wie eine Entscheidung durch den Algorithmus getroffen worden ist. Diese Erklärbarkeit ist jedoch in der Medizin eine fast schon zwingende Forderung, da sie insbesondere aus forensischer Sicht relevant ist. In den letzten Jahren wurden daher Anstrengungen unternommen worden, die Entscheidungswege der Algorithmen sichtbar zu machen („erklärbare KI“).
Hierdurch kann dann verstanden werden, warum bestimmte Vorhersagen gemacht oder bestimmte Bildklassifikationen vorgenommen worden sind. Da die finale Entscheidung über weitere diagnostische und Behandlungsschritte bei Behandelnden und Patienten/-innen liegen, ist eine solche Erklärbarkeit relevant.
Schlussfolgerung
Aufgrund der generierten Datenmengen zeigt die Endodontie viele Anwendungsmöglichkeiten für KI. Bei der Detektion von apikalen Läsionen ist die Entwicklung reliabler Modelle zügig vorangeschritten, sodass bereits kommerzielle Produkte erhältlich sind. In einigen Versuchsaufbauten konnte KI bereits eine höhere Genauigkeit aufweisen als Zahnärzte/-innen.
Die Detektion von besonderen Anatomien oder die Vorhersage von Behandlungsergebnissen mittels KI wurden untersucht, jedoch zeigten sich hierbei heterogene Ergebnisse. Insgesamt sind einige Hürden, wie die Verfügbarkeit größerer Datenmengen, zu überwinden, damit KI ihr mögliches Potenzial entfalten kann.