Bei Deep Learning ist es kaum nachvollziehbar, warum ein Neuronales Netz bestimmte Entscheidungen trifft. Doch welche Kriterien spielen bei der Entscheidung eine Rolle?
Deep Learning: Welche Kriterien spielen bei einer Entscheidung eine Rolle und wie lernt das Neuronale Netz?
(Bild: Dmitry - stock.adobe.com)
Der Kluge Hans, oder im Englischen Clever Hans genannt, war ein Pferd Anfang des 20. Jahrhunderts, das vermeintlich rechnen konnte und dabei das Ergebnis mit Hufklopfen wiedergab [1]. Tatsächlich hatte das Pferd jedoch gelernt, die Körpersprache seiner Aufgabensteller zu lesen, die damit die Lösung vorgaben. Der Clever-Hans-Effekt bezeichnet seitdem in der Wissenschaft die unbewusste Beeinflussung eines Verhaltens.
Deep-Learning-Lösungen können einen ähnlichen Effekt haben. Ein System, das Boote in Bildern erkennen soll, reagiert möglicherweise primär auf Wasser. Bei vielen Bildern fällt das nicht auf, da Boote in der Nähe von Wasser anzutreffen sind. Wie Wissenschaftler der TU Berlin vermuten, ist es „durchaus denkbar, dass ungefähr die Hälfte der aktuell eingesetzten KI-Systeme implizit oder explizit solche Clever-Hans-Strategien nutzen.“ [2] Wie lässt sich erkennen und vermeiden, dass man einen Clever-Hans-Predictor baut und ist es wirklich schlimm, einen solchen Effekt im System zu haben?
Entscheidungs-Kriterien eines Neuronalen Netzes
Ein großer Nachteil des Deep Learning ist, dass es kaum nachvollziehbar ist, warum ein Neuronales Netz bestimmte Entscheidungen trifft. Unter dem Stichwort Explainable AI [3] wird an Methoden geforscht, die zumindest Hinweise darauf geben, anhand welcher Kriterien ein Neuronales Netz seine Entscheidungen trifft, also die Eingabe einer Klasse zuordnet. Dabei gibt es zwei Gruppen an Verfahren: Die einen Verfahren erklären für konkrete Eingabedaten, anhand welcher Informationen eine Entscheidung getroffen wurde. Layer-wise Relevance Propagation zeigt in einer Heatmap, welche Datenbereiche für eine Entscheidung herangezogen wurden. Bei Bildern zeigt sie, ob ein Zug hauptsächlich anhand der Schienen im Bild erkannt wurde. Bei der Signalanalyse hebt sie relevante Zeitabschnitte und Kanäle hervor. Vergleichbares gibt es auch bei Neuronalen Netzen für Textanalyse. Mit sogenannten Attention-Mechanismen bewertet ein Modell abhängig vom Kontext, welche Wörter besonders wichtig sind. Auch diese Information lässt sich visualisieren.
Die andere Gruppe sind generative Verfahren, die aktuell für die Bilderkennung eingesetzt werden. Generell will man verstehen, was ein Neuronales Netz gelernt hat. Dabei wird ein Bild nach und nach so verändert, dass es möglichst gut zu einer Klasse passt. Der Deep-Dream-Algorithmus von Google gehört zu den ersten Verfahren dieser Gruppe. Google analysierte, welche Information relevant ist, dass ihr Neuronales Netz auf einem Bild eine Hantel erkennt. Das überraschende Ergebnis war, dass das Netz mit einbezieht, ob in diesem Bild ein Arm zu sehen ist, der die Hantel hält.
Es müssen genügend Trainingsdaten bereitstehen
Ein Neuronales Netz lernt ausschließlich datengetrieben. Es müssen Trainingsdaten bereitstehen, welche die komplette Bandbreite an Eingaben bestmöglich repräsentieren. Es muss zunächst der Problemraum definiert werden: Welche Szenarien müssen berücksichtigt werden und wie soll die Ausgabe des Modells sein? Die getroffenen Entscheidungen haben einen großen Einfluss auf den praktischen Nutzen im tatsächlichen Betrieb und auf die Komplexität des Modells. Es hat sich bewährt, den Problemraum am Anfang so stark wie möglich einzuschränken, sodass gerade noch ein praktischer Nutzen vorhanden ist, und den Problemraum schrittweise zu erweitern.
Bei einer komplexen Eingabe ist die Wahrscheinlichkeit höher, unbewusst Korrelationen in die Eingaben hineinzubringen. Beispielsweise indem alle Trainingsdaten einer Klasse zur selben Tageszeit aufgenommen werden. Deshalb sollten die Daten in einer Art aufgenommen werden, die dem späteren, realen Betrieb so gut wie möglich entspricht. Allerdings ist eine Clever-Hans-Strategie nicht immer problematisch. Entscheidend ist, wie der Problemraum definiert ist. Sollen nur Bilder von Schiffen und von Zügen unterschieden werden, so ist es valide, wenn Bilder von Zügen anhand der Schienen und Bilder von Schiffen anhand des Wassers erkannt werden.
Problematisch wird es nur, wenn Schiffe auch in der Nähe von Gleisanlagen erkannt werden sollen. Wie viel Einfluss eine mögliche Clever-Hans-Strategie auf die Erkennungsrate des Modells im realen Betrieb hat, zeigt die Auswertung des Testdatensatzes. Wie bei den anderen Daten sollen die Testdaten der tatsächlichen Anwendung entsprechen. Werden bei einem gut erstelltem Testdatensatz alle definierten Szenarien mit hoher Genauigkeit erkannt, ist die Genauigkeit im späteren Betrieb vermutlich ähnlich gut, auch wenn eine Clever-Hans-Strategie genutzt wird. Verursachen Fehlentscheidungen keinen großen Schaden, ist das Verhalten durchaus akzeptabel.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Deutlich anders ist das beispielsweise in der Medizin, wenn es um Menschenleben geht. Aufgrund des hohen Risikos einer Fehlentscheidung können KI-Systeme nur unter ganz bestimmten Bedingungen eingesetzt werden. Allerdings können gerade hier die Explainable-AI-Ansätze helfen, den Arzt bei einer Diagnose besser zu unterstützen, indem sie auf relevante Datenabschnitte hinweisen.
Referenzen
[1] Hans Joachim Gross: Eine vergessene Revolution. Die Geschichte vom klugen Pferd Hans. In: Biologie in unserer Zeit. Band 44, Nr. 4, 2014, S. 268–272
[2] Gemeinsame Pressemitteilung der Technischen Universität Berlin und des Fraunhofer Heinrich-Hertz-Instituts HHI vom 11. März 2019: Wie intelligent ist Künstliche Intelligenz? In: Medieninformation Nr. 40/2019: https://www.tu-berlin.de/?203846
[3] A. Holzinger. Informatik Spektrum (2018) 41:138. https://doi.org/10.1007/s00287-018-1102-5
* Dr. Matthias Weidler entwickelt Algorithmen mit Fokus auf Bildverarbeitung und maschinelles Lernen bei ASTRUM IT. Dr. Jan Paulus ist Experte für maschinelles Lernen und Mustererkennung. Beide sind AI and Machine Learning Engineer, Consultant und Trainer bei ASTRUM IT in Nürnberg.