Nur mit Data Science ist eine erfolgreiche KI möglich

Redakteur: Dipl.-Ing. (FH) Hendrik Härter

Voraussetzung für eine erfolgreiche Künstliche Intelligenz (KI) ist ein umfassendes Datenmanagement. Die Kompetenzen begrenzen sich nicht auf das reine Engineering. Ethik und Recht bleiben nicht außen vor.

Anbieter zum Thema

Kai-Uwe Sattler, Professor für Datenbanken und Informationssysteme an der Technischen Universität Ilmenau und Mitglied der Plattform Lernende Systeme.
Kai-Uwe Sattler, Professor für Datenbanken und Informationssysteme an der Technischen Universität Ilmenau und Mitglied der Plattform Lernende Systeme.
(Bild: Michael Reichel / arifoto.de)

Egal, ob ein medizinisches Assistenzsystem oder eine Software für die vorausschauende Wartung von Industrieanlagen: Sie alle nutzen Daten, die auf Methoden der Künstlichen Intelligenz (KI) ausgewertet werden. Dazu ist ein umfassendes Datenmanagement erforderlich.

Kurz: Es kommt auf die richtigen Daten an und das damit zusammenhängende Datenmanagement. Wichtig ist aber auch, welche Kompetenzen Data-Science-Fachleute mitbringen müssen. Antworten gibt Kai-Uwe Sattler, Professor für Datenbanken und Informationssysteme an der TU Ilmenau. Außerdem ist er Mitglied der Arbeitsgruppe „Technologische Wegbereiter und Data Science“.

Herr Sattler, große Mengen an Daten plus intelligente Algorithmen ergeben nutzbringende KI-Anwendungen. Was ist falsch an dieser Rechnung?

Große Datenmengen allein genügen leider nicht. Zwar werden gerade für das Lernen mit tiefen Netzen große Trainingsdaten benötigt, aber dies erhöht natürlich auch den Aufwand der Datenerfassung, -vorbereitung und des Trainings. Daher kommt es darauf an, die richtigen Daten als Trainingsdaten zur Verfügung zu haben. So sollten die Trainingsdaten – beispielsweise für die Bilderkennung – die zu identifizierenden Objekte enthalten.

Aber eben auch Negativbeispiele in allen möglichen bzw. auftretenden Variationen. Hierbei sind Bias (Voreingenommenheit) und Diskriminierung schon bei der Datenauswahl zu vermeiden. In der Literatur ist eine ganze Reihe von Beispielen für Bias und Diskriminierung beschrieben, die zeigen, welche Auswirkungen dies haben kann.

Wie werden aus Daten brauchbare Daten? Worauf kommt es beim Data Engineering an?

Zunächst müssen überhaupt geeignete Daten erfasst werden, die das zu bearbeitende Problem repräsentieren. So sollten für eine Anwendung des Predictive Maintenance eben auch Fehlerzustände, und nicht nur normale Betriebsdaten erfasst werden. Sind Daten erfasst, müssen sie aufbereitet werden. Das umfasst die Bereinigung wie das Erkennen und Entfernen fehlerhafter Werte, die Verknüpfung mit anderen Daten und die Annotation der Daten.

Sowohl die Daten als auch die Erfassungs- und Verarbeitungsprozesse sollten dokumentiert und durch Metadaten beschrieben werden, um eine Nachvollziehbarkeit zu gewährleisten. Der Aufwand dieser Vorbereitung kann in KI-Projekten bis zu 80% des Gesamtaufwands betragen. Data Engineering stellt die Methoden und Infrastrukturen für diese Prozesse zur Verfügung und umfasst Datenmanagement, Datenintegration und Datenaufbereitung – beispielsweise durch Datenbanksysteme, Big Data-Systeme oder Data-Cleaning-Werkzeuge.

Welche Fähigkeiten benötigen Entwicklerinnen und Entwickler, um vertrauenswürdige KI-Anwendungen zu schaffen?

Neben Methodenkenntnissen aus dem Bereich des maschinellen Lernens bzw. der Künstlichen Intelligenz sind dies insbesondere Kenntnisse zur Datenmodellierung, -transformation und -integration, aber auch Kenntnisse der Statistik, um Eigenschaften der Daten und die Qualität der Ergebnisse bewerten zu können.

Ferner sind Kenntnisse aus Ethik und Recht hilfreich, um verantwortungsvoll mit den Daten umgehen zu können. Und es ist ein umfassendes Anwendungswissen unabdingbar. Das zeigt, dass es sich nicht mehr allein um klassische Softwareentwicklung handelt. Vielmehr sind es Anforderungen, die einen interdisziplinären Zugang erfordern: Anwendungsexperten benötigen zunehmend sogenannte Data-Literacy-Expertise und Data-Science-Fachleute müssen die Anwendungsdomänen verstehen.

Hier wird sich ein großer Bedarf an Weiterbildungsangeboten entwickeln.

Buchtipp

Das Fachbuch „Cybersicherheit" führt grundlegend und praxisnah an die aktuellen Herausforderungen der IT-Security heran. Dabei werden bewusst neue digitale Entwicklungen, wie IoT-Anwendungen und die Vernetzung industrieller Maschinen und Anlagen durch Industrie-4.0-Technologien, adressiert.

Mehr erfahren bei Vogel Fachbuch

Whitepaper: Von Daten zur KI – Intelligentes Datenmanagement als Basis für Data Science und den Einsatz Lernender Systeme.

(ID:46990418)