Trends Grundlagen News

iStock.com/Natali_Mis

Forschung: Wie mit Data Science erfolgreiche KI entsteht

Ein aktuelles Whitepaper der Plattform Lernende Systeme zeigt die Bedeutung des interdisziplinären Forschungszweigs Data Science als Schlüsseldisziplin für Wissenschaft sowie Wirtschaft und benennt Handlungsoptionen. Die Experten regen demnach an, Kenntnisse des Datenmanagements auch in informatikfernen Studiengängen und in der Schule zu vermitteln und empfehlen eine unabhängige Dateninfrastruktur, teilte die Plattform Lernende Systeme mit.

Insbesondere das Erschließen der Daten und die Sicherstellung der Datenqualität sei häufig ein aufwändiger Prozess, heißt es im Whitepaper. So werde für KI-Projekte der Aufwand für die Datenerfassung und –aufbereitung auf bis zu 80 Prozent geschätzt. Die Ergebnisse und Empfehlungen von KI-Systemen könnten nur so gut sein wie die ihnen zugrundeliegenden Daten. Fehlerhafte Werte müssten zum Beispiel erkannt und entfernt, Daten annotiert und – um sie nachvollziehbar zu machen – durch Metadaten beschrieben werden. Neben Aspekten wie Vollständigkeit oder Widerspruchsfreiheit sollte auch bereits bei der Datenauswahl auf mögliche Verzerrungen geachtet werden, um etwa Diskriminierung zu vermeiden.

Umfassendes Datenmanagement notwendig

 „Wenn Daten der Rohstoff des digitalen Zeitalters sind, dann ist Data Science das Werkzeug, mit dem sich dieser Schatz heben lässt “, betonte Co-Autor Daniel Keim, Professor für Datenanalyse und Visualisierung der Universität Konstanz. „Große Datenmengen allein reichen nicht aus, um KI-Anwendungen zu entwickeln. Zuvor müssen die Daten für das Training von lernenden Algorithmen erst vorbereitet, ihre Validität geprüft und die Daten zugänglich gemacht werden. Dafür brauchen wir ein umfassendes Datenmanagement inklusive fortgeschrittener Möglichkeiten zur Visualisierung der Daten. Das wird in der Diskussion um Künstliche Intelligenz leider oft zu wenig beachtet“, so Keim.

Der Beruf des Data Scientists gelte als einer der wichtigsten Berufe, heißt es in dem Whitepaper. Zudem würden Data Science-Kompetenzen heute schon in vielen anderen Berufsbildern gefordert. So empfehlen die Autoren, der Data Science in Informatikstudiengängen mehr Raum zu geben. Um das Verständnis von Data Science-Prozessen und -Technologien zu fördern, sollten aber auch andere Studiengänge und Schulen Data Literacy-Kompetenzen vermitteln. Über die Forschung hinaus sei dies die Grundlage, um Talente auszubilden, die schließlich KI-Wissen in die Unternehmen tragen und dort den Transfer in die Anwendung unterstützen könnten, so die Autoren. 

Neben der Aus- und Weiterbildung ist nach Ansicht der Autoren eine unabhängige Infrastruktur mit ausreichend Speicher- bzw. Rechenkapazität notwendig, um das Potenzial der Daten für Wirtschaft und Gesellschaft abschöpfen
zu können. Man dürfe sich nicht zu einer unreflektierten Übernahme von scheinbar erfolgreichen Modellen der Internet-Konzerne verführen lassen. Um die Prozesse des Datenmanagements eigenständig gestalten zu können, sei ein Ausbau von europäischen Datenräumen und -infrastrukturen notwendig, raten die Autoren. (ud)
 

Verwandte Artikel

Anzeige

Lexikoneinträge