Trends Markt

Photo by Fabio Santaniello Bruun on Unsplash

Automatische Texterzeugung: Wie KI Sportberichte verfasst

Das trifft insbesondere auf die Sportberichterstattung zu. Seit dem Start der Saison 2019/2020 erscheinen auf dem vom Deutschen Fußball-Bund e.V. (DFB) betriebenen Portal fußball.de automatisch erzeugte Vor- und Nachberichte zu den Ligaspielen im Männer-, Frauen- und älteren Jugendbereich – und zwar bundesweit bis in die untersten Spielklassen. An jedem Wochenende entstehen bis zu 75.000 Texte auf KI-Basis über Amateurfußball, die auf fußball.de veröffentlicht werden.

Grundlage der Spielberichte sind die verfügbaren offiziellen Spieldaten aus dem DFBnet, einem vernetzten IT-System für die organisatorischen Aufgaben in Sportverbänden und Vereinen. Natural Language Generation (NLG), ein auf KI basierendes Verfahren zur Texterstellung, formt aus relevanten Daten wie Spielergebnis, Torschützen und Auswechslungen einen Text in einem natürlich klingenden Deutsch. Technologisches Herzstück des Projekts sei die NLG-Plattform textengine.io von Retresco, heißt es in einer Mitteilung des 2008 in Berlin gegründeten Unternehmens, das automatisierten Content anbietet.

„Große Mengen an Primärdaten“

Gute Beispiele für den sinnvollen Einsatz von NLG-Systemen seien Bereiche, in den große Mengen an Daten anfielen, die NLG-Programme dann in Textformform umwandelten, erläutert Retresco in einem White Paper. „Die dahinterliegenden Prozesse beinhalten eine Reihe von technologischen und computerlinguistischen Raffinessen: Große Mengen an Primärdaten – sie enthalten beispielsweise Auskunft über Namen, Häufigkeiten, Produkteigenschaften, Messwerte usw. – werden zunächst der Datenbank der Software hinzugefügt“, heißt es.

Im Fußballbereich kommen Daten zu den Spielern, Teams, zur Liga sowie zu den Tabellen als Datenbasis infrage. Doch wie schafft es das System, eine natürlich klingende Sprache zu erzeugen? Hierfür benötige ein NLG-System vorab unter anderem Templates, heißt es in dem White Paper. Hinter Templates verbergen sich demnach mit Synonymen und Varianten angereicherte Formulierungen. „Lexikalisierungsalgorithmen sorgen dann dafür, dass sie für jede mögliche Datenkonstellation grammatikalisch korrekt ausgedrückt werden können und dabei vollautomatisiert Texte entstehen, die so abwechslungsreich wie möglich sind.“

Texte von Beiträgen menschlicher Redakteure nicht unterscheidbar

Im Bereich der Fußballberichterstattung entstehen den Angaben zufolge auf diese Weise computergenerierte Texte, die in der Wahrnehmung der Leser von Beiträgen menschlicher Redakteure nicht zu unterscheiden seien. Hier ein Beispiel: „Der FC Bayern München behauptet nach dem Erfolg über Wolfsburg den dritten Tabellenplatz. Die Offensive des FC Bayern in Schach zu halten ist kein Zuckerschlecken. Auch der VfL Wolfsburg war in diesem Spiel mehrmals überfordert. Bereits 46-mal schlugen die Angreifer des FCB in dieser Spielzeit zu. Mit dem Sieg knüpfte der FC Bayern an die bisherigen Saisonerfolge an. Insgesamt reklamiert der FC Bayern München zehn Siege und drei Remis für sich, während es nur vier Niederlagen setzte. Der FCB ist seit drei Spielen unbezwungen.“

Der Text enthält alle wesentlichen Informationen, wenngleich es viele Wortwiederholungen gibt. Mehrmals heißt es kurz hintereinander „FC Bayern“.
Doch wo liegen die Grenzen der KI? Zwar können mit dem NLG-System stark faktenbasierte Texte erzeugt werden. Doch die Stimmung, die Atmosphäre einer Partie, kann eine KI kaum adäquat widergeben. Von Journalisten kommt denn auch zum Teil deutliche Kritik. KI-basierten Texten mangele es an jeglicher Kreativität.     

Automatische Erstellung von Reportings

Ein zunehmend relevantes Anwendungsfeld für NLG sind laut White Paper von Retresco die automatische Erstellung von Reportings. Insbesondere im Bereich Accounting, im Finanz- oder Versicherungswesen könnten mithilfe von NLG Prozesse rund um die aufwändige Erstellung von Reportings, zum Beispiel von Tätigkeits- oder Fondsberichten, skalierbar gestaltet werden. Große Mengen an Daten könnten auf diese Weise effizient ausgewertet, Informationen interpretiert und Handlungsempfehlungen gezielt formuliert werden: Aufgaben, für die Business Analysten konventionell viel Zeit verwenden, ließen sich durch automatische Textgenerierung zeit- und kostensparend skalieren, heißt es.

In der Finanz- und Versicherungsbranche, in denen Reportings direkt zur Wertschöpfung beitragen, erlaube NLG damit die Erschließung neuer Märkte sowie die Reduzierung interner Aufwände. Für die interne Verwendung, etwa im Bereich Finance und Controlling oder im Bereich Risk Adivsory, stelle NLG mit Berichten auf Basis von Business-Intelligence-Systemen datenbasierte Entscheidungsvorlagen bereit. Dr. Sebastian Köhn, Senior Manager im Bereich Regulatory Risk beim Wirtschaftsprüfungsunternehme Deloitte, erklärt: „Die Finanzbranche in all ihren
Ausprägungen gehört zu den Paradebeispielen für die vielversprechenden Potenziale von NLG.“

„Am Ende steht ein aus Zahlen generierter Text“

Die Analyse von großen Mengen an Daten, die Interpretation von Informationen und die Formulierung von Handlungsempfehlungen gehörten zum Kerngeschäft von Banken, Fondsgesellschaften oder Versicherern, so Köhn. „Die einzelnen Schritte auf dem Weg zu Reportings und Berichten folgen dabei immer ähnlichen Mustern. Hier setzt NLG an, indem regelhafte Analyseschritte in einer Software abgebildet und von der Technologie in skalierbaren Volumina ausgeführt werden. Am Ende steht ein aus Zahlen generierter Text, den die Maschine effizienter und weniger fehleranfällig erstellt hat, als ein menschlicher Bearbeiter“, erläutert der Experte.

Die Effekte seien eindeutig. Für bestimmte wiederkehrende Reportings etwa reduziere sich der Aufwand in der Erstellung um bis zu 80 Prozent. „Wichtig dabei zu betonen: NLG erstellt Entscheidungsvorlagen, die Entscheidung selbst trifft
der Mensch“, resümiert Köhn. (ud)

Stichworte

Verwandte Artikel

Anzeige

Lexikoneinträge