Article
Die Zukunft der Texterstellung - Deloitte Network for Language Technology
Natural Language Generation: Neue Technologien ermöglichen automatische Texterzeugung auf höchstem Niveau
Perfekte Texte, die so auch von Menschen verfasst sein könnten: Digitale Systeme erstellen heutzutage aus Daten flüssig formulierte Berichte, Vorlagen und Nachrichten in bester Qualität. Natural Language Generation (NLG) ist kostengünstig, flexibel, extrem präzise und dank der transparenten regelbasierten Erzeugung revisionssicher. Eine hoch entwickelte Technologie des Deloitte Network for Language Technology mit einem breiten Spektrum von Einsatzbereichen: Attraktiv ist NLG so gut wie überall, wo es um die Erstellung komplexer Texte geht.
Computer-generierte Texte sind heute keine Seltenheit mehr. Beispielsweise in Form von automatisch erzeugten Finanznachrichten, Wetterberichten oder Sport-News. Doch solche Einsatzbereiche sind erst der Anfang. Denn Natural Language Generation Technologie auf dem neuesten Stand kann viel mehr: Nicht nur einfache, repetitive Themen mit beschränkten Variablen können verarbeitet werden. Auch komplexe Sachverhalte mit mehrdimensionalen Zusammenhängen und einem hohen Gehalt an spezifischem Hintergrundwissen werden nun auf Knopfdruck in beliebig formatierte, in sich stimmige Textform gebracht. Mit den neuen Lösungen des Deloitte Network for Language Technology werden aufwendige Workflows, zum Beispiel bei der Erzeugung von internen Berichten und Vorlagen, weitgehend automatisiert und somit stark vereinfacht. Das ist in vielen Branchen und Funktionen relevant. Und auch extern ist die Vielfalt der Anwendungen für NLG sehr breit, etwa bei der Gestaltung individualisierter Kundenkommunikation für eine zeitgemäße Customer Experience.
Deloitte Network for Language Technology: Sprache verstehen, Texte verfassen
Der automatisierte Umgang mit natürlicher Sprache beinhaltet für Unternehmen zwei grundsätzliche Aspekte: das Analysieren („Lesen“) unstrukturierter Texte und die Extraktion strukturierter Daten einerseits, das Erzeugen von hochwertigen Texten („Schreiben“) auf der Grundlage von Daten andererseits. Zwei Seiten derselben Medaille, für die das Deloitte Network for Language Technology jeweils Lösungen anbietet. Die zugrundeliegenden Methodiken sind allerdings völlig verschieden. Beim automatisierten Textverstehen (Natural Language Processing, NLP) kommen Techniken des Maschinenlernens zum Einsatz. Unstrukturierter Text-Input wird verarbeitet, wobei ein Hauptschwerpunkt der kognitiven Kapazität in der Erkennung und Reduktion von Sprachvariationen liegt. Dabei werden Mustererkennung und Wahrscheinlichkeitsalgorithmen eingesetzt. Automatisiertes Textverstehen wird zum Beispiel bei Textmining genutzt. Deloitte bietet in diesem Zusammenhang Lösungen wie den DocQMiner, ein leistungsfähiges Mining-Tool.
Bei der Erzeugung von Texten (Natural Language Generation, NLG), die in diesem Artikel im Vordergrund steht, liegen dagegen strukturierte Informationen als Ausgangsmaterial vor, etwa in Form von Datenbanken oder Spread Sheets. Diese werden analysiert und dann gemäß eines eindeutigen Regelwerks zunächst in logischen Repräsentationen dargestellt. Aus diesen semantischen Inhalten werden dann im nächsten Schritt grammatisch korrekte Sätze und Texte erstellt. Die kognitive Kapazität dieser Form von Künstlicher Intelligenz ist also darauf ausgerichtet, die Variabilität natürlicher Sprache zu imitieren – und somit „natürlich“ wirkende Schriftstücke zu erzeugen, denen man nicht anmerkt, dass sie kein Mensch verfasst hat. Auch hier hat das Deloitte Network for Language Technology marktführende Lösungen entwickelt.
Effizienter Workflow bei voller Kontrolle
Was sind nun die konkreten Vorteile der NLG Technologie in der Praxis, und wie sieht der Workflow aus? Ein erfolgreich umgesetzter, innovativer Use Case des Deloitte Network for Language Technology betrifft Marktfolgefunktionen in der Finanzbranche. Bei diesem Beispiel kann der Einsatz von automatisch erstellten Texten die Produktion von Reports und Entscheidungsvorlagen in Rahmen des Kreditgeschäfts wesentlich verbessern. Die Vorbereitung der Kreditentscheidung wird zu weiten Teilen automatisiert. Aber natürlich nicht der komplette Prozess: Die Entscheidung als solche trifft immer noch der Mensch. Nur hat der zuständige Sachbearbeiter durch die NLG Technologie erhebliche eigene Kapazitäten eingespart, die er nun verstärkt auf die eigentliche Risikotreiberanalyse des Kreditgeschäfts und die damit verbundene Kreditentscheidung verwenden kann. Im Workflow werden viele bislang manuell erbrachte Tätigkeiten jetzt digital ausgeführt: Im ersten Schritt werden Daten gesammelt und passend für die Weiterverarbeitung strukturiert aufbereitet. Dabei können zum Beispiel Methoden wie Robotic Process Automation (RPA) zum Einsatz kommen. Im nächsten Schritt leitet die NLG Technologie aus den strukturierten Daten im Rückgriff auf die angelegte Ontologie inhaltlicher Zusammenhänge des Sachgebiets die wesentlichen Informationen des Themenkomplexes ab. Die abgebildeten Fakten werden eingeordnet und bewertet. So entsteht eine Handlungsempfehlung, die dann wiederum in sinnhafte sprachliche Einheiten verwandelt und in Form eines ausformulierten Textes als Entscheidungsvorlage für den Mitarbeiter ausgegeben wird.
Die Vorteile dieses Vorgehens sind umfangreich. Gegenüber einer manuellen Abarbeitung lässt sich je nach Use Case mit NLG eine Kostenersparnis von 25 bis 50% erzielen, wie sich in der Praxis des Deloitte Network for Language Technology ergeben hat. Die Durchlaufzeit reduziert sich um 60 bis 70%. Die Qualität ist über jeden Zweifel erhaben, die Aufgaben werden mit höchster Genauigkeit erledigt. Und das skalierbar und sehr flexibel – sieben Tage die Woche, rund um die Uhr. Risiken durch menschliche Fehler entfallen, Mitarbeiter können ihre Kapazitäten anderweitig einsetzen. Besonders hervorzuheben ist außerdem der Compliance-Vorteil von NLG: Da die Vorgänge zum Beispiel bei der Berichterstellung vollständig regelbasiert ablaufen und komplett protokolliert sind, lässt sich eine hundertprozentige regulatorische Zuverlässigkeit erreichen. Außerdem ist durch das hohe Verarbeitungstempo in kritischen Situationen beispielsweise ein regulatorisch geforderter Report sehr schnell und kostengünstig zu erstellen.
Die vielfältigen Einsatzgebiete von Natural Language Generation
Die Erarbeitung von Kreditentscheidungsvorlagen in der Finanzindustrie ist ein attraktiver Anwendungsfall für NLG – aber nur einer unter vielen. Vom Deloitte Network for Language Technology schon erprobte oder in Entwicklung befindliche Use Cases für die automatische Erzeugung natürlicher Sprache gibt es in etlichen Branchen. Während bei „firmeninternen“ Anwendungen dabei u.a. der regulatorische Sicherheitseffekt besonders zum Tragen kommt, ist es bei externen die hohe Granularität der Personalisierung. In allen Fällen bietet NLG signifikante Kostenvorteile.
Um einige Beispiele auszuführen: Im Management Reporting und regulatorischen Berichtswesen erstellt das NLG-Angebot des Deloitte Network for Language Technology aus Rohdaten entscheidungsrelevante Informationen und Vorlagen. Die Ausgabe kann dabei ad hoc im jeweils gewünschten Format erfolgen, ob in Schriftform oder als gesprochener Text. So könnte ein Vorstandsmitglied im Bedarfsfall einen Bericht etwa komplett im formellen Quartalsberichtsformat abrufen – oder mithilfe eines zusätzlichen digitalen Sprachassistenten eine interaktive „Konversation mit dem Bericht“ führen und die passenden Antworten auf seine Fragen erhalten, ganz so wie in einem Dialog mit einem Mitarbeiter.
Auch in den Sektoren Health Care und Life Sciences gibt es eine Vielzahl von Anwendungsgebieten. Hier müssen schließlich besonders viele detailgenaue und regulatorisch sensible Texte erstellt werden. Die Erzeugung von einwandfreien Arznei- und Medizinproduktbeschreibungen, ob für Mitarbeiter oder für Kunden, kann durch NLG sehr effizient automatisiert werden. Auch im Kundenmanagament sind die Optionen der NLG Technologie wertvoll. Hier ist beispielsweise bislang eine persönliche Ansprache einer sehr großen Menge von Kunden mithilfe von individuell erstellten Texten aus Kosten- und Praktikabilitätsgründen kaum machbar. Mit NLG können dagegen etwa massenhaft persönlich zugeschnittene Glückwunschkarten geschrieben werden, die viel mehr enthalten als nur den Namen und das Datum. Hier können beispielsweise Daten über individuelle Vorlieben oder Erfahrungen aus der Vergangenheit verarbeitet und als persönliche Note in den Text mit einfließen. Weitere spannende Einsatzbereiche sind aus der Sicht des Deloitte Network for Language Technology auch Digital Learning (Bereitstellung individualisierter Schulungsmaterialien) und LegalTech (automatisiertes Verfassen von Mandanten- und Vertragskorrespondenz).
Generell können die konkreten Anwendungsfälle von Natural Language Generation in drei Ebenen eingeteilt werden, entsprechend dem Komplexitätsgrad der zugrundeliegenden Abläufe:
- Descriptive Analytics bedeutet, dass strukturierte Daten sprachlich wiedergegeben werden.
- Anspruchsvoller ist der Level Explorative Analytics, der demgegenüber ein Erkennen von Zusammenhängen in den Daten und deren logische Verarbeitung beinhaltet.
- Die avancierteste Stufe stellt schließlich Predictive Analytics dar: Intelligente Algorithmen erkennen Trends und verbalisieren sie durch die NLG Technologie.
Wie es funktioniert: Weltwissen, Logik, Grammatik
Bei der Erarbeitung von NLG-Lösungen kooperiert das Deloitte Network for Language Technology exklusiv mit marktführenden deutschen Softwarefirmen, die komplexe deutschsprachige Text Engines entwickeln. Bei Text Engines handelt es sich um grammatische Regelwerke (Linguistische Körper) zur Texterzeugung, die zum Beispiel per API-Schnittstelle anzusteuern sind. Doch diese linguistischen „Maschinen“ genügen noch nicht zur Erzeugung von konkret nutzbaren sprachlichen Inhalten. Zusätzlich ist auch ein zweites Element notwendig: das entsprechend aufbereitete, relevante fachliche Vokabular. Dazu gehört auch – und das ist noch anspruchsvoller – ein „Wissen“ über die inhaltlichen Zusammenhänge und Logiken des jeweiligen Fachgebiets. Das spezifische „Wörterbuch“ und ein komplexes Modell des relevanten Weltwissens, d.h. die jeweilige Ontologie, sind dabei nun der Beitrag der Experten des Deloitte Network for Language Technology. Die Ontologie wird spezifisch für den Kunden und seinen Einsatzbereich entwickelt. Erst dadurch ist es möglich, die zugrundeliegenden vorstrukturierten Daten als in sich stimmigen semantischen Gehalt zu strukturieren. Dieser wird dann in die grammatischen Regelwerke eingespeist, die daraus syntaktisch korrekte Sätze und Texte erzeugen.
Das Service Offering von Deloitte besteht also in einer individualisierten Erstellung von Text Engines für Unternehmen auf Basis einer spezifisch zugeschnittenen Ontologie. Entscheidend für den Erfolg des Ansatzes ist dabei die besondere Branchenexpertise zur Anpassung der Text Engines. Bei der Erstellung der Ontologie werden zunächst vorliegende Texte und Berichte des betreffenden Bereichs und des erwünschten Formats ausgewertet: Welche Aussagen werden darin gemacht, welche impliziten Fragen beantwortet? In einem Data Dictionary werden dann sämtliche Datenpunkte zusammengestellt, die nötig sind, um genau diese Fragen zu beantworten. Für die Erfassung der inneren Zusammenhänge des Sachgebiets führen Mitarbeiter des Deloitte Network for Language Technology Interviews mit relevanten Experten. Mit den Erkenntnissen aus diesen Recherchen können die Verknüpfungslogiken des Themenfelds eins zu eins abgebildet werden, was sich in der Software sehr gut visualisieren lässt. Wichtig zur Abgrenzung ist an dieser Stelle der Verweis auf den oben schon angesprochenen Umstand, dass es sich bei NLG zwar um eine Form der Künstlichen Intelligenz, aber eben nicht um ein neuronales Netz oder eine andere Variante des maschinellen Selbstlernens handelt. Die Prozesse verlaufen bei NLG komplett regelbasiert – was zum Beispiel für die Compliance-Frage von entscheidender Bedeutung ist.
Bot or Not? Empirisch basierte Qualitätskontrolle für „Roboter-Texte“
Textqualität – bis vor einiger Zeit die größte Herausforderung automatisierter Erzeugung natürlicher Sprache. Definiert wird Qualität hier anhand der Frage, ob sich der Output wirklich wie von Menschenhand geschrieben liest, oder ob man ihm doch den „maschinellen“ Autor anmerkt. „Bot or not“ – diese Frage stellt sich heute dank fortgeschrittener Text Engines aber nicht länger. Dazu trägt auch eine strenge, kognitionswissenschaftlich basierte Qualitätskontrolle bei, die das Deloitte Network for Language Technology in Zusammenarbeit mit dem Deloitte Neuroscience Institute durchführt – in der Entwicklung und potenziell auch in der Anwendung. Mit empirischen Testmethoden lässt sich anhand der neurophysiologischen Reaktion der Versuchsperson nachweisen, ob, wo genau und wie stark ein durch NLG erzeugter Text vom Rezipienten abgelehnt wird. Ein Eyetracker misst etwa, welche Informationen die Nutzer tatsächlich lesen oder welche Signalwörter besonders gut funktionieren. Ein EEG wiederum dokumentiert die emotionale Reaktion auf bestimmte Partien des Textes.
Eine Prämisse dieses Ansatzes ist die große Bedeutung unserer unbewussten Reaktionen und Bedürfnisse, die bis zu 95% unserer Entscheidungen prägen, aber kaum je explizit zu Bewusstsein gebracht oder gar sprachlich formuliert werden. Somit bietet dieses Verfahren erhebliche Vorteile gegenüber einer direkten Konsumentenbefragung in der Marktforschung. Um die Reaktionen richtig interpretieren zu können, werden sie in dem von Deloitte entwickelten NeedSphere-Verfahren (LINK zum Artikel Neurobranding, sobald dieser veröffentlicht ist) durch Assoziationstests mit dem individuellen Bedürfnisprofil der Versuchsperson abgeglichen. So lassen sich die impliziten Bedürfnisse und Ängste gegenüber NLG erkennen und durch qualitative Änderungen am Text aktiv ausräumen. Eine objektive Validierungsmethode, die für die Arbeit des Deloitte Network for Language Technology sehr hilfreich ist
Herausforderungen und Lösungen: Natural Language Generation mit dem Deloitte Network for Language Technology
Trotz höchster Textqualität bestehen typische Herausforderungen bei der praktischen Umsetzung von NLG, die im Einzelfall geklärt werden müssen. Zwei Aspekte sind dabei in der Erfahrung der Fachleute vom Deloitte Network for Language Technology auf der Seite des Kunden besonders wichtig. Erstens muss die Datenqualität im Unternehmen sichergestellt werden. Sind die Daten überhaupt ausreichend verfügbar, sind sie intakt und liegen sie im richtigen Format vor? Bei der Behebung von Problemen dieser Art können Technologien wie Textmining helfen. Zweitens ist die Nutzerakzeptanz bei der praktischen Implementierung unbedingt sicherzustellen, damit der Einsatz von NLG den erwünschten Erfolg haben kann. Manche Mitarbeiter haben Bedenken gegenüber der neuen Technik oder sorgen sich aufgrund der Automatisierung um ihren Arbeitsplatz. Themen, die es im Rahmen eines zielführenden Change Managements ernst zu nehmen gilt. Deloitte unterstützt in beiden Bereichen mit der technischen und organisatorischen Expertise eines führenden globalen Netzwerks.
Insgesamt sucht das Angebot des Deloitte Network for Language Technology zur automatisierten Texterstellung auf dem Markt derzeit seinesgleichen. Die exklusiven Technologie-Kooperationen mit den führenden deutschen Entwicklungshäusern Retresco und AX Semantics garantieren ein höchstmögliches Qualitätsniveau der eingesetzten Software. Und das fundierte, breite Branchenwissen der Experten von Deloitte gewährleistet eine präzise fachgerechte Umsetzung, maßgeschneidert für die speziellen Belange eines jeden Unternehmens.