27.07.2020 – Kategorie: Marketing
Textroboter im E-Commerce: Von strukturierten Daten zum anspruchsvollen Verkaufstext
Sie schreiben schnell, in mehreren Sprachen und das in hoher Qualität: Textroboter erleichtern Onlineshop-Betreibern das Leben – vor allem bei der Content-Erstellung. SaaS-Lösungen unterstützen dabei, automatisiert generierte Texte für Inhalte in gleichbleibend hoher Qualität zu nutzen.
Die Verfügbarkeit von Daten ist ein entscheidender Treiber der Digitalisierung. Informationen sind für Algorithmen die Grundlage, um sich stetig zu verbessern und neues zu lernen. Ähnlich wie beim Vokabellernen des menschlichen Gehirns verhelfen große Mengen an Daten einem „selbstlernenden“ System zu immer mehr Präzision und Wertschöpfung. Auch im Bereich Text- und Content-Erstellung erhält der Mensch durch intelligente Tools wie Textroboter mehr Spielraum und Möglichkeiten.
Onlineshops können ihre Produktbeschreibungen heute schon automatisiert generieren und damit Zeit und Kosten einsparen. Der Softwareanbieter AX Semantics hat einen Textroboter auf Basis moderner NLG-Technologie programmiert, der individuelle Texte in 110 Sprachen generieren kann. Mit strukturierten Daten, menschlicher Kreativität und Textkompetenz lassen sich Produktbeschreibungen für Onlineshops in wenigen Schritten mit der Software automatisiert erstellen.
Schritt 1: Daten für Textroboter bereitstellen und strukturieren
Beinlänge, Farbe und Passform – diese und viele weitere Informationen sind Kunden von Mode-Onlineshops wichtig und gehören in eine gute Produktbeschreibung. Damit die Software von AX Semantics Texte generiert, die angebotene Produkte detailliert und präzise beschreiben, braucht es Daten in strukturierter Form. Diese können beispielsweise direkt aus dem Produktinformationsmanagement-System (PIM) per API-Schnittstelle in den Textroboter einfließen. Ebenso ist es möglich Datensätze einfach in Form von Excel-Tabellen oder als CSV-Datei im Tool hochzuladen. Je reichhaltiger die Datengrundlage ist, desto ausführlicher und umfassender kann das Textkonzept im Nachgang angelegt werden. Die Qualität der Daten bildet eine essenzielle Grundlage für eine entsprechend hohe Textqualität.
Schritt 2: Satzkonstruktionen mit Textroboter erstellen
Sind die Daten strukturiert, formuliert der User in der AX NLG Cloud Beispielsätze zu verschiedenen Produkteigenschaften und Textabschnitten an, und fasst sie in Statements zusammen. So können beispielsweise vier verschiedene Einleitungssätze entstehen, die alle unter dem Statement „Einleitung“ zusammengefasst werden. Die Verknüpfung über das Statement sorgt im Tool dafür, dass in der finalen Produktbeschreibung nicht alle vier, sondern nur einer der Einleitungssätze ausgespielt wird. Die Maschine hat also gelernt, eine Aussage zu treffen und sie auf verschiedene Arten zu formulieren. Das Beispiel lässt sich natürlich auf alle weiteren Sätze übertragen und es entsteht ein Text ohne Doppelungen.
Muss ein bestimmter Satz unter sehr unterschiedlichen Bedingungen funktionieren, besteht die Möglichkeit, durch sogenannte „Branches“ einzelne Satzteile zu steuern. Diese Verzweigungen umklammern den Teil des Satzes, der randomisiert oder nur unter bestimmten Umständen verändert ausgespielt werden soll. So wird aus dem Satz „Die Hose verfügt durch drei praktische Taschen über ausreichend Stauraum“ unter der Voraussetzung, dass die Hose mit fünf Taschen ausgestattet ist: „Die Hose verfügt dank 5-Pocket-Style über großzügigen Stauraum.“ Dieses Prinzip der regelgeleiteten Zuordnung lässt jeden Satz mit den entsprechenden Datenpunkten verschmelzen und kann theoretisch wie praktisch auf alle Satzteile angewandt werden. Synonyme sorgen dafür, dass kein Satz dem anderen gleicht. Mehr dazu unter Schritt 4.
Mehr Informationen mit Bulletpoints bereitstellen
Eine beliebte Möglichkeit, innerhalb von Produkttexten mehr Informationen bereitzustellen, sind Bulletpoints – ganz gleich, ob dort das Material genauer beschrieben oder die generellen Eigenschaften des Produkts noch einmal auf den Punkt gebracht werden sollen. Auch diese Option lässt sich durch die Software einbauen. In einem neuen Statement im „Write-Mode“ werden wie gewohnt Container gesetzt, die über Variablen mit Informationen aus dem Datensatz gefüllt werden. Die Container bekommen dann die Anweisung, eine Bullet-Liste aus den Eingangsdaten zu erstellen. Die Datenpunkte können dabei randomisiert oder immer in derselben Reihenfolge ausgespielt werden.
Im „Narrate-Modus“ lassen sich die unterschiedlichen Satzgerüste in die passende Reihenfolge bringen. In dieser Ansicht bringt man dem Tool bei, welche Statements zu einer Story gehören, und in welcher Reihenfolge sie erzählt werden sollen. Besonders praktisch ist hierbei, dass ein einzelnes Statement in verschiedenen Stories verwendet werden kann. Wann welche Story ausgespielt wird, kann ebenfalls im Narrate-Modus bestimmt werden, diesmal mithilfe von Triggern, welche als Teil des dritten Schritts im Set-up angelegt werden.
Schritt 3: Setup mit strukturierten Daten anlegen
Im dritten Schritt geht es darum, Verknüpfungen zwischen den Daten und den bereits erstellten Satzkonstruktionen herzustellen. Dies geschieht im Transform-Modus des Composers der AX NLG Cloud. Damit das Setup angelegt werden kann, benötigt man strukturierte Daten, die nach Möglichkeit schon dem aktuellen PIM-Aufbau entsprechen. Es muss sich nicht um einen kompletten Datensatz mit allen Produkten handeln, zwei oder drei Produkte derselben Kategorie können völlig ausreichend sein und einen Überblick über die Verknüpfungsmöglichkeiten bieten.
Sind die Daten in der Cloud – dies geschieht über den Bereich „Data Sources“ – können einzelne Produkte als Testobjekte ausgewählt werden. Im „Analyze-Modus“ werden die Datenfelder angezeigt, die aus den Daten hervorgehen. Hier lässt sich auch überprüfen, ob es zu Fehlern im PIM gekommen ist. Wählt man eine Variable aus, werden alle Werte angezeigt, die für diese Variable ausgewählt wurden. Fehlende Buchstaben oder Groß- und Kleinschreibung können so aufgedeckt und ausgebessert werden.
Wurden die Daten vollständig und korrekt eingetragen, kann über eine Funktion namens „Add Data Node“ ein Datenpunkt mit einem Klick importiert werden. Im Transform-Modus taucht er als Knotenpunkt auf, der weiterverarbeitet und analysiert werden kann. Dort geht es anschließend darum, Verknüpfungen zwischen einzelnen Knotenpunkten herzustellen und beispielsweise „Wenn-Dann-Beziehungen“ abzuleiten.
Jede einzelne „Data-Node“ wird im Transform-Mode grafisch als kleiner Kasten angezeigt. Über Strings kann er mit jedem anderen Node verbunden werden – so entstehen schnell komplexe Datenpfade. Im Normalfall hat der Data-Node von Anfang an eine Phrase-Node und ein Trigger. In der Phrase-Node bringt man der Plattform bei, wie sie über den Inhalt des Data Nodes sprechen soll. Da sie Nomen, Adjektiv und noch einige andere grammatische Eigenschaften verwerten kann, lassen sich hier aus mehreren verschiedenen Data-Nodes komplexe grammatische Gebilde mit großem Funktionsumfang bilden.
Container unterstützen Textroboter bei der Texterstellung
Damit die Informationen aus den Daten auch im Text verwendet werden können, muss an die Phrase-Node immer eine Variable angefügt werden. Diese kann durch die Verwendung von Containern in den Text eingebaut werden, sodass beispielsweise der Produktname automatisiert angepasst wird, wenn ein anderes Produkt beschrieben wird. Aus „Die Hose verfügt durch drei praktische Taschen über ausreichend Stauraum“ wird „Der Overall verfügt durch drei praktische Taschen über ausreichend Stauraum“. Hat das neue Produkt nicht nur einen anderen Namen, sondern auch andere Eigenschaften, können auch diese Informationen im Transform-Mode verknüpft und so automatisiert angepasst werden: „Der Overall verfügt durch zwei praktische Taschen über ausreichend Stauraum“.
Weitere Funktionen im Transform-Modus dienen dazu, komplexe Satzkonstruktionen zu schaffen und somit möglichst lebendige Texte zu verfassen. Besonders gut funktionieren Texte, die nicht nur die Produktdaten nacherzählen, sondern dem Kunden erklären, was dieses Produkt ihm in seinem Alltag nützt. So können Konditionen eingebaut werden, die dafür sorgen, dass zusätzliche Sätze oder Variablen nur dann ausgespielt werden, wenn ein festgelegtes Kriterium erfüllt wird.
Dadurch kann man umso genauer auf die Eigenschaften des Produktes eingehen: „Der Overall verfügt durch vier praktische Taschen über ausreichend Stauraum. Geldbeutel, Schlüssel, Sonnenbrille und Co verstauen Sie hier im Handumdrehen.“ Eine andere Funktion, die für passgenaue Sätze sorgt, ist die „Lookup Table“ mit deren Hilfe Begriffe aus den Datensätzen umgeformt werden können, sodass der Texte variabler gestaltet werden können. So wird zum Beispiel aus dem Blumenmuster aus dem Datensatz für bestimmte Statements das Adjektiv geblümt“ – aus der sperrigen ISO Norm EN 343 wird wetterbeständig.
Schritt 4: Iterationen und Varianz mit Textroboter erzeugen
Wenn das grundlegende Setup für den Textroboter steht, können bereits erste Entwürfe vollständiger Produktbeschreibungen ausgespielt werden. Oftmals fallen in diesem Schritt, der in der AX NLG Cloud im sogenannten Review-Modus stattfindet, kleinere (und größere) Fehler auf, die sich durch einen Blick in die Daten oder den “Transform-Modus” schnell beheben lassen. Doch fehlerfreie Sätze sind nicht gleich gute Produktbeschreibungen. Um den Textfluss zu verbessern, sind oftmals verschiedene Iterationsstufen notwendig.
1. Iteration: kleine Fehler und Unstimmigkeiten anpassen
Die ersten Texte, die ausgespielt werden sind in der Regel gespickt von kleinen Fehlern aus verschiedensten Quellen. Es heißt also: Geduldig bleiben und Detektiv spielen. Zunächst kann es helfen, im Write-Modus das Statement auf Tippfehler oder Grammatikfehler zu überprüfen. Diese lassen sich innerhalb von wenigen Klicks ausbügeln. Liegt der Fehler nicht im Statement, sondern in den Daten im Container, schaut man sich im“Transform-Modus die Variable an, die diesen Container bedient. Oftmals sind es falsche Verbindungen oder fehlende Befehle in den “Wenn-Dann-Beziehungen” die dafür sorgen, dass im finalen Text nicht das ausgespielt wird, was eigentlich angedacht ist.
2. Iteration: Wiederholungen meiden und Textfluss herstellen
In den meisten Fällen bestehen die Statements in der ersten Version noch aus einfachen Subjekt-Prädikat-Objekt Sätzen mit ein paar einsamen Adjektiven hier und da. Alle Informationen über das Produkt sind vorhanden, die Grammatik stimmt, aber ein angenehmes Leseerlebnis sieht anders aus. Um mehr Varianz innerhalb der einzelnen Produktbeschreibungen zu erzeugen, geht man Statement für Statement im Write-Modus durch und schreibt sich viel verwendete Satzanfänge und Adjektive auf. Auch die Position des Produktnamens oder der Produktkategorie im Satz wiederholt sich oft, sodass die Texte redundant wirken, obwohl im Backend viel Varianz herrscht.
Mithilfe dieser Liste mit häufig verwendeten Begriffen kann anschließend herausgestellt werden, an welcher Stelle im Text Redundanzen auftauchen und wo sie vermieden werden können. Sowohl im “Write-Modus” als auch im “Transform-Modus” können mithilfe von Branches Synonyme an den Stellen eingefügt werden, sodass für ausreichend Varianz im finalen Text gesorgt ist.
3. Iteration: Feinschliff
Der Text ist fehlerfrei und die Varianz ist gegeben. Nun heißt es, mit einem kritischen Auge die einzelnen Produkttexte ein weiteres Mal durchzugehen. So fallen letzte kleinere Fehler auf, die bei den vorherigen Iterationen durchgegangen sind. Am besten geschieht dies wieder im Review-Modus, denn dort werden die Texte so ausgespielt wie auch später im Onlineshop. Fällt bei der letzten Iteration nichts mehr auf, sind die Texte reif für den Shop.
Jedes neue Produkt in einem Onlineshop birgt nicht nur Potenzial für mehr Textvarianz, sondern leider auch für neue Fehler und Probleme innerhalb der Texte. Daher ist es ratsam, die Texte in regelmäßigen Abständen zu überprüfen und gegebenenfalls anzupassen um die Qualität zu garantieren.
Schritt 5: Kanalspezifische Texte in mehreren Sprachen
Prinzipiell können zudem – eine entsprechende Datenqualität vorausgesetzt – nicht nur der Shop, sondern auch Marktplätze, Newsletter, Printprodukte oder sonstige Marketingkanäle mit hochwertigen, individuellen Texten befüllt werden. Besonders spannend wird es, wenn hier weitere Datenquellen, etwa die Kaufhistorie oder Wetterdaten eingebunden werden. Das gilt auch für die Überführung der Satz-Templates in weitere Sprachen. Diese müssen lediglich einmalig professionell in die jeweilige Sprache übersetzt werden – vom PIM bis hin zur letzten Iteration.
Je nach Sprache unterscheidet sich nicht nur das Vokabular, sondern auch die Grammatik und der Satzbau stark. Daher bietet es sich an, mit Muttersprachlern oder professionellen Übersetzern das Projekt von Anfang bis Ende zu übersetzen. Dadurch wird schnell klar, ob der PIM-Aufbau angepasst werden muss, welche Verknüpfungen im Transform-Modus erhalten bleiben können und ob die Synonyme Wort für Wort übersetzt oder neu angelegt werden sollten. Die Sätze werden in der jeweiligen Sprache formuliert und mit den Daten aus dem PIM verknüpft. Die semantischen Regeln werden getrennt von der Sprache erstellt und können daher auf jede Sprache angewendet werden. Es müssen lediglich die sprachlichen Elemente angepasst werden.
Content-Automatisierung mit Textroboter auf der Überholspur
Der Nutzen der modernen NLG-Technologie wird vielen Onlineshops immer bewusster: Zeit- und Kostenersparnisse, konstante Textqualität bei sich veränderten Sortimenten, schnelle Reaktionszeiten auf temporäre Phänomene (vom Kälteeinbruch bis zur Corona-Pandemie) und am Ende mehr Verkäufe durch bessere Google-Rankings und Conversions im Shop. Zudem lassen sich mit der Technologie unterschiedliche Kanäle mit Content bespielen. Ob Marktplätze, Newsletter oder Webseite, Textroboter helfen Onlineshops viele Herausforderungen zu meistern und regelmäßiger und effizienter Content zu kreieren. Gartner schätzt, dass bis zum Jahr 2022 etwa 25 Prozent aller Unternehmen die NLG-Technologie zur Automatisierung von Texten einsetzen werden.
Über den Autor: Saim Alkan ist Gründer und CEO von AX Semantics. Das Unternehmen wurde 2001 als aexea GmbH in Stuttgart gegründet und im Jahr 2016 zur AX Semantics umfirmiert. Mit rund 40 Mitarbeitern wird seit Jahren an der Software gearbeitet. Saim Alkan erkannte als Wirtschaftsingenieur früh die Bedeutung der automatisierten Texterstellung mit Natural Language Generation in den Bereichen E-Commerce und Medien.
Teilen Sie die Meldung „Textroboter im E-Commerce: Von strukturierten Daten zum anspruchsvollen Verkaufstext“ mit Ihren Kontakten: