Echtzeit-Empfehlungen im E-Commerce – Graphdatenbanken liefern die nötige Power

Heutzutage erwarten Käufer personalisierte und präzise Empfehlungen und reagieren weniger auf Universalvorschläge. Hinter der Erstellung attraktiver Angebote steckt eine hochmoderne Technologie, die die Kaufgewohnheiten der Kunden erfasst und aktuelle Kaufentscheidungen sofort analysiert. Anhand dieser Daten werden die geeignetsten Produktempfehlungen abgegeben. Diese komplexe Analyse muss in Echtzeit stattfinden, damit der Kunde nicht zur Website eines Wettbewerbers wechselt. Daran muss sich jede Datenbanktechnologie messen lassen.

Relationale Datenbanken stoßen aufgrund ihrer rigiden Struktur und fehlenden Skalierbarkeit schnell an ihre Grenzen. Deswegen ist eine neue Generation von Datenbanktechnologien entwickelt worden, die ohne vordefinierte und feste Schemata auskommen – eine allgemein bekannte Einschränkung von SQL-Datenbanken.

Diese neuen Technologien werden gemeinhin unter dem heterogenen Sammelbegriff NoSQL zusammengefasst. Gemeinsam haben diese Datenbankmodelle jedoch nur ihre nicht-relationale Methodik. Aktuelle Entwicklungen zeigen, dass sich der NoSQL-Begriff zunehmend auflöst und sich drei Hauptkategorien mit ihren jeweiligen Charakteristika herauskristallisieren: dokumentenorientierte Datenbanken, Key-Value-Datenbanken und Graphdatenbanken.

Keine der Datenbanksysteme nimmt für sich in Anspruch, die bestehenden relationalen Architekturen ersetzen zu können. Selbst untereinander machen sie sich keine Konkurrenz. Vielmehr haben sie jeweils für gewisse Anwendungsfälle ihre Vorteile und bieten sich so als sinnvolle Ergänzungen an. Daten sind unterschiedlich strukturiert und müssen daher anders verarbeitet werden.

Für viele Marktbeobachter steht fest, dass sich Daten in Zukunft nicht mehr mit einer einzigen Datenbanktechnologie effizient beherrschen lassen. Ein „One database fits all“-Ansatz passt daher in zunehmenden Maße nicht mehr zu den Anforderungen von Unternehmen. Der Trend geht zu einem hybriden oder polyglotten Ansatz, bei dem mehrere unterschiedliche Systeme eingesetzt werden. Graphdatenbanken beispielsweise eignen sich besonders gut bei Abfragen von stark vernetzten Daten in Echtzeit.

Graphdatenbanken spielen bei vernetzten Daten ihre Stärken aus

Ein Graph ist die allgemeine Bezeichnung für eine abstrakte Struktur, die eine Menge von Objekten zusammen mit den zwischen diesen Objekten bestehenden Verbindungen repräsentiert, in der Mathematik als Knoten und Kanten bezeichnet. Sowohl die Knoten als auch die Kanten können Eigenschaften, sogenannte Properties besitzen. Graphen werden meistens dargestellt durch einzelne Kreise, die mit Linien verbunden sind. Anschauliche Beispiele dafür sind Stammbäume, Mind-Maps oder das U-Bahn-Netz einer Stadt. Eine wichtige Anwendung des Graphenmodells ist die Suche nach einer kürzesten Route zwischen zwei Orten in einem Straßennetz.

In einer Graphdatenbank lassen sich Daten in Form von Graphen speichern, verwalten und abfragen. Sie eignen sich besonders gut, stark vernetzte und unstrukturierte Informationen anschaulich darzustellen. Denn sie weisen den gespeicherten Daten (beispielsweise Kunden oder Produkte) und der Beziehung zwischen diesen Daten (beispielsweise „wer kauft was“ oder „welcher Kauf fand zuerst statt“) die gleiche Bedeutung zu. Diese Beziehungen werden also nicht mehr als bloße Metadaten abgetan, sondern stehen vielmehr im Zentrum des Modells.

Graphdatenbanken erleiden bei extrem vielen, miteinander verknüpften Datensätzen keine Performance-Verluste. Die Beziehungen zwischen Elementen müssen für eine Abfrage nicht aufwändig berechnet werden, sondern sind durch die vorliegenden Strukturen einfach verfolgbar. Die Abfragegeschwindigkeit hängt nicht von der Gesamtmenge der Daten in der Datenbank und der Anzahl von Verknüpfungsoperationen ab, sondern nur von der Anzahl der konkreten Beziehungen, die für die gewünschte Abfrage relevant sind.

Das Datenmodell lässt sich leicht mit beliebigen, zusätzlichen Hierarchien und Zugriffsstrukturen anreichern, die einen extrem schnellen Zugriff auf Teilaspekte der Daten ermöglichen. Neu gewonnene Informationen (beispielsweise Ähnlichkeit von Produkten oder relevante Empfehlungen für einen Kunden) können als neue Beziehungen im Graphen abgelegt werden, die dann Abfragen für Echtzeit-Anwendungsfälle weiter beschleunigen können.

Die Technologie von Internetriesen wie Google, Facebook und LinkedIn basiert auf Graphdatenbanken. Diese Unternehmen mussten ihre eigenen Datenbanken mühsam intern entwickeln. Heute dagegen können Unternehmen auf kommerzielle Datenbank-Engines wie Neo4j zurückgreifen.

Höhere Geschwindigkeit, weniger Hardwareressourcen, größere Nutzerzahlen

Als Ergänzung zu relationalen Datenbanken nutzen Unternehmen jeder Branche Graphdatenbanken, um Datenvernetzungen und -zusammenhänge schnell abbilden zu können. Abfragen, die in anderen Datenbanktechnologien noch Minuten oder gar Stunden dauerten, liefern jetzt in Millisekunden das Ergebnis. Mit relationalen Datenbanken würden die gleichen Abfragen in derselben Geschwindigkeit wesentlich mehr Rechnerleistung und Hardwarekapazitäten benötigen. Darüber hinaus lässt sich der Zugriff auf die Daten auf weitere Nutzergruppen ausweiten, ohne das System zu überfordern. Durch diese drei Vorteile – höhere Geschwindigkeit, weniger Hardwareressourcen, größere Nutzerzahlen – können Unternehmen völlig neue Produkte und Services anbieten. Berechnungen, die vorher nur langsam im Batchverfahren beispielsweise über Nacht möglich waren, stehen jetzt in Echtzeit zur Verfügung.

Dadurch eignen sich Graphdatenbanken besonders gut für Empfehlungen. Denn zu optimalen Empfehlungen – und der damit verbundenen maximalen Wertsteigerung – gehört weit mehr als die Angabe meistverkaufter Produkte. Diese spielen beim Identifizieren der besten Empfehlungen durchaus eine Rolle, sind aber nicht individuell auf einzelne Kunden zugeschnitten. Heute sind präzise auf den Kunden im „Long Tail“ zugeschnittene Empfehlungen gefragt, keine universellen Vorschläge.

Für Echtzeit-Empfehlungen müssen Daten zu den früheren Käufen des Kunden schnell abgefragt werden können, um Verbindungen zu Benutzern herzustellen, die ein ähnliches Kaufverhalten aufweisen und deren soziale Netzwerke sich mit dem des Kunden überschneiden. Außerdem müssen neu erkennbare Interessen des Kunden sofort erfasst werden können. Alte und neue Daten zum Kaufverhalten lassen sich in Graphdatenbanken problemlos zusammenführen.

Im E-Commerce setzt Walmart auf Graphdatenbank

Walmart bedient wöchentlich fast 250 Millionen Kunden in 11.000 Geschäften in 27 Ländern und auf E-Commerce-Seiten in 10 Ländern. Die E-Commerce-Gruppe von Walmart verwendet eine Graphdatenbank, um das Kaufverhalten bzw. die Kundenwünsche von Online-Käufern schneller und genauer zu verstehen. Das Ziel ist es, personalisierte Empfehlungen („Dies könnte Sie auch interessieren“) in Echtzeit zu geben – erwiesenermaßen ein gutes Verfahren, den Umsatz zu maximieren.

Darüber hinaus möchte das Unternehmen anhand des Kaufverhaltens von Online-Kunden große Produktlinien optimieren sowie seine Remarketing-Anwendung stärken. Im Zuge dessen wurde ein kompliziertes Batch-Verfahren, das zur Vorbereitung der relationalen Datenbank verwendet wurde, durch ein einfaches Graphdatenbanksystem ersetzt und ein Echtzeit-Empfehlungssystem mit geringer Wartezeit erstellt.

Der Performance-Vorteil von Graphdatenbanken ermöglicht viele weitere innovative Anwendungen. Auf einer Website für Filmempfehlungen beispielsweise können Fans Filme entdecken, bevor sie ins Kino kommen und erhalten Empfehlungen basierend auf individuellen Vorlieben – eine völlig neue Werbestrategie in der Filmbranche. Gleichzeitig erhalten Filmstudios Informationen zu Präferenzen und Verhalten der Filmfans, auf deren Basis sie dann zielgerichtet Marketingkampagnen entwerfen. Das Unternehmen zog MySQL-Datenbanken für das Empfehlungssystem in Betracht, die aber der riesigen Datenmenge nicht gerecht wurden. Die Wahl fiel schließlich auf eine Graphdatenbank, die Empfehlungen für Benutzer viel schneller bereitstellt – einer der wichtigsten Aspekte des Geschäftsmodells.

Autor: Holger Temme (im Bild), Area Director CEMEA, Neo Technology.

RSS Feed

Neuen Kommentar schreiben

Entdecken Sie die Printmagazine des WIN-Verlags