8 min read

Empfehlungen: von Vanille bis Personalisierung - Teil III.

Published on
July 3, 2020
Author
Pierre Lupi Chen
Pierre Lupi Chen
AI & Data
Subscribe to our newsletter
Subscribe
Empfehlungen: von Vanille bis Personalisierung - Teil III.

Hier ist Teil III. meiner Serie über maschinelles Lernen und Personalisierung - lesen Sie den ersten Artikel hier und den zweiten hier.

Wie man Empfehlungen personalisiert

Einfach nur bestimmte und relevante Produkte an Kunden zu empfehlen, kann nicht als "Personalisierung" bezeichnet werden. Um Empfehlungen wirklich zu personalisieren, müssen wir über die Frage nach dem "Was" hinaus das Gesamtbild erfassen, indem wir uns mit drei weiteren Fragen befassen:

  • Wann: Wann ist der richtige Zeitpunkt, um den Kunden zu erreichen, entweder um ihm neue Empfehlungen zu geben oder um ihn zum Kauf zu bewegen?
  • Warum: Warum haben wir Kundenabwanderung? Wir müssen die Gründe kennen oder zumindest eine Vorstellung davon haben, warum Kunden aufhören, unsere Produkte zu nutzen oder uns verlassen (und ich spreche davon, eine gewisse Kausalität aus den Daten abzuleiten, was unsinnig wäre, da ein Kaufakt von einer Vielzahl externer Faktoren abhängt, die wir nicht verfolgen können).
  • Wie: Wie können wir die Abwanderung umkehren? Sobald wir etwas über einen abwandernden Kunden wissen, können wir Maßnahmen ergreifen, um seine Abwanderungsneigung umzukehren; dies gilt vor allem für langlebige Güter und bis zu einem gewissen Grad auch für schnelldrehende Güter.

Modellierung der Abwanderungsneigung

Lassen Sie uns nun tief in die 3 Fragen der Personalisierung eintauchen! Um die Wann-Frage zu beantworten, sind wir es gewohnt, ein binäres Etikett für loyale oder abwandernde Kunden zu einem bestimmten Zeitpunkt als Leistungsindikator (KPI) zu verwenden und dann binäre Klassifizierungsmodelle für die Abwanderungsneigung zu trainieren, die Likelihoods ausgeben.

Sobald solche Modelle trainiert wurden, können wir sie verwenden, um die Frage nach dem Warum zu beantworten.

Genauer gesagt, können wir aus den Techniken zur Erklärung der Modelle (z. B. wichtigste Merkmale, wichtigste Entscheidungsregeln) Erkenntnisse gewinnen, die erklären, warum ein Kunde abwandert.

Lassen Sie uns ein wenig tiefer in solche Erkenntnisse eintauchen und, genauer gesagt, darüber, was sie liefern.

Kundensegmentierung

Nehmen wir das Beispiel eines zu trainierenden Abwanderungsneigungsmodells.

Normalerweise entwickeln wir Merkmale aus sehr unterschiedlichen, sogar heterogenen Datenquellen. Zum Beispiel aus Google Analytics 360-Daten und, sagen wir mal, aus Wettervorhersagedaten.

Wenn wir mit solch unterschiedlichen Datenquellen konfrontiert werden, gibt es in der Regel zwei Vorbehalte:

  • In der Regel ist es unwahrscheinlich, dass unsere Merkmale untereinander oder mit der Zielvariablen in irgendeiner Weise linear interagieren; deshalb sind Modelle mit linearen Komponenten, wie neuronale Netze, nicht die Norm.
  • Kundensegmentierung ist nichts anderes als Clustering; das Clustering von Instanzen auf der Grundlage von Merkmalen, selbst wenn diese normalisiert sind und ursprünglich auf verschiedenen Skalen liegen, bleibt schwierig. Entscheidungsbaum-Ensembles sind in der Regel die besten Modelle, die eingesetzt werden können.

Um eine robuste Kundensegmentierung durchzuführen, verwenden wir nicht die ursprünglichen Merkmale, ob normalisiert oder nicht, sondern arbeiten mit Instanzen.

Da diese Instanzen in den Raum der aus den Entscheidungsbäumen generierten Entscheidungsregeln eingebettet sind, entstehen durch die Einbettung spärliche Darstellungen, die auf der gleichen Skala liegen.

Eine solche Einbettung wurde von Friedman und Popescu demokratisiert, als sie 2005 ihre bahnbrechende Arbeit über RuleFit veröffentlichten.

Segmenttrends

Sobald wir unsere Kundensegmente haben, sind die Trends im Wesentlichen durch die wichtigsten Entscheidungsregeln gegeben, die in jeder Gruppe angekreuzt werden, wie z. B.:

  • Welches sind die gemeinsamen Merkmale des Kaufverhaltens?
  • Welches sind die gemeinsamen Merkmale, wenn Kunden abwandern? Das ist eine Frage der einfachen Statistik, die man berechnen kann.

Solche Entscheidungsregeln können auch nach ihrer Wichtigkeit bewertet werden, z. B. nach der Bedeutung der Merkmale.

Einfache lineare Modelle wie eine Lasso-Regression können diese Aufgabe übernehmen, genau wie bei RuleFit von Friedman und Popescu.

Personalisierte Diagnose

Lassen Sie uns nun im Detail über die Diagnose der Personalisierung sprechen! Trends werden aus einer Gruppe von Instanzen, d. h. einer Untergruppe der Grundgesamtheit, gebildet.

In diesem Sinne handelt es sich bei der Modellanalyse um eine globale Interpretation.

Um eine bestimmte Instanz zu diagnostizieren, müssen wir zu einer lokalen Interpretation übergehen, auf der Ebene einer einzelnen Instanz/eines einzelnen Punktes, d.h. eines einzelnen Kunden.

Hierfür gibt es verschiedene Methoden: Lokale Surrogatmodelle wie LIME, die Berechnung von Shapley-Werten auf Monte-Carlo-Basis oder Erklärungsmodelle wie KernelSHAP und TreeSHAP.

Lokale Surrogatmodelle leiden unter verschiedenen Vorbehalten, angefangen bei der Einstellung der richtigen Nachbarschaft in Bezug auf den Kernel und die zugehörigen Hyperparameter, die das Ergebnis stark schwanken lassen.

Shapley-Methoden werden in der Regel bevorzugt, da sie einfacher zu interpretieren sind. Für jeden Kunden kennen wir genau die wichtigsten Merkmalswerte, die die Entscheidung des Modells beeinflussen, einen solchen Kunden als mehr oder weniger abwanderungsgefährdet auszugeben.

Darüber hinaus kennen wir auch die Stärke und die Richtung des Beitrags jedes auffälligen Merkmalswerts zur Abwanderungsvorhersage.

Hier ist eine Illustration der Verwendung von Shapley-Werten in einem Dummy-Anwendungsfall.

Wir sind eine hypothetische Website, die alle möglichen Arten von Elektronik verkauft, von Fernsehern über Kameras bis hin zu Drohnen oder Waagen, was auch immer.

Unsere Problemstellung ist einfach:

  • Es ist der Black Friday-Ausverkauf. Wir haben Kunden, die gerade auf der Website sind und viele Seiten durchblättern. Im Grunde genommen befinden sie sich in einer Sitzung und wir können ihre Aktivitäten über Google Analytics 360 verfolgen.

Wir lassen unser Abwanderungsmodell laufen, um herauszufinden, welche Kunden wahrscheinlich abwandern, d. h. die Artikel, die sie am Ende der Sitzung in ihren Warenkorb gelegt haben, nicht kaufen werden.

Unser Abwanderungsmodell läuft in Echtzeit und gibt Online-Vorhersagen, während unsere Kunden noch in der Sitzung sind.

Wir lassen auch SHAP in Echtzeit laufen, um für jeden Kunden, insbesondere für die abtrünnigen Kunden, zu interpretieren, was das Modell zu der Annahme veranlasst, dass sie abtrünnig werden könnten.

Kunde A prüft Produkte im Zusammenhang mit Fernsehern.

Kunde A ist nicht abwanderungsgefährdet, mit einer vorhergesagten Abwanderungswahrscheinlichkeit von nur 0,06.

Die Merkmalswerte, die die 0,06-Vorhersage beeinflussen, sind:

  • Der Zeitraum des Black Friday.
  • Die hohe Anzahl der geprüften ähnlichen Produkte: 10 verschiedene Fernsehgeräte.

Diese Merkmalswerte sind blau hervorgehoben und lassen die Vorhersage sinken.

Da es unwahrscheinlich ist, dass Kunde A den Laden wechselt, sollten wir keine Maßnahmen ergreifen.

Kunde B sucht nach Produkten, die mit Waagen zu tun haben.

Kunde B ist abwanderungsgefährdet mit einer vorhergesagten Abwanderungswahrscheinlichkeit von 0,71.

Die Merkmalswerte, die die 0,71-Vorhersage beeinflussen, sind:

  • Der Zeitraum des Schwarzen Freitags; Waagen sind möglicherweise nicht sehr beliebt.
  • Die geringe Anzahl ähnlicher Produkte, die geprüft wurden: zwei verschiedene Gewichtswaagen.
  • Null Vergleiche wurden durchgeführt.
  • Die aktuelle Zeit, die in der Sitzung verbracht wurde.

Alle diese Merkmale sind rot hervorgehoben, d. h. sie erhöhen die Vorhersage, die Abwanderungswahrscheinlichkeit.

Der Einfachheit halber nehmen wir an, dass sich diese Merkmale monoton und invers zur Abwanderungswahrscheinlichkeit bewegen, d. h. wenn die Werte dieser Merkmale erhöht werden, sollte die Abwanderungswahrscheinlichkeit sinken.

Um die Anzahl der zu prüfenden ähnlichen Produkte und die Anzahl der durchzuführenden Vergleiche zu erhöhen, müssen wir dem Kunden nur ähnliche Produkte vorschlagen und sie miteinander vergleichen.

Dies kann mit einem kleinen Schiebefenster geschehen, das rechts auf der Seite mit der Kaufabwicklung oder der Hauptproduktseite auftaucht, während der Kunde noch in der Sitzung ist.

Und wenn der Kunde die im Pop-up-Fenster präsentierten zusätzlichen Produkte prüft, erhöht sich zwangsläufig seine Verweildauer.

Die drei wichtigsten Erkenntnisse lassen sich also mit einer einfachen Änderung des Website-Layouts umsetzen.

Bei den anderen, weniger wichtigen Merkmalswerten ist nichts wirklich umsetzbar.

Wir können den Zeitraum nicht ändern und wir können dem Kunden auch nicht vorschlagen, sich andere Produktkategorien anzusehen oder auf unsere Website zurückzukehren, wenn er beispielsweise vor einem Laptop sitzt.

Wir können die Richtung der Funktion extrapolieren, um die Tendenz zur Abwanderung umzukehren und die richtigen Maßnahmen zu ergreifen.

Solche Maßnahmen betreffen die letzte Frage: das Wie.

Wichtige Erkenntnisse

Produktempfehlungen sind weit verbreitet.

Sie verbessern das Kundenerlebnis quantitativ und sorgen für eine Diversifizierung sowie eine stärkere Personalisierung. Aber die Empfehlung bestimmter, für einen Kunden relevanter Produkte reicht nicht aus, um das Kundenerlebnis zu personalisieren.

Man muss den Kunden zum richtigen Zeitpunkt ansprechen, um ihn nicht zu verwirren. Auf diese Weise wird die Erfahrung des Kunden qualitativ verbessert.

Die Anwendung einer individuellen Strategie zur Kundenbindung ist ein weiterer Schritt zur qualitativen Verbesserung der Kundenerfahrung.

Manchmal ist die Empfehlung neuer oder ähnlicher Produkte nicht der richtige Schritt, um Kunden zum Kauf zu bewegen, insbesondere bei teuren Waren.

Es kann besser sein, verwertbare Erkenntnisse hinter den Kulissen zu nutzen, um den Kunden zu überzeugen, ein Produkt zu kaufen, während er sich in der Sitzung befindet.

Diese zusätzliche Ebene der Personalisierung ist ein Muss.

Zusammenfassend lässt sich sagen, dass eine vollständig personalisierte Empfehlungsmaschine alle beschriebenen Aspekte behandeln sollte:

  • Stricto sensu Produktempfehlungen.
  • Abruf von abwandernden Kunden.
  • Analyse von abwandernden Kunden und Gewinnung von verwertbaren Erkenntnissen.
  • Aktionen aus den Erkenntnissen, um sie in verschiedene Kanäle einzubetten (von E-Mail-Kampagnen bis zu Websites oder Apps).

Diese Aufgaben sind in der Regel komplex, lassen sich aber an die Besonderheiten der Branche und der Kunden des Unternehmens anpassen.

Aus diesem Grund können Personalisierung und vollständig personalisierte Empfehlungsmaschinen nicht einfach standardisiert werden, und automatisiertes maschinelles Lernen wird möglicherweise nie in der Lage sein, sie vollständig zu bewältigen.

Author
Pierre Lupi Chen
AI & Data
Subscribe to our newsletter
Subscribe