Hier ist Teil III. meiner Serie über maschinelles Lernen und Personalisierung - lesen Sie den ersten Artikel hier und den zweiten hier.
Einfach nur bestimmte und relevante Produkte an Kunden zu empfehlen, kann nicht als "Personalisierung" bezeichnet werden. Um Empfehlungen wirklich zu personalisieren, müssen wir über die Frage nach dem "Was" hinaus das Gesamtbild erfassen, indem wir uns mit drei weiteren Fragen befassen:
Lassen Sie uns nun tief in die 3 Fragen der Personalisierung eintauchen! Um die Wann-Frage zu beantworten, sind wir es gewohnt, ein binäres Etikett für loyale oder abwandernde Kunden zu einem bestimmten Zeitpunkt als Leistungsindikator (KPI) zu verwenden und dann binäre Klassifizierungsmodelle für die Abwanderungsneigung zu trainieren, die Likelihoods ausgeben.
Sobald solche Modelle trainiert wurden, können wir sie verwenden, um die Frage nach dem Warum zu beantworten.
Genauer gesagt, können wir aus den Techniken zur Erklärung der Modelle (z. B. wichtigste Merkmale, wichtigste Entscheidungsregeln) Erkenntnisse gewinnen, die erklären, warum ein Kunde abwandert.
Lassen Sie uns ein wenig tiefer in solche Erkenntnisse eintauchen und, genauer gesagt, darüber, was sie liefern.
Nehmen wir das Beispiel eines zu trainierenden Abwanderungsneigungsmodells.
Normalerweise entwickeln wir Merkmale aus sehr unterschiedlichen, sogar heterogenen Datenquellen. Zum Beispiel aus Google Analytics 360-Daten und, sagen wir mal, aus Wettervorhersagedaten.
Wenn wir mit solch unterschiedlichen Datenquellen konfrontiert werden, gibt es in der Regel zwei Vorbehalte:
Um eine robuste Kundensegmentierung durchzuführen, verwenden wir nicht die ursprünglichen Merkmale, ob normalisiert oder nicht, sondern arbeiten mit Instanzen.
Da diese Instanzen in den Raum der aus den Entscheidungsbäumen generierten Entscheidungsregeln eingebettet sind, entstehen durch die Einbettung spärliche Darstellungen, die auf der gleichen Skala liegen.
Eine solche Einbettung wurde von Friedman und Popescu demokratisiert, als sie 2005 ihre bahnbrechende Arbeit über RuleFit veröffentlichten.
Sobald wir unsere Kundensegmente haben, sind die Trends im Wesentlichen durch die wichtigsten Entscheidungsregeln gegeben, die in jeder Gruppe angekreuzt werden, wie z. B.:
Solche Entscheidungsregeln können auch nach ihrer Wichtigkeit bewertet werden, z. B. nach der Bedeutung der Merkmale.
Einfache lineare Modelle wie eine Lasso-Regression können diese Aufgabe übernehmen, genau wie bei RuleFit von Friedman und Popescu.
Lassen Sie uns nun im Detail über die Diagnose der Personalisierung sprechen! Trends werden aus einer Gruppe von Instanzen, d. h. einer Untergruppe der Grundgesamtheit, gebildet.
In diesem Sinne handelt es sich bei der Modellanalyse um eine globale Interpretation.
Um eine bestimmte Instanz zu diagnostizieren, müssen wir zu einer lokalen Interpretation übergehen, auf der Ebene einer einzelnen Instanz/eines einzelnen Punktes, d.h. eines einzelnen Kunden.
Hierfür gibt es verschiedene Methoden: Lokale Surrogatmodelle wie LIME, die Berechnung von Shapley-Werten auf Monte-Carlo-Basis oder Erklärungsmodelle wie KernelSHAP und TreeSHAP.
Lokale Surrogatmodelle leiden unter verschiedenen Vorbehalten, angefangen bei der Einstellung der richtigen Nachbarschaft in Bezug auf den Kernel und die zugehörigen Hyperparameter, die das Ergebnis stark schwanken lassen.
Shapley-Methoden werden in der Regel bevorzugt, da sie einfacher zu interpretieren sind. Für jeden Kunden kennen wir genau die wichtigsten Merkmalswerte, die die Entscheidung des Modells beeinflussen, einen solchen Kunden als mehr oder weniger abwanderungsgefährdet auszugeben.
Darüber hinaus kennen wir auch die Stärke und die Richtung des Beitrags jedes auffälligen Merkmalswerts zur Abwanderungsvorhersage.
Hier ist eine Illustration der Verwendung von Shapley-Werten in einem Dummy-Anwendungsfall.
Wir sind eine hypothetische Website, die alle möglichen Arten von Elektronik verkauft, von Fernsehern über Kameras bis hin zu Drohnen oder Waagen, was auch immer.
Unsere Problemstellung ist einfach:
Wir lassen unser Abwanderungsmodell laufen, um herauszufinden, welche Kunden wahrscheinlich abwandern, d. h. die Artikel, die sie am Ende der Sitzung in ihren Warenkorb gelegt haben, nicht kaufen werden.
Unser Abwanderungsmodell läuft in Echtzeit und gibt Online-Vorhersagen, während unsere Kunden noch in der Sitzung sind.
Wir lassen auch SHAP in Echtzeit laufen, um für jeden Kunden, insbesondere für die abtrünnigen Kunden, zu interpretieren, was das Modell zu der Annahme veranlasst, dass sie abtrünnig werden könnten.
Kunde A prüft Produkte im Zusammenhang mit Fernsehern.
Kunde A ist nicht abwanderungsgefährdet, mit einer vorhergesagten Abwanderungswahrscheinlichkeit von nur 0,06.
Die Merkmalswerte, die die 0,06-Vorhersage beeinflussen, sind:
Diese Merkmalswerte sind blau hervorgehoben und lassen die Vorhersage sinken.
Da es unwahrscheinlich ist, dass Kunde A den Laden wechselt, sollten wir keine Maßnahmen ergreifen.
Kunde B sucht nach Produkten, die mit Waagen zu tun haben.
Kunde B ist abwanderungsgefährdet mit einer vorhergesagten Abwanderungswahrscheinlichkeit von 0,71.
Die Merkmalswerte, die die 0,71-Vorhersage beeinflussen, sind:
Alle diese Merkmale sind rot hervorgehoben, d. h. sie erhöhen die Vorhersage, die Abwanderungswahrscheinlichkeit.
Der Einfachheit halber nehmen wir an, dass sich diese Merkmale monoton und invers zur Abwanderungswahrscheinlichkeit bewegen, d. h. wenn die Werte dieser Merkmale erhöht werden, sollte die Abwanderungswahrscheinlichkeit sinken.
Um die Anzahl der zu prüfenden ähnlichen Produkte und die Anzahl der durchzuführenden Vergleiche zu erhöhen, müssen wir dem Kunden nur ähnliche Produkte vorschlagen und sie miteinander vergleichen.
Dies kann mit einem kleinen Schiebefenster geschehen, das rechts auf der Seite mit der Kaufabwicklung oder der Hauptproduktseite auftaucht, während der Kunde noch in der Sitzung ist.
Und wenn der Kunde die im Pop-up-Fenster präsentierten zusätzlichen Produkte prüft, erhöht sich zwangsläufig seine Verweildauer.
Die drei wichtigsten Erkenntnisse lassen sich also mit einer einfachen Änderung des Website-Layouts umsetzen.
Bei den anderen, weniger wichtigen Merkmalswerten ist nichts wirklich umsetzbar.
Wir können den Zeitraum nicht ändern und wir können dem Kunden auch nicht vorschlagen, sich andere Produktkategorien anzusehen oder auf unsere Website zurückzukehren, wenn er beispielsweise vor einem Laptop sitzt.
Wir können die Richtung der Funktion extrapolieren, um die Tendenz zur Abwanderung umzukehren und die richtigen Maßnahmen zu ergreifen.
Solche Maßnahmen betreffen die letzte Frage: das Wie.
Produktempfehlungen sind weit verbreitet.
Sie verbessern das Kundenerlebnis quantitativ und sorgen für eine Diversifizierung sowie eine stärkere Personalisierung. Aber die Empfehlung bestimmter, für einen Kunden relevanter Produkte reicht nicht aus, um das Kundenerlebnis zu personalisieren.
Man muss den Kunden zum richtigen Zeitpunkt ansprechen, um ihn nicht zu verwirren. Auf diese Weise wird die Erfahrung des Kunden qualitativ verbessert.
Die Anwendung einer individuellen Strategie zur Kundenbindung ist ein weiterer Schritt zur qualitativen Verbesserung der Kundenerfahrung.
Manchmal ist die Empfehlung neuer oder ähnlicher Produkte nicht der richtige Schritt, um Kunden zum Kauf zu bewegen, insbesondere bei teuren Waren.
Es kann besser sein, verwertbare Erkenntnisse hinter den Kulissen zu nutzen, um den Kunden zu überzeugen, ein Produkt zu kaufen, während er sich in der Sitzung befindet.
Diese zusätzliche Ebene der Personalisierung ist ein Muss.
Zusammenfassend lässt sich sagen, dass eine vollständig personalisierte Empfehlungsmaschine alle beschriebenen Aspekte behandeln sollte:
Diese Aufgaben sind in der Regel komplex, lassen sich aber an die Besonderheiten der Branche und der Kunden des Unternehmens anpassen.
Aus diesem Grund können Personalisierung und vollständig personalisierte Empfehlungsmaschinen nicht einfach standardisiert werden, und automatisiertes maschinelles Lernen wird möglicherweise nie in der Lage sein, sie vollständig zu bewältigen.