Beiträge

Product Matching: der Erfolgsfaktor für Market Intelligence

Ein Kommentar von unserer Gründerin Dr. Hanna Köpcke.

Durch Big Data eröffnen sich dem Handel neue Möglichkeiten, seine Marktposition zu stärken. Mit Market Intelligence, das heißt umfassendes Wissen über den Markt und die eigene Position, wappnen sich Unternehmen gegen eine Verdrängung vom Markt und den harten Preiskampf. Bei Händlern setzt dieser Ansatz ein tiefes Verständnis ihrer Produkte, Preise, Konditionen und ihrer aktuellen Markposition voraus.

Außerdem wird eine moderne IT-Infrastruktur benötigt, die den Einsatz einer intelligenten und selbstlernenden Big Data Analytics-Lösung erlaubt. Denn Geschäftsvorteile lassen sich nur erzielen, wenn die riesigen Mengen an Daten sinnvoll gesammelt und ausgewertet werden.

Treibende Faktoren für Market Intelligence

Ein entscheidender Faktor ist der Kunde, dessen Ansprüche und Gewohnheiten sich in den letzten Jahren stark gewandelt haben. Comparison Shopping hat sich durch Digitalisierung, Mobile Shopping und Preisvergleichsportale zur Norm entwickelt. Genau damit müssen sich Unternehmen im E-Commerce auseinandersetzen. Viel zu häufig entstehen Probleme, wenn es um die Einschätzung und Erkennung von Markttrends und das Mithalten mit bestehenden und neuen Wettbewerbern geht. Vor allem Kunden stellen eine Herausforderung dar, die sich vor dem Kauf umfangreich online informieren und von anderen Wettbewerbern immer nur einen Klick entfernt sind.

Daneben zwingt das stark steigende Datenvolumen den Online-Handel dazu, Big Data-Analyse-Plattformen einzusetzen, um ein transparentes Marktbild zu erhalten. Ein Beispiel ist die Nutzung von Big Data zur Wettbewerbs- und Preisbeobachtung: Ein aussagekräftiger Benchmark lässt sich längst nicht mehr mit Excel-Tabellen und Co. erzielen. Durch die hohe Angebotsvielfalt hat dieses Vorgehen längst keine Aussagekraft mehr – insbesondere dann nicht, wenn der internationale Wettbewerb berücksichtigt werden soll. Market Intelligence hilft dabei, ähnliche oder äquivalente Datensätze mit einer hohen Treffergenauigkeit zu identifizieren – dieser Prozess wird auch Product Matching genannt.

Mit Product Matching internen und externen Mehrwert erzielen

Zwar gehört die Daten- bzw. Kundenanalyse im Online-Handel längst zum Alltag, häufig fehlt es aber an der Verknüpfung der Daten und der Schaffung einer transparenten Umgebung. Product Matching ist eine Form der Datenanalyse im E-Commerce, die sowohl intern, als auch extern von hoher Bedeutung ist.

Intern wird Product Matching zur Datenbankbereinigung eingesetzt: Duplikate werden in den Produktstammdaten von Online-Händlern und Markenherstellern identifiziert und eliminiert. Als Match gelten zwei Datensätze, die dasselbe Produkt repräsentieren. Häufig entstehen Duplikate aufgrund von unterschiedlichen Produktbezeichnungen. Diese können bereits beim Einspeisen der Daten in die Datenbank entstehen, da das Produkt oft bereits bei den Lieferanten eine uneinheitliche Beschreibung hat.

Das Worst-Case-Szenario einer Datenbank mit geringer Qualität: Sowohl dem Kunden als auch dem Produktmanager wird angezeigt, dass das Produkt nicht mehr verfügbar sei. Somit wechselt der Kunde zu einem anderen Anbieter und der Manager bestellt die Ware fälschlicherweise nach, obwohl der Artikel noch auf Lager ist. Durch die Bereinigung der Datenbank und die damit verbundene Verbesserung der Datenqualität, werden Kosten gesenkt sowie die Usability und Kundenzufriedenheit gesteigert.

 

Market Intelligence: Variation von Produktdaten

Abbildung 1: Beispiel für Möglichkeiten der Produktbeschreibung im Möbel-Online-Handel. Quelle: Eigene Darstellung.

 

Extern dient Product Matching zur Wettbewerbs- und Marktbeobachtung. Man spricht von einem Match, wenn sich zwei Datensätze auf vergleichbare Produkte beziehen. Mit dem Einsatz intelligenter Technologien lassen sich somit die eigenen Preise mit den Angeboten im nationalen und internationalen Wettbewerb vergleichen und darauf basierend fundierte Analysen der Preisstrategie der Wettbewerber erstellen. Händler können die Preise und das Sortiment anschließend der aktuellen Marktsituation anpassen. So wappnen sich Online-Akteure gegen den harten Preiskampf und die Verdrängung vom Markt durch Pure Player und Start-ups.

Barrieren beim Product Matching

Die größten Schwierigkeiten beim Matching von Produktdaten bestehen im Umgang mit sehr heterogenen Produktbeschreibungen sowie mangelnden Standards zur eindeutigen Identifizierung (EAN/GTIN). Für den Handel gibt es meist keine Vorschrift, wie eine Produktbeschreibung aussehen, was sie beinhalten und wie detailliert sie sein muss. Uneinheitliche Bezeichnungen entstehen unter anderem durch die Verwendung von:

  • Domänenspezifischen Bezeichnungen und Abkürzungen: Im Bereich Fashion ist zum Beispiel „lg. A.“ eine Abk. für „Lang arm“. Im Bereich Elektronik ist LG ein Markenhersteller.
  • Heterogene Bezeichnungen für Größen und Stückangaben, zum Beispiel 168 Stück gegenüber 3 mal 56 Stück
  • Uneinheitliche Schreibweisen von Modellbezeichnungen, zum Beispiel DHI655FX gegenüber DHI 655 FX oder DHI-655 FX.
  • Synonyme: Im Bereich Fashion bezeichnen zum Beispiel Hoody, Hoodie und Kapuzenpullover einen Pullover mit Kapuze

Im Matching erfolgt der Vergleich zweier Produkte anhand ihrer Attribute (Größe, Farbe, Marke, etc.). Dazu werden meist folgende Ähnlichkeitsmaße herangezogen: EditDistance, Jaccard, TFIDF und Trigram. Um eine hohe Qualität des Matches zu erreichen, empfiehlt es sich, unterschiedliche Maße für verschiedene Attributswerte (zum Beispiel für die Attribute „Größe“ und „Marke“) zu kombinieren.

Eine weitere generelle Herausforderung für das Matching ist die Effektivität. Um diese zu bewerten, werden üblicherweise zwei Maße verwendet: Precision und Recall.

Precision und Recall beurteilen die Effektivität

Das Matching von Produkten erweist sich als effektiv, wenn eine perfekte Balance zwischen Genauigkeit und Trefferquote erreicht wird – Kenner in der IT-Branche sprechen von Recall und Precision. Im Idealfall liegen beide Werte bei 100 Prozent.

Recall – das Maß für die Vollständigkeit: Der Recall misst den Anteil der erkannten Matches an allen tatsächlichen Matches und gilt damit als Maß für die Vollständigkeit des Matching. Ist der Recall hoch, wurden viele der tatsächlich vorhandenen Matches gefunden.
Precision – das Maß für die Treffergenauigkeit: Mit der Treffergenauigkeit lässt sich feststellen, wie hoch der Anteil der tatsächlichen Matches an den erkannten Matches ist.

 

Recall vs. Precision

Abbildung 2: Recall vs. Precision. Quelle: Eigene Darstellung

 

Wird die Definition eines gleichen Produktes eng gefasst, fällt die Marktanalyse weniger präzise aus und ein blinder Fleck entsteht. Denn der Matching Prozess wird gleiche Produkte ignorieren, die eine unterschiedliche Beschreibung haben. Die Datenqualität in Bezug auf Treffergenauigkeit ist in diesem Fall sehr hoch, die Messwerte für Recall jedoch sehr gering.

Eine weiter gefasste Definition, die mehr Variationen zulässt, liefert ein besseres Marktbild, es steigt aber das Risiko, dass ungleiche Produkte fälschlicherweise miteinander verglichen werden. Hier ist die Aussage des Recalls zwar sehr stark, die Treffgenauigkeit dafür aber gering.

Welche Vorteile entstehen durch Market Intelligence?

Mit Market Intelligence erreichen Unternehmen im digitalen Business eine umfassende Transparenz der Marktsituation und der eigenen Prozesse. Product Matching ist ein wichtiger Bestandteil davon, denn dadurch wird eine gute Datengrundlage geschaffen, ein fehlerfreies Produktmanagement ermöglicht und die Basis für den Wettbewerbsvergleich gelegt.

Da Kunden sich dank Preisvergleichsportalen schnell einen guten Marktüberblick verschaffen können, sind Unternehmen gezwungen, sich mit aktuellen Marktbedingungen auseinanderzusetzen: Amazon beispielsweise nimmt in Hochverkaufszeiten bis zu zehn Milliarden Preisänderungen vor. Um hier mithalten zu können, müssen Preise und Sortiment anhand eines Wettbewerbsvergleichs regelmäßig angepasst werden. Außerdem schafft es Potenzial für höhere Margen und eine bessere Verhandlungsbasis bei Lieferanten.

Ein einwandfreies und kanalunabhängiges Management von Produktdaten ist nicht zuletzt entscheidend für die Customer Experience: Fehlbestellungen und die Abwanderung zum Wettbewerb bleiben aus.

Dieser Kommentar von unserer Gründerin und CTO Dr. Hanna Köpcke ist in einer ähnlichen Form im BigData Insider erschienen.

Verpassen Sie nicht Dr. Hanna Köpckes Vortrag zum Thema „Datenqualität: Big Data Matching“ auf der SMART DATA Developer Conference am 6. Dezember in Köln!

Erfahren Sie in unserem Whitepaper „Product Matching Excellence“ wie im E-Commerce in Zeiten von Big Data wertvolle Produktinformationen gewonnen werden.