Smart Data und künstliche Intelligenz haben im Handel längst Einzug gehalten. Noch sind es allerdings vor allem die großen Unternehmen, die solche Technologien nutzen. Damit auch kleine und mittelständische Händler das Potenzial im eigenen Haus ausloten können, bietet das öffentlich geförderte Smart Data Center Baden-Württemberg kostenfreie Workshops an.
Dr. Andreas Wierse, Geschäftsführer der Sicos BW GmbH, stellt das Angebot in einem Gastbeitrag vor.
Digitale Prozesse, Produkte und Services gehören für viele Unternehmen längst zum Alltag. Die Handelsbranche bildet da keine Ausnahme – auch nicht darin, dass es vor allem die großen Unternehmen sind, die entsprechende Technologien nutzen.
Den kleinen und mittleren Unternehmen (KMU) hingegen mangelt es häufig an den notwendigen Ressourcen und/oder dem Know-how. Vielen von ihnen fehlt beispielsweise schon das Grundverständnis dafür, dass es für gewinnbringende Datenanalysen nicht allein auf die Menge der Daten (Big Data), sondern auch auf deren Qualität und Varianz ankommt (Smart Data).

© IMAGO / Zoonar
Daten zu erheben ist das eine, sie gewinnbringend zu verwerten, das andere. Kleinen und mittelständischen Händlern fehlt es dafür häufig schlicht an den Ressourcen.
Mit unterschiedlichen Initiativen, Förderprogrammen und Kompetenzzentren stehen bundesweit mittlerweile zahlreiche Angebote bereit, die KMU dabei unterstützen, das eigene Datenpotenzial und dessen mögliche Nutzung richtig einzuschätzen. Ein möglicher Partner: das Smart Data Solution Center Baden-Württemberg (SDSC-BW). Es berät neutral und unabhängig rund um Smart-Data-Technologien und künstliche Intelligenz (KI) – mit finanzieller Unterstützung durch das Landesministerium für Wissenschaft, Forschung und Kunst (MWK).
Workshops und Leuchtturmprojekte
Das SDSC-BW wurde 2014 von der Sicos BW GmbH und dem Karlsruher Institut für Technologie (KIT) gegründet und hat seither unter anderem Potenzialanalysen für KMU angeboten. Unternehmen lernten hierbei erste Smart-Data-Technologien kennen und einschätzen – im Kontext ihrer eigenen Daten. Letztlich wussten sie genau, ob und inwiefern sich die Hebung des eigenen Datenschatzes lohnt und welche Werkzeuge dafür erforderlich sind.
Um die Einstiegsschwelle für interessierte Unternehmen zu senken, bietet das SDSC-BW inzwischen als ersten Schritt einen kostenfreien halbtägigen Workshop an. Die Experten des KIT kommen hierzu in das Unternehmen und beleuchten Daten und relevante Fragestellungen – sowohl aus technischer als auch aus geschäftlicher Sicht.
Als Ergebnis erhalten die Unternehmen eine erste Bestandsaufnahme, die bereits erkennen lässt, in welche Richtung sich das Unternehmen in Bezug auf Data Analytics und KI bewegen könnte. Bei Fragestellungen, die besondere Effizienzsteigerungen erwarten lassen, können die Experten auch ein sogenanntes Leuchtturmprojekt anschließen.
Das Beispiel XPLN
Eines der analysierten Unternehmen ist die XPLN GmbH (vormals Price Intelligence GmbH), ein Anbieter für Marktüberwachungssoftware mit Schwerpunkt auf der Optimierung von E-Commerce-Daten für Händler und Hersteller.
In modernen E-Commerce-Systemen fallen große Datenmengen an – insbesondere, wenn Warenhäuser ihre großen Lager füllen und Produkte aus Lieferantenlisten in das hauseigene Product-Information-Management-System (PIM-System) integriert werden sollen. Auf diesem Weg von der Lieferantenliste in das PIM-System werden Daten teilautomatisiert verarbeitet. Im Rahmen einer Potenzialanalyse untersuchte das SDSC-BW, wie der Kategorisierungsprozess von Produkten in hierarchische Klassifikationsschemata innerhalb von PIM-Systemen vollautomatisiert werden könnte – und das auf Basis der Beschreibung nebst Produkttiteln.
Als Datengrundlage stellte XPLN eine komplette PIM-Struktur sowie eine breite Masse an Lieferantenlisten zur Verfügung.
Vollautomatisierter Prozess für die Produktklassifizierung
Die Herausforderung: Der Prozess der Multilabel-Produktklassifizierung mit Hilfe von aktuellen Algorithmen der natürlichen Sprachverarbeitung (NLP) benötigt Datensätze mit einer signifikanten Informationsgüte. Wichtig ist auch eine ausgewogene Verteilung über die zur Verfügung stehenden Kategorien, um Modelle für eine Vorhersage im Rahmen der Klassifizierung effizient zu trainieren.
Es galt deshalb, einen vollautomatisierten Prozess für die Produktklassifizierung zu erarbeiten, der auch bei weniger ausgewogenen Verteilungen funktioniert. Parallel zum XPLN-Entwicklerteam mussten die SDSC-BW-Experten verschiedene Strategien verfolgen, wie Daten und Modelle bestmöglich auf- und verarbeitet werden können, um die Rate der korrekten Klassifizierungen zu erhöhen.
Im Rahmen der Analyse untersuchten die Experten detailliert das PIM-System sowie die Lieferantendaten. Der Fokus lag dabei auf der Identifikation von textuellen Informationen mit signifikantem Informationsgehalt und deren Auftreten nebst Gewichtung. So konnte das Team Rückschlüsse auf Modellgenauigkeiten ziehen und eine geeignete Modellauswahl treffen.
Auf Grundlage der untersuchten Algorithmen bereitete das Expertenteam eine ideale Datenbasis mit maximal möglichem Informationsgehalt auf und trainierte drei Modelle für den Einsatz in der sogenannten flachen Produktklassifizierung.
Durch die Zusammenarbeit der Experten und des Entwicklerteams konnte XPLN zeitnah einen erfolgreichen und soliden Prozess für die automatische Produktklassifizierung implementieren. Das Beispiel zeigt: Externe Hilfestellung kann KMU die Türen in die Welt der Datenanalysen und -nutzung öffnen – und das oft leichter als gedacht.