Automatische Klassifikation von Produkten und Warengruppen

Machine Learning – Produkte und Warengruppen werden klassifiziert, um einordnen zu können, um was für ein Produkt es sich eigentlich handelt:

Ist das Butter oder Margarine?

Es gibt viele verschiedene, auch internationale, Organisationen, die Standards für solche Warengruppen- und Klassifikationssysteme bereitstellen, beispielsweise:

  • Global Product Classification (GPC)
  • eCl@ss
  • United Nations Standard Products and Services Code (UNSPSC)
  • FDA Product Classification

Die Standardisierung von Warengruppen hilft Unternehmen dabei, die Kommunikation sowohl intern, als auch zwischen den Unternehmen zu verbessern und Missverständnisse bzgl. der Art eines Produktes z.B. im Beschaffungsprozess zu vermeiden.
Typischerweise funktionieren diese Klassifikationssysteme so, dass jeder Warengruppe eine eindeutige Nummer oder ID zugeordnet wird. Oft wird eine Hierarchie von übergeordneten Kategorien angeboten, die den Anwender bei der Suche und Auswahl der Warengruppe unterstützt.

An einem einfachen Beispiel (Butter und Margarine) lässt sich das Zuordnen einer Kategorie veranschaulichen:

Man erkennt an diesem Beispiel deutlich, dass sich die Kategorien der unterschiedlichen Systeme nicht immer ein-zu-eins aufeinander abbilden lassen. Die Granularität und die Vollständigkeit der Warengruppen sind oft unterschiedlich ausgeprägt. So fehlt z.B. in UNSPSC die Kategorie „Butter“, während es in eCl@ss keine Kategorie „Margarine“ gibt.

Um eine große Anzahl von Artikeln jeweils einer Kategorie des Klassifikationssystems zuzuordnen, wäre in vielen Fällen ein erheblicher manueller Aufwand nötig. Jeder Artikeldatensatz muss angeschaut und von Hand der passenden Nummer zugeordnet werden. Sollen mehrere Warengruppensysteme (z.B. GPC, eCl@ss, UNSPSC wie in dem Beispiel oben) gepflegt werden, so müssen entsprechend mehrere dieser Nummern herausgesucht und zugeordnet werden. Bei manchen Kunden besteht die Herausforderung darin, sehr viele Artikel auf einmal zu klassifizieren, bei anderen Kunden muss gewährleistet werden, dass ein kontinuierlicher Strom von neuen Artikeldatensätzen möglichst zeitnah klassifiziert wird. Bei einigen Kunden wird sogar beides benötigt.

An dieser Stelle kommt der Service b-classified zum Einsatz: Anstatt alle Artikel manuell zu klassifizieren, wird nur noch eine vergleichsweise kleine Teilmenge des Sortiments, die sogenannte Trainingsmenge, betrachtet. Die Trainingsmenge wird einmal manuell klassifiziert, dann in den Service b-classified hochgeladen und dort ausgewertet. Auf Basis dieser Auswertung und dem daraus „erlernten“ Modell, kann b-classified fortan selbständig beliebige weitere Artikel klassifizieren. Auch ein kontinuierlicher Strom von Artikeln kann damit automatisch, also sehr schnell und ohne weitere manuelle Arbeit, klassifiziert werden. Der einmalige Aufwand, zu Beginn die Trainingsmenge händisch zu klassifizieren, beträgt nur einen Bruchteil dessen, was andernfalls für das manuelle Klassifizieren der gesamten Artikelmenge notwendig gewesen wäre.

In diesem konkreten Anwendungsfall können mit dem Einsatz von Machine Learning Zeit- und Kosteneinsparungen bei der Klassifizierung von Produkten erzielt und auch nachvollziehbar transparent dargestellt werden.


Wir zeigen Ihnen auf, wie Sie mit Machine Learning Nutzen für Ihr PIM generieren.

Sprechen Sie uns an!