Dokumenten-Tagging

Zu den Produktinformationen, die in Unternehmen verarbeitet werden, gehören in den meisten Fällen auch Dokumente, wie z.B. PDF-Dateien, Word-Dokumente, Excel-Tabellen etc. Bei diesen Dokumenten handelt es sich häufig um Verbraucherinformationen, Betriebsanleitungen, Gefahrenhinweise, Broschüren usw. aber das Thema Dokumente ist noch weitaus vielfältiger. Handelsunternehmen stellen ihren Lieferanten oft zahlreiche Dokumente zur Verfügung, die für die Logistik und sonstige Prozesse entlang der Lieferkette wichtig sind. Das können Formulare und Anleitungen sein, aber z.B. auch rechtliche Dokumente.

Mit Tagging die richtigen Dokumente schnell verfügbar machen!

Durch entsprechendes Tagging soll es Kunden, Mitarbeitern und Lieferanten leicht gemacht werden, die richtigen Dokumente möglichst schnell zu finden.

Manchmal müssen die Dokumente konkreten Artikeln zugeordnet werden, damit sie mittels der Artikelnummer überhaupt gefunden werden können. In anderen Fällen sollen die Dokumente nach bestimmten Themenbereichen identifizierbar sein und deshalb entsprechend getaggt werden.

Beim Tagging von Dokumenten handelt es sich um eine besondere Variante der Klassifizierung

Jedem Dokument können nämlich gleich mehrere Labels oder Tags zugeordnet werden. Im maschinellen Lernen spricht man in diesem Zusammenhang von der sogenannten Multi-Label-Klassifizierung. Im Unterschied zur Multi-Class-Klassifizierung, bei der immer exakt eine Klasse ausgewählt werden soll, gibt es bei der Multi-Label-Klassifizierung keine Einschränkung, wie viele Labels dem Dokument zugeordnet werden.

Muli-Label-Klassifizierung

Selbstverständlich wird auch die Multi-Label-Klassifizierung von b-classified unterstützt. Das Vorgehen ist hier ähnlich wie bei der automatischen Klassifizierung nach Warengruppen. Auf Basis einer Trainingsmenge, also einer Menge von manuell getaggten Dokumenten, wird die Klassifizierungs-Engine in b-classified sozusagen „angelernt“ und kann dann unbekannte Dokumente automatisch mit den passenden Tags versehen.

Manuelles Taggen von Dokumenten ist fehlerbehaftet!

In diesem Fall ist die Aufwandsersparnis sicherlich ein wichtiger Beweggrund für den Einsatz von b-classified. Jedoch auch die Qualität und die Zuverlässigkeit lassen sich dadurch steigern. Manuelles Taggen von Dokumenten ist nämlich durchaus fehlerbehaftet. Hinzu kommt, dass verschiedene Mitarbeiter oft unterschiedlich taggen. Durch konsequente Automatisierung lässt sich ein einheitlicheres und besseres Ergebnis erzielen.


Wir zeigen Ihnen auf, wie Sie mit Machine Learning Nutzen für Ihr PIM generieren.

Sprechen Sie uns an!