Das Unternehmen

Das Saarbrücker Unternehmen Satzweiss.com ist seit 2004 am Markt und Lösungsanbieter für Projekte im Bereich von Satz- und Layout. Das Unternehmen setzt auf einen hohen Automatisierungsgrad. Die Kunden kommen aus Industrie, Fachverlagen und öffentlichen Institutionen. Strukturierte Dokumente und standardisierbare, einfache kreative Gestaltung stehen dabei im Fokus der Betrachtung. Typische Datenquellen sind beispielsweise strukturierte Dokumente aus dem Bereich Verwaltung oder juristische Texte, die auf XML-Dateien, HTML-Dateien sowie eingescannten Dokumenten basieren können. Überführt werden die Dokumente frei nach Kundenwunsch in andere Layouts für Print, Web oder auch Sonderformate. Derzeit beschäftigt das Unternehmen 25 Mitarbeitende.

Projektablauf

Zunächst wurde die Problemstellung gemeinsam von den Expert:innen des Mittelstand 4.0 Kompetenzzentrums Saarbrücken und Satzweiss.com erarbeitet. Danach wurde eine Technologierecherche und Machbarkeitsanalyse durchgeführt. Dadurch wurde eine passende Lösung ausfindig gemacht. Um diese im Unternehmen implementieren zu können, wurden verschiedene Anbieter analysiert und Satzweiss.com eine Auswahl zur Verfügung gestellt.

Projektstatus

Planungsphase 100%
Durchführungsphase 100%
Abschlussphase 100%

Eingesetzte Technologien

  • Optical Character Recognition

    OCR bzw. Optical Character Recognition (deutsch optische Zeichenerkennung) beschreibt eine Technologie, die aus Raster- / Bilddateien wie PDFs, JPGs etc. Textdateien erstellen kann. Durch die Umwandlung ist es möglich die gewonnenen Daten zur Weiterverarbeitung oder zur Automatisierung von Prozessen, wie der Rechnungsverarbeitung, zu nutzen.

  • Bildbasierte Klassifikation mittels Objekterkennung

    Im Bereich der Objekterkennung klassifiziert das zugrundeliegende Modell künstlicher Intelligenz Bereiche eines Bildes. Eine Beispielanwendung hierzu ist das autonome Fahren. Damit ein Fahrzeug auf die äußeren Gegebenheiten automatisiert reagieren kann, müssen die Informationen aus Bild- und Videoaufnahmen verstanden werden. Damit ein Fahrzeug auf die äußeren Gegebenheiten automatisiert reagieren kann, müssen die Informationen aus Bild- und Videoaufnahmen verstanden werden. Über Objekterkennung werden so Ampeln, Fußgänger, andere Fahrzeuge etc. identifiziert. Das selbe Prinzip ist auch bei Textdokumenten anwendbar, statt Ampeln werden Überschriften, statt Fußgänger Aufzählungen und statt Fahrzeuge Seitennummern erfasst. Für die Klassifikation werden hier herkömmlicherweise sogenannte Bounding-Boxes benötigt, welche den Bereich auf dem Bild markieren, der zu einer bestimmten Klasse gehört. Textbausteine können somit einer bestimmten Klasse zugewiesen und im nächsten Schritt ein einheitliche Format überführt werden.

    Bildbasierte Klassifikation mittels Objekterkennung

Vorgehen

  • Herausforderung

    Welches Problem sollte gelöst werden?

    Als Satzagentur wandelt Satzweiss.com regelmäßig bereits veröffentlichte Artikel in neutrale Formate um. In diesem neutralen Format sind alle Informationen zu den Inhalten der Dokumente und deren Struktur bekannt, sodass von diesem eine Umwandlung in jegliche neue Formate möglich ist. Um dies zu gewährleisten, markieren die Mitarbeitenden von Satzweiss.com in einem händischen, zeitaufwändigen und sich wiederholenden Prozess einzelne Textabschnitte mit den entsprechenden Klassen (Überschrift, Aufzählung, etc.). Das Ergebnis ist ein einheitliches und medienneutrales Format.

    Monatlich überführt das Unternehmen ca. 800 Dokumente in einheitliche Formate, die zwischen einer und mehreren hundert Seiten aufweisen. Dafür fallen für die händische Klassifizierung der Textbausteine durch Mitarbeitende (auch Tagging genannt) ca. 240 Mitarbeitendenstunden pro Monat an. Ziel ist es, über eine Softwarelösung den Klassifikationsprozess zu automatisieren. Dadurch kann der manuellen Aufwand durch die Mitarbeitenden minimiert werden. Außerdem ermöglicht dies eine potenzielle Erweiterung des Geschäftsmodells, skalierend ohne Mitarbeitendenüberlastung zusätzliche Aufträge annehmen zu können.

  • Analyse

    Welche Informationen wurden betrachtet?

    Die Projektmitarbeitende des Kompetenzzentrums Saarbrücken evaluierten in einer umfassenden Technologierecherche mögliche Lösungswege und bewerteten diese anhand einer Machbarkeitsanalyse. Dazu wurden Bedarfe und Anforderungen bezüglich der Klassifikation von Textbausteinen im konkreten Anwendungsfall mit Satzweiss.com erarbeitet. Die Analyse ergab, dass bereits auf dem Markt existierende Standardlösungen die bestehenden Anforderungen nicht erfüllen. Aus einer Auswahl verschiedener Technologien kristallisierte sich die bildbasierte Klassifikation mittels Objekterkennung als die nötige Technologie heraus, um eine entsprechende Automatisierung des dargestellten Prozesses durch eine Softwareentwicklung zu ermöglichen.

    Analyse

  • Konzept

    Wie wurde das Problem angegangen?

    Im Rahmen des Umsetzungsprojektes wurde eine Architektur entwickelt, um automatisiert eingehende Dokumente zu analysieren und deren Textbausteine zu klassifizieren. Eingangsdokumente gelangen in einem nicht bearbeitbaren Format (PDF) zu Satzweiss.com. Danach wird das Dokument gleichzeitig durch OCR und Künstliche Intelligenz prozessiert. Die OCR-Komponente wandelt den zuvor nicht bearbeitbaren Textinhalt in ein bearbeitbares Format um. Die Künstliche Intelligenz (Objekterkennung) klassifiziert die im Dokument vorhandenen Textbausteine. Durch die geschickte Kombination von OCR und KI wird ein Dokument erstellt, in welchem möglichst alle benötigten Inhalts- und Strukturinformationen enthalten sind. Aufgrund der Komplexität der Klassifikation und dem Anspruch einer nahezu fehlerfreien Klassifikation wird das Ergebnis durch einen Mitarbeitenden von Satzweiss.com überprüft und falls notwendig erweitert oder korrigiert. Die Erkenntnisse durch die Fehlerkorrektur werden dem Algorithmus zur Verfügung gestellt, um im nächsten Durchlauf die korrekte Klassifizierung durchzuführen. Die Erkenntnisse durch die Fehlerkorrektur werden dem Algorithmus zur Verfügung gestellt, um in der nächsten Prozessierung die korrekte Klassifizierung durchzuführen. Mit dem Wissen über den Inhalt und die Klassifikation wird das Dokument durch eine seitens Satzweiss.com entwickelte Softwarelösung in das finale Format überführt. Durch die Umsetzung der Lösungsarchitektur würden voraussichtlich über 85% der im aktuellen Prozess entstehenden Personalaufwände reduziert werden.

  • Validierung

    Wie wurde das Konzept abgesichert?

    Im Rahmen des Umsetzungsprojektes wurden alle Erkenntnisse und Evaluationen in enger Kooperation durch die Technologierecherche, die Machbarkeitsanalyse, die Entwicklung einer Lösungsarchitektur und die Anbieteranalyse Satzweiss.com aufbereitet zur Verfügung gestellt. Dem Geschäftsführer liegen alle notwendigen Informationen als Grundlage für die fundierte Investitionsentscheidung vor.

    Validierung

  • Ergebnis

    Welche Lösungen wurden erzielt?

    Durch die Einführung der Automatisierung können absehbar signifikante Zeit- und Personalaufwände eingespart werden. Das Unternehmen findet sich in einer für mittelständische Unternehmen klassischen Problemstellung wieder. Eine reine Eigenentwicklung stellt einen zu großen Aufwand für diesen Anwendungsfall dar, somit kann zwischen einer anpassbaren Software als Grundlage für weitere Entwicklungen oder einem Zukauf einer auf den Prozess zugeschnittenen Individuallösung entschieden werden.

Erfolgsfaktoren

Mensch-zentrierte KI

Hohe Qualität der Trainingsdaten

Enge Kooperation zwischen Anbieter und Satzweiss.com (klare Anforderungen)

Benutzer-freundlichkeit zum schnellen Bearbeiten der Dokumente

Künstliche Intelligenz (KI) ist bereits Bestandteil unseres Alltags geworden. Möchten auch Sie wissen, wie sich durch KI das Potential in der betrieblichen Praxis steigern lässt? Für diese und alle weiteren Fragen rund um das Thema KI in der Geschäftswelt unterstützen Sie unsere KI-Trainer:innen am Mittelstand 4.0-Kompetenzzentrum Saarbrücken.

Sie wollen mit dem Mittelstand-Digital Zentrum Saarbrücken in Kontakt treten? Haben Sie Fragen rund um die angewendeten Technologien?

Hier finden Sie Ihren Ansprechpartner:

Tobias Greff

Mittelstand-Digital Zentrum Saarbrücken

Telefon: +49 (681) 85787-350
E-Mail: t.greff@digitalzentrum-saarbruecken.de
Webseite: www.digitalzentrum-saarbruecken.de

Roman Jansen-Winkeln

Satzweiss.com
WordPress Cookie Plugin von Real Cookie Banner