So lief es früher:
OGE (Open Grid Europe GmbH) ist einer der führenden Fernleitungsnetzbetreiber Europas. Ein Projekt zum Prüfen des Fernleitungsnetzes auf seine Wasserstofftauglichkeit stellt die Verantwortlichen vor große Herausforderungen. Um diese Tauglichkeit beurteilen zu können, müssen sie die gesamte technische Dokumentation aller verbauten Materialien auswerten. Die Daten liegen nur in Form eingescannter Dokumente vor. Dokumente, die teilweise bis ins Jahr 1940 zurückreichen. Dazu gehören Herstellerangaben, Bauteillisten, Materialbestandteile sowie technische und chemische Eigenschaften aus Prüfzeugnissen. Das zuverlässige Extrahieren und Verfügbarmachen relevanter Informationen ist die Voraussetzung, um notwendige Umrüstungen für den Infrastrukturwechsel kostenoptimal durchführen zu können. Die Datenmenge und die Heterogenität des Ausgangsmaterials machen eine manuelle Auswertung unmöglich.
Dann kommt KI ins Spiel:
KI-Anwendungen ermöglichen es – trotz des heterogenen Ausgangsmaterials – große Teile der Dokumentenauswertung zu automatisieren. Schlüsselfunktionen sind dabei die sogenannte Key Value Detection sowie die Tabellenextraktion. Einen großen Mehrwert bringt eine KI auch bei der Schrifterkennung, vor allem bei schlechten Scan- oder Dokumentqualitäten oder Formularen mit handschriftlichen Einträgen.
Fachleute setzen die Key Value Detection insbesondere bei der Extraktion spezifischer Informationen ein, um diese in eine Datenbank überführen zu können. So wird zu einem bekannten Schlüssel (Key), wie beispielsweise einem „Hersteller“ oder „Prüfgegenstand“, der passende Wert (Value) in der näheren Umgebung im Dokument gesucht. Da bestimmte Seiten – beziehungsweise deren Form – häufiger in Dokumenten vorkommen, hilft eine vorgeschaltete Seitenklassifikation dabei, die Ergebnisse zu verbessern. Abhängig von der Klasse wird die Key-Value-Extraktion entsprechend konfiguriert, wodurch Suchbereiche präzisiert und Extraktionsfehler minimiert werden.
Bei der Extraktion aus Tabellen kommt es darauf an, tabellarische Strukturen – auch ohne eine gezeichnete Tabelle – zu erkennen. Anhand der erkannten Tabellenstruktur werden die Informationen aus einer Zelle in Zusammenhang mit einer vorhandenen Spalten- und/oder Zeilenbeschriftung gebracht. Die Kombination aus Spaltenbeschriftung und Zellwert ergibt dann wieder ein Key-Value-Pärchen, welches extrahiert wird.
So ist es jetzt:
Die eingesetzten KI-Verfahren sorgen dafür, dass die Daten aus den eingescannten PDF-Dateien in strukturierter Form vorliegen. Die Verantwortlichen entwickelten ein Datenschema für die zu extrahierenden Informationen und bauten eine Datenbank auf. Auf die Datenbank haben verschiedene Systeme Zugriff. Zusätzlich ist der gesamte Dokumentenbestand mittels Suchinterface vollständig durchsuchbar, so dass auch nicht extrahierte Informationen einfach auffindbar sind.
Dr. Daniel S. Bick, Ansprechpartner OGE
Kontakt
Sie haben Fragen zum Thema Künstliche Intelligenz?
Sie überlegen, welche Möglichkeiten KI Ihrem Unternehmen eröffnen kann? Sie wollen mehr über Anwendungsfälle und Technik erfahren? Wir haben keine Standardantworten im Gepäck – aber wir bringen unser Fachwissen, unsere Neugier auf Ihr Geschäft und unsere Leidenschaft für Technologie mit. Wir freuen uns darauf, mit Ihnen ins Gespräch zu kommen.
KontaktKI-Studie
Die KI-Studie: eine Bestandsaufnahme zwischen Möglichkeiten, Maßnahmen und Misstrauen
Über 320 Unternehmensentscheider und 1.000 Endkunden gaben uns einen Einblick in ihre Vorstellungen, Vorurteile und Vorhaben rund um KI. Der KI-Report „Eine Bestandsaufnahme“ fasst die zentralen Ergebnisse zusammen.
Mehr erfahrenKI-Vorgehens- modell
Das KI-Vorgehensmodell: Building AI-based Systems
Das Entwickeln datengetriebener KI-Anwendungen benötigt im Vergleich zu klassischen IT-Lösungen eine andere Projektstruktur und ein anderes Fachwissen der Beteiligten. Unser Ansatz des „Building AI-based Systems“ wird diesen Unterschieden gerecht.
Mehr erfahren