Auslesen von Informationen aus unstrukturierten Dokumenten

PDF-Dokumente enthalten wertvolle Informationen, welche jedoch nur schwer für automatisierte Verarbeitung genutzt werden können. Unsere Extraktor Anwendung erlaubt das maschinelle Auslesen von Informationen aus PDF, wie z.B. Maintenance Planning Data (MPD) aus Maintenance Specification Documents in der Luftfahrtindustrie.

Mit einer intuitiven Benutzeroberfläche werden Bereiche in den PDF-Dateien definiert, welche automatisch ausgelesen werden sollen. Eine Textmustererkennung erlaubt es, Kriterien für die Gruppierung der ausgelesenen Daten zu definieren. Da solche Dokumente in der Regel periodisch von den OEM publiziert werden, können einmal vorgenommene Definitionen als Konfigurationen gespeichert und wieder verwendet werden.

Die extrahierten Daten werden als Tabellen in Excel ausgegeben. Für regelmässig wiederkehrende Extraktionen bietet das System ausserdem einen Revisionsvergleich, der in den Excel-Tabellen die geänderten Werte hervorhebt.

Der Extraktor ist modular aufgebaut und erlaubt es uns, anwendungsspezifische Anpassungen schnell und flexibel zu realisieren. Zu den implementierten Dokumenten gehören heute Teilenummern aus Teilekatalogen (IPD) und Maintenance Planning Data (MPD) von verschiedenen Herstellern und für verschiedene Kunden.

Neben dem Produkt Extractor bieten wir zusammen mit unserem Service-Partner eDOC Aviation Service sowohl einmalige als auch wiederkehrende Extraktionen inklusive Qualitätssicherung auch als Service an.

eDOC Aviation. All rights reserved Impressum

Zum schliessen in das Bild klicken