Unter Entity Extraction (EE) verstehen wir die Extraktion von strukturierten Daten aus unstrukturierten Dokumenten, bzw. Texten. Durch die Anwendung von LLMs (Large Language Models) wird die EE gerade revolutioniert. Während in früheren Tagen die EE über komplizierte Regelwerke unter Anwendung von Regulären Ausdrücken umgesetzt wurde, sind es heute tiefe Neuronale Netze. Komplexe Regelwerke müssen immer wieder an neue Dokumenten klassen und Formate angepasst werden. Die Wartung ist relativ kompliziert auf aufwendig. Der Einsatz von LLMs vereinfacht die EE massiv und ermöglicht die Entwicklung von allgemein verwendbaren Lösungen.
Herausforderung
Eingehende Dokumente lösen in Unternehmen verschiedene Geschäftsprozesse aus. Ob Rechnungen, Briefe oder E-Mails – die Verarbeitung der Dokumente benötigt eine Extraktion der wesentlichen Informationen aus den Dokumenten, z.b. Rechnungsempfänger, IBAN, Rechnungsbetrag usw. beim Beispiel einer automatisierten Rechnungsverarbeitung.
Die manuelle Extraktion der Informationen ist zeitaufwändig, fehleranfällig und bindet wertvolle Ressourcen.
Unser Kunde, ein führender DMS-Hersteller, beauftragte uns mit der Entwicklung einer KI-basierten Lösung zur automatischen EE.
Herangehensweise
Um die gewünschte Information aus einem Dokument zu extrahieren, ist eine präzise Anfrage an das LLM notwendig. Dies erfordert sorgfältiges Prompt-Engineering, bei dem die Anfrageformulierung und der Kontext genau definiert werden.
Für optimale Ergebnisse ist ein Training des LLMs auf domänenspezifischen Daten unerlässlich. In unserem Projekt stellte uns der Kunde einen Datensatz relevanter Dokumente und die bereits extrahierten Informationen zur Verfügung. Durch dieses Training werden die LLMs auf die spezifischen Anforderungen der Anwendung angepasst und liefern präzisere und zuverlässigere Ergebnisse.
Ergebnisse
Die Integration von EE mit modernster LLM-Technologie in DMS-Systeme revolutioniert die Dokumentenverarbeitung und eröffnet Unternehmen eine Vielzahl neuer Möglichkeiten zur Optimierung ihrer Geschäftsprozesse. Durch die Automatisierung manueller Tätigkeiten, die Verbesserung der Informationsqualität und -zugänglichkeit sowie die Schaffung neuer Anwendungsfelder steigern Unternehmen ihre Effizienz, Produktivität und Wettbewerbsfähigkeit deutlich.