SLIMDOC
Trotz zunehmender Digitalisierung werden Dokumente wie Rechnungen, Geschäftsberichte, Beschwerden, Formulare und Verträge weiterhin häufig genutzt. SLIMDOC adressiert neuartige KI-Modelle für automatisiertes Dokumentverstehen, also für die korrekte Auswertung solcher unstrukturierten Dokumente, noch immer ein Kernproblem effizienter Geschäftsprozesse. Besonders herausfordernd ist es, multimodale Dokumente zu verstehen: Diese besitzen nicht nur komplexe textuelle Inhalte oder Layouts, sondern enthalten neben Text auch Bilder wie Grafiken oder Fotos. SLIMDOC möchte KI-Modelle entwickeln, die solche Dokumente zuverlässig analysieren, und zwar leichtgewichtig: Einerseits, indem teures Datensammeln und händische Annotation vermieden werden, und andererseits durch kompaktere Modellarchitekturen, die eine zeit- und energiesparendere Inferenz gestatten. Hierzu werden drei Forschungsthemen adressiert: (1) Distillation: SLIMDOC möchte aus Large Language Models, die für ihre erstaunlichen Problemlösefähigkeiten bekanntermaßen Milliarden von Parametern nutzen, kleinere Modelle extrahieren, die auf den jeweiligen Extraktions-Task spezialisiert sind. (2) SLIMDOC möchte Dokumente ähnlich zu denen eines Use Cases datenschutzkonform synthetisieren, so dass KI-Experten wertvolle Daten für Off-Premise-Training und Optimierung gewinnen. (3) SLIMDOC möchte Text- und Bildinformation (welche bislang eher als unterstützendes Signal dient) auf neuartige Weise kombiniert betrachten, so dass sich auch spezialisierte multimodale Informationsextraktions-Tasks lösen lassen.
Dieses Projekt wird in Zusammenarbeit mit der R+V Versicherung AG, der Insiders Technologies GmbH und der Doxis GmbH durchgeführt.
Es wird durch das Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) gefördert (FKZ: 13HAW15PX4).
Projektleitung:
Prof. Dr. Adrian Ulges