AUTOMATISIERUNG DER ERSCHLIESSUNG MIT METHODEN DER KÜNSTLICHEN INTELLIGENZ

Die ZBW sammelt und erschließt wirtschaftswissenschaftliche Literatur und Fachinformationen aus aller Welt. Um deren Auffindbarkeit zu gewährleisten, bereitet die ZBW sie formal und inhaltlich auf und versieht sie mit hochqualitativen Metadaten. Diese dienen dem ZBW-eigenen Fachportal EconBiz als Datenbasis und stehen darüber hinaus Dritten zur Nachnutzung zur Verfügung.

Die Anzahl der Publikationen, insbesondere digitaler Publikationen, steigt auch in den Wirtschaftswissenschaften. Gleichzeitig entstehen durch aktuelle Entwicklungen in der Informatik und den Informationswissenschaften neue technologische Möglichkeiten, die wir aufgreifen und in unsere Erschließungsstrategie integrieren, um die Abdeckung und die Qualität unserer Metadaten auch weiterhin sicherzustellen.

Die Automatisierung verschiedener Abläufe im Erschließungsprozess und deren lückenlose Verzahnung mit der intellektuellen Formal- und Sacherschließung ist an der ZBW eine Daueraufgabe. Wir evaluieren fortlaufend maschinelle Verfahren, entwickeln sie im Rahmen eigener Forschungsarbeit neu oder weiter und überführen sie in den Produktivbetrieb.

Automatisierung der Sacherschließung (AutoSE)

In einem forschungsbasierten Projekt (AutoIndex, bis 2018) wurde an der ZBW auf der Basis von Open-Source-Lösungen aus dem Machine Learning eine Eigenlösung für die Sacherschließung entwickelt, die mehrere assoziative und lexikalische Verfahren in einem Fusion-Ansatz zusammenführt und damit eine höhere Performanz erzielt. Die Lösung nimmt sogenannte „Short Texts“ (Titel, Autoren-Keywords) als Input und generiert daraus Vorschläge für Deskriptoren aus dem Standardthesaurus Wirtschaft (STW), die die Ressource adäquat zusammenfassen. Durch diverse regelbasierte Nachverarbeitungsschritte wird die Qualität der so erzeugten Metadaten weiter erhöht und gesichert. Des Weiteren werden anlassbezogen von einer Gruppe erfahrener Sacherschließer*innen stichprobenartig intellektuelle Bewertungen durchgeführt, welche uns ebenfalls als Grundlage für eine kontinuierliche Weiterentwicklung der bestehenden Lösung dienen.

Forschung und Entwicklung

Über die bereits eingesetzten Verfahren hinaus evaluieren wir ständig aktuelle Ergebnisse aus dem Gebiet der Künstlichen Intelligenz, etwa aus dem Deep Learning. Neben dem Generieren von Deskriptorenvorschlägen selbst könnte man neuronale Netze auch verwenden, um im Rahmen des Fusion-Ansatzes das Zusammenspiel der einzelnen Verfahren zu optimieren, und um eine automatisierte Qualitätsabschätzung auf Dokumentebene vorzunehmen, so dass die zu erschließenden Dokumente jeweils dem am besten für sie geeigneten (maschinellen oder intellektuellen) Verfahren zugeführt werden können.

Weitere Themen, die sich zur Automatisierung anbieten, sind z.B. die Extraktion von Strukturelementen aus elektronischen Volltexten zur Anreicherung von Metadatensätzen für die Formalerschließung, oder die Extraktion häufig auftretender Terme aus der automatisierten Sacherschließung heraus als Kandidatenvokabular für die Weiterentwicklung des Standardthesaurus Wirtschaft (STW). In beiden Bereichen bestehen bereits erste Ergebnisse aus studentischen Abschlussarbeiten.

Transfer in die Praxis

Wir befassen uns insbesondere mit der Frage, wie wir die an der ZBW erarbeiteten Forschungsergebnisse für die Erschließung systematisch und nachhaltig als nutzbare Instrumente im produktiven Arbeitsalltag zur Verfügung stellen können. Hierfür identifizieren wir die betroffenen Stakeholder, analysieren die notwendigen Eigenschaften einer geeigneten Software-Architektur für den Einsatz der von uns entwickelten Lösungen, und erstellen einen Meilensteinplan für deren Umsetzung in Kooperation mit den betroffenen Einheiten im Haus und im Austausch mit nationalen und internationalen Partnern, die sich mit ähnlichen Fragestellungen und Herausforderungen befassen.

Publikationen

Veröffentlichungen der ZBW zum Thema finden Sie im ZBW-Publikationsarchiv. Bitte suchen Sie nach dem Stichwort Automatic Subject Indexing.

Für weitere Vorträge und Veröffentlichungen zum Thema siehe auch Publikationsliste Anna Kasprzik.