KÜNSTLICHE INTELLIGENZ AN DER ZBW

Die Anwendung von Methoden aus der künstlichen Intelligenz spielt eine bedeutende Rolle in einigen zentralen Arbeitsfeldern in der ZBW. Um Informationen kontinuierlich zu erschließen, sie bedarfsorientiert zu strukturieren und in ihren Zusammenhängen zu analysieren, greift die ZBW neueste Erkenntnisse, Methoden und Werkzeuge der Künstlichen Intelligenz auf, prüft sie auf deren Praxistauglichkeit und übersetzt sie in eigene Anwendungen bzw. nutzt sie für deren Weiterentwicklung.

Konkret betreibt die ZBW angewandte Forschung im Bereich Machine Learning (Maschinelles Lernen) und arbeitet an folgenden Forschungs- und Entwicklungsthemen:

Literatur erschließen

Die Sacherschließung, also das Annotieren von Literaturressourcen mit semantischen Angaben ist eine Kernaufgabe der ZBW, um das Auffinden relevanter Literatur im Bestand zu erleichtern. Aufgrund der digitalen Publikationsflut ist es kaum mehr möglich, alle Ressourcen intellektuell zu annotieren, so dass über Automatisierungsstrategien nachgedacht werden muss. Aus Sicht des Machine Learning ist die Sacherschließung eine sogenannte Multi-Label-Classification-Herausforderung, und mit dem Aufschwung der Künstlichen Intelligenz in den letzten Jahren stehen nun immer mehr Methoden, auch als Open-Source-Software, zur Lösung dieser Aufgabe bereit.

Insbesondere Methoden aus dem Deep Learning (d.h. die Verwendung multipler Schichten von neuronalen Netzen) erfreuen sich aktuell großer Aufmerksamkeit. Eine Studie zur automatischen Sacherschließung an der ZBW ergab, dass neuronale Netze unter den untersuchten Umständen allen damals verfügbaren klassischen Verfahren (wie Nearest-Neighbour-Klassifikatoren oder Support-Vektor-Maschinen) überlegen waren, und die Qualität der Ergebnisse auf vergleichbarem Niveau war, wenn nur der Titel an Stelle des Volltexts zur Sacherschließung verwendet wurde. Darüber hinaus konnte gezeigt werden, dass neuronale Netze, die nur Titeldaten verwenden, unter bestimmten Umständen sogar bessere Ergebnisse liefern als Volltext-Modelle.

Ergebnisse aus der angewandten Forschung an der ZBW haben ebenfalls gezeigt, dass eine Kombination mehrerer Verfahren bessere Ergebnisse bringt, weil so die Stärken einzelner Verfahren weiterhin zum Tragen kommen, ihre Schwächen jedoch weniger ins Gewicht fallen. Machine-Learning-Verfahren können zusätzlich dazu genutzt werden, die Qualität des erwarteten Outputs einzelner Verfahren für verschiedene Inputs abzuschätzen und entsprechend zu entscheiden, welches Verfahren auf welche Ressource angewendet werden soll. Neue Forschungsergebnisse zu Methoden sowohl aus dem statistischen oder lexikalisch-semantischen Bereich als auch für neuronale Netze fließen stetig in die Anwendungen ein.

Die Herausforderung für den Einsatz in der Praxis besteht darin, diese Methoden aus der KI an den Bibliothekskontext der ZBW, an das kontrollierte Vokabular und die Metadaten anzupassen und ausreichend Trainingsdaten für die Methoden zu finden. In dem Vorhaben AutoSE (Automatische Sacherschließung) befasst sich die ZBW mit der Frage, wie sich die im Hause entwickelten Machine-Learning-Lösungen zur automatisierten Sacherschließung nachhaltig als ein produktives Verfahren in den bibliothekarischen Erschließungsprozess integrieren lassen und wie diese im laufenden Betrieb stetig weiterentwickelt werden können.

Zusammenhänge aufzeigen

Neben der automatisierten Sacherschließung bieten die Methoden der Künstlichen Intelligenz auch Entwicklungsmöglichkeiten für innovative nachgelagerte Anwendungen. Mithilfe des Natural Language Processing ist es beispielsweise möglich, Gemeinsamkeiten und Unterschiede zwischen einer bestehenden Literatursammlung und einem einzelnen Dokument hervorzuheben.

Nutzende der ZBW verwenden bei ihrer Literaturrecherche üblicherweise die Suchmaschine Econbiz. Sie formulieren Suchanfragen und erhalten eine sortierte Liste von Dokumenten, die zu ihrer Suchanfrage passen. Dabei wird das individuelle Wissen des Nutzenden nicht berücksichtigt.

Unter Verwendung neuster Erkenntnisse der Computerlinguistik werden an der ZBW gegenwärtig Prototypen entwickelt, die diese Herausforderung meistern können. Mithilfe von Natural-Language-Processing-/Understanding-Methoden können Informationen darüber geliefert werden, wie sich ein neuer Text in die bereits gelesenen Dokumente einordnet, die Nutzenden bei der Beurteilung eines Suchergebnisses helfen. Ist der Inhalt beispielsweise komplett neu, oder bestehen Überschneidungen mit bereits gelesenen Dokumenten? Die hierbei verwendeten Algorithmen leiten aus einzelnen Wörtern und Sätzen der Texte sowie deren Beziehungen komplette Textzusammenhänge und Sachverhalte ab. Sie identifizieren aussagekräftige und passende Schlagwörter und erkennen, ob die damit verbundenen Konzepte bereits bekannt sind.

Lernen aus Text- und Graphdaten

Gegenwärtig erforscht die ZBW auch die Verwendung neuronaler Netze für weitere Bausteine der Literatursuche. Gegenstand der Untersuchungen sind insbesondere die Einsatzmöglichkeiten und die beeinflussenden Faktoren (z.B. Netzwerkstruktur oder der Titel einer Publikation) auf die entwickelten Modelle. Die bisherigen Entwicklungen für Literatur-Empfehlungssysteme können beispielsweise auf Basis der zitierten Werke auf möglicherweise fehlende Zitationen hinweisen oder auf Basis bereits erschlossener Deskriptoren weitere Deskriptoren empfehlen.

Ein weiteres Forschungsfeld beschäftigt sich mit dem Einsatz von Wortvektoren und -matrizen in der Literatursuche. Mit Wortvektoren lassen sich semantische Ähnlichkeiten und Zusammenhänge zwischen verschiedenen Worten erfassen. Sie können mit Hilfe von maschinellem Lernen aus großen Datenmengen von unstrukturiertem Text erzeugt werden. Mit der Erweiterung zu Wortmatrizen kann zudem die Reihenfolge der Worte berücksichtigt werden, welche bei klassischen Wortvektoren meist vernachlässigt wird. Beide Konzepte werden auf Ihren Einsatz zur verbesserten Beantwortung von Anfragen in Suchmaschinen untersucht.

Analyse wissenschaftlicher Innovationsprozesse

Die bestehenden Metadatenbestände an der ZBW und in Partnereinrichtungen eignen sich ebenfalls hervorragend für die Erforschung maschineller Lernverfahren. Im Projekt Q-Aktiv beschäftigt sich die ZBW mit dem Lernen von Repräsentationen in dynamischen Netzwerken aus bibliographischen Metadaten. Das Ziel von Q-Aktiv ist es, eine Repräsentation für die Konzepte eines kontrollierten Vokabulars zu erlernen. Als Datengrundlage wird neben den Forschungspapieren auf die Netzwerkstruktur zwischen Autor*innen, Konzepten, Zeitschriften und Institutionen zurückgegriffen. Bisher wurden verschiedene Techniken zum Erlernen von Repräsentationen für Konzepte verglichen. Aktuell wird diese Methodik für dynamische Netzwerke, die sich beispielsweise über die Zeit verändern, erweitert, um Wissenschaftsdynamiken zu analysieren und ggf. vorherzusagen zu können.

Mit diesen Anpassungen existierender KI-Verfahren an den bibliothekarischen Kontext leistet die ZBW den Transfer in die Praxis. Die Forschung und konkrete Anwendung auf bestehende Produkte und Dienstleistungen der ZBW liefert wertvolle Erkenntnisse und führt zu einem noch besseren Zugang zu wirtschaftswissenschaftlich relevanten Informationen.

Bei der Bearbeitung dieser Themen pflegen wir den Austausch mit anderen Bibliotheken und Forschungsinstitutionen. Die anwendungsbezogenen und aus der informationswissenschaftlichen Community resultierenden Erfahrungen und Erkenntnisse speziell im Machine Learning bringt die ZBW gern in aktuelle Diskurse und Debatten zum Thema Informationsversorgung und Künstliche Intelligenz ein.

Connect & Collect: KI-gestützte Cloud für die interdisziplinäre vernetzte Forschung und Innovation für die Zukunftsarbeit

Das Projekt Connect & Collect (CoCo) koordiniert das Netzwerk der regionalen Kompetenzzentren der Arbeitsforschung. Die Forschungs- und Entwicklungsarbeiten zielen auf eine „Cloud der Arbeitsforschung“, die die interdisziplinäre Kooperation unterstützt, technologische und soziale Innovationen voranbringt und Strukturen für einen nachhaltigen Wissenstransfer bereitstellt.

Zur Unterstützung der Kompetenzzentren entwickelt das Projekt CoCo eine Infrastruktur mit KI-gestützten Werkzeugen und innovativen Methoden, die einen neuen Zuschnitt der interdisziplinären Arbeitsforschung ermöglichen. Es entsteht eine „Cloud der Arbeitsforschung“, die die Kompetenzzentren und weitere Anspruchsgruppen zusammenbringt und Gelegenheit zur Kooperation und Vernetzung bietet. Ein wichtiger Bestandteil ist ein Daten- und Wissensspeicher, der die gemeinsame Nutzung von Forschungsdaten, Wissen und Ressourcen ermöglicht. Darüber hinaus unterstützen KI-basierte Werkzeuge die vernetzte Arbeit und den Ergebnistransfer in die Wirtschaft.

Das Projekt startet in Kooperation mit drei Fraunhofer-Instituten, dem DIE und der ZBW im März 2021 (Laufzeit 4 Jahre); ZBW ist führender Technologiepartner.

Projektpartner:

  • Fraunhofer-Institut für Arbeitswirtschaft und Organisation IAO
    Koordinator, Vernetzung und FuE zu Zukunftsarbeit, Konzeption der Infrastruktur, Entwicklung KI-Module
    Stuttgart
  • ZBW – Leibniz-Informationszentrum Wirtschaft
    Digitale Informationsinfrastrukturen, Open Science, Forschung zu Anreizsystemen, Entwicklung der Infrastruktur
    Kiel, Hamburg
  • Fraunhofer-Institut für Fabrikbetrieb und –automatisierung IFF
    sozio-technische Wissens- und Kollaborationssysteme, Konzeption/Entwicklung des Daten- und Wissensspeichers
    Magdeburg
  • Fraunhofer-Zentrum für Internationales Management und Wissensökonomie IMW
    Zielbild, Geschäftsmodelle, Konzeption/Entwicklung der Cloud der Arbeitsforschung, Veranstaltungen für Kompetenzzentren
    Leipzig
  • Deutsche Institut für Erwachsenenbildung – Leibniz-Zentrum für Lebenslanges Lernen e.V. (DIE)
    Lebenslanges Lernen, Netzwerkmoderation, kontinuierliche Evaluation
    Bonn

Literatur zum Thema