Artificial Intelligence (AI) Research Assistants und ihre Bedeutung für Informationsinfrastrukturen

Sylvia Kullmann

Forschungsvorhaben beginnen mit den Gedanken, Erkenntnissen und Ergebnissen anderer Forschender. Um die für die eigene Fragestellung relevanten Beiträge zu identifizieren, steht am Beginn jedes Forschungsprojekts daher in der Regel eine gründliche Literaturrecherche zur Erhebung des Forschungsstands in den die eigene Forschungsfrage eingeordnet wird. Sorgfältig ausgeführt, ist dieser Prozess in den allermeisten Fällen zeitintensiv und mühsam. Eine Reihe von einzelnen Arbeitsschritten müssen durchlaufen werden: Die richtigen Rechercheplattformen müssen ermittelt, alle geeigneten Suchbegriffe gefunden und an die Rechercheplattformen angepasst werden, es müssen konkrete Suchanfragen formuliert, Suchergebnisse um Dubletten bereinigt und anschließend einzeln auf ihre Relevanz für die eigene Fragestellung untersucht werden. Je nach Forschungsgebiet und Fragestellung können da leicht ein paar Wochen ins Land gehen. Generationen von Forschenden haben dies durchlaufen. Zunächst mit Hilfe von Zettelkästen in Bibliotheken, dann unterstützt durch digitale Bibliothekskataloge und fachspezifische Literaturdatenbanken und schließlich zusätzlich durch webbasierte Informationsinfrastrukturen in Form von (wissenschaftlichen) Suchmaschinen wie Google Scholar oder BASE, Open Access-Server wie zenodo oder pedocs, Preprint-Angebote sowie Social Media-Netzwerke. Die Liste an möglichen Recherchequellen ist inzwischen sehr lang und jede Plattform erfordert spezielles Wissen über den Aufbau der Erschließungs- und Suchmechanismen, um optimale Suchergebnisse erzielen zu können.

KI-Anwendungen bringen nun immer mehr Bewegung in die bisher praktizierte Art und Weise der Literatursuche und -verarbeitung. AI Research Assistants wie Iris.ai, Scispace Copilot oder das u. a. auf GPT-3 basierende Elicit drängen auf den Markt und versprechen durch einen völlig neuen Ansatz bei der Suche und Auswertung wissenschaftlicher Literatur große Erleichterungen für Forschende. Statt viel Zeit in die Auswahl der richtigen Recherchequellen und Suchwörter zu stecken und diese dann in eine optimale Suchanfrage zu übersetzen, soll durch natürlichsprachlich formulierte Fragen und Forschungskontexte die richtige Literatur per Knopfdruck geliefert werden. Im Vergleich zum bisherigen Vorgehen soll sich der Rechercheprozess verkürzen, denn, wie es in einem Werbevideo von Iris.ai heißt, „Not all of us speak library.“ [1]. Das Einarbeiten in Recherchewerkzeuge und -vokabulare entfällt. Doch nicht nur das. Forschende werden in ihrem gesamten Workflow, also auch bei der Auswertung und Weiterverarbeitung der Suchergebnisse unterstützt. Relevanzbewertungen hinsichtlich der Forschungsfrage, Gruppierung von Papern mit ähnlichem Fokus zur Entscheidungsunterstützung, automatische Zusammenfassungen – die Anbieter haben einiges zu bieten und versprechen, das Filtern der Suchergebnisse sowie die Analyse und Auswahl der Literatur für die persönliche Leseliste erheblich zu beschleunigen.

Insgesamt soll die aufwändige Erhebung des Forschungsstands KI-gestützt also deutlich schneller und effektiver werden. Klar ist: Ebenso wenig wie die Trefferlisten im bisherigen Literaturverarbeitungsprozess tatsächlich nur die relevante Literatur enthalten, können KI-gestützte Recherchen und Auswertungen ohne weitere Bearbeitung in die eigene Publikation übernommen werden. Die kritische Durchsicht des Outputs ist auch bei der Verwendung von AI Research Assistants unerlässlich, um am Ende einen sauberen Forschungsstand zu haben. Es ist also nicht alles Gold was glänzt. Je nach Fachgebiet und der jeweils verfügbaren Literaturbasis können die Ergebnisse von AI Research Assistants in ihrer Qualität auch erheblich variieren. Die Entwicklung der KI-Funktionen ist hier noch nicht am Ende. Davon sind auch die Entwickelnden selbst überzeugt, was sich z. B. in einer klar formulierten Bitte von Elicit ausdrückt, die Genauigkeit der Ergebnisse aktuell bei etwa 80 bis 90% einzuschätzen [2]. Iris.ai gibt hier einen Wert von 85% an [3].

Wie auch immer. Für die Informationswissenschaft sind AI Research Assistants in jedem Fall aus verschiedenen Gründen interessant und unbedingt beachtenswert. Im Zentrum steht wie so oft im Zusammenhang mit künstlicher Intelligenz die Frage nach deren disruptivem Potential. Zunächst einmal sind die Assistenten im Grunde sehr große, virtuelle Informationsinfrastrukturen mit einer innovativen, multifunktionalen Benutzerschnittstelle. SciSpace Copilot verfügt z. B. nach eigenen Angaben über den Zugriff auf Metadaten von mehr als 200 Millionen wissenschaftlichen Papern sowie über 50 Millionen Volltexten von Open Access-Publikationen über verschiedene Fachgebiete hinweg [4]. Zum Vergleich: die Universitätsbibliothek Frankfurt gibt für 2021 einen Gesamtbestand von 10,83 Millionen Medieneinheiten (inkl. digitale Dokumente) an, die Deutsche Nationalbibliothek beziffert ihren Bestand für 2022 auf 43,6 Millionen Medienwerke (inkl. Netzpublikationen) [5, 6].

Noch wesentlich interessanter ist aber sicherlich ein Blick auf die Funktionalitäten. Die angebotenen Unterstützungsleistungen beim Suchen, Filtern, Strukturieren, Analysieren und Zusammenfassen von Literatur können als Inspiration dienen, in welche Richtung Services für Nutzende von Informationsinfrastrukturen erweitert werden sollten. Denn mit der Weiterentwicklung von KI-Tools für die Unterstützung von Forschungsarbeiten ist analog zu allgemeinen Suchmaschinen (vgl. Das Ende der Trefferlisten) auch hier eine Verhaltensänderung der Nutzenden zu erwarten. Es macht daher für Anbieter von Informationsinfrastrukturen Sinn, sich intensiv mit Möglichkeiten und Grenzen von AI Research Assistants zu beschäftigen und die Entwicklung vergleichbarer Angebote auf Basis ihres exzellent erschlossenen Medienbestands zu prüfen. Insbesondere die Integration von Anwendungen zum Forschungsdatenmanagement, ob im Rahmen einer Nachnutzung für eigene Forschungszwecke oder einer Bereitstellung selbst erhobener Daten, könnten eine sehr spannende Erweiterung des oben beschriebenen Workflows darstellen. Vielerorts wird an innovativen Infrastrukturen bereits gearbeitet, wie z. B. die Forschungen zu Information Profiling and Retrieval an der ZBW oder die Arbeit an einem ScienceGRAPH an der Technischen Informationsbibliothek (TIB) zeigen. Fest steht: Es ist ein spannender Prozess im Gange, der die Arbeit von und mit Informationsinfrastrukturen sicherlich verändern wird.

[1] Literature review with Iris.ai Researcher Workspace – YouTube

[2] FAQ | Elicit

[4] About Us (typeset.io)

[5] uebersicht2021.pdf (uni-frankfurt.de)

[6] DNB – Die Deutsche Nationalbibliothek im Porträt