DGI-Blog

Monthly Archives: März 2023

KI-Tutorial an der Hochschule Darmstadt

By | Künstliche Intelligenz | No Comments

Sylvia Kullmann

KI-Tutorial zu den Modellen hinter ChatGPT

Wie sieht KI die Welt? Diese und andere Fragen waren Gegenstand eines virtuellen KI-Tutorials am 28. März 2023 an der Hochschule Darmstadt. In acht Einheiten führten Prof. Dr. Markus Döhring und sein Team aus angehenden Data Scientists an der Hochschule Darmstadt Teilnehmende mit und ohne Informatik-Vorkenntnisse durch die Welt der KI-Sprachmodelle.

Blick hinter den Vorhang

Lernziele waren die Vermittlung von Grundlagen zur automatisierten Sprachverarbeitung, der wichtigsten KI-Lernmechanismen sowie wahrscheinlichkeitsbasierter Sprachtechnologien. Jede Einheit widmete sich einem eigenen Schwerpunktthema. Die Palette erstreckte sich von der Arbeitsweise der Wortvektoren über die Mustererkennung in neuronalen Netzen bis hin zur Manipulierbarkeit von KI-Sprachmodellen und der Funktionsweise Generativer Bildmodelle. Durch den gelungenen Wechsel von  Vorträgen und praktischen Übungen wurde ein tieferer Einblick in Möglichkeiten und Grenzen der „KI-Wunderkinder“ gewährt, die durch ChatGPT seit November 2022 auch in der breiten Öffentlichkeit für großes Aufsehen sorgen. Für die Praxisteile stand  ein virtuelles Labor mit einer persönlichen Ausführungsumgebung zur Verfügung. Dieses war eigens für das KI-Tutorial eingerichtet worden. Ausgerüstet mit theoretischem Wissen und klar formulierten Aufgabenstellungen konnte schrittweise selbst Hand angelegt und Licht in die Black Box KI gebracht werden.

KI als Herausforderung

Der Blick in das Innenleben von KI-Modellen machte erneut deutlich, dass Sprachtechnologien den Menschen in besonderer Weise herausfordern. Die Erkenntnis, dass mit einer ausreichend großen Menge an geeigneten Beispieltexten, den Trainingsdaten, das Errechnen von in sich stimmigen, argumentativ ausgewogenen und exzellent strukturierten neuen Texten möglich ist, ließ wieder einmal die unangenehme Frage aufkommen, wie berechenbar unsere menschlichen Gedanken tatsächlich sind. Gleichzeitig wurde klar, dass Bildung in der digitalen Welt mehr denn je hinterfragt werden muss. Übertragen auf menschliche Bildungskontexte muss geklärt werden: Was sind in Zukunft die geeigneten Trainingsdaten für uns Menschen, damit wir unsere Stärken im Zusammenspiel mit KI optimal nutzen können?

KI-Tutorials für Zukunftskompetenzen

In einem ersten Schritt wären solche KI-Tutorials an allen Ausbildungsstätten ein wichtiger Beitrag zur Ergänzung menschlicher Kompetenzprofile der Zukunft. Denn natürlich sind KI-Sprachmodelle nicht unfehlbar und allwissend. In den praktischen Übungen wurde überdeutlich, welchen Einfluss veränderte oder manipulierte Trainingsdaten auf den Inhalt automatisch generierter Texte haben können. Auch wurde klar, wie wichtig die Formulierung von Zielen und Einsatzkontexten bei der Entwicklung von KI-Sprachmodellen sind und wie aufwändig das Training dafür sein kann. Nur wer selbst gesehen hat, was unzureichend trainierte KI leisten oder eben nicht leisten kann, wird die neue Technologie einschätzen und verantwortungsvoll nutzen können.

Worauf achtet die KI? Diese Frage begleitete die Teilnehmenden über das gesamte KI-Tutorial hinweg. Prof. Dr. Markus Döhring und seinem Team ist es gelungen, eine Antwort mitzugeben und gleichzeitig umgekehrt aufzuzeigen, worauf wir Menschen bei KI achten sollten.

DGI-Vortragsreihe

Einen Beitrag in dieser Richtung  möchte auch die DGI mit der aktuellen Vortragsreihe Künstliche Intelligenz – Vom Wunderkind zum Allrounder leisten. In unregelmäßigen Abständen nehmen virtuelle Vorträge aus ganz unterschiedlichen Disziplinen und Blickwinkeln KI und Ihre Folgen in den Fokus.

PATINFO2023

By | Ankündigung | No Comments

PATINFO2023 „Schutzrechtsinformationen als Rohstoff für die Wirtschaft von morgen“ vom 14. bis 16. Juni in Ilmenau

Schutzrechtsanmeldungen für Patente, Marken und Designs von heute dienen dem Schutz der Innovationen von morgen.
Zu den Aspekten Schutzfähigkeit und Marktpotential kommt die Frage: Sind die kreativen oder technischen Ideen nachhaltig?
Welche Techniken können wir verwenden, um die Schutzrechtsanmeldungen zu identifizieren und zu bewerten. Was ist Rohstoff für die Wirtschaft von morgen, was ist eher Ballast.
Welche neuen Tools und Quellen helfen uns, diese Fragen zu klären, wo gibt es noch zu hebendes Potential? Fachleute aus Forschung und Industrie, Patentämtern, Kanzleien und aus der Informationsbranche erläutern die Themen aus ihrer Perspektive.

PATINFO2023 – begleitenden Ausstellung, Kurzvorträge und kostenlose Workshops

In der begleitenden Ausstellung und in einer Reihe von Kurzvorträgen stellen Software-Anbieter und Informationsdienstleister ihre neuesten Entwicklungen vor. Mit dabei ist auch wieder das Team Patentmanagement Thüringer Hochschulen mit aktuellen Technologieangeboten aus dem Wissenschaftsbereich, für die Verwertungspartner aus der Wirtschaft gesucht werden.
Ein kostenloses Workshop-Programm rundet die Veranstaltung ab. Die PATINFO2023 organisiert durch das Landespatentzentrum Thüringen, bleibt auch 2023 das ideale Forum für den Erfahrungsaustausch zwischen öffentlichen, privaten und gewerblichen Anbietern und Nutzern im Umfeld von Patenten, Marken und Designs.

PATINFO2023 – Programm:

PATINFO2023 – Anmeldung (Frühbucherrabatt bis 30.04.2023):

Artificial Intelligence (AI) Research Assistants und ihre Bedeutung für Informationsinfrastrukturen

By | Allgemein | No Comments

Sylvia Kullmann

Forschungsvorhaben beginnen mit den Gedanken, Erkenntnissen und Ergebnissen anderer Forschender. Um die für die eigene Fragestellung relevanten Beiträge zu identifizieren, steht am Beginn jedes Forschungsprojekts daher in der Regel eine gründliche Literaturrecherche zur Erhebung des Forschungsstands in den die eigene Forschungsfrage eingeordnet wird. Sorgfältig ausgeführt, ist dieser Prozess in den allermeisten Fällen zeitintensiv und mühsam. Eine Reihe von einzelnen Arbeitsschritten müssen durchlaufen werden: Die richtigen Rechercheplattformen müssen ermittelt, alle geeigneten Suchbegriffe gefunden und an die Rechercheplattformen angepasst werden, es müssen konkrete Suchanfragen formuliert, Suchergebnisse um Dubletten bereinigt und anschließend einzeln auf ihre Relevanz für die eigene Fragestellung untersucht werden. Je nach Forschungsgebiet und Fragestellung können da leicht ein paar Wochen ins Land gehen. Generationen von Forschenden haben dies durchlaufen. Zunächst mit Hilfe von Zettelkästen in Bibliotheken, dann unterstützt durch digitale Bibliothekskataloge und fachspezifische Literaturdatenbanken und schließlich zusätzlich durch webbasierte Informationsinfrastrukturen in Form von (wissenschaftlichen) Suchmaschinen wie Google Scholar oder BASE, Open Access-Server wie zenodo oder pedocs, Preprint-Angebote sowie Social Media-Netzwerke. Die Liste an möglichen Recherchequellen ist inzwischen sehr lang und jede Plattform erfordert spezielles Wissen über den Aufbau der Erschließungs- und Suchmechanismen, um optimale Suchergebnisse erzielen zu können.

KI-Anwendungen bringen nun immer mehr Bewegung in die bisher praktizierte Art und Weise der Literatursuche und -verarbeitung. AI Research Assistants wie Iris.ai, Scispace Copilot oder das u. a. auf GPT-3 basierende Elicit drängen auf den Markt und versprechen durch einen völlig neuen Ansatz bei der Suche und Auswertung wissenschaftlicher Literatur große Erleichterungen für Forschende. Statt viel Zeit in die Auswahl der richtigen Recherchequellen und Suchwörter zu stecken und diese dann in eine optimale Suchanfrage zu übersetzen, soll durch natürlichsprachlich formulierte Fragen und Forschungskontexte die richtige Literatur per Knopfdruck geliefert werden. Im Vergleich zum bisherigen Vorgehen soll sich der Rechercheprozess verkürzen, denn, wie es in einem Werbevideo von Iris.ai heißt, „Not all of us speak library.“ [1]. Das Einarbeiten in Recherchewerkzeuge und -vokabulare entfällt. Doch nicht nur das. Forschende werden in ihrem gesamten Workflow, also auch bei der Auswertung und Weiterverarbeitung der Suchergebnisse unterstützt. Relevanzbewertungen hinsichtlich der Forschungsfrage, Gruppierung von Papern mit ähnlichem Fokus zur Entscheidungsunterstützung, automatische Zusammenfassungen – die Anbieter haben einiges zu bieten und versprechen, das Filtern der Suchergebnisse sowie die Analyse und Auswahl der Literatur für die persönliche Leseliste erheblich zu beschleunigen.

Insgesamt soll die aufwändige Erhebung des Forschungsstands KI-gestützt also deutlich schneller und effektiver werden. Klar ist: Ebenso wenig wie die Trefferlisten im bisherigen Literaturverarbeitungsprozess tatsächlich nur die relevante Literatur enthalten, können KI-gestützte Recherchen und Auswertungen ohne weitere Bearbeitung in die eigene Publikation übernommen werden. Die kritische Durchsicht des Outputs ist auch bei der Verwendung von AI Research Assistants unerlässlich, um am Ende einen sauberen Forschungsstand zu haben. Es ist also nicht alles Gold was glänzt. Je nach Fachgebiet und der jeweils verfügbaren Literaturbasis können die Ergebnisse von AI Research Assistants in ihrer Qualität auch erheblich variieren. Die Entwicklung der KI-Funktionen ist hier noch nicht am Ende. Davon sind auch die Entwickelnden selbst überzeugt, was sich z. B. in einer klar formulierten Bitte von Elicit ausdrückt, die Genauigkeit der Ergebnisse aktuell bei etwa 80 bis 90% einzuschätzen [2]. Iris.ai gibt hier einen Wert von 85% an [3].

Wie auch immer. Für die Informationswissenschaft sind AI Research Assistants in jedem Fall aus verschiedenen Gründen interessant und unbedingt beachtenswert. Im Zentrum steht wie so oft im Zusammenhang mit künstlicher Intelligenz die Frage nach deren disruptivem Potential. Zunächst einmal sind die Assistenten im Grunde sehr große, virtuelle Informationsinfrastrukturen mit einer innovativen, multifunktionalen Benutzerschnittstelle. SciSpace Copilot verfügt z. B. nach eigenen Angaben über den Zugriff auf Metadaten von mehr als 200 Millionen wissenschaftlichen Papern sowie über 50 Millionen Volltexten von Open Access-Publikationen über verschiedene Fachgebiete hinweg [4]. Zum Vergleich: die Universitätsbibliothek Frankfurt gibt für 2021 einen Gesamtbestand von 10,83 Millionen Medieneinheiten (inkl. digitale Dokumente) an, die Deutsche Nationalbibliothek beziffert ihren Bestand für 2022 auf 43,6 Millionen Medienwerke (inkl. Netzpublikationen) [5, 6].

Noch wesentlich interessanter ist aber sicherlich ein Blick auf die Funktionalitäten. Die angebotenen Unterstützungsleistungen beim Suchen, Filtern, Strukturieren, Analysieren und Zusammenfassen von Literatur können als Inspiration dienen, in welche Richtung Services für Nutzende von Informationsinfrastrukturen erweitert werden sollten. Denn mit der Weiterentwicklung von KI-Tools für die Unterstützung von Forschungsarbeiten ist analog zu allgemeinen Suchmaschinen (vgl. Das Ende der Trefferlisten) auch hier eine Verhaltensänderung der Nutzenden zu erwarten. Es macht daher für Anbieter von Informationsinfrastrukturen Sinn, sich intensiv mit Möglichkeiten und Grenzen von AI Research Assistants zu beschäftigen und die Entwicklung vergleichbarer Angebote auf Basis ihres exzellent erschlossenen Medienbestands zu prüfen. Insbesondere die Integration von Anwendungen zum Forschungsdatenmanagement, ob im Rahmen einer Nachnutzung für eigene Forschungszwecke oder einer Bereitstellung selbst erhobener Daten, könnten eine sehr spannende Erweiterung des oben beschriebenen Workflows darstellen. Vielerorts wird an innovativen Infrastrukturen bereits gearbeitet, wie z. B. die Forschungen zu Information Profiling and Retrieval an der ZBW oder die Arbeit an einem ScienceGRAPH an der Technischen Informationsbibliothek (TIB) zeigen. Fest steht: Es ist ein spannender Prozess im Gange, der die Arbeit von und mit Informationsinfrastrukturen sicherlich verändern wird.

[1] Literature review with Iris.ai Researcher Workspace – YouTube

[2] FAQ | Elicit

[3] IRIS.AI: The Artificial Intelligence-powered R&D assistant | IRIS AI Project | Fact Sheet | H2020 | CORDIS | European Commission (europa.eu)

[4] About Us (typeset.io)

[5] uebersicht2021.pdf (uni-frankfurt.de)

[6] DNB – Die Deutsche Nationalbibliothek im Porträt