Studie zeigt Begrenztheit von LLMs

TU Darmstadt

Andrea Gillhuber, 13.08.2024, 08:48

Studie zeigt Begrenztheit von LLMs

Eine neue Studie unter der Leitung der TU Darmstadt hat die Grenzen von KI-Modellen wie ChatGPT aufgezeigt. Die Forschenden kommen zu dem Ergebnis, dass es ein Trugschluss sei, dass LLMs komplexe Aufgaben ohne menschliche Unterstützung korrekt ausführen könnten.

Eine neue Studie unter der Leitung der TU Darmstadt hat die Grenzen von KI-Modellen wie ChatGPT aufgezeigt. Die Untersuchung, die im August auf der Jahrestagung der Association for Computational Linguistics (ACL) in Bangkok vorgestellt wird, kommt zu dem Schluss, dass diese Modelle weniger eigenständig lernfähig sind als bisher vermutet. Es gibt keine Hinweise darauf, dass Large Language Models (LLMs) ein allgemeines »intelligentes« Verhalten entwickeln, das komplexes Denken oder planvolles Handeln ermöglicht.

Die Studie konzentriert sich auf sogenannte »emergente Fähigkeiten« – unerwartete Leistungssprünge der Sprachmodelle, die bei zunehmender Skalierung beobachtet wurden. Obwohl diese Modelle durch größere Datenmengen und komplexere Strukturen immer mehr sprachbasierte Aufgaben bewältigen können, wie das Erkennen von Fake News oder das Ziehen logischer Schlüsse, gibt es laut den Forschenden keine Beweise dafür, dass sie ein differenziertes Denkvermögen entwickeln.

Die Wissenschaftler, darunter TU-Professorin Iryna Gurevych und Dr. Harish Tayyar Madabushi von der University of Bath, stellten fest, dass die Modelle lediglich die Fähigkeit erlangten, relativ einfachen »Unsere Ergebnisse bedeuten jedoch nicht, dass KI überhaupt keine Bedrohung darstellt«, betonte Gurevych. »Wir zeigen vielmehr, dass die angebliche Entstehung komplexer Denkfähigkeiten, die mit bestimmten Bedrohungen verbunden sind, nicht durch Beweise gestützt wird und dass wir den Lernpozess von LLMs doch gut steuern können. Daher sollte der Fokus künftiger Forschung auf weiteren Risiken liegen, die von den Modellen ausgehen, beispielsweise auf deren Potenzial, zur Generierung von Fake News genutzt zu werden.«

Für Nutzer von KI-Systemen wie ChatGPT bedeutet dies, dass man sich nicht darauf verlassen sollte, dass diese Modelle komplexe Aufgaben ohne menschliche Unterstützung korrekt ausführen können. Es wird empfohlen, klare Anweisungen zu geben und Beispiele zu nennen. Die Neigung der Modelle, plausibel klingende, aber falsche Ergebnisse zu erzeugen – die sogenannte Konfabulation – bleibt laut der Studie weiterhin bestehen, auch wenn sich die Qualität der Modelle in letzter Zeit erheblich verbessert hat.

zurück zur Themenseite

Das könnte Sie auch interessieren

»Security und KI« - Teil 1

ChatGPT und die Code-Analyse

Mit LLMs ergeben sich neue Möglichkeiten zur Analyse und Verbesserung von Code. Dieser Artikel ist der erste einer dreiteiligen Serie zu Experimenten, die zeigen, wie bereits verfügbare generelle Sprachmodelle sicherheitsrelevante Prozesse und...

mehr...

Artikelserie zu Large Language Models

ChatGPT in der Industrie

ChatGPT war im vergangenen Jahr das Hype-Thema. Für 2024 wird der Einzug dieser Technologie in die Industrie erwartet. In einer neuen Artikelserie werden die Möglichkeiten und die Herausforderungen von ChatGPT für die Industrie herausgearbeitet.

mehr...

TU München

Robotik und ChatGPT miteinander verbinden

Prof. Schöllig (TU München) setzt ChatGPT ein, um Choreographien für Drohnenschwärme passend zur jeweiligen Musik zu entwickeln. Ein Sicherheitsfilter verhindert, dass die Flugroboter zusammenstoßen. LLMs wie ChatGPT können also in der Robotik...

mehr...

Auswirkungen von KI

KI, ChatGPT und Co. verändern unser Gehirn

Digitales Arbeiten fordert das Gehirn ganz ordentlich. Auch der Einsatz von KI-Tools wie ChatGPT kann Prozesse im Oberstübchen verändern. Was macht das mit unserer Steuerzentrale?

mehr...

Sabo Mobile IT

LLM als Basis für die Sprachsteuerung

Sabo Mobile IT setzt bei seiner Sprachsteuerung Sabot auf ‚Large Language Models‘ – kurz LLM. Über die Technik dahinter und den Datenschutz im industriellen Umfeld spricht Thomas Sykora.

mehr...

Aufbau der größten föderierten...

Neue EU-Plattform soll Werkstoffentwicklung um Faktor 4 beschleunigen

Mit MaterialsCommons entsteht erstmals eine europaweite föderierte Digitalinfrastruktur für die Werkstoffforschung, die über 26 Einrichtungen und mehr als 30 Industriepartner vernetzt. Ziel ist es, die bislang fragmentierte Datenlandschaft zu...

mehr...

VDE-Studie zu Elektrotechnik

Mehr Renteneintritte als Studienabschlüsse

Bis 2029 werden laut einer VDE-Analyse mehr als 30.000 Elektroingenieurinnen und -ingenieure in den Ruhestand gehen, ohne dass ausreichend Absolventen nachrücken. Ursache sind sinkende Studierendenzahlen und hohe Abbruchquoten.

mehr...

Europäisches Forschungsnetzwerk

Universität Paderborn wird Teil von ‚ELLIS NRW‘

Die Universität Paderborn gehört zu den Gründungsmitgliedern der neuen Forschungseinheit ‚ELLIS Unit NRW‘. Das europäische Netzwerk bündelt KI-Forschung in Nordrhein-Westfalen mit Fokus auf maschinelles Lernen und erklärbare KI.

mehr...

Universität Klagenfurt

KI ‚CheckMate‘ optimiert industrielle Abläufe

Die Universität Klagenfurt hat mit ‚CheckMate‘ ein KI-System entwickelt, das eigenständig Algorithmen für komplexe Kombinatorik- und Optimierungsprobleme erstellt. Die Technologie soll industrielle Planungs- und Logistikprozesse effizienter machen...

mehr...

Studie zeigt Begrenztheit von LLMs

Das könnte Sie auch interessieren

ChatGPT und die Code-Analyse

ChatGPT in der Industrie

Robotik und ChatGPT miteinander verbinden

KI, ChatGPT und Co. verändern unser Gehirn

LLM als Basis für die Sprachsteuerung

Neue EU-Plattform soll Werkstoffentwicklung um Faktor 4 beschleunigen

Mehr Renteneintritte als Studienabschlüsse

Universität Paderborn wird Teil von ‚ELLIS NRW‘

KI ‚CheckMate‘ optimiert industrielle Abläufe

Rubriken

Schwerpunkte

Service

Magazin

Unser Netzwerk