KI-Halluzinationen: Hilfe, meine KI ʇɹǝıuıznןןɐɥ!

Nicht nur Menschen können halluzinieren, sondern auch generative Sprachmodelle wie beispielsweise ChatGPT. Was eine KI-Halluzination ist, wodurch sie entsteht und wie sie verhindert werden kann, haben wir einmal genauer beleuchtet. 

Was ist eine KI-Halluzination?

Von einer KI-Halluzination spricht man, wenn ein großes generatives Sprachmodell (Large Language Model; LLM) falsche Informationen oder Fakten erzeugt, die nicht der Realität entsprechen. Dabei erscheinen die Halluzinationen – zumindest auf den ersten Blick – oft plausibel, da flüssige, kohärente Texte generiert werden.

Wichtig ist jedoch zu betonen, dass LLMs nicht bewusst lügen, sondern schlichtweg kein Bewusstsein für die erstellten Texte haben.

„Large Language Models neigen dazu, sehr selbstsicher auch neue (Falsch-) Informationen zu erfinden.“ – Thora Markert, Head of AI Research and Governance bei TÜVIT

Wie entstehen KI-Halluzinationen?

Die technischen Gründe für KI-Halluzinationen können vielfältig sein. Mögliche Faktoren sind beispielsweise:

  • Veraltete, schlechte oder widersprüchliche Trainingsdaten, auf die sich das LLM stützt
  • Falsche Klassifizierung von Daten
  • Fehlender Kontext bzw. unklare oder inkonsistente Benutzereingaben
  • Schwierigkeiten bei der Erkennung von Umgangssprache, Sarkasmus, etc.
  • Unzureichende Trainings- und Generierungsmethoden oder Programmierung

So ist es möglich, dass LLMs auch Halluzinationen erzeugen, obwohl sie auf konsistente und zuverlässige Datensätze zurückgreifen.

Die Eindämmung von Halluzinationen zählt damit zu den grundsätzlichen Herausforderungen für KI-Anwender und Entwickler. Denn LLMs stellen in der Regel eine Blackbox dar, wodurch es mitunter schwierig sein kann, zu ermitteln, warum eine bestimmte Halluzination erzeugt wurde.

Was sind Arten von KI-Halluzinationen?

Der Begriff der KI-Halluzinationen umfasst ein breites Spektrum: Von kleineren Ungereimtheiten bis hin zu frei erfundenen Informationen. Arten von KI-Halluzinationen sind unter anderem:

  • Satzwidersprüche: Generierte Sätze stehen im Widerspruch zu vorherigen Sätzen bzw. Teilen der erzeugten Antwort.
  • Widersprüche zur Eingabeaufforderung: Die generierte Antwort oder Teile davon stimmen nicht mit der Eingabeaufforderung durch den Nutzer bzw. die Nutzerin überein.
  • Faktische Widersprüche: Eine durch das LLM erfundene Information wird als Tatsache verkauft.
  • Zufällige Halluzinationen: Das LLM erzeugt zufällige Informationen, die nichts mit der eigentlichen Eingabeaufforderung zu tun haben.

Welche Gefahren entstehen durch KI-Halluzinationen?

Verlassen sich Nutzer:innen zu sehr auf die Ergebnisse eines KI-Systems, weil diese sehr überzeugend und zuverlässig aussehen, kann es passieren, dass sie die Falschinformationen nicht nur selbst glauben, sondern auch weiterverbreiten.

Für Unternehmen, die LLM-gestützte Dienste im Rahmen der Kundenkommunikation einsetzen, besteht zudem potenziell die Gefahr, dass Kund:innen mit unwahren Informationen versorgt werden. Das wiederum kann sich negativ auf den Ruf des Unternehmens auswirken.

Wie erkenne ich KI-Halluzinationen?

Der einfachste Weg, eine KI-Halluzination zu erkennen bzw. zu enttarnen, besteht darin, die ausgegebenen Informationen sorgfältig auf ihre Korrektheit hin zu überprüfen. Als Nutzer:in einer generativen KI sollte man demnach stets im Hinterkopf behalten, dass auch diese Fehler machen kann und nach dem „Vier-Augen-Prinzip“ aus KI und Mensch vorgehen.

Wie können KI-Halluzinationen verhindert werden?

Um KI-Halluzinationen und anderen Herausforderungen von KI-Systemen entgegenzuwirken, sind entsprechende Prüfungen durch unabhängige Dritte empfehlenswert. So können Schwachstellen im besten Falle bereits identifiziert und behoben werden, bevor Anwendungen offiziell zum Einsatz kommen.

„LLMs sind leistungsstarke Werkzeuge, bringen aber auch Herausforderungen wie das Phänomen der KI-Halluzination mit sich. In Form von umfassenden Prüfungen unterstützen wir KI-Entwickler deshalb dabei, bestehende Risiken bestmöglich zu identifizieren sowie minimieren und das Vertrauen in die Technologie weiter zu stärken.“ – Vasilios Danos, Head of AI Security and Trustworthiness bei TÜVIT

Über die TÜV Informationstechnik GmbH

Die TÜV Informationstechnik GmbH ist auf die Prüfung und Zertifizierung der Sicherheit in der Informationstechnik ausgerichtet. Als unabhängiger Prüfdienstleister für IT-Sicherheit ist die TÜV Informationstechnik GmbH international führend. Zahlreiche Kunden profitieren bereits von der geprüften Sicherheit des Unternehmens. Zum Portfolio gehören Cyber Security, Evaluierung von Software und Hardware, IoT/Industrie 4.0, Datenschutz, ISMS, Smart Energy, Mobile Security, Automotive Security, eID und Vertrauensdienste sowie die Prüfung und Zertifizierung von Rechenzentren hinsichtlich ihrer physischen Sicherheit und Hochverfügbarkeit.

Die 1995 gegründete TÜV Informationstechnik GmbH mit Sitz in Essen ist ein Unternehmen der TÜV NORD GROUP, die mit über 14.000 Mitarbeitenden und Geschäftsaktivitäten in weltweit 100 Ländern als einer der größten Technologie-Dienstleister agiert.

Firmenkontakt und Herausgeber der Meldung:

TÜV Informationstechnik GmbH
Am TÜV 1
45307 Essen
Telefon: +49 (201) 8999-9
Telefax: +49 (201) 8999-888
http://www.tuvit.de

Ansprechpartner:
Verena Lingemann
Redakteurin
Telefon: +49 (201) 8999-658
E-Mail: v.lingemann@tuvit.de
Für die oben stehende Story ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.

counterpixel