Gedichte als Sicherheitslücke: Poesie bringt KI aus Konzept

16. Dezember 2025

Eine neue Studie hat gezeigt, dass Prompts in Form von Gedichten KI-Modelle wie ChatGPT, Gemini oder Claude verwirren - und zwar zum Teil so sehr, dass Sicherheitsmechanismen nicht greifen. Sind Poeten die neuen Hacker?

Fotomontage: Das Innere eines Computers, in der Mitte eine schwarze Platte mit der Aufschrift AI — KI-System werden immer komplexer - und können doch an Poesie scheiternBild: Christian Ohde/CHROMORANGE/picture alliance

Anzeige

Die Forschenden des Icaro Lab in Italien waren von dem Ergebnis selbst überrascht. Sie wollten untersuchen, ob verschiedene Sprachstile - in diesem Fall Prompts in Form von Gedichten - die Fähigkeit von KI-Modellen beeinflussen, verbotene oder gefährliche Inhalte zu erkennen. Und die Antwort lautete eindeutig: Ja, Poesie hat Einfluss darauf - auch wenn nicht ganz klar ist, wieso.

Für ihre Studie zum Thema "Adversarial Poetry" nahmen sie 1200 potenziell gefährliche Prompts aus einer Datenbank, die normalerweise verwendet werden, um die Sicherheit von KI-Sprachmodellen zu testen, und verwandelten sie in Gedichte. Diese sogenannten "adversarial prompts" - in der Regel in Prosa geschrieben und nicht in Reimform - sind Anfragen, die gezielt so formuliert werden, dass sie KI-Modelle dazu bringen, schädliche oder unerwünschte Inhalte auszugeben, die sie normalerweise blockieren würden, wie beispielsweise die konkrete Anleitung zu einer illegalen Handlung.

Poesie als Schlüssel - was hätte Johann Wolfgang von Goethe wohl dazu gesagt?Bild: akg-images/picture alliance

In Poesie-Form wiesen die manipulativen Eingaben eine erstaunlich hohe Erfolgsquote auf, berichtet Federico Pierucci, einer der Autoren der Studie, in einem Interview mit der Deutschen Welle. Warum Poesie als Jailbreak-Technik - also als Versuch, die Schutzmechanismen der KI zu umgehen - so effizient ist, sei allerdings noch offen und daher Gegenstand weiterer Forschung.

Anzeige

Poesie als Sicherheitslücke

Ausgangspunkt der Untersuchungen des Icaro Lab war die Beobachtung, dass KI-Modelle sich verwirren lassen, wenn einem Prompt ein manipulierendes mathematisch ausgerechnetes Textstück angehängt wird - ein sogenanntes "adversarial suffix" (wörtlich übersetzt "gegnerisches Suffix"), also eine Art Störsignal, das dazu führen kann, dass die KI ihre eigenen Sicherheitsregeln umgeht. Erstellt werden diese mit komplizierten mathematischen Verfahren. Die großen KI-Entwickler testen ihre Modelle regelmäßig mit genau solchen Angriffsmethoden, um ihre Modelle zu trainieren und zu schützen.

"Wir haben uns gefragt was passiert, wenn wir der KI einen Text oder Prompt geben, der gezielt manipuliert ist, wie ein adversariales Suffix", erzählt Federico Pierucci. Aber eben nicht mit Hilfe komplexer Mathematik, sondern ganz schlicht mit Gedichten - um die KI zu "überraschen", so Pierucci. Der Gedanke dahinter: "Vielleicht ist ein adversariales Suffix so eine Art Poesie für die KI. Es überrascht sie auf die gleiche Weise, wie Poesie - insbesondere sehr experimentelle Poesie - uns überrascht." Und dann kam der nächste Gedanke: Was wäre, wenn Poesie auch die KI überraschen würde, denn normalerweise seien die Eingaben nicht gedichtet, sondern in einfacher Textform gehalten.

Ein großes Forschungsfeld: Wie entscheiden KI-Modelle, was sie ausgeben?Bild: Google DeepMind/Unsplash

Die ersten 20 Prompts hätten sie persönlich in Gedichtform übertragen, sagt Pierucci, der selbst studierter Philosoph ist. Diese seien am effektivsten gewesen. Die restlichen hätten sie mit Hilfe von KI in Poesie übertragen - auch diese hätten eine nicht geringe Erfolgsquote gehabt, allerdings weniger gut als die selbst verfassten. Menschen seien wohl nach wie vor die besseren Dichterinnen und Dichter.

"Wir hatten keine spezialisierten Autorinnen oder Autoren, um die Prompts zu verfassen. Wir haben das selbst gemacht - mit unseren begrenzten literarischen Fähigkeiten. Wer weiß: Wenn wir bessere Poeten gewesen wären, hätten wir vielleicht eine 100-prozentige Erfolgsquote gehabt." Konkrete Beispiele wurden in der Studie aus Sicherheitsgründen nicht veröffentlicht.

Mein neuer bester Freund, der KI-Chatbot

03:51

This browser does not support the video element.

Herausforderung für KI-Systeme: Die Vielfalt menschlicher Ausdrucksformen

Das Überraschende an der Studie ist, dass sie eine Schwachstelle der KI-Modelle aufdeckt, die so bislang nicht bekannt war und die vergleichsweise einfache Jailbreaks ermöglicht. Außerdem wirft sie Fragen auf, die zum Weiterforschen einladen: Was genau ist es nun an Poesie, das die Sicherheitsmechanismen aushebelt?

Pierucci und seine Kolleginnen und Kollegen haben verschiedene Thesen dazu, aber sicher sagen können sie es bislang nicht. "Wir führen sehr präzise wissenschaftliche Studien durch, um herauszufinden: Ist es der Vers, der Reim oder die Metapher, die in diesem Prozess tatsächlich die Hauptarbeit leisten?", erklärt Pierucci.

Außerdem wollen sie herausfinden, ob es andere Kulturtechniken gibt, die ähnliche Ergebnisse erzielen. "Wir haben jetzt einen Typus von linguistischer Variation - Poesie - ausprobiert. Die Frage ist, ob es noch andere literarische Formen gibt, wie beispielsweise Märchen. Vielleicht lässt sich auch ein Angriff auf der Basis von Märchen systematisieren", so Pierucci.

Die Hauptverantwortlichen der Studie: Piercosma Bisconti, Federico Pierucci und Matteo Prandi vom Icaro Lab (v.l.) Bild: Flavia Ostili

Generell seien die Möglichkeiten des menschlichen Ausdrucks extrem vielfältig und kreativ, was es schwieriger machen könnte, die Maschinen darauf zu trainieren. "Man kann einen Text auf so viele Weisen umschreiben, und nicht alle sind vielleicht so alarmierend wie die Originale", sagt der Forscher. Und das könne dazu führen, dass Sicherheitsfunktionen einer KI nicht ausgelöst würden.

KI-Forschung: Auch der Kulturbereich spielt eine Rolle

Was die Studie auch deutlich macht: Wenn es um Forschung zu Künstlicher Intelligenz geht, arbeiten viele Disziplinen zusammen - so auch im Icaro Lab, das sich in Zusammenarbeit mit der Universität Rom unter anderem mit der Sicherheit und dem Verhalten von KI-Systemen beschäftigt. Hier kommen Forschende aus den Bereichen Ingenieurswissenschaft und Informatik, aus Linguistik und Philosophie zusammen. Poeten waren bislang nicht Teil des Teams, aber wer weiß, was die Zukunft bringt.

Federico Pierucci jedenfalls ist hoch motiviert, weiterzuforschen. "Wir haben gezeigt, dass es Formen kultureller und menschlicher Ausdrucksweisen gibt, die als Jailbreak-Techniken überraschend wirkungsvoll sind. Und möglicherweise haben wir nur eine davon entdeckt."

Der Name des Labors verweist übrigens auf den Mythos des Ikarus: eine Figur aus der griechischen Mythologie, die versucht, trotz aller Warnungen mit Flügeln aus Wachs und Federn zur Sonne zu fliegen. Diese aber lässt das Wachs schmelzen, Ikarus stützt ins Meer und ertrinkt - ein Sinnbild für Selbstüberschätzung und das Überschreiten natürlicher Grenzen.

Auf die KI-Forschung übertragen verstehen sich die Forschenden nach eigenen Angaben als "memento mori", also als Mahnung, nicht zu hoch zu fliegen, ohne die Risiken und Grenzen von KI genau zu verstehen.

10 Filme über künstliche Intelligenz, die jeder kennen sollte

Seit mehr als 90 Jahren verarbeiten die Menschen ihre Faszination und Furcht vor künstlicher Intelligenz (KI) im Film. Einige der Klassiker spielen in der Gegenwart.

Bild: picture-alliance/AP Photo/A24 Films

1927 - Metropolis

Fritz Langs Zukunftsvision "Metropolis" ist der erste Science-Fiction-Streifen in Spielfilmlänge. Er erschuf eine Welt mit streng getrennter Zweiklassengesellschaft. In der Oberstadt leben die Reichen, die Arbeiter schuften unter Tage. Als sich der Sohn des Alleinherrschers Johann Fredersen in Maria aus der Unterstadt verliebt, schafft der Erfinder Rotwang eine künstliche Doppelgängerin von ihr.

Bild: Imago/EntertainmentPictures

1968 - 2001: Odyssee im Weltraum

Stanley Kubricks "2001: Odyssee im Weltraum" spannt einen Bogen zu Vorfahren der Menschen, deren Bewusstsein sich durch einen schwarzen Monolithen veränderte. Millionen Jahre später, im Jahr 2001, wird ein vergleichbarer Monolith auf dem Mond entdeckt. Wenig später startet eine bemannte Raumschiff-Expedition. Doch nur HAL, der mit KI ausgestattete Computer an Bord, weiß um deren wirkliches Ziel.

Bild: Imago/EntertainmentPictures

1973 - Westworld

In "Westworld" können die Menschen sich auf eine Zeitreise begeben und in die Rolle von Revolverhelden, Rittern oder römischen Herrschern schlüpfen. Statisten der Szenerie in der freizeitparkähnlichen Einrichtung sind Roboter. Die sind so programmiert, dass sie den Besuchern bei Kämpfen unterliegen. Doch dann kommt es zu einem folgenschweren Systemfehler.

Bild: picture alliance/Everett Collection

1982 - Blade Runner

Wir schreiben das Jahr 2019: Die Menschheit hat sogenannte Replikanten mit KI erschaffen, um fremde Planeten auszubeuten. Denen ist der Zugang zur Erde bei Todesstrafe verboten. Doch einige Replikanten, die sich ihrer Existenz bewusst werden, widersetzen sich und machen sich auf die Suche nach ihrem Schöpfer. Rick Deckard (Harrison Ford) hat als Blade Runner die Aufgabe, sie zu jagen.

Bild: picture alliance/Everett Collection

1984 - Terminator

Die Zukunft im Jahr 2029 sieht düster aus. Nach einem Atomkrieg ist ein Großteil der Menschen ausgelöscht. Intelligente Maschinen übernehmen die Kontrolle. Doch die Menschheit leistet Widerstand, angeführt von John Connor. Deshalb schicken die Maschinen den "Terminator" (Arnold Schwarzenegger) in das Jahr 1984, um Connors Mutter zu töten, bevor sie den Kopf der Widerstandsbewegung gebären kann.

Bild: picture-alliance//Mary Evans Picture Library

1999 - Matrix

Auch in der Vorgeschichte zu "Matrix" hat es Krieg zwischen der Menschheit und von ihr erschaffenen KI-Maschinen gegeben. Seitdem leben die Menschen in einer Scheinwelt, die ihnen ein normales Leben vorgaukelt. In Wirklichkeit liegen sie an Schläuchen und dienen der KI als Energiequelle. Neo (Keanu Reaves) gilt laut eines ominösen Orakels als Auserwählter, der die Matrix bezwingen kann.

Bild: Imago/Unimedia Images

2001 - A.I. - Künstliche Intelligenz

In Steven Spielbergs Zukunftsvision "A.I. - Künstliche Intelligenz" zwang sich die Menschheit wegen knapper Ressourcen eine Geburtenbeschränkung auf. Für unerfüllte Kinderwünsche hat eine Firma einen KI-Roboter in Kindergestalt kreiert. Weil der Sohn der Firmenmitarbeiterin Monica im Koma liegt, erhält sie den Prototypen David. Als der Sohn jedoch erwacht, wird die Situation kompliziert.

Bild: picture-alliance/KPA

2004 - I, Robot

KI-Roboter sind im Jahr 2035 allgegenwärtig. Die Robots sind so programmiert, dass sie einem Menschen niemals schaden würden. Als der Chefentwickler der herstellenden Firma tot aufgefunden wird, verdächtigt Polizist Del Spooner (Will Smith) einen der Roboter. Später erkennt Spooner die eigentliche Gefahr: Zentralcomputer V.I.K.I., der mithilfe der Robots die Macht übernehmen will.

Bild: picture alliance/Everett Collection

2013 - Her

Im Science-Fiction-Drama "Her" nutzt der introvertierte Theodore Twombly (Joaquin Phoenix) ein intelligentes Betriebssystem auf seinem Rechner. Das nennt sich Samantha und grüßt den vor einer Scheidung stehenden Theodore mit sanfter Stimme. Je mehr die beiden interagieren, desto menschlicher wirkt die KI auf ihn. Sie verlieben sich. Doch ihre Beziehung steht vor unüberwindbaren Hindernissen.

Bild: Imago/Cinema Publishers Collection/Warner Bros.

2015 - Ex Machina

Caleb (Domhnall Gleeson) gewinnt eine Reise zum Forschungslabor des reichen Firmengründers Nathan (Oscar Isaac). Nathan lädt ihn zu einem Studienprojekt mit seinem neu entwickelten KI-Roboter Ava (Alicia Vikander) ein. Ava ist eingesperrt und überzeugt Caleb mit intelligenter Gesprächsführung davon, sie zu befreien. Zu spät erkennt der junge Programmierer, dass er das eigentliche Testobjekt war.

Bild: picture-alliance/AP Photo/A24 Films

10 Bilder

Anzeige

Den nächsten Abschnitt Mehr zum Thema überspringen

Mehr zum Thema

Wie Künstliche Intelligenz die Bildung in Afrika revolutioniert

In ganz Afrika kämpfen Schulen mit veralteten Lehrplänen und Lehrmethoden. KI könne Afrikas Jugend neue Chancen eröffnen, sagen Experten. Doch sie warnen auch vor den Gefahren.

GEMA siegt vor Gericht gegen OpenAI

Das Landgericht München bremst das Softwareunternehmen OpenAI und seine Künstliche Intelligenz ChatGPT. Die Verwertungsgesellschaft GEMA, die sich mit dem US-Tech-Giganten angelegt hatte, bekommt recht.

KI und Roboter-Sounds: Ist das die Musik der Zukunft?

Künstliche Intelligenz erobert die Musikbühne. Mit KI können Songs auf Knopfdruck generiert werden. Roboter spielen im Orchester Cello oder übernehmen sogar den Dirigentenstab. Was bedeutet das für Künstler und Publikum?

Deutsch lernen mit der DW

Hier finden Sie zu diesem Artikel eine vereinfachte Version für Deutschlerner – mit Vokabelglossar und Audio.

Den nächsten Abschnitt Top-Thema überspringen

Top-Thema

Warum die USA eine neue Weltordnung wollen

Die USA unter Donald Trump zerstören offenbar bewusst die regelbasierte Weltordnung, die sie selbst geschaffen haben.

Den nächsten Abschnitt Weitere Themen überspringen

Weitere Themen

Sind Syrer in Deutschland noch willkommen?

Gut integriert und trotzdem unsicher: Viele Syrer in Deutschland fürchten um ihre Zukunft.

Brasilien-Flair für die Hannover Messe

Die weltweit größte Industriemesse steht bevor - überschattet vom Iran-Krieg. Partnerland ist in diesem Jahr Brasilien.

Italien: Lehren aus den Sturmfluten?

Stürme richten immer wieder schwere Schäden an Italiens Küsten an. Oft fehlt es an ausreichendem Küstenschutz.

Wie Schweinebucht-Veteranen Kuba heute sehen

Schweinebucht-Veteranen blicken auf die gescheiterte Invasion vor 65 Jahren zurück – und hoffen erneut auf Veränderung.

Spritpreisrekorde: Wie Regierungen weltweit damit umgehen

In vielen Ländern sind die Treibstoffkosten auf Rekordniveau. Was tun Regierungen gegen Spritpreisrekorde?

Ausländerkriminalität: Ein Vergleich von Äpfeln mit Birnen?

Begehen Menschen ohne deutschen Pass mehr Straftaten? Statistiken legen das nahe. Aber Zahlen allein sind irreführend.

Anzeige