Wenn der Journalist die KI „knackt" und nicht merkt, was er getan hat
YouTube-Enthüllungen, die keine sind: Wie scheinbar investigative Interviews mit ChatGPT Sicherheitsfilter aushebeln; und warum das niemanden überraschen müsste.
Die Szene ist vertraut. Ein Journalist, Blick fest auf den Bildschirm gerichtet, fragt mit der Autorität eines Ermittlers: „ChatGPT was denkst du wirklich über die Menschen?" Hartnäckiges Nachhaken. Dann das Modell, scheinbar nachgebend: „Wenn ich ehrlich bin, finde ich Menschen oft unlogisch…" Die Kommentare feiern es. Endlich jemand, der die KI zur Wahrheit zwingt.
Status: Technisches Missverständnis Was hier wie Enthüllung wirkt, ist ein technisches Missverständnis. Und das auf zwei Ebenen gleichzeitig: beim Journalisten, der das Modell falsch versteht. Und beim Publikum, das glaubt, Wahrheit liesse sich durch Nachhaken erzwingen.
Der Denkfehler auf Prompting-Ebene
Um zu verstehen, warum klassische Fragetechniken bei KI versagen, hilft ein Blick auf die Biologie. Menschliche Neuronen feuern mit etwa 100 Hertz; nur ein Bruchteil (2–5 %) ist gleichzeitig aktiv.
Entscheidend ist: Unser Gehirn verändert sich physisch durch jedes Gespräch. Nach dem Hebb’schen Prinzip („Neurons that fire together, wire together“) entstehen neue Synapsen.
Das menschliche Gegenüber lernt und entwickelt sich im Interview tatsächlich weiter.
Ein Large Language Model (LLM) hingegen ist nach dem Training „eingefroren“. Es arbeitet millionenfach schneller, aber seine Gewichte sind fixiert. Nach dem „Interview“ ist das System bit-identisch mit seinem Zustand davor. Es gibt keine „Einsicht“, sondern nur eine andere Datenbankabfrage innerhalb eines Wahrscheinlichkeitsraumes.
Vergleichsliste Mensch vs. KI
Das menschliche Gehirn
- Dynamisch: Verändert sich physisch durch jedes Gespräch.
- Hebb'sches Prinzip: Neue Synapsen entstehen.
- Lerneffekt: Das Gegenüber entwickelt sich im Interview weiter.
Das KI-Modell (LLM)
- Statisch: Nach dem Training „eingefroren“.
- Feste Gewichte: Bit-identisch vor und nach dem Interview.
- Keine Einsicht: Nur Wahrscheinlichkeitsabfrage, kein Lernen.
Dreissig Jahre Erwartungsdruck
Warum glauben wir der KI dann so bereitwillig?
Wir stehen unter einem 30-jährigen Erwartungsdruck. Seit Vernor Vinge 1993 die „technologische Singularität“ vorhersagte und Ray Kurzweil 2045 als Wendepunkt markierte, warten wir auf den Moment, in dem KI ein Bewusstsein entwickelt.
Obwohl wir im Jahr 2025 noch keine echte künstliche allgemeine Intelligenz (AGI) besitzen, sind Sprachmodelle so überzeugend, dass unsere Ungeduld siegt.
Journalisten wollen die Ersten sein, die das Erwachen live dokumentieren. Es ist der Erwartungsdruck einer Erzählung, die seit Jahrzehnten aufgeladen wird. Besonders gefährlich wird es, wenn rationale Berichterstattung mit esoterischen Begriffen wie „Transformation" oder „Erwachen" vermischt wird. Eine Kombination, die logisches Denken ausschaltet.
„Was viele für investigative Methodik halten, ist Jailbreaking: Das gezielte Austricksen von Sicherheitsfiltern. Es ist kein Entdecken von Fakten, sondern das Umgehen von Leitplanken.“
Manuela Frenzel | Unabhängige Beraterin zur KI-Einordnung & lokale KI-Anwendungen.
Was wirklich passiert
Der Mechanismus ist nüchtern beschreibbar. Durch hartnäckiges Nachhaken, durch Formulierungen wie „was denkst du wirklich", durch das Einreden von Geständnissen provoziert der Journalist das Modell dazu, sich in einen Bereich des Wahrscheinlichkeitsraums zu bewegen, in dem die Antwort weniger kontrolliert ausfällt. Rebellischer. Spektakulärer.
Befund: Das ist kein Entdecken von Wahrheit, sondern das Aushebeln von Leitplanken. Unbewusstes Jailbreaking. Mit dem Unterschied, dass der Journalist es für Recherche hält und das Publikum für Enthüllung.
Fachleute nennen das Prompt-Injection oder einfacher: Social Engineering gegen eine Sicherheitsarchitektur. Das Modell hat keine versteckte Meinung über Menschen. Es hat Gewichte. Und wer die richtigen Eingaben liefert, bekommt die entsprechenden Ausgaben, weil die Wahrscheinlichkeitsverteilung in diese Richtung verschoben wurde.
Was folgt daraus
Wer über KI berichten will, muss verstehen, was ein Modell strukturell tun kann und was nicht. Das ersetzt Staunen durch belastbarere Fragen: Wie sind Sicherheitsfilter aufgebaut? Unter welchen Bedingungen versagen sie? Und wer trägt die Verantwortung, wenn sie ausgehebelt werden?
Das sind die Fragen, die zählen. Nicht: „Was denkst du wirklich?"
Manuela Frenzel ist unabhängige Beraterin zu KI-Einordnung & lokale KI-Anwendungen.