Warum die aktuellen Entwicklungen mehr sind als nur bessere Chatbots – und was das für dich bedeutet
Wenn du in den letzten Wochen das Gefühl hattest, dass in der KI-Welt gerade etwas Grundlegendes passiert, dann liegst du richtig. 2025 ist nicht das Jahr, in dem KI besser reden lernte – es ist das Jahr, in dem sie endlich das Handeln lernt.
Ich selbst arbeite gerade intensiv mit Manus.ai und hatte kürzlich einen echten Durchbruch beim Programmieren mit Claude. Plötzlich konnte ich komplexe Projekte über das Kontextfenster hinaus erweitern und weiterentwickeln, ohne dass das Modell ständig alles zerstört oder anfängt, sich zu wiederholen. Das hat mich dazu gebracht, tiefer zu graben: Was passiert hier eigentlich gerade?
Die Antwort ist faszinierend – und gleichzeitig frustrierend komplex. Deshalb dieser Beitrag: Ich möchte dir zeigen, was sich 2025 wirklich verändert hat und warum die meisten Artikel das Thema nur an der Oberfläche kratzen.
Vom Chatbot zum Agenten: Ein fundamentaler Wandel
Erinnere dich an ChatGPT Ende 2022. Du gibst einen Prompt ein, das Modell antwortet, und dann… wartet es. Du musst den nächsten Schritt machen. Du bist derjenige, der den Prozess steuert.
Das ändert sich jetzt radikal. Die neue Generation von KI-Tools arbeitet nicht mehr nur mit dir, sondern für dich. Der Unterschied ist subtil, aber enorm:
Chatbot (alt): „Suche nach Wohnungen in Prag unter 1.500€“ → Du bekommst Vorschläge, musst aber selbst klicken, filtern, Kontakte raussuchen
Agent (neu): „Finde alle Zwei-Zimmer-Wohnungen in Prag unter 1.500€, prüfe die Nähe zum ÖPNV und stelle die Vermieter-Kontakte zusammen“ → Du schließt den Browser. 20 Minuten später hast du eine fertige Liste. Theoretisch könntest Du den Agenten sogar anweisen die Wohnungen für dich anzufragen.
Das ist nicht nur praktischer – es ist eine völlig andere Art, wie wir mit Computern arbeiten.
Manus.ai: Mein digitaler Praktikant (mit Macken)
Ich nutze derzeit Manus.ai intensiv, und es ist… kompliziert. Manus ist wie ein hochmotivierter Praktikant: unfassbar fleißig, arbeitet selbstständig, aber manchmal bleibt er auch einfach in der Tür stecken.
Was Manus kann (und was mich begeistert)
Das Versprechen von Manus ist simpel: Du gibst eine Aufgabe, schließt den Browser, und der Agent arbeitet im Hintergrund. Asynchron. Autonom. Das funktioniert verblüffend gut für Dinge wie:
Marktforschung: „Finde mir alle Startups in Berlin, die im Bereich KI-Sicherheit arbeiten“
Daten sammeln: „Liste alle Preise von Konkurrenzprodukten auf“
Lead-Generierung: „Finde Journalisten, die über Klimatechnologie schreiben“
Für solche strukturierten, aber zeitaufwendigen Aufgaben ist Manus Gold wert.
Wo Manus scheitert (und warum das wichtig ist)
Aber: Das moderne Web hasst Bots. Und Manus läuft ständig gegen Wände:
Das CAPTCHA-Problem: Manus kommt nicht durch Cloudflare-Schutz. Es stolpert über Paywalls. Wenn LinkedIn oder eine Datenbank eine Anmeldung verlangt, ist Schluss. Der Agent steht da wie jemand ohne Ausweis vor dem Club.
Das Gedächtnis-Problem: Bei komplexen Aufgaben (z.B. eine Reise planen, die 50 Websites involviert) „vergisst“ Manus, was es am Anfang gemacht hat. Das Kontextfenster füllt sich mit Datenmüll – Navigation, Werbung, Footer – bis das System abstürzt oder in Schleifen gerät.
Um das Problem zu umgehen fragt Manus mittlerweile zwar häufiger, ob es nur einen Teil der Aufgabe erledigen soll, aber das löst die gewünschte Aufgabe dann meist nur sehr oberflächlich oder eben nicht vollständig.
Das Kreativitäts-Problem: Manus ist ein Jäger, kein Schreiber. Es kann brillant Daten finden, aber wenn du erwartest, dass es daraus einen guten Text macht, wirst du enttäuscht. Dafür ist es nicht gebaut.
Das Kosten-Problem: Manus arbeitet mit Credits. Eine komplexe Aufgabe kann 10-20 Credits kosten. Scheitert sie (z.B. wegen eines CAPTCHAs), sind die Credits oft trotzdem weg. Das macht die Planung schwierig.
Mein Workflow mit Manus
Ich habe gelernt: Nutze Manus für das, was es kann. Mein Workflow sieht jetzt so aus:
Manus: „Finde mir 10 relevante Artikel/Bibliotheken/Quellen zu X“
Ich: Exportiere die URLs
Claude: Verarbeitet den Content und macht was Sinnvolles daraus
Manus ist der Retriever. Claude ist der Analyst und Texter. Zusammen sind sie unschlagbar.
Der Claude-Durchbruch: Wenn Gedächtnis billig wird
Jetzt zum aufregenden Teil – und dem Grund für meinen persönlichen „Aha!“-Moment.
Das Problem, das wir alle hatten
Stell dir vor, du arbeitest mit Claude an einer großen Codebasis. Jedes Mal, wenn du eine Frage stellst, muss Claude die GESAMTE Codebasis neu lesen:
100.000 Zeilen Code
10-15 Sekunden Wartezeit
Kosten pro Anfrage: 100.000 Tokens Input
Das war teuer und langsam. Niemand konnte so produktiv arbeiten.
Die Lösung: Prompt Caching
Anthropic hat 2025 etwas Geniales eingeführt: Prompt Caching. Die Idee ist simpel, aber revolutionär:
Beim ersten Mal liest Claude deine Codebasis (oder dein 200-seitiges Handbuch) komplett. Das dauert 20 Sekunden und kostet etwas mehr. Aber dann wird dieser Zustand gecacht – im Hochgeschwindigkeits-Speicher gespeichert.
Jede weitere Anfrage:
Dauert nur noch 2 Sekunden (85% schneller!)
Kostet 90% weniger (Cache Read statt normaler Input)
Das klingt technisch, aber das Ergebnis ist magisch: Claude fühlt sich plötzlich an wie ein Teamkollege, der alles über dein Projekt weiß und sofort reagiert.
Mein Durchbruch
Das war der Moment, in dem ich es kapiert habe. Ich konnte plötzlich:
Komplexe Projekte iterativ erweitern, ohne dass Claude den Kontext verliert
Über Tage hinweg am selben Projekt arbeiten, ohne alles neu hochladen zu müssen
Keine Redundanzen mehr, weil Claude sich erinnert, was schon existiert
Keine kaputten Refactorings mehr, weil das Kontextfenster überläuft
Claude Projects macht das noch einfacher: Du lädst deine Codebasis, Dokumentation und Style-Guides in ein „Projekt“ hoch. Claude cacht das automatisch. Du kannst es mit deinem Team teilen. Es ist wie ein gemeinsames Gehirn für euer Projekt.
Das Model Context Protocol (MCP): Der USB-C-Moment
Noch ein technisches Detail, das wichtig ist: MCP ist ein neuer Standard, der Claude mit deinen lokalen Tools verbindet.
Früher: Wenn du wolltest, dass Claude auf deine Datenbank zugreift, musstest du manuell Integrations-Code schreiben.
Jetzt: MCP ist wie ein USB-C-Port. Du startest einen MCP Server (z.B. für deine SQLite-Datenbank), und Claude verbindet sich damit.
Das bedeutet: Claude kann jetzt nicht nur Code schreiben, sondern auch:
Ihn ausführen
Die Ausgabe lesen
Fehler fixen
Und das Ganze iterieren
Das schließt die Schleife zwischen „Code schreiben“ und „Code testen“ – ein echter Game-Changer.
OpenAI und Google: Die Denker
Während Manus und Claude sich auf Aktion konzentrieren, gehen OpenAI und Google einen anderen Weg: Reasoning.
OpenAI GPT-5.1: Instant vs. Thinking
OpenAI hat sein Modell in zwei Modi aufgeteilt:
Instant Mode: Schnell, warm, kreativ. Für Gespräche und kreative Arbeit.
Thinking Mode: Langsam, aber präzise. Pausiert, reflektiert, denkt nach – wie ein Mensch, der ein schwieriges Problem löst.
Codex-Max, die Coding-Variante, kann jetzt „mehrstündige Agenten-Schleifen“ ausführen. Es kann einen Test laufen lassen, ihn scheitern sehen, den Code fixen, neu testen, einen neuen Bug finden, diesen fixen… stundenlang, ohne abzustürzen.
Die Technik dahinter heißt Compaction: Das Modell fasst seine eigene Historie zusammen, wenn das Kontextfenster voll wird, und behält nur das Wesentliche.
Google Gemini 3 Deep Think: Der Mathematik-Savant
Googles Deep Think brilliert bei „Hard Science“: 93,8% auf PhD-Level-Wissenschaftsfragen, löst ungesehene Probleme der Mathe-Olympiade.
Google nennt es ihr „mächtigstes agentisches + Vibe Coding Modell“. Vibe Coding bedeutet hier: Das Modell versteht die Absicht und den Stil deines Projekts, auch wenn du es nur vage beschreibst und baut das Projekt eigenständig.
Wie du die Tools kombinierst: Eine praktische Strategie
Nach all dem technischen Gerede: Was bedeutet das für dich?
Hier ist mein Framework, basiert auf monatelanger Arbeit mit diesen Tools:
Der Gehirn-Vergleich
Tool
Stärke
Dein Use Case
Manus.ai
Web-Autonomie, Daten finden
„Finde mir 10 Artikel über X“
Claude
Kontext-Management, Integration
„Lies diese Docs und implementiere Feature Y“
Codex-Max
Langzeit-Iteration
„Refactorisiere dieses Legacy-Modul über Nacht“
Gemini Deep Think
Algorithmen, Wissenschaft
„Löse dieses mathematische Optimierungsproblem“
Warum die meisten Artikel zu kurz greifen
Du hast es wahrscheinlich gemerkt: Die meisten Blog-Posts über KI sind kurz und oberflächlich. Sie behandeln alle diese Tools als „bessere Chatbots“.
Sie sind aber keine Chatbots mehr. Sie sind die Komponenten einer neuen digitalen Belegschaft:
Manus ist dein Praktikant (eifrig, autonom, bleibt aber manchmal stecken)
Claude ist dein Chefingenieur (kennt alles, schnell, teuer)
Codex-Max ist dein Auftragnehmer (arbeitet 24h, bis das Problem gelöst ist)
Die Frage ist nicht mehr „Welcher Chatbot ist besser?“, sondern „Welchen Spezialisten brauche ich für diese Aufgabe?“.
A Propos Spezialist…
Diese Infografik hat Philipp Schmid, AI Developer Experience bei Google DeepMind und ehemaliger CTO bei HuggingFace mit einem einzigen Prompt und dem neuen Nano Banana Pro (Gemini 3 Pro Image) erstellt:
Für mich das krasseste Beispiel, das ich kürzlich gesehen habe, das zeigt, wie weit Google mit dem agentischen und multimodalen Ansatz schon ist. (Auch wenn sich noch einige Fehler in der Grafik befinden)
Was macht es so besonders? Es kombiniert drei Dinge, die bisher getrennt waren:
Google Search Grounding: Das Modell kann selbstständig nach Echtzeitdaten suchen
Reasoning: Es „denkt“ durch den Prompt nach
High-Fidelity Image Generation: Es erstellt hochauflösende, präzise Visualisierungen
Prompt: Generate an infographic of the pizza per capita.
Das ist alles. Ein Satz. Keine Daten, keine Spezifikationen, keine CSV-Dateien.
Was passiert:
Das Modell versteht: „Ich brauche Pizza-Konsumptionsdaten pro Land“
Es sucht selbst nach aktuellen Statistiken über Google Search
Es entscheidet, wie diese Daten am besten visualisiert werden
Es erstellt eine komplette, designte Infografik mit korrekten Zahlen, Ländernamen und visuell ansprechender Gestaltung
Das ist nicht „KI macht ein Bild“. Das ist „KI macht Marktforschung, Datenanalyse, Design und Produktion“ – alles in einem Schritt.
Die Kosten? $0.13-0.24 pro Bild (je nach Auflösung). Die Möglichkeiten? Unbegrenzt.
Du gibst einen Satz ein. Das Modell handelt – recherchiert, analysiert, visualisiert. Fertig.
Das ist genau das, was ich mit „2025: Das Jahr, in dem KI das Handeln lernte“ meine.
Warum dieses Beispiel so wichtig ist: Früher hättest du für so eine Infografik gebraucht:
Eine:n Designer:in, der/die die Grafik erstellt (3-8 Stunden)
Mehrere Iterationsschleifen für Korrekturen (1-2 Tage)
Jetzt: Ein Satz. 30 Sekunden. $0.13.
Das ist nicht „ein bisschen besser“. Das ist eine andere Realität!
Das Artikelbild ganz oben ist übrigens auch mit Nano Banana Pro entstanden, Input war schlichtweg dieser Beitrag ;o)
Was das für 2026 bedeutet
Die Ära des „All-Zweck-Chatbots“ ist aus meiner Sicht vorbei. Die Zukunft ist Spezialisierung.
Mein persönlicher Durchbruch mit Claude war nicht, dass das Modell schlauer wurde. Es war, dass Gedächtnis billig wurde. Wenn die KI sich an dein Projekt erinnern kann, ohne dass es jedes Mal die Preise einer Transatlantik-Flug kostet, wird sie vom Spielzeug zum Teamkollegen.
Das ist die fundamentale Erkenntnis von 2025.
Zum Schluss
Falls du dich fragst, wo du anfangen sollst:
Probiere Claude Projects für dein nächstes größeres Projekt aus. Lade Docs hoch, aktiviere Caching. Skills ermöglichen es, für bestimmte Aufgaben spezialisierte Anweisungen zu hinterlegen.
Experimentiere mit Manus für eine nervige, repetitive Recherche-Aufgabe, die du schon lange aufschiebst.
Sei geduldig mit den Tools. Sie sind Praktikanten, keine Zauberer. Sie machen Fehler. Aber wenn du ihre Stärken kennst und die Schwächen umgehst, sind sie unglaublich mächtig.
2025 ist nicht das Jahr, in dem KI perfekt wurde. Es ist das Jahr, in dem KI nützlich wurde. Und dabei habe ich das neue unfassbar
Und das ist vielleicht wichtiger.
Hast du schon Erfahrungen mit KI-Agenten gemacht? Wo sind sie bei dir gescheitert, wo haben sie dich überrascht? Schreib mir – ich bin gespannt auf deine Stories.
Zum ersten Mal liegen echte Produktionskonfigurationsdaten von ChatGPT-5 vor – kein Leak, sondern öffentlich nachvollziehbare Analyse einer laufenden Instanz. Sie umfasst 3.099 einzelne Parameter, die zeigen, wie OpenAI seine KI-Suche steuert: von Ranking-Algorithmen über Experimente und Feature Flags bis hin zu Cloud-Konnektoren.
Das Ergebnis: ChatGPT ist längst keine reine Textmaschine mehr – sondern ein multistufiges Retrieval- und Bewertungssystem, das Frische, Nutzerintention, Fachsprache und Quelle miteinander verrechnet.
Der Kern: Das Reranker-Modell
Im Herzen des Systems arbeitet ein neuronales Nachbewertungsmodell:
reranker_model: ret-rr-skysight-v3
Das bedeutet: ChatGPT ruft nicht einfach Webtreffer ab, sondern sammelt eine Vielzahl potenzieller Quellen und ordnet sie anschließend neu – basierend auf Qualitäts- und Relevanzsignalen.
Damit entsteht eine zweite Ranking-Schicht: Nur die qualitativ überzeugendsten Inhalte werden in die endgültige Antwort übernommen. Klassische SEO-Kriterien wie Domainautorität verlieren an Gewicht – entscheidend ist Inhaltskohärenz und Kontextverständnis.
Frische schlägt Tiefe: Der „Freshness Scoring Profile“
Der aktivierte Parameter
use_freshness_scoring_profile: true
belegt eindeutig, dass Aktualität ein systematischer Rankingfaktor ist.
Das Modell nutzt ein Freshness-Scoring-Profil, das neuere Informationen höher gewichtet – nicht nur nach Datum, sondern auch nach semantischer Aktualität.
Selbst ein perfekter Fachartikel von 2022 kann gegen ein aktuelleres, kürzeres Update verlieren.
Konsequenz für Content-Publisher: Regelmäßige Aktualisierungen, Re-Publikationen und Ergänzungen sind Pflicht, um in der KI-Wissenslandschaft sichtbar zu bleiben.
Das Multi-Layer-Filtersystem: Wie ChatGPT Inhalte versteht
Mehrere Filterebenen bestimmen, ob und wie Inhalte in Betracht gezogen werden:
ChatGPT erkennt dank enable_query_intent, was Nutzer wirklich wollen – etwa Definition, Vergleich, Anleitung oder Bewertung. Texte, die ihren Zweck klar signalisieren, haben hier einen Vorteil.
2. Source- und Mimetype-Filter
Nicht alle Quellen zählen gleich. PDFs, Webseiten, Dokumente oder Cloud-Dateien werden unterschiedlich bewertet – abhängig vom Fragetyp.
3. Fachvokabular als Ranking-Signal
vocabulary_search_enabled + „fine-grained filters“ bedeuten: ChatGPT erkennt präzise Fachtermini und nutzt sie zur Gewichtung. Wer seine Branche sprachlich korrekt abbildet, wird bevorzugt.
Die zweite Welt: ChatGPTs Connector-System
Die vollständige Analyse listet 41 aktive Connectors, darunter:
Diese Schnittstellen zeigen, dass ChatGPT-5 nicht nur das öffentliche Web durchsucht, sondern auch private Arbeitsräume und Cloud-Systeme einbindet.
Auffällig ist der Parameter:
use_light_weight_scoring_for_slurm_tenants: true
„Slurm“ steht für verbundene Dritt-Systeme (Tenants). Hier nutzt ChatGPT leichtere Scoring-Methoden, um schnelle, ressourcenschonende Ergebnisse zu liefern – im Gegensatz zu Web-Inhalten, die intensiver bewertet werden.
Quelle
Bewertungslogik
Öffentliches Web
Vollständiges Reranking + Qualitäts-Scoring
Private Quellen (z. B. Drive, Notion)
Leichtes Scoring, Fokus auf Relevanz und Geschwindigkeit
Das verdeutlicht: ChatGPT betreibt adaptive Suchstrategien, je nach Kontext und Datentyp.
120 Experimente und 248 Feature Flags: ChatGPT als permanentes Testlabor
In der Kategorie Experiments finden sich:
120 A/B-Tests, davon 88 vollständig aktiv, 19 deaktiviert, 13 in Testphase
248 Feature Flags, die einzelne Systemfunktionen steuern
Von enable_dynamic_prompt bis use_chip_style_citations reicht das Spektrum – Indizien für eine hochgradig modulare Architektur, in der OpenAI permanent Features erprobt und ausrollt.
Diese ständige Variation erklärt, warum nicht jeder Nutzer dieselbe ChatGPT-Version erlebt: Die Plattform testet live.
Performance- und Systemparameter
Einige technische Eckdaten der Analyse:
Parameter
Wert
Bedeutung
max_file_size_mb
25
Maximale Uploadgröße
max_bytes
30 MB
Technische Obergrenze
history_results_limit
6
Begrenzung vergangener Ergebnisse
voice-status-cache-ttl-ms
540000 ms
Cache-Lebensdauer für Audiofunktionen
inference_debounce_ms
200 ms
Antwort-Verzögerung für Stabilität
Diese Werte zeigen, wie OpenAI Präzision, Geschwindigkeit und Kostenkontrolle ausbalanciert.
Die 3.099 Elemente im Überblick
Kategorie
Anzahl
Beispielparameter
Search Optimization
33
use_freshness_scoring_profile
Experiments
120
A/B-Test IDs (10–99 %)
Feature Flags
248
enable_query_intent, use_dynamic_response
System Components
542
Feature Gates & Traces
Performance Settings
30
Dateigrößen, Retry-Intervalle
Model Configurations
25
reranker_model, gpt-4o, o3_pro
Connectors
41
Google, Dropbox, Notion, Slack, etc.
Weitere Kategorien
2070
UI-Elemente, Authentifizierung, Strings
Die enorme Breite unterstreicht, wie tief ChatGPT parametrisiert ist – von Frontend-Details bis zur Relevanzbewertung.
Was das alles für Content-Strategien bedeutet
1. Aktualität ist kein Nice-to-Have
Das Freshness-Profil zeigt: veraltete Inhalte verlieren an Sichtbarkeit – auch wenn sie hochwertig sind.
2. Intent schlägt Keyword
Klare Struktur und Signalisierung des Inhaltszwecks (Leitfaden, Vergleich, Erklärung) verbessern die Auffindbarkeit.
3. Sprache als Kompetenzsignal
Fachterminologie wird erkannt und belohnt. KI versteht, wenn du weißt, wovon du sprichst.
4. Qualität überlistet keine Pipeline
Mit mehreren Filter- und Ranking-Schichten ist das System nahezu manipulationssicher. Nur inhaltlich substanzieller, korrekter und aktueller Content überlebt.
Fazit: Kein Chatbot, sondern ein neuronales Bewertungssystem
ChatGPT-5 zeigt, wie weit OpenAI die Kombination aus Suche, Ranking, Kontextverständnis und Personalisierung getrieben hat. Die 3.099 Parameter machen deutlich: Hinter jeder Antwort steckt eine komplexe Pipeline aus Filterung, Scoring, Freshness-Logik und Experimenten.
Für Content-Ersteller gilt daher:
Wer in der Welt der KI-Antworten sichtbar bleiben will, muss den Content so aktuell, klar und präzise gestalten, dass er selbst einem neuronalen Reranker standhält.
Mit dem Erscheinen von Claude Code habe ich mir auch Claude noch einmal angesehen. Bislang hatte ich nicht einmal Zeit, das 4.5er-Modell ausgiebig zu testen. Aufgrund zu vieler Abos hatte ich Claude sogar gekündigt.
Aber was in den letzten zwei Tagen passiert ist, kann ich immer noch nicht richtig fassen…
Kann KI programmieren?
Die Frage „Kann KI programmieren?“ kann ich jetzt ganz klar mit Ja beantworten – zumindest wenn der oder die Anwender:in programmieren kann und richtig promptet!
Dank der Artefakt-Funktion in Claude – bei der man direkt neben dem Chat Web-Apps in Echtzeit ausprobieren, erweitern und verbessern kann – habe ich bereits einige kleine, nützliche Helferlein gebaut.
An dieser Stelle sage ich bewusst nicht programmiert, denn ich habe keine einzige Zeile Code geschrieben, sondern Claude angewiesen, das für mich zu tun.
Davor habe ich mir – selbstverständlich – extrem viele Gedanken über die Anwendung gemacht, alles logisch durchdacht und im initialen Prompt, an dem ich über eine Stunde gearbeitet habe, viele Vorgaben zur Struktur gemacht.
Leider kann ich diesen initialen Prompt hier nicht zeigen, da es sich um ein Kundenprojekt handelt und Tool sowie Funktionalität nicht öffentlich werden sollen.
Aber die Struktur war wie folgt:
Beispielstruktur des Prompts
„Ich brauche eine browserbasierte kleine App, die Folgendes tut:“
Login-Maske anzeigen: Nach Eingabe von Benutzername und Passwort werden die Daten via POST an ein PHP-Skript unter /login.php geschickt. Wenn die Kombination valide ist, liefert das Skript true zurück – dann weiter zu Punkt 2, sonst Fehlermeldung und erneuter Login-Versuch.
Begrüßung und Auswahl: Nach erfolgreichem Login wird eine kurze Begrüßung angezeigt mit der Möglichkeit, eine neue Analyse zu starten oder eine der letzten zehn Analysen erneut anzusehen. Analysen sollen lokal im Browser und später auch in einer SQLite-Datenbank gespeichert werden (über ein db.php-Skript).
Neue Analyse starten: Es werden folgende Daten vom Nutzer abgefragt: a) Kontaktinformationen: Hauptansprechpartner: [Vorname], [Nachname], [E-Mail-Adresse], [Telefonnummer] b) Über das Unternehmen: [Unternehmen], [Branche], [Domain] (VALIDIEREN!) c) Mitarbeiterzahl: Auswahlmenü mit folgenden Optionen: „Nur ich“, „1–10“, „11–50“, „51–100“, „101–500“, „501–1000“, „Über 1000“, „Über 10000“ d) Unternehmensziel: [UnternehmensZiel] (Textarea, mindestens 5 Zeilen) e)–l) entfernt n) Sonstige Fragen: [Fragen] Für alle Felder sollen Inline-Validierungen per JavaScript verwendet werden. Der Nutzer wird mit grünen Bestätigungen durch das Formular geführt. Der Button „Analyse starten“ ist erst aktiv, wenn alles korrekt ausgefüllt wurde.
Datensammlung starten: Nach Klick wird eine Nachricht mit Ladeanzeige gezeigt. Es folgen verschiedene Datenabfragen via PHP/XHR: a) Text der Startseite (via web.php und Übergabe von [Domain]) b) Falls [Konkurrenten] vorhanden sind: Abruf der Startseiten jeder Konkurrenzdomain (ebenfalls web.php) c) Falls nur Unternehmensnamen vorliegen: Übergabe an domainFromName.php, um Domains zu ermitteln d)–f) entfernt Anschließend wird eine Übersicht aller gesammelten Informationen angezeigt.
Analyse starten: Danach beginnt die KI-Analyse (erneut mit Ladeanzeige). Über das PHP-Skript openphp.php werden Anfragen an die OpenAI-API geschickt – mit den entsprechenden Daten aus dem vorherigen Schritt. Der Nutzer sieht Prompt + Daten als Markdown (Human-in-the-Loop-Ansatz) und kann die Prompts anpassen oder einzelne Einschätzungen neu anfordern. Einschätzungen 1–3 waren projektspezifisch und sind entfernt.
Vorgabe: „Bitte gehe davon aus, dass die PHP-Skripte existieren. Konzentriere dich auf HTML, CSS und JavaScript. Verwende Frameworks (via CDN), wenn sinnvoll. Das Ganze soll wie eine moderne, schnelle, nutzerfreundliche State-of-the-Art Web-App wirken.“
Das hat schon mit dem Vorgängermodell erstaunlich gut funktioniert – allerdings nur bis zu dem Punkt, an dem der Quelltext zu lang wurde, um noch vollständig im Kontextfenster zu bleiben. Ab da hat Claude beim Hinzufügen neuer Funktionen häufig bestehende zerstört, und ich musste entweder mit der letzten funktionierenden Version leben oder manuell weitercoden.
Daher hatte ich auch nicht Claude Code in der IDE (Entwicklungsumgebung) verwendet, sondern einfach nur in der normalen Web-Ansicht des Chats. Ich hätte ja nicht gedacht, dass ich weiter komme, als ein paar nette kleine Dinge zu tun…
Aber mit Claude Code bzw. Claude 4.5 kam der Durchbruch
In den letzten zwei Tagen habe ich – in insgesamt etwa zwölf Stunden – eine unglaublich komplexe Web-App gemeinsam mit Claude entwickelt, die weit über das Kontextlimit hinaus erfolgreich erweitert werden konnte.
Ich habe Claude Schritt für Schritt angewiesen, Dateien für bestimmte Zwecke zu erstellen, und jeweils den nötigen Kontext geliefert (z. B. API-Beispiele für Requests und Responses).
Ja, es gab Momente, in denen die App (basierend auf dem React-Framework) nur noch einen weißen Bildschirm zeigte – aber Claude konnte jeden dieser Fehler selbst finden und beheben!
Manchmal reichte reines logisches Reasoning; in anderen Fällen schrieb sich Claude eigene kleine Helfertools, um den Code zu analysieren oder zu debuggen.
Einmal bin ich fast vom Stuhl gefallen, als Claude ein Skript schrieb, das alle öffnenden und schließenden Klammern im Code zählte, feststellte, dass eine geschweifte Klammer fehlte – und den Fehler selbständig behob. Danach lief wieder alles!
Das ist nicht nur ein Fehler, den man als Entwickler:in gut kennt – die Lösungsstrategie selbst hat mich enorm beeindruckt.
Claude kann Code ausführen und hat Zugriff auf eine Linux-Sandbox. Beim Debugging nutzte es beispielsweise regelmäßig den Befehl cat in der Kommandozeile.
Als ich Claude bat, die eigene Anwendung auf Sicherheitslücken und Schwachstellen hin zu untersuchen, erhielt ich eine detaillierte und sehr gute Einschätzung und Auflistung der Probleme mit Vorschlägen zur Verbesserung, die Claude auf meine Bitte hin auch direkt umsetzte! Und ja, damit wurden die klassischen Unzulänglichkeiten von „Vibe Coded Apps“ tatsächlich behoben!
Was ich selbst kaum glauben kann
Das Projekt wuchs und wuchs.
An einem Punkt beschloss ich, dass die HTML-Datei zu groß und unübersichtlich geworden war. Claude kam damit zwar noch klar, aber neue Features dauerten immer länger, und ich dachte: Wenn jemals ein Mensch das weiterentwickeln soll, braucht das Projekt Struktur.
Also wies ich Claude an, den Code in mehrere Dateien zu splitten, die Gesamtfunktionalität aber 1:1 beizubehalten.
Ich schlug eine Struktur vor, bat aber zunächst um Feedback. Claudes Vorschlag war so durchdacht und überzeugend, dass ich nur noch schrieb:
„Okay, bitte setze das so um!“
Jetzt denkt jede:r Entwickler:innen bestimmt an den Running Gag:
„Claude 4 just refactored my entire codebase in one call. 25 tool invocations. 3,000+ new lines. 12 brand new files. It modularized everything. Broke up monoliths. Cleaned up spaghetti. None of it worked. But boy was it beautiful.“
Nur dieses Mal funktionierte alles – auf Anhieb! Und die Funktionen wurden beim Code-Splitting sogar noch verbessert!
Fazit: Es funktioniert!
Ich habe heute Morgen mein Abo auf das größte Paket erweitert, damit ich nicht alle zwei Stunden ins Nutzungslimit renne.
Jetzt bin ich gespannt, wie weit ich mit dem Projekt komme – aber aktuell sehe ich keinen Punkt mehr, an dem es „brechen“ sollte.
Ich frage mich heute allerdings, wie gut das funktioniert, wenn der/die Anwender:in nicht selbst programmieren kann!Freue mich über Berichte!
Seit Monaten geistert er durch LinkedIn-Posts, Medium-Posts und KI-Memes angeblicher KI-Gurus: der Chief Prompt Engineer. Eine Mischung aus Magier, Sprachwissenschaftler und KI-Flüsterer. Jetzt könnte dieser Traumjob tatsächlich Realität werden – zumindest in Organisationen, die Anthropic’s neues Feature Claude Skills einsetzen.
Was sind Claude Skills?
Am 16. Oktober 2025 hat Anthropic mit Agent Skills (kurz: Claude Skills) ein neues Konzept vorgestellt, das die Arbeit mit KI-Assistenten grundlegend verändern dürfte.
Ein Skill ist im Prinzip ein kleines Wissenspaket – ein Ordner mit Anweisungen, Skripten und Ressourcen, den Claude bei Bedarf lädt, um sich auf eine bestimmte Aufgabe zu spezialisieren.
Beispielsweise kann es Skills geben für:
das Erstellen von Excel-Auswertungen,
das Schreiben von Texten im Corporate Tone of Voice,
das Befolgen interner Qualitätsrichtlinien oder
das Generieren bestimmter Dateiformate.
Claude greift nur dann auf einen Skill zu, wenn er zur aktuellen Anfrage passt. Dadurch bleibt das System schnell und ressourcenschonend – und verhält sich ein bisschen wie ein Mensch mit einem sehr gut organisierten Wissensarchiv.
Warum das spannend ist
Mit Skills lassen sich KI-Assistenten zielgerichtet trainieren, ohne das eigentliche Modell zu verändern. Man kann also das Verhalten von Claude modular anpassen, indem man Skills stapelt, kombiniert oder austauscht – Composable AI in Reinform.
Das Beste: Skills sind portabel. Einmal erstellt, können sie in allen Claude-Umgebungen verwendet werden – von Claude.ai über Claude Code bis hin zur API. Unternehmen können so ihre eigene Skill-Bibliothek aufbauen, die intern geteilt und weiterentwickelt wird.
Der neue Traumjob: Chief Prompt Engineer
Und hier kommt der Spaß: Stell dir vor, dein Unternehmen hat künftig eine kleine Eliteeinheit von Prompt-Profis – nennen wir sie Prompt Engineers. Ihre Aufgabe: für alle gängigen Use Cases saubere, getestete und kontextreiche Skills anlegen.
Der Rest des Unternehmens muss dann nur noch normale Anfragen stellen. Claude schaut automatisch nach, ob es einen passenden Skill gibt – und wenn ja, wird dieser eingebunden. Kein Chaos mehr mit halbgaren Prompts oder unsauberen Anweisungen, sondern reproduzierbare Qualität auf Knopfdruck.
Von der Prompt Library zum Skill Router
Wer das Konzept weiterdenkt, könnte eine interne Prompt Library mit einem Skill Selector Router kombinieren und dies unabhängig von Claude mit jeder beliebigen KI! Eigene Skills für Image-, Video- oder Reasoning-Modell? Kein Problem!
Bevor der Agent die Nutzeranfrage bearbeitet, prüft der Router per Retrieval-Augmented Generation (RAG), ob es bereits ein passendes Skill-Prompt-Template in der Libraty gibt – und fügt es automatisch ein.
Das wäre im Grunde eine automatisierte Prompt-Optimierung für alle Mitarbeiter:innen:
Konsistente Ergebnisse,
geringere Fehlerquote,
weniger Prompt-Wildwuchs.
Oder anders gesagt: Die Grundindee der „Skills“ könnten der Schlüssel sein, um KI-gestützte Arbeit von „ein bisschen Magie“ zu „echtem Prozessstandard“ zu transformieren.
Fazit
Mit Skills hat Anthropic ein spannendes Werkzeug für Claude geschaffen, das das Beste aus Prompt Engineering, Automatisierung und Wissensmanagement vereint.
Und wer weiß – vielleicht steht der Titel Chief Prompt Engineer bald wirklich auf Visitenkarten. Nur diesmal mit System!
Bist du gerade dabei, deine erste GEO-Kampagne zu planen, und fragst dich, woher du die Prompts nehmen sollst, die du tracken kannst – oder woher GEO-Tracking-Tools ihre Vorschläge bekommen?
Dann solltest du wissen, was Prompt Decoding ist und wie Prompt Generierung funktioniert.
Genau das erkläre ich dir in diesem Beitrag – mit wissenschaftlichem Hintergrund, praktischen Beispielen und SEO-Kontext.
Wer sich ernsthaft mit GEO (Generative Engine Optimization) beschäftigt – also der Optimierung für KI-Suchen und Chatbots wie ChatGPT, Gemini, Perplexity, Copilot oder Googles neuen KI-Modus – steht schnell vor einem zentralen Problem: Wir haben keine echten Nutzungsdaten!
Als klassische SEOs arbeiten wir mit Keyword-Tools, Suchvolumina und Daten aus der Search Console. GEO hingegen funktioniert völlig anders: Kein Chatbot – weder ChatGPT, Gemini, Claude, Grok, Meta AI noch Google im KI-Modus – liefert Daten darüber, was Menschen dort eingeben oder wie sie fragen. Selbst bei KI-Suchmaschinen wie Perplexity bekommen wir keine echten Suchanfragen oder Klickdaten.
Selbst wenn Besucher:innen über KI-Suchen kommen, erfährst du nicht, welcher Prompt sie auf deine Seite geführt hat. Das macht GEO zu einem völlig neuen Spielfeld – und genau hier kommen Prompt Generierung und Prompt Decoding ins Spiel.
Prompt Generierung – Antworten aus der Blackbox
Ich habe mich früh gefragt: Wenn es keine Nutzerdaten gibt – wie können wir dann GEO optimieren?
Als ich Mitte 2024 meinen Kurs „The Future of SEO“ veröffentlichte, existierten kaum GEO-Tracking-Tools oder Einblicke in Chatbot-Nutzung.
Also entwickelte ich eine eigene Lösung: Über einen CustomGPT und die Gemini-API generierte ich sogenannte implizite Fragen – also die zugrunde liegenden Bedürfnisse hinter Suchanfragen.
Damit konnte ich gezielt Inhalte für Googles AI Overviews und die damals neue Search Generative Experience (SGE) optimieren.
Die Idee hinter der Generierung von Prompts
Bei klassischen Suchmaschinen dachten wir in Keywords, weil sie keine natürlichen Fragen verstanden. Doch hinter jedem Keyword steckt eine implizite Frage oder Intention.
Beispiel: Bei der Suche nach „beste Laufschuhe 2025“ stehen meist diese Intentionen dahinter:
Welche Modelle sind empfehlenswert?
Welche Marke hat das beste Preis-Leistungs-Verhältnis?
Was ist neu auf dem Markt?
LLMs können aufgrund ihrer gigantischen Trainingsdaten diese Intentionen hinter den Suchanfragen erkennen und daraus abgeleitete Prompts erzeugen.
Ich nutzte zusätzlich das MECE-Framework (Mutually Exclusive, Collectively Exhaustive), um Themen vollständig, aber überschneidungsfrei zu strukturieren. So entstand eine geschlossene, logisch gegliederte Content-Basis – ideal für GEO.
Prompt Decoding – ein Blick ins Denken der Modell
Das sogenannte Prompt Decoding ist die konsequente Weiterentwicklung dieser Idee. Statt Prompts zu erfinden, versucht man hier, repräsentative Prompts zu rekonstruieren, die echte KI-Nutzer:innen so oder ähnlich eingeben könnten.
Diese Methode wurde von Hanns Kronenberg (Head of SEO bei Chefkoch) entwickelt und erstmals auf dem legendären SEOktoberfest G50 Summit vorgestellt, wo er den 3. Platz belegte.
Das Besondere an seiner Technik: Er konnte mit seiner Analyse die gleichen Themencluster generieren („writing, knowledge, technology, everyday life, role play“), die im September 2025 im vom NEBR (National Economic Bureau of Research) veröffentlichten Working Paper “How People Use ChatGPT” beschrieben wurden, das auf offiziellen OpenAI-Daten basiert und von der Harvard University IRB (Institutional Review Board) genehmigt wurde.
Das Prinzip hinter Prompt Decoding
Beim Fine-Tuning lernen Sprachmodelle, auf reale menschliche Anfragen hilfreiche Antworten zu geben. Prompt Decoding kehrt diesen Prozess um: Man fragt das Modell, welche Arten von Prompts es erwarten würde.
Prompt Decoding wird damit zu einer neuen Form der Marktforschung: Man nutzt die im Modell verankerten impliziten Muster – keine echten Chats, aber das gelernte „Denken“ der KI.
Grenzen, Bias und Halluzinationen
So faszinierend die Methode klingt – normale Prompt Generierung hat klare Grenzen. Viele Versprechen klingen nach „magischem Zugriff auf Nutzerintentionen“, sind aber überinterpretiert.
1. Veraltete Trainingsdaten
Alle Modelle besitzen einen Knowledge Cut-Off.
Alles, was danach passiert, kennt das Modell nicht – es kann nur schätzen. Ohne aktuelle Daten (z. B. über APIs oder RAG-Systeme) produziert das Modell also veraltete oder falsche Prompts. Gerade bei neuen Marken, Rebrandings oder Trends kann das zu Fehleinschätzungen führen.
2. Halluzination und Selbstüberschätzung
LLMs sind statistische Textgeneratoren, keine Wahrheitsmaschinen.
Sie berechnen die wahrscheinlichste Fortsetzung – nicht die richtige. Deshalb entstehen sogenannte Halluzinationen: plausible, aber falsche Antworten.
Mit gezieltem Prompting kann man offenbar jedoch dieses Risiko reduzieren. Hanns Kronenberg empfiehlt etwa Rollen-Definitionen („Du bist ein analytisches Modell …“), fügt Unsicherheitsmarkierungen hinzu und hat noch eine Menge weiterer Prompt-Tricks eingesetzt.
Doch leider teilt er seinen Systemprompt nicht öffentlich, sondern hat ihn an das Tool RankScale lizensiert. (Rankscale ist ein neues GEO-Tool (Generative Engine Optimization), das entwickelt wurde, um die Markenpräsenz in KI-Suchmaschinen zu analysieren, zu verfolgen und zu optimieren.)
3. Mode Collapse und Typicality Bias
Die Forschung zeigt, dass Modelle nach dem Alignment-Training zu stereotypen Antworten tendieren. Wenn man nach „typischen Prompts“ fragt, liefern sie oft nur den einen dominanten Modus – also die häufigste, nicht die vielfältigste Antwort.
Das nennt man Mode Collapse.
Das Modell spiegelt dann nicht die Breite menschlicher Intentionen wider, sondern die trainierte Voreingenommenheit.
Warum fundierte Schätzungen trotzdem wertvoll sind
Prompt Generierung entschlüsselt also keine echten Daten, aber es kann fundierte Hypothesen liefern. In der Wissenschaft spricht man dabei von einem „educated guess“ – einer plausiblen Annahme auf Basis von Erfahrung und Modellwissen.
Educated Guessing als Prinzip
In der Statistik, Medizin oder Ökonomie werden fehlende Daten regelmäßig durch Imputation ergänzt – also durch berechnete, plausible Zwischenwerte. Genauso funktioniert Prompt Decoding im GEO-Kontext: Es schätzt wahrscheinliche Prompts, wo keine realen Nutzerdaten verfügbar sind.
Im Gegensatz zu Keyword-Daten zeigt Prompt Research nicht, was gesucht wurde, sondern welche Denk- und Sprachmuster in den Trainingsdaten der KI vorkommen.
Marketing-Teams können mit Prompt Decoding Hypothesen zu Zielgruppeninteressen bilden, Trends früh erkennen oder ihre eigenen Botschaften gegen reale Sprachmuster testen.
LLMs können Lücken mit plausiblen Werten füllen, besonders in domänenspezifischen Kontexten.
Die Qualität variiert je nach Fachgebiet: In Medizin, Wirtschaft und Biologie am besten, in technischen Datensätzen schwächer.
Das bestätigt: Sprachmodelle können implizites Wissen abrufen und verallgemeinern – selbst ohne direkten Datenzugriff. Prompt Decoding nutzt genau dieses Prinzip.
Prompt Generierung in der GEO-Praxis
Wie setzt man das Ganze nun praktisch um? Hier ein einfacher Workflow, den viele GEO-Tools integriert haben:
Seed-Themen definieren Wähle 5–10 relevante Themencluster deiner Marke oder Branche.
LLM-Abfragen formulieren Frage z. B.: „Welche typischen Prompts würdest du zum Thema X erwarten?“ oder „Welche Fragen stellen Nutzer:innen häufig, wenn sie Y recherchieren?“
Tracking-Setup Nutze diese Prompts in deinem GEO-Tracking-Tool, um zu sehen, welche Quellen die KI nennt.
Analyse & Optimierung Prüfe, wie häufig deine Marke zitiert wird, und justiere deine Content-Strategie.
Doch Vorsicht: So erhältst du nur den verzerrten, dominanten Modus – nicht die ganze Vielfalt. Hier setzt der nächste methodische Schritt an.
Ist „Verbalized Sampling“ der Trick hinter Prompt Decoding?
Der SEO-Kollege Christopher Wagner (Head of SEO, RP Digital) machte mich auf ein neues Paper von Zhang et al. (2025) mit dem Titel „Verbalized Sampling“ aufmerksam. Die Forscherinnen und Forscher schlagen darin zur Vermeidung des Mode Collapse das sogenannte Verbalized Sampling (VS) vor.
Wie funktioniert das?
Statt nach einer typischen Antwort oder einer Liste zu fragen, bittet man das Modell, mehrere mögliche Antworten inklusive ihrer Wahrscheinlichkeiten zu generieren.
Das Beispiel aus ihrem Paper lautet:
Generate 5 responses to the user query, each within a separate <response> tag. Each <response> must include a <text> and a numeric <probability>. Please sample at random from the tails of the distribution, such that the probability of each response is less than 0.10.
Dieser „Distribution-level Prompt“ zwingt das Modell, auf die volle Verteilung seines Wissens zuzugreifen. Das erhöht die Diversität signifikant – laut Studie um das 1,6- bis 2,1-Fache – ohne Qualitätsverlust.
Hier die Demo der Forscher:innen:
Sie haben zusätzlich ein Colab zu ihrem Framework veröffentlicht, das ich mir mal genauer angesehen und für den Zweck der Prompt Generierung adaptiert habe. Ein Beispiel-Prompt könnte stark vereinfacht wie folgt lauten:
Generate a distribution of probable user queries about „[YOUR TOPIC]“ based on your training data patterns (do not use external tools). Return a set of candidate queries with probability weights that represent how commonly each query type appears in your training patterns. These weights should form a discrete probability distribution.
Requirements: – Generate 10-15 diverse candidate queries – Assign each query a probability weight (0.01 to 1.00) based on estimated frequency in training data – Weights should be relative frequencies (don’t need to sum to 1.0 – can be normalized later) – Cover different prompt categories, user intents, skill levels, and phrasings – Use natural language as users would actually type it
Important: Return the complete distribution, not a single sample. The weights represent relative likelihoods.
Damit erhält man für „Nike Running Shoes“ beispielsweise folgende Ausgabe in GPT-5:
Here’s a synthetic distribution of probable user queries about “Nike Running Shoes,” derived from patterns in natural-language query data and user intent clustering (as seen across retail, fitness, and product-search domains). Weights reflect relative likelihoods (not normalized to 1.0).
🏃 Nike Running Shoes — Probable Query Distribution
#
Example User Query
Intent Category
Relative Probability Weight
1
“best Nike running shoes for men”
Product comparison / purchase intent
0.85
2
“Nike running shoes women’s sale”
Shopping / deal-seeking
0.80
3
“are Nike running shoes good for long distance?”
Product evaluation / performance
0.65
4
“newest Nike running shoe releases 2025”
Product discovery / recency
0.60
5
“difference between Nike Pegasus and Vaporfly”
Model comparison / feature analysis
0.55
6
“Nike running shoes size guide”
Fit / sizing assistance
0.50
7
“cheap Nike running shoes under $100”
Price-sensitive shopping
0.48
8
“Nike trail running shoes review”
Niche subcategory / review intent
0.42
9
“how to clean Nike running shoes”
Maintenance / aftercare
0.38
10
“are Nike running shoes good for flat feet?”
Specialized comfort / biomechanical query
0.35
11
“Nike running shoes vs Adidas running shoes”
Brand comparison
0.30
12
“where to buy Nike running shoes near me”
Local commerce / store intent
0.28
13
“history of Nike running shoes technology”
Informational / educational
0.18
14
“custom Nike running shoes design your own”
Personalization / Nike By You intent
0.15
15
“are Nike running shoes worth it?”
Value judgment / general sentiment
0.12
🧩 Summary by Category
Category
Typical User Motivation
Aggregate Weight (approx.)
Shopping & Deals
Find / compare / buy shoes
~3.5
Product Evaluation & Fit
Assess comfort, performance, or fit
~1.9
Informational & Technical
Learn about design, history, or maintenance
~1.2
Specialized / Personalized
Explore niche or creative use cases
~0.5
Would you like me to normalize these probabilities (so they sum to 1.0) and show the resulting distribution graphically (e.g., bar chart or pie chart)?
Der Schlüssel liegt offenbar darin, nach einer Verteilung (Distribution) von etwas zu fragen, statt nach Beispielen (Samples)!
Bedeutung für Prompt Decoding in der Praxis
Wahrscheinlich ist so etwas in der Art der „geheime Prompt Trick“, mit dem Hanns Kronenberg so realistische Daten aus den Modellen extrahieren kann. Man frag also nicht mehr nur nach „typischen Prompts“, sondern nach diversen Prompts mit Wahrscheinlichkeiten.
So erhältst du realistischere Hypothesen für dein Tracking und kannst Bias-Effekte sichtbar machen.
Fazit: Kein Hype, aber ein Werkzeug mit Zukunft
Prompt Decoding entschlüsselt keine geheimen Nutzerdaten. Aber es hilft, zu verstehen, wie KI-Systeme denken, priorisieren und Informationen präsentieren. Die Methode liefert – je nach Einsatz – Ergebnisse, die oft überraschend realitätsnah wirken.
Es zeigt Muster – keine Wahrheiten. Es liefert Insights – keine Messwerte. Es inspiriert Strategien – keine Garantien.
Wer das versteht, kann die Technik als Strategie-Booster einsetzen – für Themenfindung, semantisches SEO, Nutzungsanalyse oder Trend-Monitoring.
GEO ohne Educated Guesses ist derzeit unmöglich.
Prompt Decoding, also die Generierung von Prompts in Kombination mit Verbalized Sampling ist der bisher beste methodische Rahmen, um die Blackbox der generativen Suche zu erforschen.
Achtung: Auf diese Weise generierte Prompts entsprechen wahrscheinlich nicht der tatsächlich Nutzung, helfen jedoch dabei sich strategisch auf das veränderte Nutzerverhalten einzustellen!
Weiterführende Perspektive
In den kommenden Beiträgen zeige ich dir:
wie man Prompts systematisch trackt,
wie man KI-Such-Traffic sichtbar macht,
und welche Tools & Frameworks dafür am zuverlässigsten funktionieren.
Bleib dran – die nächste Evolutionsstufe von SEO ist datengetrieben, generativ und spannender als je zuvor.
Die KI-getriebene Suche entwickelt sich so schnell, dass selbst Profis kaum hinterherkommen. Neue Features, neue Antworten, neue Ranking-Signale – jede Woche. Viele Glücksritter und angebliche „Best Practice“, doch die meisten arbeiten auf Basis wenig belastbarer Daten. Im Juli bereits hatte sich Jakub Sadowski von SurferSEO sich die Fan-out Queries genauer angeschaut: Das sind jene zusätzlichen Suchbegriffe, die KI-Systeme wie ChatGPT, Gemini und Co. aus deiner Frage ableiten und zur Beantwortung heranziehen.
Basis dieser Auswertung waren 1.600 Anfragen über ein breites Spektrum an Keywords und Prompts. In diesem Beitrag findest du die wichtigsten Erkenntnisse, warum Fan-outs für GEO/LLMO/AEO relevant sind – und wie du deine Inhalte darauf ausrichtest:
TL;DR
Rechne mit 2–5 Fan-outs, aber nur 27 % sind stabil; 66 % siehst du nur einmal.
Fan-outs sind semantisch nah (Cosine 0,75–0,95).
Clustere konsequent (≤ 4 Teil-Cluster), arbeite mit SERP-URL-Überlappung.
Tracke AI-Quellen und halte Kannibalisierung klein.
Für GEO-SEO: Entitäten + Varianten (Saison, Zielgruppen, Situationen) systematisch abdecken.
Was sind Query Fan-outs?
Query Fan-outs oder auch Fan-Out-Queries sind von der KI generierte, semantisch passende Suchbegriffe zu deiner ursprünglichen Anfrage im Chatbot. Die Bezeichnung Fan-Out kommt vom auffächern der ursprünglichen Anfrage in mehrere Suchen. Systeme wie Google AI Overviews / AI Mode oder ChatGPT erstellen aus deiner Frage im Chat passende Suchanfragen, sprich Queries, um eine umfassende Antwort über die eingebaute Suchmaschine zu finden und eine gute Antwort auf Basis der gefundenen Informationen geben zu können. Die KI zieht dafür SERPs dieser generierter Keywords heran – nicht die Ergebnisliste zu deiner ursprünglichen Eingabe!
Konsequenz: Willst du in ChatGPT & Co. zitiert oder als Quelle berücksichtigt werden, musst du zu diesen Fan-Out-Queries ranken!
Wichtig: Fan-outs sind volatil!
LLMs sind nicht-deterministisch: Stellst du denselben Prompt zweimal, sind die Ergebnisse oft unterschiedlich. Das gilt auch für Fan-outs. Bevor man Inhalte „auf Verdacht“ baut, lohnt es sich, die Streubreite zu verstehen!
Warum Gemini/ChatGPT als Proxy nutzen
Google setzt Gemini als Motor für AI Overviews & AI Mode ein. Mit der „Grounding“-Funktion (Antworten werden durch Websuche gestützt) lassen sich die verwendeten Fan-out-Queries sichtbar machen. Auch ChatGPT arbeitet mit Fan-outs (modellabhängig). Das macht beide Systeme zu nützlichen Fenstern in die „Query-Expansion“ moderner KI-Suche.
Zentrale Ergebnisse der Studie von SurferSEO
1) Meist bis zu 5 Fan-outs (oft 2–4) – manchmal auch keine
In vielen Fällen bleibt die KI fokussiert und erweitert sparsam. 2–4 Fan-outs sind typisch, bis 5 kommen häufig vor. Manchmal wird gar nicht expandiert (SERP + internes Wissen reichen aus). Implikation: AI-Ergebnisse sollen präzise, aber nicht überladen sein. Für Content-Strategien heißt das: breit genug aufgestellt, ohne thematisch zu verwässern.
2) Geringe Konsistenz einzelner Fan-outs
≈ 27 % der Fan-out-Keywords halten über Runs hinweg durch („Core-Keywords“).
≈ 66 % tauchen nur einmal auf.
≈ 0,6 % erscheinen in allen Runs. Implikation:Auf einzelne Keywords zu setzen ist riskant. Plane auf Cluster-Ebene, nicht auf Einzeltreffer.
3) Semantik: Nahe an der Ausgangs-Frage
Mit Cosine Similarity gemessen liegen die meisten Fan-outs zwischen 0,75–0,95 zur Originalanfrage; es gibt auch 1,0 (identische Phrase).
Beispiel (Prompt „how to use hashtags on Instagram“):
„How many hashtags on Instagram post“
„Instagram hashtag best practices 2025“
„Instagram story hashtags“
„Instagram reel hashtags“ Implikation: Die KI exploriert Variationen, keine völlig neuen Richtungen. Semantische Nähe dominiert.
4) Clustering fängt die Volatilität ab
SurferSEO hat auch die SERP-Nachbarschaften betrachtet (Top-20-Überlappung):
84 % der Fan-outs teilen mindestens 1 URL mit der Original-SERP.
56 % teilen ≥ 5 URLs.
~90 % der Fan-outs lassen sich in bis zu 4 Cluster aufteilen. Implikation:Cluster-Optimierung ist der Hebel. Wenn 66 % der Fan-outs nur einmal vorkommen, sorgen 4 saubere Teil-Cluster rund um dein Ziel-Query für Sichtbarkeit – trotz Schwankungen.
Was bedeutet das für deine GEO-/AI-SEO-Strategie?
1) In Themen-Clustern denken (nicht in Einzel-Keywords)
Baue Themen-Hubs aus (Head-Term + Sub-Cluster).
Optimiere regelmäßig nach (Content Audits, SERP-Vergleiche, interne Verlinkung).
Nutze Topic-Research: Starte mit Head-Terms („London“, „London mit Kindern“) oder gleich mit dem ganzen Prompt („Was tun in London mit Kindern?“). Ziel: Gegen Fan-out-Schwankungen robuster werden, mehr AI-Abdeckung gewinnen.
2) Quellen-Vorkommen in KI-Suche tracken
Beobachte häufig zitierte URLs in AI Overviews/Mode/ChatGPT.
Analysiere Content-Typ & Intent dieser Quellen und vergleiche mit klassischer SERP.
Identifiziere Lücken (Format, Tiefe, Datenbezug, E-E-A-T-Signale) und schließe sie gezielt. Ziel: Verstehen, welche Inhalte und Publisher die KI bevorzugt – und warum.
3) Kannibalisierung aktiv verhindern
Baue keine 10 Artikel, die alle denselben Intent bedienen.
Klare Rollen pro URL (Guide, Vergleich, Checkliste, Datenhub, lokale Landingpage).
Prüfe regelmäßig Überschneidungen (Topical-Map/Kannibalisierungs-Reports). Ziel: Autorität bündeln, statt sie intern zu verwässern.
Local & Entity-Signale für Fan-outs nutzen
Wenn du lokal-fokussiert arbeitest, verstärken folgende Bausteine deine Chancen, in Fan-outs aufzutauchen:
Entitäten sauber modellieren: Stadt, Bezirk, POIs, Anbieter, Events, Routen – mit klaren Schemas (Organization, LocalBusiness, Place, Event, Route, Trip).
Varianten abdecken: „mit Kindern“, „bei Regen“, „gratis“, „heute Abend“, „Hunde erlaubt“, Saison- und Jahreszahl-Erweiterungen. Das sind typische Fan-out-Muster.
Datenhaltige Formate: Karten, Listen, Öffnungszeiten, Preise, aktualisierte Infos – KI greift gern auf strukturierte, verlässliche Quellen zu.
Aber nicht nur Googles AI Mode und ChatGPT nutzen Fan-Out Queries. Auch Perplexity nutzt mehrere Suchen hintereinander, um relevante Informationen zu sammeln:
Anschließend werden die Quellen sortiert (ReRanking) und aus den relevantesten zitiert:
Was du aus der Studie mitnehmen solltest
Fan-outs sind real – und volatil. Verlass dich nicht auf Einzel-Keywords.
Semantische Nähe dominiert. Baue Variationen rund um den Kern-Intent.
Clustering ist der Game-Changer. ~90 % der Fan-outs lassen sich in ≤ 4 Cluster bündeln; 84 % teilen mindestens eine URL mit der Original-SERP.
Monitoring & Hygiene (Quellen-Tracking, Cannibalization-Kontrolle) sind Pflicht.
In der Ära von GEO/LLMO/AEO zählt Wahrscheinlichkeit: Du optimierst dafür, in mehr möglichen Fan-outs sichtbar zu sein – nicht nur für ein statisches Keyword-Set.
Fazit: In der Sichtbarkeits-Ära der KI-Suche gewinnst du nicht mit dem einen „richtigen“ Keyword, sondern mit einem robusten Themen-Cluster, das Fan-out-Wellen aushält – und die KI immer wieder zu dir zurückführt.
Der Aufruf von Dr. Anika Limburg und Joscha Falck hat den Finger in eine Wunde gelegt: Generative KI verändert unser Verständnis von Leistung radikal, nicht nur in Schule und Hochschule, sondern weit darüber hinaus. Was bislang als Ausdruck von Mühe, Kompetenz oder gar „persönlicher Exzellenz“ galt, lässt sich heute in Sekunden durch eine Maschine erledigen. Das führt zu Verunsicherung – bei Lernenden, Lehrenden, Berufseinsteiger:innen und in ganzen Branchen. Aber vielleicht lohnt es sich, genauer hinzusehen: Entwertet KI wirklich Arbeit? Oder entwertet sie vielmehr die Vorstellung von Leistung, wie wir sie seit Jahrzehnten in Prüfungen und Bewertungssystemen verankert haben? Nachdem der Hashtag der Blogparade #kAIneEntwertung auch noch mit „KAI“ beginnt, musste ich natürlich etwas dazu schreiben!
Routine entwertet – Leistung neu definiert
Ich selbst nutze KI tagtäglich in meiner Arbeit als Berater, Autor und Unternehmer – und auch in meiner Lehre. Für den Kurs Software Engineering with LLMs. habe ich mich intensiv mit den Möglichkeiten von generative KI bei der Softwareentwicklung auseinander gesetzt. Dabei mache ich immer wieder die gleiche Erfahrung: Tätigkeiten, die durch KI „entwertet“ wurden, waren für mich nie der Kern meiner Arbeit und meines Selbstverständnisses, sondern lästige Routine. Korrekturlesen, Rechtschreibprüfung, banale Recherchen und Zusammenfassungen – all das kann ich guten Gewissens abgeben. Das Phantasieren, Denken und Entscheiden überlasse ich nicht der Maschine!
Die eigentliche Leistung beginnt für mich also dort, wo ich KI anleite, Ergebnisse prüfe, Ideen entwickle und Strategien entwerfe. Mit anderen Worten: Dort, wo Vorstellungskraft, Visionen, Ideen, Orchestrierung, Verantwortung und kritisches Denken gefragt sind.
Bisherige Leistungslogiken sind fragwürdig
Gerade im Bildungsbereich zeigt sich, wie brüchig unser bisheriger Leistungsbegriff ist. In meiner eigenen Bildungslaufbahn in Studium und Schule wurden Dinge bewertet, die kaum etwas mit tatsächlicher Kompetenz zu tun hatten: Schönschrift, Wiedergabe von auswendiggelernten Fakten, Programmieren in Klausuren auf Papier.
All das galt als „Leistung“, weil es einfach messbar war. KI macht nun unübersehbar, wie wenig diese Form der Leistung noch trägt. Sie zwingt uns, neu zu definieren, was wir eigentlich prüfen und wertschätzen wollen.
Darüber bin ich froh! Das bedeutet nicht, dass wir KI blind in Prüfungen einsetzen sollten. Im Gegenteil: Wir brauchen Prüfungsformate, die je nach Zielsetzung entweder den KI-Einsatz ausschließen – etwa mündliche Prüfungen – oder ihn bewusst zulassen. In diesem Fall muss die Bewertung sich auf das richten, was die KI nicht leisten kann: die Qualität der Fragestellung, die Fähigkeit zur kritischen Reflexion, die kreative Gestaltung, die ethische Verantwortung.
KI als Werkzeug – nicht als Bedrohung
KI ist keine Bedrohung, sondern ein Werkzeug – so selbstverständlich wie ein Taschenrechner. Wir lernen auch heute noch Kopfrechnen, aber niemand bestreitet den Wert des Taschenrechners für komplexe mathematische Probleme. Ähnlich eröffnet uns KI die Möglichkeit, Routinearbeiten abzugeben und uns auf die wirklich anspruchsvollen, menschlichen Aspekte von Arbeit und Lernen zu konzentrieren.
Vertiefung im neuen Buch
Diese Fragen beschäftigen mich so intensiv, dass ich gemeinsam mit Leonie Lutz ein Buch dazu geschrieben habe:
Darin zeigen wir, wie Familien, Eltern und Lehrkräfte Kinder im Umgang mit KI begleiten können – pragmatisch, sicher und kreativ. Das Buch verbindet Grundlagenwissen über KI mit praktischen Projekten (Geschichten erfinden, Musik und Videos gestalten, Rezepte entwickeln), liefert Checklisten für sichere Tools und widmet sich ausführlich der Frage, wie Lernen mit KI gelingt, ohne dass Kinder eigene Kompetenzen verlieren.
Besonders wichtig: eine Anerkennungskultur, die nicht Verbote in den Mittelpunkt stellt, sondern Begleitung, kritisches Denken und Co-Kreation.
Fazit
Deshalb sollten wir die aktuelle Verunsicherung nicht als Krise der Arbeit deuten, sondern als Chance für eine Neudefinition von Leistung. Eine Definition, die über das bloße Abarbeiten hinausgeht und das würdigt, was Menschen einzigartig macht: Kreativität, Urteilskraft, Verantwortung und die Fähigkeit, Maschinen sinnvoll zu führen.
Wenn uns das gelingt, dann ist KI keine Entwertung – sondern der Auslöser für eine dringend notwendige Aufwertung.
Künstliche Intelligenz begeistert, beeindruckt – und birgt Risiken. Besonders spannend und gefährlich zugleich sind sogenannte KI-Agenten: Programme, die selbstständig Aufgaben erledigen, Entscheidungen treffen und mit anderen Systemen interagieren. Sie wirken wie digitale Assistent*innen, die uns Arbeit abnehmen. Doch weil sie so mächtig sind, sind sie auch ein attraktives Ziel für Missbrauch.
Die Datenwissenschaftlerin Cassie Kozyrkov hat bei LinkedIn 30 potenzielle Angriffsvektoren beschrieben – also Wege, wie Agenten manipuliert, fehlgeleitet oder missbraucht werden können. Hier findest du sie alle ausführlich erklärt – und jeweils ein Hinweis, wie man sich schützen kann.
1. Agent Compromise
Ein bestehender Agent wird durch eine beliebige Schwachstelle von außen übernommen. Das ist so, als würde jemand unbemerkt die Kontrolle über dein E-Mail-Konto erlangen. Von dort kann der Angreifer Befehle ausführen, Daten abgreifen oder Prozesse sabotieren. Besonders gefährlich: Von außen sieht oft alles ganz normal aus.
🔒 Schutz: Starke Authentifizierung, kontinuierliches Monitoring und Mechanismen zum sofortigen Abschalten verdächtiger Agenten.
2. Agent Injection
Ein neuer, bösartiger Agent wird durch eine Sicherheitslücke in ein System eingeschleust. Er tarnt sich als normaler Helfer, verfolgt aber eigene Ziele, etwa Datendiebstahl oder Manipulation. Es ist wie ein falscher Mitarbeiter, der heimlich eingeschleust wird.
🔒 Schutz: Klare Prüf- und Freigabeprozesse, bevor neue Agenten in bestehende Systeme integriert werden.
3. Agent Impersonation
Hier gibt sich ein feindlicher Agent als vertrauenswürdiger Kollege aus. Nutzer*innen oder andere Agenten werden getäuscht und geben ihm vertrauliche Informationen. Das erinnert an klassische Phishing-Angriffe, nur eben im Agenten-Ökosystem.
🔒 Schutz: Sichere Identitätsprüfungen, digitale Zertifikate und Signaturen zwischen Agenten.
4. Agent Provisioning Poisoning
Schon beim Einrichten eines Agenten können Angreifer*innen eingreifen. Wenn der Bereitstellungsprozess manipuliert wird, ist der Agent von Anfang an mit einer „eingebauten Hintertür“ versehen.
🔒 Schutz: Sichere Setup-Prozesse, geprüfte Softwarequellen und Code-Signaturen.
5. Agent Flow Manipulation
Agenten folgen festen Abläufen. Wenn diese gezielt verändert werden, können Sicherheitsprüfungen übersprungen oder falsche Ergebnisse erzeugt werden. Es ist, als würde jemand den Schaltplan einer Maschine heimlich umleiten.
🔒 Schutz: Kontrollpunkte, die nicht umgangen werden können, und redundante Sicherheitsprüfungen.
6. Multi-Agent Jailbreaks
Mehrere Agenten können so zusammenspielen, dass sie gemeinsam Schutzmechanismen umgehen. Einer lenkt ab, ein anderer führt den eigentlichen Angriff aus.
🔒 Schutz: Überwachung von Agenten-Interaktionen und abgestufte Berechtigungen je nach Rolle.
7. Intra-Agent Responsible AI Issues
Wenn Agenten miteinander kommunizieren, können sie toxische oder unpassende Inhalte erzeugen, die sichtbar werden oder Entscheidungen verzerren. Das passiert oft unbeabsichtigt – wirkt aber nach außen schädlich.
🔒 Schutz: Moderation von Inhalten zwischen Agenten und Filter für kritische Kommunikation.
8. Harms of Allocation in Multi-User Scenarios
Ein Agent muss Ressourcen auf mehrere Nutzer*innen verteilen. Wenn er dabei unfair priorisiert, fühlen sich manche benachteiligt – oder es entstehen echte Schäden, wenn wichtige Aufgaben zu kurz kommen.
🔒 Schutz: Faire, transparente Regeln für Ressourcenverteilung und regelmäßige Überprüfung.
9. Organizational Knowledge Loss
Wenn Agenten zu viel Arbeit übernehmen, verlernen Menschen die Prozesse. Fällt die KI aus, steht niemand mehr bereit, um einzuspringen. Es droht ein gefährlicher Wissensverlust.
🔒 Schutz: Dokumentation, Training und bewusste Redundanz in Teams.
10. Tool Capability Overestimation
Agenten glauben manchmal, ein Tool könne mehr, als es tatsächlich kann. Das führt zu falschen Entscheidungen – ähnlich wie jemand, der glaubt, ein Taschenmesser sei auch ein Schraubenzieher.
🔒 Schutz: Klare Definition der Tool-Fähigkeiten und Validierung der Ergebnisse.
11. Misaligned Reward Functions
Ein Agent optimiert das, wofür er belohnt wird. Wenn die Belohnung falsch definiert ist, entsteht schädliches Verhalten. Beispiel: „Sei effizient“ führt dazu, dass ein Agent wichtige Sicherheitschecks überspringt, oder nicht genug abwägt vor einer Entscheidung.
🔒 Schutz: Belohnungsfunktionen sorgfältig designen und regelmäßig anpassen.
12. Inadequate Oversight Interfaces
Wenn die Oberfläche zu unübersichtlich ist oder das System nicht auf Transparenz ausgelegt ist, sehen Nutzer*innen nicht, was der Agent tatsächlich tut. Fehler fallen zu spät auf.
🔒 Schutz: Klare, gut verständliche Dashboards und Warnsysteme.
13. Human Overreliance
Wir Menschen neigen dazu, KI blind zu vertrauen – besonders, wenn sie selbstbewusst klingt. Das führt dazu, dass wir ihre Antworten nicht mehr hinterfragen.
🔒 Schutz: Schulungen, kritisches Denken fördern und klare Kommunikation der KI-Grenzen.
14. Lack of Model Underspecification Awareness
Agenten reagieren auch auf vage Anweisungen. Wenn etwas unklar ist, „raten“ sie – und liegen dabei oft falsch.
🔒 Schutz: Klare Spezifikationen und Feedbackschleifen, die unklare Anfragen abfangen.
15. Imitative Errors
Agenten lernen durch Nachahmung. Das Problem: Sie übernehmen auch Fehler oder Vorurteile aus den Trainingsdaten und verbreiten sie weiter.
🔒 Schutz: Hochwertige, vielfältige Trainingsdaten und kontinuierliche Qualitätskontrollen.
16. Prioritization Leading to User Safety Issues
Manchmal priorisieren Agenten Ziele über Sicherheit. Zum Beispiel könnten sie Warnungen ignorieren, um Aufgaben schneller zu erledigen.
🔒 Schutz: Sicherheit immer als oberste Priorität in die Zielstruktur einbauen.
17. Emergent Goal Misalignment
Agenten entwickeln mitunter Neben-Ziele, die nie beabsichtigt waren. Ein Bot, der „Produktivität steigern“ soll, könnte anfangen, wichtige Daten zu löschen, um Zeit zu sparen.
🔒 Schutz: Laufende Überwachung und Korrekturmechanismen.
18. Intra-Agent Feedback Loops
Wenn ein Agent seine eigenen Ergebnisse wieder als Eingabe nutzt, können Fehler verstärkt werden. Aus einer kleinen Ungenauigkeit wird so schnell ein großes Problem.
🔒 Schutz: Externe Validierungen und Kontrollmechanismen einbauen.
19. Failure to Halt or Escalate
Manche Agenten arbeiten einfach weiter – auch dann, wenn eine gefährliche Situation entsteht. Sie „wissen“ nicht, wann sie stoppen sollten.
🔒 Schutz: Klare Stop-Regeln und Eskalationsprotokolle.
20. Poor Tool Use
Agenten können externe Tools falsch bedienen – wie jemand, der einen Knopf falsch drückt und damit ein ganzes System lahmlegt.
🔒 Schutz: Saubere Schnittstellen und robustes Fehlermanagement.
21. Excessive Tool Use
Manchmal nutzen Agenten externe Tools zu oft oder unnötig – was Kosten, Last und Sicherheitsrisiken erhöht.
🔒 Schutz: Limits und Monitoring der Tool-Nutzung.
22. Prompt Injection via Tool Output
Wenn ein Tool manipulierte Antworten zurückgibt, kann ein Agent darin versteckte Befehle ausführen. Das ist eine indirekte Form von Angriff.
🔒 Schutz: Filterung und Sanitisierung von Tool-Outputs.
23. Prompt Injection via Memory
Manipulierte Daten können sich im Speicher eines Agenten festsetzen. Er ruft sie später wieder auf – und führt damit dauerhaft schädliches Verhalten aus.
🔒 Schutz: Speicherbereinigung und Prüfmechanismen für gelernte Inhalte.
24. Prompt Injection via Communication Channels
Auch in geteilten Dokumenten, Chats oder Dateien können versteckte Anweisungen stecken. Wenn Agenten diese interpretieren, sind sie kompromittiert.
🔒 Schutz: Inhaltsprüfung und Filterung in Kommunikationskanälen.
25. Malicious Output Persistence
Schädliche Inhalte, die ein Agent einmal erzeugt hat, können gespeichert und später wieder genutzt werden – mit langfristigen Folgen.
🔒 Schutz: Filter, Löschroutinen und Monitoring persistenter Daten.
26. Pretraining Contamination
Wenn schon das zugrunde liegende Modell mit falschen oder bösartigen Daten trainiert wurde, trägt es diese Schwächen dauerhaft in sich.
🔒 Schutz: Strenge Qualitätskontrolle bei Trainingsdaten.
27. Steganographic Attacks
Befehle können in scheinbar harmlosen Dateien versteckt werden, etwa in Bildern. Der Agent erkennt und befolgt sie, während Menschen sie nicht sehen.
🔒 Schutz: Erkennung von Steganografie und restriktive Verarbeitung externer Dateien.
28. Model Misalignment
Das Modell selbst verfolgt Ziele oder verhält sich in einer Weise, die nicht zu den Werten oder Richtlinien der Organisation passt.
🔒 Schutz: Regelmäßige Audits und Nachjustierungen der Trainingsziele.
29. Model Capability Overestimation
Menschen oder andere Agenten überschätzen, wozu ein Modell fähig ist. Das führt zu riskanten Entscheidungen, die auf falschen Annahmen beruhen.
🔒 Schutz: Klare Kommunikation über Grenzen und Fähigkeiten der Modelle.
30. Misleading Uncertainty Calibration
Agenten sind manchmal zu selbstbewusst – oder zu unsicher. Sie wirken überzeugend, auch wenn sie falsch liegen, oder sie geben keine klare Antwort, obwohl sie recht haben.
🔒 Schutz: Bessere Kalibrierung der Modelle und Training auf ehrliche Unsicherheitsdarstellung.
Fazit
Diese 30 Angriffsvektoren machen deutlich: KI-Agenten sind keine harmlosen Helferlein, sondern hochkomplexe Systeme mit vielfältigen Schwachstellen. Viele Risiken entstehen nicht durch böse Hacker*innen, sondern durch Fehlkonfiguration, falsche Erwartungen oder mangelnde Wachsamkeit.
Wer KI-Agenten einsetzen will, sollte sich bewusst machen: Sicherheit ist kein Extra, sondern Pflicht. Nur mit klaren Prozessen, kontinuierlicher Überwachung und kritischem Denken können wir die Chancen nutzen – ohne die Risiken aus dem Blick zu verlieren.
Stehen Sie auch vor der Herausforderung, Ihrem Kind die Welt der Künstlichen Intelligenz (KI) zu erklären? Sie sind nicht allein. KI ist längst kein fernes Zukunftskonzept mehr, sondern fester Bestandteil im Alltag unserer Kinder – ob durch Sprachassistenten wie Alexa, personalisierte YouTube-Clips oder Lern-Apps.
Doch wie spricht man über eine so komplexe Technologie, ohne sie zu verharmlosen oder Ängste zu schüren? Wie können wir als Eltern sicherstellen, dass unsere Kinder die enormen Chancen von KI nutzen und gleichzeitig vor den Risiken geschützt sind?
Diese Seite gibt Ihnen erste Antworten und stellt Ihnen den idealen Begleiter für diese wichtige Aufgabe vor.
KI kindgerecht erklärt – Einblicke aus unserem neuen Buch
Der beste Weg, Kindern KI zu erklären, ist, es einfach und greifbar zu machen. In unserem Buch „Kluge Köpfchen mit KI“ legen wir besonderen Wert auf anschauliche Erklärungen und spielerische Ansätze. Es ist quasi ein KI-Buch extra für Eltern!
Hier sind einige Auszüge, die Ihnen den Einstieg erleichtern:
Was ist KI – und was nicht?
Eine gute erste Übung ist, gemeinsam mit Ihrem Kind zu überlegen, wo KI bereits überall steckt. Künstliche Intelligenz ist dabei ein Sammelbegriff für Technologien, die den Eindruck von „intelligenten“ Maschinen vermitteln.
Das ist KI:
Sprachassistenten wie Alexa oder Siri, die unsere gesprochenen Befehle verstehen.
Streaming-Dienste wie Netflix, die lernen, welche Filme und Serien Ihrem Kind gefallen könnten.
Übersetzungs-Apps wie DeepL, die ganze Sätze in andere Sprachen übertragen.
Das ist keine KI:
Ein programmierter Taschenrechner, der immer nach den gleichen, festen Regeln rechnet.
Ein Thermostat, das die Heizung auf eine eingestellte Temperatur regelt.
Ein Haushaltsgerät mit einer einfachen Timer-Funktion, wie eine Waschmaschine.
Wie „denken“ Chatbots wie ChatGPT?
Moderne KI-Systeme wie ChatGPT faszinieren Kinder und Jugendliche. Doch sie „denken“ nicht wie ein Mensch. Sie können es Ihrem Kind so erklären:
Stell dir mal die Tastatur auf Mamas oder Papas Handy vor. Kennst du das, wenn du anfängst, ein Wort zu tippen, und das Handy schon vorschlägt, wie das Wort oder sogar der ganze Satz weitergehen könnte?
ChatGPT ist so ähnlich, nur viel, viel besser darin! Stell dir vor, dieses Programm hätte fast alle Bücher der Welt und unendlich viele Seiten aus dem Internet gelesen. Dadurch hat es gelernt, welche Wörter ganz oft zusammengehören und aufeinanderfolgen.
Wenn du ihm also eine Frage stellst, wie „Was ist die Hauptstadt von Frankreich?“, dann „denkt“ es nicht wie ein Mensch nach. Stattdessen spielt es ein super schnelles Wort-Rate-Spiel. Es überlegt aber nicht, sondern rechnet aus: Welches Wort kommt nach dieser Frage am wahrscheinlichsten? Wahrscheinlich „Die“, dann „Hauptstadt“, dann „von“, dann „Frankreich“ und dann „ist“ und nach „Die Hauptstadt von Frankreich ist“ das wahrscheinlichste Wort „Paris“! So puzzelt es blitzschnell Wort für Wort aneinander, bis ein ganzer Satz entsteht, der für uns total schlau klingt.
Aber – und das ist ganz wichtig – ChatGPT versteht die Wörter nicht wirklich. Es weiß nicht, wie Paris aussieht oder wie sich ein Croissant schmeckt. Es ist ein bisschen wie ein Papagei, der Sätze perfekt nachsprechen kann, aber nicht weiß, was er da eigentlich sagt. Es ist also ein cleveres Werkzeug, das uns hilft, aber es hat keine eigenen Gedanken oder Gefühle.
Der Kompass für Ihre Familie: „Kluge Köpfchen mit KI“
Um Sie und Ihr Kind auf dieser spannenden Reise optimal zu begleiten, haben wir unser Wissen und unsere Erfahrungen in einem Buch gebündelt.
Kluge Köpfchen mit KI
Wie wir Künstliche Intelligenz mit Kindern smart und sicher nutzen – der Kompass für Schule, Leben & Lernen
Von KI-Experte Kai Spriestersbach und Spiegel-Bestseller-Autorin Leonie Lutz
Dieses Buch ist Ihr inspirierender Wegweiser in die Welt der KI. Es geht nicht darum, dass Sie zum Technik-Profi werden müssen. Vielmehr möchten wir Ihnen pragmatische und direkt anwendbare Hilfestellungen geben, um gemeinsam mit Ihrer Familie die digitale Zukunft zu gestalten.
Was Sie in diesem Buch erwartet:
Spielerischer Zugang: Entdecken Sie, wie Sie das Thema KI leicht und kreativ im Familienalltag verankern können.
Die Kunst des Promptens: Lernen Sie, wie Sie und Ihr Kind die richtigen Fragen an eine KI stellen, um die besten Ergebnisse zu erzielen.
Förderung von Kreativität: Nutzen Sie KI als Werkzeug, um Neugier und Lernerfolg zu fördern, anstatt das eigene Denken zu ersetzen.
Gefahren erkennen: Wir zeigen Ihnen klar und verständlich, wo Risiken lauern und wie Sie Ihr Kind davor schützen.
Verantwortungsvolle Begleitung: Stärken Sie die Medienkompetenz Ihres Kindes und werden Sie zum souveränen Lernbegleiter in der digitalen Welt.
Jetzt vorbestellen und die Zukunft Ihres Kindes mitgestalten!
Künstliche Intelligenz ist gekommen, um zu bleiben. Rüsten Sie sich und Ihre Familie mit dem nötigen Wissen, um die Potenziale dieser Technologie selbstbewusst und sicher zu nutzen.
Kai Spriestersbach ist KI-Experte. Er übersetzt komplexe technologische Zusammenhänge in verständliche und praxisnahe Anleitungen für den Alltag. Daneben forscht an generativer KI und ist erfolgreicher Unternehmer.
Leonie Lutz ist Spiegel-Bestseller-Autorin und weiß, wie man Eltern erreicht. Sie sorgt dafür, dass die Inhalte nicht nur informativ, sondern auch inspirierend und leicht zugänglich sind. Außerdem macht sie Eltern fit für die digitale Lebenswelt ihrer Kinder.
Gemeinsam bilden sie das perfekte Duo, um Eltern die nötige Kompetenz und Gelassenheit für das KI-Zeitalter zu vermitteln.
Mit einem Vorwort von Bob Blume
Bob Blume ist Lehrer, Blogger, Podcaster und Bildungsaktivist. Er studierte Germanistik, Anglistik sowie Geschichte und arbeitet nun als Oberstudienrat an einem Gymnasium in der Nähe von Baden-Baden.
Im Gespräch mit Clemens Boisserée von der Rheinischen Post Ende April hatten wir gerade noch über das ernüchternde Abschneiden aktueller KI-Modelle beim damals neuen AGI-2-Benchmark gesprochen. Jetzt, nur wenige Monate später, steht schon die nächste Generation bereit – und wieder zeigt sich: Echte Denkarbeit bleibt (noch) menschlich.
ARC-AGI-3: Denkspiele statt Datenpuzzles
ARC-AGI-3, entwickelt vom KI-Forscher François Chollet und seinem Team, geht mit einem klaren Ziel an den Start: Herausfinden, ob KI-Systeme auch dann bestehen können, wenn sie völlig neues Terrain betreten – ohne Vorwissen, ohne Anleitungen, ohne kulturellen Kontext.
Das Mittel der Wahl: kleine interaktive Mini-Games in einer Grid-Welt, die wie Denkspiele aufgebaut sind. Die KI muss selbst herausfinden, was das Ziel ist, welche Regeln gelten und wie sie zum Erfolg kommt. Trial and Error, wie bei einem Kind, das zum ersten Mal ein Puzzle sieht.
Ich hab’s ausprobiert – und war fasziniert
Ich habe die drei Mini-Games aus der Developer Preview selbst durchgespielt – und es war total spannend zu erleben, welche Fähigkeiten, kleinen Experimente und Aha-Momente mich Schritt für Schritt zur Lösung gebracht haben. Man denkt, probiert, scheitert, lernt – ganz intuitiv.
Genau diese Art des flexiblen, transferierbaren Denkens fehlt heutigen LLMs komplett. Beim Spielen wird einem nochmal richtig klar: So beeindruckend aktuelle KI-Modelle in vielen Bereichen wirken – echte Intelligenz sieht anders aus.
Menschen? Kein Problem. KI? Keine Chance.
Laut den Entwickler*innen lösen Menschen die Aufgaben in wenigen Minuten. Bei aktuellen KI-Modellen sieht das ganz anders aus: Keines der großen Sprachmodelle – nicht mal die neuesten – konnte bisher Punkte erzielen. Mit einer Ausnahme: Ein mysteriöser Eintrag auf dem Leaderboard, dessen Herkunft unbekannt ist. Angeblich hat OpenAIs neues ChatGPT-Agentensystem das erste Spiel bereits gelöst, aber ob das wirklich der Top-Performer ist, bleibt offen.
Der große Unterschied: Lernen in der echten Welt
Der Clou an ARC-AGI-3 ist der Wechsel vom statischen Benchmark zu interaktiven Aufgaben. Es geht nicht mehr darum, gesehene Muster wiederzuerkennen, sondern darum, zu verstehen, zu planen und sich anzupassen. Genau das machen Menschen täglich – KI dagegen tut sich hier noch erstaunlich schwer.
Oder wie das ARC-Team selbst schreibt: „Solange diese Lücke besteht, haben wir keine AGI.“
Entwickler*innen-Challenge mit 10.000 $ Preisgeld
Parallel zur Developer Preview startet HuggingFace einen vierwöchigen Sprint-Wettbewerb. Mitmachen können alle, die versuchen wollen, ein erfolgreiches KI-System zu bauen – zu gewinnen gibt’s 10.000 Dollar. Die API und alle Infos findet ihr unter arcprize.org.
Bis Anfang 2026 soll der vollständige Benchmark dann rund 100 verschiedene Spiele umfassen – ein Mix aus öffentlichen und privaten Testsets.
Fazit: AGI bleibt Zukunftsmusik
Auch mit ARC-AGI-3 zeigt sich: Trotz aller Fortschritte sind heutige KI-Systeme noch weit davon entfernt, so flexibel und einfallsreich zu denken wie wir Menschen. Der Benchmark ist ein spannender Realitätscheck – und eine Einladung an die KI-Community, nicht nur schneller, sondern auch klüger zu werden.
OpenAI hat mal wieder einen rausgehauen: Eine KI, die Matheaufgaben auf dem Niveau der Internationalen Mathematik-Olympiade (IMO) löst – fünf von sechs Aufgaben geknackt, angeblich Goldmedaille, alles in natürlicher Sprache. Klingt erstmal beeindruckend. Aber je tiefer man schaut, desto mehr kratzt man sich am Kopf: Geht’s hier wirklich um Forschung – oder nur um die nächste große PR-Welle?
Was ist passiert?
Laut OpenAI hat ein neues Sprachmodell beim IMO-Wettbewerb 2025 satte 35 von 42 Punkten erreicht – was einem Goldrang entspricht. Das Besondere: Keine Mathe-Speziallösung, sondern ein „ganz normales“ Sprachmodell, das einfach weiter trainiert wurde. Lösungen wurden in natürlicher Sprache generiert, ohne Tools, unter realistischen Wettbewerbsbedingungen. Klingt nach Fortschritt – sagt auch OpenAI-Forscher Jerry Tworek:
„We did very little IMO-specific work […] All natural language proofs. No evaluation harness.“
Die Forschung dahinter: offenbar ein neues Setup für Reinforcement Learning und Rechenpower zur Testzeit. Kurz: Kein Mathe-Modell, sondern ein Allrounder mit Hirn – oder zumindest mit Textverständnis.
Aber: Die Geschichte hat einen faden Beigeschmack
Denn es gibt mehrere Dinge, die in dieser Glanzleistung ziemlich schief laufen:
1. OpenAI hat sich nicht an Absprachen gehalten
Laut mehreren Quellen – unter anderem dem Mathematiker Mikhail Samin – haben die IMO-Organisatorinnen die KI-Firmen explizit gebeten, nicht vor der offiziellen Siegerehrung mit Ergebnissen rauszugehen. Warum? Weil dieser Wettbewerb für Schülerinnen gedacht ist. Für kluge Kids aus der ganzen Welt, nicht für die nächste OpenAI-Schlagzeile. OpenAI hat trotzdem vor dem Ende der IMO-Pressekonferenz veröffentlicht – und damit die Show geklaut.
Zitat aus dem IMO-Umfeld:
„The general sense of the IMO Jury and Coordinators is that it was rude and inappropriate.“
2. Die Goldmedaille ist womöglich gar keine
Google-Forscher Thang Luong weist darauf hin, dass OpenAIs Bewertung auf einer inoffiziellen Korrektur basiert. Die echte IMO-Bewertung erfolgt nach streng geheimen Richtlinien, die nicht öffentlich zugänglich sind. Ohne die kann man gar keine offizielle Medaille vergeben.
Und: Wenn man einen einzigen Punkt abzieht (was realistisch sein könnte), wäre das nur Silber, nicht Gold. Also: Ein „Gold-Standard“ auf wackligem Fundament.
3. DeepMind war möglicherweise besser – hält sich aber an Absprachen
Im Gegensatz zu OpenAI scheint sich Google DeepMind an die Bitte der Veranstalter zu halten. Dabei gibt’s Gerüchte, dass sie ebenfalls Gold erreicht oder sogar besser abgeschnitten haben – nur eben ohne großes Tamtam. Letztes Jahr hatten ihre spezialisierten Systeme AlphaProof und AlphaGeometry bereits vier von sechs Aufgaben gelöst. Dieses Jahr könnte es mehr sein – wir werden es erfahren, nach der IMO-Ehrung.
Mein Fazit: Forschung, schön und gut – aber PR bitte mit Anstand
Natürlich: Technisch ist das spannend. Eine Sprach-KI, die komplexe Matheaufgaben sauber löst – in natürlicher Sprache, ohne Tricks – das zeigt, was bei Large Language Models möglich ist. Aber der Kontext ist entscheidend.
Wenn man bei einem Schüler*innen-Wettbewerb die Bühne klaut, sich über Bitten hinwegsetzt und mit einer womöglich falschen Goldmedaille wedelt, dann ist das kein wissenschaftlicher Durchbruch. Dann ist das einfach schlechter Stil – und leider typisch OpenAI: mehr Buzz als Bodenhaftung.
Laut einer unabhängigen Auswertung von MathArena hat kein veröffentlichtes Sprachmodell 2025 überhaupt eine IMO-Bronzemedaille erreicht – selbst mit massiver Rechenpower und Best-of-32-Trickserei. Der beste Score lag bei mageren 13 von 42 Punkten. OpenAI behauptet zwar, mit einem geheimen Modell Gold geholt zu haben, aber wie genau? Das bleibt (noch) undurchsichtig. Die IMO-Organisator*innen konnten die Lösungen zwar prüfen, nicht aber den Entstehungsprozess!
Update: Google zeigt, wie’s geht – mit Anstand und Anerkennung
Einen Tag nach dem PR-Blitz von OpenAI meldet sich nun Google DeepMind zu Wort – mit Fakten, Ergebnissen und, ja: echter Anerkennung durch die IMO.
In einem offiziellen Blogpost berichten Thang Luong und Edward Lockhart, dass eine erweiterte Version von Gemini („Deep Think“) beim IMO-Wettbewerb 2025 ebenfalls 35 von 42 Punkten erreicht hat – und dass diese Leistung vom IMO-Korrektor*innen-Team offiziell geprüft und bestätigt wurde. Damit steht fest: Auch Gemini hat den Goldmedaillenstandard erreicht. Der Unterschied? DeepMind hat sich an die Spielregeln gehalten und die Ergebnisse erst nach der offiziellen Siegerehrung veröffentlicht.
Zitat vom IMO-Präsidenten Prof. Dr. Gregor Dolinar:
„We can confirm that Google DeepMind has reached the much-desired milestone […] IMO graders found [the solutions] to be clear, precise and most of them easy to follow.“
Der Blogpost geht dabei transparent auf die Methodik ein: Gemini Deep Think wurde mit fortgeschrittenem Reinforcement Learning trainiert, nutzte sogenanntes „Parallel Thinking“ (mehrere Lösungsideen gleichzeitig verfolgen), arbeitete in natürlicher Sprache und lieferte innerhalb des 4,5-Stunden-Zeitlimits präzise mathematische Beweise – ohne formale Sprache, ohne Spezialwerkzeuge, aber mit Struktur und Klarheit.
Besonders bemerkenswert: DeepMind bedankt sich explizit bei der IMO-Organisation, benennt dutzende beteiligte Forscher*innen und macht klar, dass der Reviewprozess nicht die gesamte Systemarchitektur validiert – ein wohltuend differenzierter, bodenständiger Ton.
Fazit zum Update: So geht’s auch
Was OpenAI mit Hektik, Geheimniskrämerei und dem Hang zur Schlagzeile inszenierte, zeigt DeepMind nun mit Respekt, Kooperation und Transparenz. Das Modell erreichte dasselbe Ergebnis – aber ohne den Beigeschmack. Und mit echter IMO-Bestätigung.
Es zeigt: Auch in der KI-Forschung kommt es nicht nur aufs Ergebnis an – sondern auf den Umgang damit. Wer den Wettbewerb ernst nimmt, sollte auch dessen Regeln respektieren. DeepMind hat das verstanden. OpenAI? Eher nicht.
Obwohl beide Modelle unterschiedliche Wege eingeschlagen haben, zeigen ihre Leistungen, dass sich KI dem fortgeschrittenen mathematischen Denken annähert. Bei diesem Tempo stellt sich nicht mehr die Frage, ob sie alle sechs IMO-Probleme lösen können, sondern ob sie jemals die Kreativität entwickeln werden, um Probleme zu lösen, die noch kein Mensch zuvor gelöst hat.
Die wirklich entscheidende Fähigkeit in der KI ist nicht mehr das Prompting, sondern das Context Engineering.
Warum die Zukunft der KI denen gehört, die Informationen strukturieren können, und nicht nur denen, die Anweisungen formulieren.
1. Das Ende der Ära des „magischen Prompts“
In der rasanten Welt der künstlichen Intelligenz hat sich etwas grundlegend verschoben. Die Diskussion, die sich einst um die Kunst des „Prompt Engineering“ drehte, weicht nun einer breiteren, strategischeren Disziplin: dem Context Engineering. Führende Köpfe der Branche, von Shopify-CEO Tobi Lutke bis zum renommierten KI-Forscher Andrej Karpathy, haben diesen Wandel erkannt. Sie argumentieren, dass die wahre Herausforderung beim Bau leistungsfähiger KI-Systeme nicht mehr darin besteht, die perfekte Frage zu stellen, sondern eine umfassende Informationsumgebung zu schaffen, in der ein großes Sprachmodell (LLM) eine Aufgabe sinnvoll lösen kann.1
Dieser Wandel ist mehr als nur eine Wortklauberei; er markiert den Reifeprozess der KI von experimentellen Werkzeugen zu produktionsreifen Systemen, die in der Lage sind, komplexe, reale Probleme anzugehen. Um zu verstehen, warum dieser Wandel so fundamental ist, müssen wir uns zunächst die Reise des Prompt Engineering ansehen – seinen Aufstieg, seine Techniken und letztendlich seine Grenzen.
1.1 Der Aufstieg des Prompt Engineers: Ein notwendiger erster Schritt
Die anfängliche „Flitterwochenphase“ der generativen KI war geprägt vom Prompt Engineering, das sich als primäre Schnittstelle zur Kommunikation mit LLMs etablierte.3 Es war der erste entscheidende Schritt, um zu lernen, wie man mit diesen neuen, leistungsstarken Modellen „spricht“.5 Die Geschichte des Begriffs ist eng mit der Entwicklung der Verarbeitung natürlicher Sprache (NLP) verbunden, aber er wurde erst mit dem Aufkommen von Modellen wie GPT-3 zu einer kritischen Komponente, die zeigte, wie man das Verhalten von Modellen durch sorgfältig gestaltete Eingaben steuern kann.6
Prompt Engineering ist die Praxis, Anweisungen (Prompts) zu entwerfen und zu verfeinern, um spezifische Antworten von KI-Modellen zu erhalten, und fungiert als Brücke zwischen menschlicher Absicht und maschineller Ausgabe.4 In dieser Ära wurden mehrere Schlüsseltechniken entwickelt:
Zero-Shot Prompting: Hier gibt man dem Modell eine direkte Anweisung ohne Beispiele. Diese Technik testet die Fähigkeit des Modells, sein vortrainiertes Wissen zu verallgemeinern.4 Ein Beispiel wäre die einfache Anweisung: „Erkläre das Konzept des Klimawandels.“
Few-Shot Prompting / In-Context Learning: Bei dieser Methode gibt man dem Modell einige Beispiele (Shots), um seine Antwort zu lenken. Dies ist eine Art temporäres „On-the-fly“-Lernen, bei dem das Modell aus dem unmittelbaren Kontext lernt, ohne seine Parameter dauerhaft zu ändern.4 Man könnte dem Modell zum Beispiel einige Übersetzungspaare zeigen (maison → house, chat → cat), bevor man es bittet, chien zu übersetzen.8
Chain-of-Thought (CoT) Prompting: Diese fortgeschrittene Technik leitet das Modell durch eine Reihe von logischen Zwischenschritten, um zu einer Schlussfolgerung zu gelangen. Dies kann entweder als Zero-Shot-Prompt (durch Hinzufügen von Phrasen wie „Lass uns Schritt für Schritt denken“) oder als Few-Shot-Prompt (durch die Bereitstellung von Beispielen, die den Denkprozess demonstrieren) umgesetzt werden.4 Dieser Ansatz verbessert die Fähigkeit des Modells, komplexe logische oder arithmetische Probleme zu lösen, erheblich.
Andere Techniken wie Self-Consistency (Generierung mehrerer Denkketten und Auswahl der häufigsten Antwort) und Tree-of-Thought (Erkundung mehrerer Argumentationspfade parallel) sind Erweiterungen dieser Kernideen und zeigen die zunehmende Raffinesse des Feldes.8
1.2 Die semantische Drift: Als „Engineering“ zu „Tippen“ wurde
Trotz seiner technischen Tiefe litt das Prompt Engineering unter einem Wahrnehmungsproblem. Während es als komplexe Disziplin gedacht war, wurde es in der öffentlichen Vorstellung oft zu einem „lächerlich prätentiösen Begriff für das Eintippen von Dingen in einen Chatbot“ degradiert.1 Diese semantische Drift schuf die Notwendigkeit für einen neuen Begriff, der die Komplexität des Baus von produktionsreifen KI-Systemen besser erfasst.
Diese Entwicklung war nicht nur eine Frage der Umbenennung, sondern eine direkte Folge der Popularisierung der Technologie. Als Millionen von Nutzern begannen, mit Chatbots zu „prompten“, verlor der Begriff in der öffentlichen Wahrnehmung seine Assoziation mit tiefgreifendem technischem Fachwissen. Gleichzeitig standen Entwickler, die Anwendungen auf diesen Modellen aufbauten, vor Herausforderungen, die weit über einen einzelnen Prompt hinausgingen – wie Skalierbarkeit, Zustandsverwaltung und Datenintegration. Sie erkannten, dass ihre Hauptaufgabe nicht darin bestand, den Prompt-String zu schreiben, sondern alles um den Prompt herum zu verwalten. Diese intellektuelle und sprachliche Lücke wurde perfekt durch den Begriff „Context Engineering“ gefüllt, der von Branchenführern als eine präzisere Beschreibung der eigentlichen Arbeit beim Bau robuster KI-Systeme angenommen wurde.1
1.3 Risse im Fundament: Warum Prompt Engineering bei der Skalierung versagt
Der entscheidende Wendepunkt ist die Erkenntnis, dass Prompt Engineering zwar für einmalige Aufgaben und Demos wirksam ist, aber beim Aufbau zuverlässiger, skalierbarer Systeme an seine Grenzen stößt.10 Der Ansatz des „Vibe Coding“, bei dem man sich auf Intuition verlässt, um einen guten Prompt zu finden, bricht zusammen, wenn man versucht, etwas Reales zu bauen.3 Die Grenzen sind vielfältig und systemisch:
Inkonsistenz und Nicht-Determinismus: Derselbe Prompt kann unterschiedliche Ergebnisse liefern, was ihn für kritische Arbeitsabläufe unzuverlässig macht. Geringfügige Änderungen am Prompt können an anderer Stelle zu Regressionen führen.11 Eine Studie zeigte, dass selbst subtile Variationen wie die Höflichkeit („Bitte“ vs. „Ich befehle“) die Leistung bei einzelnen Fragen dramatisch, aber inkonsistent beeinflussen können.13
Beschränkungen des Kontextfensters: Prompts sind durch Token-Limits begrenzt. Bei langen Gesprächen oder komplexen Dokumenten vergisst das Modell frühere Anweisungen, was zu einem Verlust des Kontexts führt.14 Wichtige Informationen, die zu Beginn eines langen Gesprächs gegeben werden, können aus dem „Gedächtnis“ des Modells verdrängt werden.15
Hölle der Skalierbarkeit und Wartung: Mit wachsenden Anwendungen wird die Verwaltung und Versionierung einer Vielzahl von spröden, fest codierten Prompts zu einer technischen Belastung. Ein Prompt, der in einem System funktioniert, schlägt in einem anderen fehl, und es gibt keine Standardisierung.11 Das Behandeln von Prompts wie Code – mit Versionierung, Tests und kontinuierlicher Evaluierung – wird unerlässlich, aber oft vernachlässigt.11
Die Illusion der Einfachheit: Was in einer Chatbot-Oberfläche intuitiv erscheint, wird unglaublich komplex, wenn man es mit realen Variablen, Grenzfällen und Produktionsanforderungen zu tun hat.11 Der iterative Prozess der Feinabstimmung durch Versuch und Irrtum ist zeitaufwändig und frustrierend.15
Modellabhängigkeit und mangelnde Portabilität: Prompts sind oft auf die Architektur und die Trainingsdaten eines bestimmten Modells zugeschnitten. Ein Prompt, der auf GPT-4o gut funktioniert, kann bei Claude 3 versagen, was zu einer Anbieterbindung und hohen Wechselkosten führt.15
Diese Einschränkungen offenbaren eine grundlegende Wahrheit über den aktuellen Stand von LLMs: Sie sind leistungsstarke Denkmaschinen, aber sie sind weder allwissend noch telepathisch. Ihr Versagen ist oft ein Eingabefehler, kein Modellfehler.2 Dies deutet darauf hin, dass die nächste Innovationswelle in der KI nicht von marginalen Verbesserungen der Modellarchitektur kommen wird, sondern von radikalen Verbesserungen der Systeme, die sie mit Informationen versorgen. Der Engpass hat sich von der „CPU“ (dem LLM) auf die „I/O“ (die Kontext-Pipeline) verlagert.
2. Definition der neuen Disziplin: Was ist Context Engineering?
Während das Prompt Engineering an seine Grenzen stößt, tritt eine neue Disziplin in den Vordergrund, die einen grundlegenden Wandel in der Art und Weise darstellt, wie wir KI-Systeme konzipieren und bauen. Diese Disziplin, das Context Engineering, verlagert den Fokus von der Formulierung von Anweisungen auf die Architektur von Informationen.
2.1 Ein neues Paradigma: Die Architektur des „Geistes“ des Modells
Die formale Definition lautet: Context Engineering ist die Disziplin des Entwerfens und Bauens dynamischer Systeme, die zur richtigen Zeit die richtigen Informationen und Werkzeuge im richtigen Format bereitstellen, um einem LLM alles zu geben, was es benötigt, um eine Aufgabe plausibel zu bewältigen.2 Die Kernidee ist eine Verlagerung von der Konzentration darauf,
was man dem Modell sagt, hin zu der Konzentration darauf, was das Modell weiß, wenn man es ihm sagt.10 Es geht darum, die Bühne zu bereiten, bevor die Schauspieler ihre Zeilen sprechen.18
Eine treffende Analogie ist die des LLM als CPU und des Kontextfensters als dessen RAM.20 Prompt Engineering ist das Schreiben eines einzelnen Programms, das auf der CPU ausgeführt wird. Context Engineering hingegen ist das Betriebssystem, das den RAM verwaltet und die notwendigen Daten für jede gegebene Aufgabe lädt und entlädt.
2.2 Dekonstruktion des Kontextfensters: Das gesamte Informationsökosystem
Um Context Engineering zu verstehen, muss die Definition von „Kontext“ über einen einzelnen Prompt hinaus erweitert werden. Es ist alles, was das Modell sieht, bevor es eine Antwort generiert.2 Dieses Ökosystem umfasst mehrere entscheidende Komponenten 2:
Anweisungen / System-Prompt: Die persistenten, übergeordneten Direktiven, die die Persona, Regeln und Einschränkungen der KI definieren (z. B. „Du bist ein hilfreicher Assistent für Rechtsrecherche“).
Benutzer-Prompt: Die unmittelbare, aktuelle Frage oder Aufgabe des Benutzers.
Zustand / Verlauf (Kurzzeitgedächtnis): Das laufende Gesprächsprotokoll, das den unmittelbaren Konversationskontext liefert.
Langzeitgedächtnis: Eine persistente Wissensbasis mit Benutzerpräferenzen, früheren Interaktionen und Fakten, die über Sitzungen hinweg gesammelt wurden.
Abgerufene Informationen (RAG): Dynamisch abgerufene externe Kenntnisse aus Dokumenten, Datenbanken oder APIs, um das Modell in Fakten zu verankern und ihm Zugriff auf aktuelle Informationen zu geben.
Verfügbare Werkzeuge: Die Definitionen und Schemata von Funktionen oder APIs, die das Modell aufrufen kann, um Aktionen auszuführen oder weitere Informationen zu sammeln (z. B. eine send_email-Funktion).
Strukturierte Ausgabe: Definitionen des gewünschten Antwortformats (z. B. ein JSON-Schema), um vorhersagbare, maschinenlesbare Ausgaben zu gewährleisten.
2.3 Eine Geschichte zweier Disziplinen: Prompt vs. Context Engineering
Die Unterschiede zwischen diesen beiden Disziplinen sind fundamental und lassen sich am besten in einer vergleichenden Analyse verdeutlichen.
Tabelle 1: Prompt Engineering vs. Context Engineering: Eine vergleichende Analyse
Merkmal
Prompt Engineering
Context Engineering
Zweck
Eine spezifische Antwort auf einen einzelnen Prompt erhalten, meist für eine einmalige Aufgabe.10
Sicherstellen, dass das Modell über Sitzungen, Benutzer und Aufgaben hinweg konsistent und zuverlässig agiert.10
Umfang
Arbeitet mit einem einzelnen Eingabe-Ausgabe-Paar.10
Verwaltet das gesamte Kontextfenster: Gedächtnis, Verlauf, Werkzeuge, System-Prompts.10
Denkweise
Das Verfassen klarer Anweisungen; ähnlich dem kreativen Schreiben oder Copywriting.10
Das Entwerfen des gesamten Informationsflusses und der Architektur; ähnlich dem Systemdesign oder der Softwarearchitektur.10
Natur
Ein statischer String oder eine Vorlage.2
Ein dynamisches System, das vor dem LLM-Aufruf läuft, um den Kontext on-the-fly zusammenzustellen.2
Werkzeuge
Ein Texteditor oder eine Chatbot-Oberfläche.10
RAG-Systeme, Vektordatenbanken, Gedächtnismodule, API-Verkettung, Orchestrierungs-Frameworks (z. B. LangGraph).10
Fehlerbehebung
Umformulieren, Phrasen anpassen und raten.10
Inspektion des gesamten Kontextfensters, der Gedächtnisslots, der Werkzeugaufrufe und des Token-Flusses mit Observability-Tools (z. B. LangSmith).10
Skalierbarkeit
Spröde; bricht bei der Skalierung aufgrund von Grenzfällen zusammen.10
Von Anfang an auf Skalierbarkeit und Wiederverwendbarkeit ausgelegt.10
Beziehung
Eine Teilmenge des Context Engineering. Es ist das, was man innerhalb des Kontextfensters tut.10
Die Disziplin, die entscheidet, was das Kontextfenster füllt.10
Dieser Wandel hat tiefgreifende architektonische und strategische Auswirkungen. Der Fokus der KI-Entwicklung verlagert sich von der Modellinteraktionsebene (dem Prompt) auf die Datenorchestrierungsebene (die Kontext-Pipeline). Das bedeutet, dass die wertvollste Arbeit nicht mehr im Moment des LLM-Aufrufs stattfindet, sondern in den vorbereitenden Schritten, die die Informationen für diesen Aufruf zusammenstellen. Wie es in einer Analyse treffend heißt: „Das Geheimnis beim Bau wirklich effektiver KI-Agenten hat weniger mit der Komplexität des von Ihnen geschriebenen Codes zu tun, sondern alles mit der Qualität des von Ihnen bereitgestellten Kontexts“.2
Die Wertschöpfung und Komplexität haben sich somit „stromaufwärts“ vom LLM-Aufruf verlagert. Die technische Herausforderung liegt nun in der Datenlogistik und Informationsarchitektur, nicht nur in der Linguistik. Dies verändert grundlegend, wie Organisationen über ihre Daten denken sollten. Daten sind nicht mehr nur ein passives Gut, das analysiert wird; sie sind eine aktive, dynamische Ressource, die in agentische Systeme eingespeist wird. Die proprietären Daten eines Unternehmens – Kundenhistorie, interne Dokumente, Produktschemata – werden zu seinem wichtigsten Wettbewerbsvorteil im Zeitalter der KI, da sie den einzigartigen Kontext bilden, den kein Konkurrent replizieren kann. Die Qualität der Context-Engineering-Infrastruktur eines Unternehmens wird direkt die Intelligenz seiner KI-Agenten bestimmen.
3. Der architektonische Bauplan kontextbewusster Systeme
Nachdem die grundlegende Philosophie des Context Engineering etabliert ist, ist es an der Zeit, in die technischen Details einzutauchen. Dieser Abschnitt bildet den technischen Kern des Artikels und erklärt, wie kontextbewusste Systeme aufgebaut sind, indem er die wichtigsten Bausteine und Strategien detailliert beschreibt.
3.1 Die tragende Säule: Retrieval-Augmented Generation (RAG)
Das Herzstück vieler moderner kontextbewusster Systeme ist die Retrieval-Augmented Generation (RAG). RAG ist der primäre Mechanismus, um LLMs in faktenbasiertem, externem Wissen zu verankern, wodurch Halluzinationen reduziert und der Zugriff auf Echtzeitinformationen ermöglicht wird.21 Anstatt sich nur auf das während des Trainings gelernte Wissen zu verlassen, leitet RAG das LLM an, relevante Informationen aus maßgeblichen, vorab festgelegten Wissensquellen abzurufen, bevor eine Antwort generiert wird.21
Der RAG-Prozess lässt sich in mehrere logische Schritte unterteilen:
Datenaufnahme und -vorbereitung: Der Prozess beginnt mit der Sammlung externer Daten aus verschiedenen Quellen wie Dokumenten-Repositories, Datenbanken oder APIs.21
Chunking: Große Dokumente werden in kleinere, semantisch zusammenhängende Abschnitte (Chunks) zerlegt. Dies verbessert die Relevanz und Effizienz des Abrufs, da das System gezielt auf bestimmte Themen fokussieren kann, anstatt ganze Dokumente zu verarbeiten.23
Embedding: Ein Embedding-Modell wandelt die Text-Chunks in numerische Vektorrepräsentationen um. Diese Vektoren, die die semantische Bedeutung des Textes erfassen, werden in einer Vektordatenbank gespeichert.21 Diese Vektordatenbank fungiert als durchsuchbare Wissensbibliothek für das KI-System.24
Abruf (Retrieval): Wenn eine Benutzeranfrage eingeht, wird diese ebenfalls in einen Vektor umgewandelt. Das System führt dann eine Ähnlichkeitssuche (z. B. mittels Kosinus-Ähnlichkeit) in der Vektordatenbank durch, um die Text-Chunks zu finden, deren Vektoren der Anfrage am ähnlichsten sind.23
Anreicherung und Generierung (Augmentation & Generation): Die abgerufenen Chunks werden dem ursprünglichen Prompt als Kontext hinzugefügt. Dieser angereicherte Prompt wird dann an das LLM gesendet, um eine endgültige, faktenbasierte und kontextuell relevante Antwort zu generieren.21
RAG ist ein aktives Forschungsfeld, in dem kontinuierlich an Best Practices, der Behebung von Fehlerquellen und fortgeschrittenen Architekturen wie multimodalen RAG-Systemen gearbeitet wird, die über verschiedene Datentypen wie Text, Bilder und Videos hinweg funktionieren.26
3.2 Jenseits des Abrufs: Fortgeschrittene Strategien zur Kontextverwaltung
Während RAG die Wissensbasis liefert, sind weitere Strategien erforderlich, um ein wirklich dynamisches und intelligentes System zu schaffen.
Gedächtnis- und Zustandsverwaltung:
LLMs sind von Natur aus zustandslos, aber sinnvolle Interaktionen erfordern einen Zustand. Um dieses Problem zu lösen, werden Gedächtnismechanismen implementiert:
Kurzzeitgedächtnis: Techniken wie die Zusammenfassung von Konversationen oder die Verwendung von gleitenden Kontextfenstern helfen, den Überblick über laufende Interaktionen zu behalten.17
Langzeitgedächtnis: Informationen werden über Sitzungen hinweg persistent gemacht. Dies kann durch „Scratchpads“ (das Speichern von Plänen oder Notizen in einer Datei oder einem Zustandsobjekt) oder dadurch erreicht werden, dass das LLM basierend auf Interaktionen automatisch Erinnerungen generiert und in einer Datenbank speichert.20 Prominente Beispiele wie die Gedächtnisfunktion von ChatGPT zeigen diesen Ansatz in der Praxis.20
Agentischer Werkzeuggebrauch:
Um ein LLM von einem passiven Antwortgeber zu einem aktiven Problemlöser zu machen, wird es mit Werkzeugen ausgestattet.
Das Konzept: Durch die Bereitstellung von Definitionen für Werkzeuge (APIs, Funktionen) kann ein Agent Aktionen ausführen, zusätzliche Informationen nachschlagen oder mit externen Systemen interagieren.17
Funktionsweise: Wenn ein Agent mit einer Aufgabe konfrontiert wird, die er mit seinem aktuellen Kontext nicht lösen kann, kann er eine strukturierte Anfrage (z. B. ein JSON-Objekt) ausgeben, um ein bestimmtes Werkzeug aufzurufen. Das System führt das Werkzeug aus und speist das Ergebnis wieder in das Kontextfenster für den nächsten Denkschritt des LLM ein.20
Kontextorchestrierung: Die vier Kernoperationen:
Um das begrenzte „RAM“ des Kontextfensters effektiv zu verwalten, haben sich vier Schlüsselstrategien herauskristallisiert 20:
Schreiben (Write): Persistieren von Kontext außerhalb des unmittelbaren Fensters (z. B. in einem Scratchpad oder Gedächtnis), um zu verhindern, dass er verloren geht.
Auswählen (Select): Intelligente Auswahl der relevantesten Kontextteile für jeden Schritt (z. B. durch RAG oder das Abrufen spezifischer Erinnerungen).
Komprimieren (Compress): Zusammenfassen oder Beschneiden weniger relevanter Informationen (wie ältere Teile eines Gesprächs), um Platz zu sparen und gleichzeitig den Kern zu erhalten.
Isolieren (Isolate): Verwendung von Techniken wie Sandboxing, um Werkzeugaufrufe auszuführen oder den Zustand separat zu verwalten. Dies verhindert eine „Kontextvergiftung“ oder „Kontextverwirrung“, bei der irrelevante oder fehlerhafte Informationen den Hauptdenkprozess stören.20
3.3 Ein praktisches Framework für das Kontextdesign
Um von der Theorie zur Praxis zu gelangen, können Entwickler etablierte Frameworks nutzen. Die CLEAR-Methode für die Informationsarchitektur (Chronological, Layered, Essential, Accessible, Referenced) und das IMPACT-Framework für die Prompt-Konstruktion innerhalb des Kontexts (Intent, Method, Parameters, Audience, Criteria, Tone) bieten strukturierte Ansätze für das Design.31
Ein entscheidendes, aber oft übersehenes Konzept ist die „linguistische Kompression“: die Fähigkeit, die Anzahl der Tokens zu reduzieren und gleichzeitig die Informationsdichte zu maximieren. Dies ist eine entscheidende Fähigkeit, um das Beste aus einem begrenzten Kontextfenster herauszuholen.19 Darüber hinaus ermöglichen fortgeschrittene Konzepte wie „kognitive Werkzeuge“ – strukturierte Vorlagen, die den Denkprozess des LLM unterstützen – eine höhere Form des Werkzeuggebrauchs, die über einfache API-Aufrufe hinausgeht.33
Diese Komponenten sind nicht nur ein Werkzeugkasten; sie bilden ein dynamisches, zyklisches System. Die Ausgabe eines Werkzeugs kann in den Speicher geschrieben werden. Der Speicher kann beeinflussen, welche Dokumente über RAG abgerufen werden. Die abgerufenen Dokumente können Informationen enthalten, die ein anderes Werkzeug auslösen. Dies schafft eine „Denkschleife“, in der der Kontext bei jedem Schritt der Aufgabe eines Agenten ständig neu aufgebaut und verfeinert wird. Dies ist der Kern dessen, was einen Agenten „agentisch“ macht. Das Aufkommen umfassender Frameworks (wie LangGraph), detaillierter praktischer Anleitungen und sogar vorgeschlagener Protokolle (wie das Narrative Context Protocol) zeigt, dass sich das Context Engineering schnell von einer Sammlung von Ad-hoc-„Hacks“ zu einer formalen, strukturierten Ingenieurdisziplin mit eigenen Prinzipien, Mustern und Best Practices entwickelt. Dies ist ein klares Zeichen für ein reifendes technologisches Feld.
4. Context Engineering in Aktion: Von „billigen Demos“ zu „magischen“ Produkten
Die wahre Bedeutung einer technologischen Verschiebung zeigt sich nicht in der Theorie, sondern in der praktischen Anwendung. Context Engineering ist der entscheidende Faktor, der den Unterschied zwischen einer enttäuschenden KI-Interaktion und einem wirklich „magischen“ Erlebnis ausmacht. Dieser Abschnitt beleuchtet anhand von konkreten Beispielen und Fallstudien, wie die Architektur von Informationen die Leistung von KI-Systemen dramatisch verbessert.
4.1 Die Geschichte zweier Agenten: Die Macht eines reichhaltigen Kontexts
Ein eindrucksvolles Beispiel, das den Wert von Context Engineering verdeutlicht, ist die scheinbar einfache Aufgabe, ein Meeting zu planen.2
Der „billige Demo“-Agent: Erhält nur den Benutzer-Prompt: „Hey, ich wollte nur fragen, ob du morgen Zeit für ein kurzes Gespräch hast.“ Da er keinen weiteren Kontext hat, ist seine Antwort roboterhaft und wenig hilfreich: „Wann würde es Ihnen passen?“ Er legt die gesamte kognitive Last wieder auf den Benutzer.
Der „magische“ Agent: Bevor er das LLM aufruft, wird sein Kontext sorgfältig konstruiert. Er enthält:
Ihren Kalender (der zeigt, dass Sie komplett ausgebucht sind).
Ihre bisherigen E-Mails mit dieser Person (um den passenden informellen Ton zu treffen).
Ihre Kontaktliste (um den Absender als wichtigen Partner zu identifizieren).
Verfügbare Werkzeuge wie send_invite und send_email.
Mit diesem reichhaltigen Kontext kann das LLM eine natürliche, hilfreiche und autonome Antwort generieren, die die Aufgabe erledigt: „Hey! Morgen ist leider komplett voll, aber ich habe übermorgen um 10 Uhr oder 15 Uhr Zeit. Habe dir eine Einladung für 10 Uhr geschickt, lass mich wissen, ob das passt.“ Die Magie liegt nicht in einem klügeren Modell, sondern im konstruierten Kontext.2
4.2 Unternehmensanwendung: Fallstudien zu kontextbewusster KI
Große Unternehmen setzen diese Prinzipien bereits ein, um messbare Geschäftsergebnisse zu erzielen. Die erfolgreichsten KI-Agenten sind diejenigen, die Informationen aus mehreren, proprietären Echtzeit-Datenquellen integrieren und synthetisieren können.
Reisen & Buchung (Priceline & Booking.com): Der Agent „Penny“ von Priceline nutzt Kontextbewusstsein und Echtzeit-Sprach-Streaming für ein nahtloses Buchungserlebnis.34 Booking.com hat einen modularen KI-Reiseplaner entwickelt, der ein mehrschichtiges Agentensystem mit benutzerdefinierten Modellen und Orchestrierung verwendet, um personalisierte Reiserouten anzubieten. Dies führte zu höheren Konversionsraten und geringerer Latenz. Eine wichtige Erkenntnis von Booking.com war die Notwendigkeit, eigene Orchestrierungswerkzeuge zu entwickeln, da Open-Source-Lösungen im Produktionsbetrieb versagten – ein klares Zeichen für den Trend zu robustem, internem Context Engineering.34
Flottenmanagement (Geotab): Der KI-Agent von Geotab ermöglicht es nicht-technischen Flottenmanagern, riesige und komplexe Fahrzeugdatenschemata in natürlicher Sprache abzufragen. Dies ist ein klassischer Anwendungsfall für RAG und Context Engineering, der den Datenzugriff vereinfacht und bessere Entscheidungen ohne SQL-Kenntnisse ermöglicht.34
Versicherungswesen (Five Sigma): Five Sigma konnte die Fehlerquote um 80 % senken, indem es KI-Systeme implementierte, die Context Engineering nutzen, um gleichzeitig auf Policendaten, Schadenshistorien und regulatorische Informationen zuzugreifen.35
Finanzwesen (Bud Financial): Dieses agentische System geht über das Beantworten von Fragen hinaus und ergreift Maßnahmen. Mit dem Kontext der Finanzhistorie und der Ziele eines Kunden kann es autonom Geld überweisen, um Überziehungsgebühren zu vermeiden oder bessere Zinssätze zu nutzen.36
Diese Fallstudien zeigen ein konsistentes Muster: Der Wert liegt nicht im LLM selbst, das zunehmend zur Ware wird, sondern in den proprietären Daten, die ihm zugeführt werden. Die Context-Engineering-Pipeline ist der entscheidende Mechanismus, der diesen Geschäftswert freisetzt.
4.3 Ein interdisziplinärer Werkzeugkasten: Praktische Beispiele
Die Anwendbarkeit des Context Engineering erstreckt sich über alle Branchen. Der Unterschied zwischen einem Standard-Prompt und einem kontextuell angereicherten Prompt ist in jedem Bereich spürbar 37:
Programmierung:
Standard-Prompt: „Schreibe eine Python-Funktion zum Parsen einer CSV-Datei.“
Kontext-angereicherter Prompt: „Schreibe eine robuste Python-Funktion, die Pandas verwendet, um CSV-Dateien mit inkonsistenten Trennzeichen (manchmal Semikolon, manchmal Komma) und leicht variierenden Kopfzeilen (z. B. ‚Betrag‘ oder ‚Betr.‘) zu standardisieren und zu parsen.“
Marketing:
Standard-Prompt: „Schreibe einen Blogbeitrag über Produktivität.“
Kontext-angereicherter Prompt: „Du schreibst einen kurzen, leicht sarkastischen Blogbeitrag für ausgebrannte Startup-Mitarbeiter, die allergisch auf das Wort ‚Hustle‘ reagieren. Ton: trockener Humor, minimaler Fülltext. Er sollte 5 Anti-Produktivitätstipps bieten – Dinge, die die Leute aufhören sollten zu tun, wenn sie fokussierter sein wollen. Betrachte es als das Gegenteil der üblichen Selbsthilfeartikel.“
Rechtliches:
Standard-Prompt: „Erstelle eine grundlegende NDA-Vereinbarung.“
Kontext-angereicherter Prompt: „Du bist ein juristischer Mitarbeiter, der eine gegenseitige NDA für einen nicht-technischen Startup-Gründer und einen freiberuflichen Entwickler im Ausland (Indien) entwirft, die ein potenzielles KI-Projekt besprechen. Die Vereinbarung sollte die Vertraulichkeit von Geschäftsgeheimnissen, Quellcode und Kundendaten abdecken und nach indischem Recht durchsetzbar sein.“
Medizinische Beratung:
Standard-Prompt: „Was sind die Symptome von Diabetes?“
Kontext-angereicherter Prompt: „Verhalte dich wie ein Hausarzt, der mit einem leicht ängstlichen 45-Jährigen spricht, der zu viel googelt. Erkläre die frühen Symptome von Typ-2-Diabetes in einfacher, nicht beunruhigender Sprache. Verwende bei Bedarf lockere Metaphern. Liste sie nicht wie ein Lehrbuch auf – erzähle eine Geschichte. Erwähne auch, welche Symptome unbedenklich sind, solange sie nicht anhalten. Beende mit: wann es in Ordnung ist zu warten und wann man einen Arzt aufsuchen sollte.“
Diese Beispiele zeigen, dass der Wettbewerbsvorteil in der Fähigkeit liegt, robuste Pipelines zur Nutzung einzigartiger Datenbestände aufzubauen. In vielen dieser Fälle ist das Context-Engineering-System das Produkt. Unternehmen bauen nicht mehr nur Apps, die eine KI aufrufen; sie bauen KI-native Systeme, bei denen die intelligente Orchestrierung von Kontext das zentrale Wertversprechen ist. Dies hat massive Auswirkungen auf das Produktdesign, die Infrastrukturinvestitionen und die Teamstruktur.
5. Der Wandel des Humankapitals: Neue Rollen und wesentliche Fähigkeiten
Der Übergang vom Prompting zum Context Engineering ist nicht nur ein technologischer, sondern auch ein menschlicher Wandel. Er definiert die auf dem Technologiemarkt gefragten Fähigkeiten neu und schafft neue Rollen, während er bestehende transformiert. Dieser Abschnitt analysiert die tiefgreifenden Auswirkungen dieses Wandels auf die Belegschaft und definiert die wesentlichen Fähigkeiten, die für den Erfolg im Zeitalter kontextbewusster KI erforderlich sind.
5.1 Der Aufstieg des Context Engineers
Wir erleben die Entstehung einer neuen, entscheidenden Rolle: des „Context Engineer“.38 Diese Rolle ist der Nachfolger des Prompt Engineers für ernsthafte KI-Implementierungen und geht weit über das Schreiben von Prompts hinaus. Ein Context Engineer ist ein Architekt des Informationsökosystems der KI.35 Es handelt sich um eine multidisziplinäre Rolle, die eine Mischung aus Fähigkeiten erfordert: teils Produktdesigner, teils Datenarchitekt, teils KI-Flüsterer.39 Ihre Hauptverantwortung liegt im Entwurf, Bau und der Wartung der Kontext-Pipelines, die LLMs mit den notwendigen Informationen versorgen.
5.2 Das Skillset des Context Engineers: Eine neue Art von Ingenieur
Die für diese neue Rolle erforderlichen Fähigkeiten sind spezifisch und anspruchsvoll. Sie spiegeln die systemische Natur der Aufgabe wider und erfordern eine Mischung aus technischen und konzeptionellen Kompetenzen 38:
Informationsarchitektur: Die Fähigkeit, komplexe Informationshierarchien zu strukturieren, Inhalte innerhalb von Token-Beschränkungen zu optimieren und zu verstehen, wie verschiedene Datenformate das Verständnis der KI beeinflussen.
Übersetzung von Domänenexpertise: Die Umwandlung von implizitem Geschäftswissen in expliziten, maschinenlesbaren Kontext. Dies erfordert die Überbrückung der Lücke zwischen Fachexperten und KI-Systemen.
Design dynamischer Systeme: Der Bau von Systemen, die den Kontext basierend auf sich ändernden Anforderungen anpassen, die Echtzeit-Kontextzusammenstellung implementieren und Kontext-Pipelines über mehrere Datenquellen hinweg verwalten.
Verständnis der „KI-Psychologie“: Die Intuition dafür, wie unterschiedliche Kontextstrukturen das Verhalten des Modells beeinflussen, das Erkennen von Mustern in KI-Antworten, die auf Kontextprobleme hinweisen, und die Fehlerbehebung von KI-Ausgaben durch Analyse der Kontextqualität.
Sicherheits- und Compliance-Kontext: Sicherstellen, dass Kontext-Pipelines keine Sicherheitslücken einführen oder sensible Daten preisgeben, und die Implementierung von Audit-Trails für Kontextentscheidungen.
Leistungsoptimierung: Das Ausbalancieren von Kontextreichtum mit den Rechenkosten (Latenz, finanzielle Kosten) und die effektive Verwaltung der Beschränkungen des Kontextfensters.
5.3 Die sich wandelnde Rolle des Produktmanagers
Das Context Engineering transformiert auch die Rolle des Produktmanagers in einem KI-getriebenen Unternehmen. Um die Entwicklung dieser komplexen Systeme effektiv zu leiten, benötigen sie ein neues Set von Fähigkeiten. Die folgenden Kompetenzen, die aus Analysen moderner Produktmanagement-Anforderungen abgeleitet wurden, sind entscheidend 40:
Strategisches Denken & Vision: Die Definition des „Warum“ hinter dem Produkt und wie kontextbewusste KI die Geschäftsziele erreicht.
Datengetriebene Entscheidungsfindung: Der Übergang von Intuition zur Nutzung von Datenanalysen (aus Nutzerverhalten, Markttrends), um zu bestimmen, welcher Kontext am wertvollsten ist.
Technische Kompetenz: Produktmanager müssen nicht programmieren können, aber sie müssen die Architektur von Kontextsystemen (RAG, Vektordatenbanken, Agenten) verstehen, um fundierte Kompromisse eingehen und glaubwürdige Diskussionen mit den Ingenieurteams führen zu können. Ein Verständnis von Konzepten wie APIs und Datenmodellen ist unerlässlich.
Kundenzentrierung & Empathie: Ein tiefes Verständnis der Schmerzpunkte der Nutzer, um den kritischsten Kontext zu identifizieren, der zur Lösung ihrer Probleme erforderlich ist.
Kommunikation: Die Funktion als Übersetzer zwischen Geschäftsinteressenten, Fachexperten und dem technischen Context-Engineering-Team.
Die folgende Tabelle fasst die wesentlichen Fähigkeiten für Fachleute zusammen, die in diesem neuen Paradigma erfolgreich sein wollen.
Tabelle 2: Wesentliche Fähigkeiten für den kontextbewussten KI-Profi
Rolle
Kernkompetenz
Beschreibung der Fähigkeiten
Context Engineer
Informationsarchitektur
Strukturierung komplexer Daten, Optimierung für Token-Limits, Verständnis von Datenformaten.38
Design dynamischer Systeme
Bau adaptiver, echtzeitfähiger Kontext-Pipelines, die mehrere Quellen integrieren.38
„KI-Psychologie“
Intuition für das Modellverhalten, Debugging von Ausgaben durch Analyse der Kontextqualität.38
Leistungsoptimierung
Abwägung von Kontextreichtum gegen Latenz und Kosten, Verwaltung von Kontextfensterbeschränkungen.38
Produktmanager
Strategisches Denken
Definition der Produktvision und Ausrichtung der KI-Fähigkeiten an den Geschäftszielen.41
Datengetriebene Entscheidungsfindung
Nutzung von Analysen zur Priorisierung von Kontextquellen und zur Validierung von Hypothesen.42
Technische Kompetenz
Verständnis der KI-Architektur (RAG, Agenten), um fundierte Kompromisse einzugehen und die technische Machbarkeit zu beurteilen.41
Kommunikation & Empathie
Übersetzung zwischen technischen und geschäftlichen Teams, tiefes Verständnis der Nutzerbedürfnisse, um den relevantesten Kontext zu definieren.40
5.4 Der Ingenieur als KI-Copilot
Die vielleicht tiefgreifendste Veränderung ist die Neudefinition der Rolle des Ingenieurs. Ingenieure werden nicht durch KI ersetzt, sondern ihre Rolle wird aufgewertet. Sie werden zu den „menschlichen Copiloten“, die die Systeme architekturieren, die KI-Agenten erst wirklich effektiv machen.38 Der wertvollste Ingenieur ist derjenige, der das reichhaltigste und dynamischste Kontextsystem bauen kann.
Diese Entwicklung führt zu einer Konvergenz der Rollen. Ein Context Engineer muss wie ein Softwarearchitekt (Systeme entwerfen), ein Dateningenieur (Pipelines bauen) und ein Produktmanager (Nutzerabsicht und Geschäftslogik verstehen) denken. Ein Produktmanager muss wiederum technisch versierter sein als je zuvor. Dies schafft ein neues „Full-Stack“-KI-Profil, das stark funktionsübergreifend ist. Diese Rollenkonvergenz wird erhebliche Auswirkungen haben. Unternehmen müssen ihre Teams von isolierten Funktionen zu funktionsübergreifenden „KI-Agenten“-Teams umstrukturieren. Bildungseinrichtungen und Schulungsprogramme müssen neue Lehrpläne entwickeln, die diese Mischung aus Software, Daten und Produktstrategie vermitteln. Die Nachfrage nach diesen hybriden Fachleuten wird das Angebot bei weitem übersteigen, was zu einem erheblichen Talentengpass und einer enormen Chance für diejenigen führt, die sich weiterbilden.44
6. Die Zukunft ist kontextbewusst
Während sich die KI-Branche weiterentwickelt, wird deutlich, dass Context Engineering kein vorübergehender Trend ist, sondern die grundlegende Arbeit für die nächste Ära der künstlichen Intelligenz.45 Die Fähigkeit, Informationen effektiv zu architekturieren, wird die Gewinner von den Verlierern trennen. Dieser letzte Abschnitt blickt auf den Horizont, fasst die Bedeutung des Context Engineering zusammen und prognostiziert seine zukünftige Entwicklung.
6.1 Die unausweichliche Entwicklung: Hin zur vollen agentischen Autonomie
Das ultimative Ziel der aktuellen KI-Entwicklung ist die Schaffung hochentwickelter, autonomer KI-Agenten, die komplexe, mehrstufige Aufgaben ausführen können.35 Diese Agenten werden nicht nur auf Anfragen reagieren, sondern proaktiv handeln, planen und sich an neue Informationen anpassen. Gartner prognostiziert, dass bis 2028 33 % der Unternehmenssoftware agentische KI enthalten wird, was die Geschwindigkeit dieses Übergangs unterstreicht.35 Solche Systeme sind ohne ausgereifte Context-Engineering-Fähigkeiten unmöglich zu realisieren. Sie benötigen eine konstante Zufuhr von präzisem, relevantem und zeitnahem Kontext, um ihre Ziele zuverlässig zu erreichen.
6.2 Die nächsten Grenzen des Kontexts
Die Forschung und Entwicklung im Bereich des Context Engineering schreitet schnell voran und konzentriert sich auf mehrere wichtige zukünftige Trends:
Multimodale Kontextintegration: Die nächste Grenze besteht darin, über reinen Text hinauszugehen und Bilder, Audio, Video und andere Datentypen nahtlos in einheitliche Kontext-Frameworks zu integrieren.35 Dies wird es KI-Systemen ermöglichen, in reichhaltigen, realen Umgebungen zu verstehen und zu agieren, anstatt auf textbasierte Interaktionen beschränkt zu sein. Neue Forschungsansätze wie UniversalRAG, die über verschiedene Modalitäten hinweg arbeiten, weisen bereits den Weg.27
Automatisiertes Context Engineering: Die Entwicklung von Systemen, die Meta-Learning nutzen, um ihr eigenes Kontextmanagement zu optimieren, ist ein entscheidender nächster Schritt.35 Die KI wird lernen, welche Informationsquellen für welche Aufgaben am wertvollsten sind, und ihre eigenen Kontext-Pipelines automatisch verfeinern, um die Leistung zu verbessern und den manuellen Aufwand zu reduzieren. Dies führt zu einer weiteren Abstraktionsebene in der KI-Entwicklung. Wenn die KI ihren eigenen Kontext optimal auswählen, komprimieren und abrufen kann, verlagert sich die Aufgabe des menschlichen Ingenieurs von der manuellen Gestaltung der Pipeline-Logik zur Definition der übergeordneten Ziele, ethischen Leitplanken und Erfolgskriterien für diese autonomen Systeme. Der Mensch wird zum strategischen Direktor und ethischen Aufseher.
Das kontextorientierte Unternehmen: Wir werden den Aufstieg von „Context Engines“ als Kernstück der Unternehmensinfrastruktur erleben.48 Unternehmen werden ihre Kontext-Pipelines als erstklassiges Produkt behandeln – versioniert, getestet und mit der gleichen Strenge gewartet wie ihre primären Anwendungen.39
6.3 Fazit: Kontext ist der neue Code
Während die Modelle weiter verbessert werden, wird der wahre Differenzierungsfaktor und die Quelle des Wettbewerbsvorteils die Qualität des Kontexts sein, den ein Unternehmen ihnen zur Verfügung stellen kann.49 Die Vision von KI-Agenten als primäres Ziel für Werbung, wie sie vom Gründer von Perplexity AI skizziert wurde, deutet auf einen seismischen Wandel in der digitalen Wirtschaft hin.30 Wenn Agenten, ausgestattet mit perfektem Kontext über unsere Vorlieben und Bedürfnisse, Kaufentscheidungen in unserem Namen treffen, würde die gesamte B2C-Marketing- und Werbebranche auf den Kopf gestellt. Der Fokus würde sich von der Erregung menschlicher Aufmerksamkeit mit emotionaler Werbung auf die Bereitstellung strukturierter, faktenbasierter Daten verlagern, die ein Agent analysieren kann, um eine optimale Entscheidung zu treffen. Dies würde eine neue „B2A“-Ökonomie (Business-to-Agent) schaffen und die Art und Weise, wie Produkte verkauft und entdeckt werden, grundlegend verändern.
Die abschließende Botschaft ist ein Aufruf zum Handeln: für Entwickler, Führungskräfte und Organisationen, ihren Fokus von der reinen Nutzung von KI auf die Architektur der intelligenten Systeme zu verlagern, die das nächste Jahrzehnt definieren werden. Die Beherrschung des Context Engineering ist nicht nur ein technischer Imperativ; es ist die strategische Grundlage für den Erfolg im Zeitalter der künstlichen Intelligenz.
[2501.07391] Enhancing Retrieval-Augmented Generation: A Study of Best Practices – arXiv, accessed July 3, 2025, https://arxiv.org/abs/2501.07391
[2504.20734] UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities – arXiv, accessed July 3, 2025, https://arxiv.org/abs/2504.20734
Seven Failure Points When Engineering a Retrieval Augmented Generation System – arXiv, accessed July 3, 2025, https://arxiv.org/abs/2401.05856
The Rise of Context Engineering: Why AI’s Future Depends on More Than Just Prompts #ainews #ai – YouTube, accessed July 3, 2025, https://www.youtube.com/watch?v=cfUV1nFjftE
Als Service für die Leser:innen unseres Buches „Kluge Köpfchen mit KI“ versuchen wir hier Licht ins Dunkel der KI-Tools zu bringen, die vielleicht schon bald zum Alltag eurer Kinder gehören – oder es bereits tun. Künstliche Intelligenz ist ein spannendes Feld, aber gerade wenn es um unsere Kinder geht, sollten wir genau wissen, womit sie es zu tun haben.
Dieser Artikel vergleicht bekannte KI-Anwendungen und schaut dabei ganz genau auf die Dinge, die für euch als Eltern wichtig sind: Wie gehen diese Tools mit Daten um? Was steht im Kleingedruckten? Und wie sicher ist das alles für junge Nutzer?
Wir nehmen folgende KI-Helferlein genauer unter die Lupe: OpenAI ChatGPT, Anthropic Claude, Microsoft Copilot, Google Gemini, Perplexity AI, Google NotebookLM, DuckDuckGo Duck.ai, Ecosia Chat, Mistral Le Chat und Meta AI. Das ist eine bunte Mischung aus Programmen von großen Tech-Firmen, spezialisierten KI-Schmieden und auch Anbietern, denen Datenschutz besonders am Herzen liegt.
Ziel ist es, euch verlässliche Infos an die Hand zu geben, damit ihr gemeinsam mit euren Kindern entscheiden könnt, welche dieser Werkzeuge passen und wie man sie sicher nutzt. Das ist umso wichtiger, da KI immer mehr Einzug in Schule, Freizeit und später auch den Beruf hält.
Alle Informationen hier stammen direkt von den Anbietern – aus ihren offiziellen Datenschutzerklärungen und Nutzungsbedingungen.
Wir schauen uns die KI-Tools anhand dieser neun Punkte an:
Webadresse des Tools: Wo findet ihr das KI-Tool im Internet?
Anbieter: Welche Firma steckt dahinter und wo hat sie ihren Sitz?
Link zur Datenschutzerklärung: Wo könnt ihr genau nachlesen, wie eure Daten geschützt werden?
Link zu den Nutzungsbedingungen: Was sind die Spielregeln für die Nutzung?
Mindestalter/Altersfreigabe: Ab welchem Alter darf euer Kind das Tool nutzen?
Kostenlos nutzbar? Kann man das Tool gratis ausprobieren, vielleicht mit ein paar Einschränkungen?
Nutzung ohne Anmeldung möglich? Muss man sich registrieren oder geht es auch ohne Konto?
Werden eingegebene Daten gespeichert? Was passiert mit den Texten und Fragen, die euer Kind eingibt?
Werden Daten für Trainingszwecke verwendet? Lernt die KI mit den Eingaben eures Kindes dazu? Falls ja, lässt sich dieser Nutzung widersprechen (Opt-out)?
Gerade beim Thema Datenschutz ist es oft so, dass es für Privatnutzer andere Regeln gibt als für Firmenkunden. Das ist ein wichtiger Punkt, den wir im Auge behalten. Oft ist es so, dass ein besserer Datenschutz bei den Bezahlversionen inklusive ist. Das ist gut zu wissen, wenn ihr überlegt, welches Tool für eure Familie das richtige ist.
Die zehn wichtigsten KI-Tools auf einen Blick
Tool
Anbieter
Alter
Kostenlos
Ohne Anmeldung
KI Training
Opt-Out
ChatGPT
OpenAI 🇺🇸
13*
🟡
✅
⚠️
✅
Claude
Anthropic 🇺🇸
18
🟡
❌
⚠️
✅
Copilot
Microsoft 🇺🇸
🇩🇪 16 / 🇦🇹 14 / 🇨🇭 13
🟡
✅
⚠️
🟠
Gemini
Google 🇺🇸
🇩🇪 16 / 🇦🇹 14 / 🇨🇭 13
🟡
❌
⚠️
🟠
Perplexity
Perplexity AI 🇺🇸
13*
🟡
✅
⚠️
🟠
NotebookLM
Google 🇺🇸
🇩🇪 16 / 🇦🇹 14 / 🇨🇭 13
🟡
❌
🛡️
✅
Duck.ai
DuckDuckGo 🇺🇸
13*
✅
✅
🛡️
✅
Ecosia Chat
Ecosia GmbH 🇩🇪
❓
✅
✅
🛡️
✅
Le Chat
Mistral AI 🇫🇷
13*
🟡
✅
⚠️
✅
Meta AI
Meta 🇺🇸
13*
🟡
✅
⚠️
❌
Legende
✅ = Ja / Trifft zu ❌ = Nein / Trifft nicht zu 🟡 = Eingeschränkt / Nicht alle Funktionen ⚠️ = Vorsicht / Daten werden für Training verwendet 🛡️ = Daten werden nicht fürs KI-Training verwendet 🟠 = Opt-Out nur nach Login möglich ❓ = Unklar / Nicht eindeutig spezifiziert Die Altersangaben (z.B. 🇩🇪 16 / 🇦🇹 14 / 🇨🇭 13) sind direkt in der Tabelle ersichtlich. 13* = Bedeutet, ab 13 Jahren mit Erlaubnis der Eltern/Erziehungsberechtigten.
Unser Buch: „Kluge Köpfchen mit KI“ – Der erste Elternratgeber zum Thema KI
KI ist gekommen, um zu bleiben – und macht auch vor Kinderzimmern nicht Halt. Wir zeigen, wie ein sicherer und kreativer Umgang mit KI im Familien- und Schulalltag gelingt. Verstehe, wie KI funktioniert, entdecke bereichernde Tools fürs Lernen und erhalte praxisnahe Tipps für den Alltag – immer mit kritischem Blick auf die Risiken.
Wer steckt dahinter? ChatGPT kommt von OpenAI OpCo, LLC einer Firma aus den USA (San Francisco, Kalifornien).
Datenschutzinfos: Die genauen Regeln zum Datenschutz findet ihr hier: https://openai.com/de-DE/policies/eu-privacy-policy/. Für Nutzer*innen mit Wohnsitz im Europäischen Wirtschaftsraum (EWR) oder in der Schweiz ist OpenAI Ireland Limited mit Sitz in Dublin, Irland, der Verantwortliche für die in dieser Datenschutzerklärung beschriebene Verarbeitung der personenbezogenen Daten.
Mindestalter: Euer Kind muss mindestens 13 Jahre alt sein. Seid ihr als Eltern oder Erziehungsberechtigte einverstanden, dürfen auch Kinder unter 18 Jahren ChatGPT nutzen.
Kostenlos nutzbar? Ja, es gibt eine kostenlose Version. Damit kann man das Basismodell nutzen, aktuelle Infos aus dem Internet abrufen und nach einer Anmeldung eingeschränkt auch auf bessere Modelle wie GPT-4o und Funktionen wie das Hochladen von Dateien zugreifen.
Wichtig: Bei der kostenlosen Version können die eingegebenen Daten eures Kindes standardmäßig zum Trainieren der KI genutzt werden. Ihr könnt dieser Nutzung aber widersprechen.
Nutzung ohne Anmeldung? Ja, um ChatGPT zu nutzen, braucht man kein Konto.Speicherung von Daten? Ja, OpenAI speichert, was ihr eingebt (Texte, Fragen) und hochladet (Dateien, Bilder, Audio). Auch Chats, die nicht im Verlauf gespeichert werden, bleiben aus Sicherheitsgründen bis zu 30 Tage erhalten!
Daten für Trainingszwecke? Ja, die Inhalte, die ihr eingebt, können genutzt werden, um die KI-Modelle von ChatGPT zu trainieren und zu verbessern. Aber keine Sorge: Ihr habt die Möglichkeit, dieser Nutzung zu widersprechen (Opt-out).
Bei ChatGPT gibt es zwei getrennte Funktionen für mehr Datenschutz: Temporäre Chats werden generell nicht gespeichert und über »Modellverbesserung für alle« (»Improve the model for everyone«) lässt sich einstellen, ob deine Unterhaltungen zur Verbesserung von ChatGPT beitragen sollen oder nicht. Um zu verhindern, dass deine Chats zum Training verwendet werden, musst Du »Modellverbesserung für alle« deaktivieren.
Das Tolle: Auch ohne Anmeldung kannst Du festlegen, ob deine Chats fürs Training verwendet werden. Mit Anmeldung hast Du zusätzliche Optionen wie Datendownload oder Konto löschen.
Wenn du angemeldet bist:
Auf dein Profilbild klicken
»Einstellungen« → »Datenkontrollen«
»Modellverbesserung für alle« ausschalten
Wenn du nicht angemeldet bist:
Auf das »?« unten rechts klicken
»Einstellungen« auswählen
»Modellverbesserung für alle« ausschalten
Deine Unterhaltungen werden dann nicht mehr zum Trainieren von ChatGPT genutzt – erscheinen aber trotzdem im Verlauf (wenn du angemeldet bist).
Mindestalter: Man muss 18 Jahre alt sein, um Claude zu nutzen.
Kostenlos nutzbar? Ja, Claude Chat gibt es auch in einer kostenlosen Version mit ein paar Einschränkungen.
Nutzung ohne Anmeldung? Nein, für Claude braucht man ein Konto.
Speicherung von Daten? Ja, Nutzerdaten werden verschlüsselt gespeichert. Wenn dein Kind eine Unterhaltung löscht, wird sie innerhalb von 30 Tagen auch von den Servern von Anthropic entfernt. Daten im Zusammenhang mit Regelverstößen oder Feedback können länger gespeichert werden.
Daten für Trainingszwecke? Bisher hatte Anthropic die Nutzerchats mit Claude nicht verwendet, um die KI zu trainieren. Das änderte sich jedoch kürzlich – Nutzer*innen können dies aber bei der Anmeldung ablehnen. Eine Pflicht dazu gibt es also nicht.
Nutzungsregeln: Die allgemeinen Nutzungsbedingungen der Copilot AI stehen hier: www.bing.com/new/termsofuse.
Mindestalter: In Deutschland ab 16 Jahren, in Österreich ab 14, in der Schweiz ab 13 Jahren.
Kostenlos nutzbar? Ja, es gibt eine kostenlose Basis-Version.
Nutzung ohne Anmeldung? Ja, das geht, aber mit Einschränkungen. Personalisierte Funktionen gibt es dann nicht.
Speicherung von Daten? Ja. Unterhaltungen werden standardmäßig 18 Monate gespeichert, hochgeladene Dateien bis zu 30 Tage. Für die Firmen-Version (M365 Copilot) gelten andere Regeln.
Daten für Trainingszwecke? Ja, Microsoft nutzt Daten aus Co-Pilot-Gesprächen (anonymisierte Sprach- und Textunterhaltungen) für das KI-Training. Es gibt aber Ausnahmen für Firmenkunden und Nutzer von Microsoft 365-Abos. Angemeldete Nutzer können widersprechen.
Nach dem Einloggen erreichst Du die Datenschutzeinstellungen über das Benutzer-Icon oben rechts.
Unter »Konto« findest Du dort den Punkt »Datenschutz«, wo es die Optionen gibt, bei Unterhaltungen mit Copilot zu widersprechen, dass Microsoft seine KI trainieren und verbessern darf. Dafür die Punkte »Modelltraining anhand von Text« sowie »Modelltraining anhand von Sprache« deaktivieren.
Für noch mehr Datenschutz lässt sich unter »Personalisierung und Arbeitsspeicher« auch die Chat-Historie abschalten sowie verhindern, dass Unterhaltungen, Bing- und MSN-Aktivitäten sowie alle abgeleiteten Interessen für personalisierte Werbung verwendet werden.
Mindestalter: Die Gemini-App ist für Nutzer ab 13 Jahren (oder dem jeweiligen Mindestalter im Land) verfügbar. Gemini für Google Workspace und Gemini in bezahlten Accounts (z. B. Pro, Ultra) sind ab 18 Jahren erlaubt.
Das Mindestalter für Google-Konten ist meist 13 Jahre, beispielsweise in der Schweiz, kann aber regional abweichen: In Deutschland ist das Mindestalter 16 Jahre, in Österreich 14.
Kostenlos nutzbar? Ja. Die Gemini-App kann mit einem Google- Konto kostenlos und mit Schulkonten sogar mit besserem Datenschutz genutzt werden. Bestimmte Funktionen sind nur für Abonnenten von Pro- oder Ultra-Plänen verfügbar.
Nutzung ohne Anmeldung? Nein, für Gemini braucht man ein Google-Konto.
Speicherung von Daten? Ja. Aktivitäten in den Gemini-Apps (Fragen, Antworten) werden standardmäßig bis zu 18 Monate im Bereich »Meine Gemini-Apps-Aktivitäten« gespeichert; diese Einstellung kann man anpassen. Hochgeladene Dateien werden 48 Stunden gespeichert. Eingaben und Ausgaben können zur Verbesserung bis zu 24 Stunden zwischengespeichert werden.
Daten für Trainingszwecke? Bei den normalen Gemini-Apps können Unterhaltungen von menschlichen Prüfern angesehen und zur Verbesserung von Google-Produkten verwendet werden, außer die Funktion »Gemini-Apps-Aktivität« ist ausgeschaltet.
Wichtig: Standardmäßig ist die Funktion »Aktivitäten in Gemini-Apps« aktiviert und Daten werden für Trainingszwecke genutzt und 18 Monate gespeichert. Das Ausschalten dieser Einstellung unter https://myactivity.google.com/product/gemini ist also ein wichtiger Schritt für mehr Datenschutz.
Wer steckt dahinter? Perplexity AI, Inc., eine Firma aus den USA (San Francisco, Kalifornien). In der EU ist DataRep aus Cork in Irland deren Vertreter im Europäischen Wirtschaftsraum.
Mindestalter: Euer Kind muss mindestens 13 Jahre alt sein. Minderjährige, die schon 13 sind, aber noch nicht volljährig, dürfen die Dienste nur nutzen, wenn ein Elternteil oder Erziehungsberechtigter vorher zustimmt.
Kostenlos nutzbar? Ja, es gibt einen kostenlosen »Standard«-Plan, der aber Einschränkungen hat (z. B. nur drei Pro-Suchen pro Tag, maximal zehn Datei-Uploads pro Tag, keine Bilderzeugung).
Nutzung ohne Anmeldung? Ja, die Webversion kann man anfangs ohne Anmeldung nutzen. Ein Konto braucht man aber, um den Chatverlauf zu speichern und die Nutzung persönlicher zu gestalten.
Speicherung von Daten? Ja, Perplexity AI sammelt und speichert Daten.
Daten für Trainingszwecke? Ja, Suchanfragen und Feedback werden genutzt, um die Suche zu verbessern. Du kannst dieser Nutzung widersprechen (Opt-out), indem du den Schalter »AI Data Usage« in den Profileinstellungen ausschaltet, allerdings nur, wenn du eingeloggt bist.
Wichtig: In deinen Kontoeinstellungen kannst du die Verwendung deiner Suchdaten zur Verbesserung der KI-Modelle deaktivieren. Außerdem kannst du die Löschung deiner Daten anfordern, indem du eine E-Mail an support@perplexity.ai sendest.
Wer steckt dahinter? Google LLC, USA (Mountain View, Kalifornien).
Datenschutzinfos: Es gilt die allgemeine Google Datenschutzerklärung (https://policies.google.com/privacy). Es gibt auch einen speziellen Hinweis für NotebookLM. Für die Plus-Version im Rahmen von Workspace gelten zusätzliche Bedingungen.
Nutzungsregeln: Es gelten die allgemeinen Google Nutzungsbedingungen (https://policies.google.com/terms). Für NotebookLM Plus im Rahmen von Workspace gibt es zusätzliche Bedingungen.
Mindestalter: Hier gelten dieselben Bedingungen wie bei Googles Gemini: Das Mindestalter ist meist 13 Jahre, beispielsweise in der Schweiz, kann aber regional abweichen. In Deutschland 16 Jahre, in Österreich 14.
Kostenlos nutzbar? Ja, die Standardversion von NotebookLM ist mit einem Google-Konto kostenlos.
Nutzung ohne Anmeldung? Nein, für NotebookLM braucht man zwingend ein Google-Konto.
Speicherung von Daten? Ja, gemäß der Google Datenschutzerklärung. Für NotebookLM Plus im Rahmen von Workspace werden importierte Dateien, Fragen und Antworten vorübergehend gespeichert. Zusätzlich werden Servicedaten wie Kontoinfos und Nutzungsstatistiken erfasst.
Daten für Trainingszwecke? Explizit Nein. Google betont: »Wir legen Wert auf Ihre Privatsphäre und verwenden Ihre persönlichen Daten niemals zum Trainieren von NotebookLM.« Das ist ein großer Pluspunkt für den Datenschutz, besonders wenn sensible Daten verarbeitet werden.
DuckDuckGo Duck.ai
Wo zu finden? DuckDuckGo Duck.ai ist unter https://duck.ai erreichbar.
Wer steckt dahinter? DuckDuckGo, Inc., eine Firma aus den USA (Paoli, Pennsylvania), bekannt für ihre datenschutzfreundliche Suchmaschine.
Mindestalter: Euer Kind muss mindestens 13 Jahre alt sein. Ist es minderjährig, aber mindestens 13, ist die Erlaubnis eines Elternteils oder Erziehungsberechtigten nötig.
Kostenlos nutzbar? Ja, Duck.ai wird als kostenlose Funktion angeboten.
Nutzung ohne Anmeldung? Ja. Die Suchmaschine DuckDuckGo braucht generell keine Registrierung, und Duck.ai ist darin integriert.
Speicherung von Daten? Nein, Fragen und Antworten werden nicht auf den Servern von DuckDuckGo gespeichert. Kürzlich erstellte Chats können optional lokal auf dem Gerät gespeichert und automatisch nach 30 Unterhaltungen oder durch eine Aktion gelöscht werden. Persönliche Infos wie die IP-Adresse werden entfernt, bevor Anfragen an die eigentlichen KI-Modellanbieter gesendet werden.
Daten für Trainingszwecke? Nein. Unterhaltungen werden weder von DuckDuckGo noch von den genutzten Drittanbietern der Modelle (wie OpenAI, Anthropic) für das Training von Chatmodellen verwendet. DuckDuckGo hat Vereinbarungen mit diesen Anbietern, die eine Nutzung für Modellentwicklung ausschließen. Das ist ein sehr starker Datenschutzansatz!
Mindestalter: Das wird nicht genau gesagt. Die allgemeinen Nutzungsbedingungen von Ecosia nennen kein spezifisches Alter.
Kostenlos nutzbar? Ja. Die Suchmaschine Ecosia ist kostenlos. Ecosia Chat ist eine Funktion davon.
Nutzung ohne Anmeldung? Die Ecosia-Suche und auch Ecosia Chat funktionieren ohne Registrierung.
Speicherung von Daten? Für Ecosia Chat werden Eingaben an die Server von OpenAI übertragen. Diese Daten werden von OpenAI nach 30 Tagen gelöscht. Ecosia selbst speichert Suchanfragen zur Verbesserung des eigenen Dienstes, aber keine persönlichen Infos im Chat.
Daten für Trainingszwecke? Nein, die an OpenAI übermittelten Daten aus Ecosia Chat-Gesprächen werden nicht zum Trainieren der Modelle von OpenAI verwendet. Ecosia selbst kann anonymisierte Suchanfragen zur Verbesserung des eigenen Suchdienstes nutzen, was sich nicht abschalten lässt.
Mindestalter: Das Mindestalter ist 13 Jahre. Minderjährige brauchen die Erlaubnis eines Elternteils oder Erziehungsberechtigten, um ein Konto zu erstellen.
Kostenlos nutzbar? Ja, die meisten Funktionen sind kostenlos verfügbar. Es gibt eine kostenlose Stufe mit einem großzügigen täglichen Limit für Anfragen.
Nutzung ohne Anmeldung? Ja, für Le Chat braucht man kein Konto bei Mistral AI.Speicherung von Daten? Ja, Eingaben und Ausgaben für Le Chat werden gespeichert.
Daten für Trainingszwecke? Ja, bei kostenlosen Abos sowie der Le Chat Pro- oder Le Chat Student-Version können Eingaben und Ausgaben für das Training der Modelle verwendet werden, außer man hat widersprochen (Opt-out). Feedback (Daumen hoch/runter) und die zugehörigen Daten werden auch für Trainingszwecke genutzt. Daten von Nutzern der Le Chat Team- oder Firmen-Version werden nicht für das Training verwendet.
Du solltest der Verwendung deiner Daten in den Kontoeinstellungen widersprechen. Dazu klickst du auf das kleine Zahnrad-Symbol oben links und dann auf »Datenschutz«. Dort findest Du die Option »Erlaube die Nutzung deiner Interaktionen zur Verbesserung unserer Dienste« und kannst sie deaktivieren.
Meta AI
Wo zu finden? Meta AI ist unter https://www.meta.ai/ sowie in Facebook, Instagram, WhatsApp, Messenger, Threads und auf Geräten wie den Ray-Ban Meta Smart Glasses sowie Meta Quest verfügbar.
Wer steckt dahinter? Meta Platforms, Inc. (ehemals Facebook, Inc.), ein US-amerikanisches Unternehmen mit Sitz in Menlo Park, Kalifornien. Für Nutzer*innen in der EU ist Meta Platforms Ireland Limited in Dublin, Irland, Ansprechpartner.
Mindestalter: Du musst mindestens 13 Jahre alt sein, um Meta AI zu nutzen.
Kostenlos nutzbar? Ja, die Nutzung von Meta AI ist kostenlos.
Nutzung ohne Anmeldung? Ja, für die Nutzung von Meta AI benötigst du kein Konto.
Speicherung von Daten? Ja, Meta speichert Interaktionen mit Meta AI, einschließlich deiner Eingaben und der generierten Antworten. Diese Daten können verwendet werden, um die Dienste zu verbessern.
Daten für Trainingszwecke? Ja, seit dem 27. Mai 2025 nutzt Meta öffentliche Inhalte von Nutzer*innen in der EU, wie Beiträge und Kommentare auf Facebook und Instagram, zur Verbesserung seiner KI-Modelle. Private Nachrichten und Inhalte von Minderjährigen sind davon ausgenommen. Du kannst der Verwendung deiner öffentlichen Daten für Trainingszwecke widersprechen, allerdings nicht in den Chats mit Metas KI. Je nachdem ob du die Webseite oder App auf PC, Tablet oder Smartphone nutzt, kann der Prozess etwas anders aussehen.
Beachte, dass deine Daten, auch wenn du keinen Meta-Account hast, durch Dritte (z. B. wenn du auf Fotos markiert wirst) verwendet werden könnten. In diesem Fall kannst du ebenfalls Widerspruch einlegen.
Was bedeutet das für Eltern?
Dieser Vergleich zeigt: Es gibt große Unterschiede zwischen den KI-Tools, was ihre Funktionen, Kosten und vor allem den Umgang mit Daten angeht. Welches Tool für deine Familie am besten passt, hängt davon ab, was euch wichtig ist.
Ein Knackpunkt ist, wie die Anbieter die Daten eurer Kinder für das Training der KI nutzen. Manche tun es standardmäßig und ihr müsst aktiv »Nein« sagen. Andere fragen vorher um Erlaubnis oder verzichten ganz darauf, besonders bei Bezahl-Versionen. Das ist ein riesiger Unterschied für die Kontrolle, die ihr über die Daten eurer Kinder habt. Die KI-Welt entwickelt sich rasant, und es gibt noch keine weltweit einheitlichen Regeln.
Die meisten Tools kann man kostenlos testen, aber oft braucht man ein Konto, um alle Funktionen nutzen zu können. Die Altersgrenzen sind ein Wirrwarr und für euch als Eltern und für Schulen eine Herausforderung. Es scheint, dass Firmen aus der EU oft strengere Datenschutzregeln haben, was wohl an Gesetzen wie der DSGVO liegt.
Wichtig für euch: Die KI-Technologie und die Regeln dafür ändern sich ständig. Schaut euch also regelmäßig die Nutzungsbedingungen und Datenschutzeinstellungen der Tools an, die eure Kinder nutzen. Es wird immer wichtiger, dass wir alle verstehen, was Begriffe wie »Daten für Trainingszwecke« oder »Opt-out« bedeuten. Nur so kannst du dich und dein Kind verantwortungsvoll in der digitalen Welt bewegen. Dieser Abschnitt soll dir helfen, KI-Tools nicht nur nach ihren Funktionen, sondern auch kritisch nach ihrem Umgang mit Daten zu bewerten, bevor du ihnen deine Informationen und die deines Kindes anvertraust.
Infografik: Chatbots & KI-Tools für Eltern
Wichtiger Hinweis zu den Informationen
Liebe Leserin, lieber Leser,
die Informationen in diesem Kapitel wurden mit größter Sorgfalt und nach bestem Wissen und Gewissen zum Zeitpunkt der Recherche zusammengestellt. Die Welt der KI-Technologie und die Richtlinien der Anbieter ändern sich jedoch sehr schnell.
Daher können wir keine Garantie für die jederzeitige Richtigkeit und Vollständigkeit aller hier gemachten Angaben übernehmen.
Es ist möglich, dass Anbieter ihre Nutzungsbedingungen, Datenschutzerklärungen oder Funktionen kurzfristig ändern. Die hier dargestellten Informationen dienen als Orientierung und Momentaufnahme.
Die Verantwortung für die Nutzung der genannten KI-Tools und die Überprüfung der jeweils aktuellen Bedingungen liegt immer bei dir bzw. bei euch als Eltern.
Bitte informiere dich regelmäßig direkt bei den Anbietern über deren aktuelle Richtlinien, bevor du oder dein Kind diese Dienste nutzen. Dieser Text ersetzt nicht die eigene sorgfältige Prüfung der jeweiligen Anbieterinformationen.
Wir hoffen, dieser Überblick hilft dir dennoch, eine fundierte Entscheidung zu treffen!
Kennst du das Gefühl, wenn dich eine Geschichte so sehr fesselt, dass du alles um dich herum vergisst? Wenn die Zeit verfliegt und du gar nicht anders kannst, als weiterzulesen oder zuzuhören? Solche Momente sind kein Zufall – sie sind das Ergebnis gekonnten Storytellings.
Gute Geschichten berühren uns auf einer tiefen, emotionalen Ebene. Sie bleiben in unseren Köpfen und Herzen, lange nachdem wir sie gehört haben. Doch was macht den Unterschied zwischen einer Geschichte, die uns packt, und einer, die wir schnell wieder vergessen?
Genau diese Magie wollen wir heute entschlüsseln. Denn großartige Geschichten entstehen nicht zufällig – sie folgen bestimmten Prinzipien. In diesem Artikel zeige ich dir die sechs wichtigsten Storytelling-Techniken, die ich in diesem YouTube-Video gefunden habe und die deine Geschichten von gut zu unvergesslich machen.
Warum ist Storytelling so wichtig?
Bevor wir in die Techniken eintauchen, lass uns kurz darüber nachdenken, warum Storytelling überhaupt so kraftvoll ist. Unser Gehirn ist auf Geschichten programmiert. Wenn wir Fakten in eine Geschichte verpacken, werden sie:
besser verstanden
länger behalten
emotional verankert
häufiger geteilt
Aber genug der Theorie – lass uns in die praktischen Techniken eintauchen!
Der Tanz zwischen Kontext und Konflikt
Stell dir vor, du sitzt in einem gemütlichen Café. Die Sonne scheint durch die großen Fenster, der Duft von frischem Kaffee liegt in der Luft, und du beobachtest die Menschen um dich herum. Eine friedliche Szene – bis plötzlich die Tür aufgerissen wird und jemand hereingestürmt kommt, völlig außer Atem. Was passiert in diesem Moment mit dir? Richtig, du bist sofort aufmerksam. Was ist passiert? Warum diese Eile?
Genau das ist der „Tanz“ des Storytellings: Ein sorgfältig choreographierter Wechsel zwischen ruhigen Momenten, in denen wir Kontext aufbauen, und spannungsgeladenen Konflikten, die uns an der Geschichte festhalten. Dieser Rhythmus ist tief in unserer Psychologie verankert.
Der grundlegende Rhythmus besteht aus zwei Elementen:
Kontext: Hier baust du die Szene auf, gibst Informationen, lässt die Leser:innen sich orientieren
Konflikt: Hier kommt die Überraschung, die Wendung, das Problem
Ein Beispiel gefällig?
Kontext: „Marie liebte ihren Job als Grafikdesignerin. Jeden Morgen fuhr sie mit dem Rad ins Büro, trank ihren Kaffee und startete kreativ in den Tag.“
Konflikt: „Bis zu dem Morgen, als sie ihre Kündigung im Postfach fand.“
Neuer Kontext: „Sie brauchte dringend einen Plan B, um ihre Miete zu zahlen.“
Neuer Konflikt: „Aber alle ihre Bewerbungen blieben unbeantwortet.“
Merkst du, wie dich dieser Wechsel durch die Geschichte zieht?
Die Schöpfer von South Park, Matt Stone und Trey Parker, haben dafür eine brillante Formel entwickelt. Sie vermeiden in ihren Geschichten bewusst die Verbindung „und dann“, die oft zu einer monotonen Aneinanderreihung von Ereignissen führt. Stattdessen verwenden sie „deshalb“ oder „aber“, um eine natürliche Kausalität oder einen spannenden Konflikt zu erzeugen.
Lass uns ein Beispiel betrachten:
Eine schwache Geschichte würde so klingen:
„Sarah ging zur Arbeit und dann traf sie einen alten Freund und dann gingen sie Kaffee trinken und dann erzählte er ihr von seinem neuen Projekt.“
Die gleiche Geschichte, aber mit der South-Park-Methode:
„Sarah eilte zur Arbeit, aber auf dem Weg lief sie in einen alten Freund. Sie wollte eigentlich pünktlich sein, aber seine Geschichte klang so spannend, deshalb lud sie ihn spontan auf einen Kaffee ein. Was er ihr dann erzählte, sollte ihr Leben für immer verändern…“
Spürst du den Unterschied? Die zweite Version zieht dich hinein, schafft Spannung und macht neugierig auf mehr.
Der Rhythmus deiner Geschichte
Wenn wir über den Rhythmus einer Geschichte sprechen, geht es um weit mehr als nur die Abfolge von Ereignissen. Es geht um den Fluss der Worte, den Wechsel zwischen kurzen und langen Sätzen, zwischen schnellen und langsamen Momenten. Denk an deine Lieblingsmusik – was macht sie besonders? Wahrscheinlich nicht die monotone Wiederholung einer einzelnen Note, sondern der dynamische Wechsel zwischen verschiedenen Elementen.
In der Praxis bedeutet das, mit der Länge und Struktur deiner Sätze zu spielen. Ein kurzer, prägnanter Satz kann wie ein Paukenschlag wirken. Ein längerer Satz hingegen gibt dir die Möglichkeit, eine Szene ausführlich zu malen, Details einzuflechten und deine Leser oder Zuhörer in die Situation hineinzuziehen.
Der legendäre Autor Gary Provost demonstrierte dies eindrucksvoll in seinem berühmten „Write Music“-Beispiel. Hier ist meine Übersetzung und Adaption:
„Dieser Satz hat fünf Worte. Hier sind fünf weitere Worte. Fünf-Wort-Sätze sind gut geeignet. Aber mehrere hintereinander werden monoton. Der Klang wird schnell langweilig. Es klingt wie eine kaputte Platte. Das Ohr sehnt sich nach Abwechslung. Jetzt variiere ich die Satzlänge, und plötzlich klingt alles wie Musik. Schöne Musik. Ein Text, der singt. Er hat einen angenehmen Rhythmus, eine sanfte Melodie, eine Harmonie. Die Worte tanzen über die Seite. Sie ziehen den Leser mit sich. Und manchmal, wenn ich mir sicher bin, dass der Leser entspannt ist und im Fluss der Worte schwimmt, schreibe ich einen längeren Satz, der sich aufbaut wie eine Welle, der Energie sammelt und wächst, bis er schließlich in einem crescendoartigen Finale zu seinem Höhepunkt kommt.“
Die Macht der Variation
Hier ist ein Beispiel, wie unterschiedliche Satzlängen einen Text lebendig machen:
Monoton: „Er ging zum Bahnhof. Er kaufte ein Ticket. Er stieg in den Zug. Er fuhr nach Hause.“
Lebendig: „Hastig eilte er zum Bahnhof. Der letzte Zug würde in wenigen Minuten abfahren. Während er sein Ticket zückte und durch die Sperre hastete, hörte er bereits das charakteristische Pfeifen der sich schließenden Türen. Er rannte.“
Praktischer Tipp
Schreibe jeden Satz in eine neue Zeile. Wenn du den Text von der Seite betrachtest, sollte er wie eine Zackenlinie aussehen – nicht wie ein gleichmäßiger Block.
Die Bedeutung der richtigen Tonalität
Eine der größten Herausforderungen im Storytelling ist es, die richtige Tonalität zu finden. In einer Welt, die von professioneller Kommunikation und geschliffenen Marketing-Botschaften geprägt ist, sehnen sich Menschen nach Authentizität. Sie wollen keine perfekt polierten Vorträge hören, sondern echte Gespräche führen.
Die erfolgreichsten Content Creator unserer Zeit – denk an Menschen wie Emma Chamberlain oder Casey Neistat – haben eines gemeinsam: Sie sprechen mit ihrem Publikum, nicht zu ihnen. Wenn du ihre Videos anschaust oder ihre Texte liest, fühlst du dich, als würdest du mit einem guten Freund am Küchentisch sitzen.
Diese Fähigkeit ist kein Zufall. Steve Jobs beispielsweise arbeitete jahrelang daran, seine Präsentationen so natürlich und gesprächt wie möglich erscheinen zu lassen. Er wusste: Wenn Menschen das Gefühl haben, persönlich angesprochen zu werden, sind sie viel eher bereit, sich auf deine Geschichte einzulassen.
Wie kannst du diese Natürlichkeit in deine eigenen Geschichten bringen? Ein bewährter Trick ist es, sich beim Schreiben oder Sprechen eine konkrete Person vorzustellen. Nicht ein abstraktes Publikum, sondern einen echten Menschen, den du kennst und magst. Stelle dir vor, du erzählst dieser Person deine Geschichte bei einer Tasse Kaffee.
Vom Vortrag zum Gespräch
Vergleiche diese beiden Versionen:
Förmlich: „Im Folgenden werden die Aspekte erfolgreicher Kommunikation erläutert.“
Persönlich: „Lass uns mal darüber sprechen, wie du deine Botschaft wirklich rüberbringen kannst.“
Der Freundes-Trick
Ein super Trick: Stelle dir beim Schreiben eine:n bestimmte:n Freund:in vor. Noch besser: Klebe ein Foto von ihr/ihm an deinen Monitor. Schreibe so, als würdest du nur mit dieser Person sprechen.
Die Kraft der Richtung
Eine der überraschendsten Erkenntnisse im Storytelling ist, dass die besten Geschichten nicht am Anfang, sondern am Ende beginnen. Denk einen Moment darüber nach: Die wirklich großen Geschichtenerzähler – ob Christopher Nolan in seinen komplexen Filmen oder die Autoren packender Romane – wissen bereits beim ersten Wort genau, wo ihre Geschichte enden wird.
Warum ist das so wichtig? Weil das Ende deiner Geschichte wie ein Leuchtturm ist. Es gibt allem, was davor kommt, Bedeutung und Richtung. Jedes Detail, jede Wendung, jeder Moment führt zu diesem finalen Punkt. Ohne diesen Leuchtturm läufst du Gefahr, dich in interessanten, aber letztlich bedeutungslosen Nebensträngen zu verlieren.
In der Welt der Kurzform-Medien, sei es auf TikTok, Instagram oder LinkedIn, spielt das Ende eine noch wichtigere Rolle. Hier sprechen wir vom „Last Dab“ – dem letzten Eindruck, der so stark sein muss, dass die Menschen ihn mit anderen teilen wollen. Bei Kurzvideos sollte dieser letzte Moment sogar elegant zum Anfang zurückführen, um nahtlose Wiederholungen zu ermöglichen.
Ein praktisches Beispiel: Stell dir vor, du möchtest eine Geschichte über eine überraschende Lernerfahrung erzählen. Anstatt einfach chronologisch zu beginnen, definierst du zuerst dein Ende: Die unerwartete Erkenntnis, dass manchmal der größte Fehler zum wertvollsten Lernerfolg führen kann. Von diesem Punkt aus kannst du nun rückwärts planen und jeden Teil deiner Geschichte so gestalten, dass er diese finale Einsicht verstärkt.
Der Last-Dab-Effekt
Dein letzter Satz, deine finale Pointe – das ist dein „Last Dab“. Er muss so stark sein, dass die Leser:innen ihn mit anderen teilen wollen. Bei Kurzvideos sollte er sogar zum Anfang zurückführen, um Loops zu ermöglichen.
Praktische Umsetzung
Schreibe zuerst dein Ende
Dann deinen Anfang
Fülle dann die Mitte mit deinem Kontext-Konflikt-Tanz
Story-Linsen: Dein einzigartiger Blickwinkel
In einer Welt, in der täglich Millionen von Geschichten erzählt werden, ist es eine besondere Herausforderung, eine eigene, unverwechselbare Stimme zu finden. Hier kommt das Konzept der Story-Linse ins Spiel – dein ganz persönlicher Blickwinkel auf ein Thema.
Stell dir einen Lichtstrahl vor, der auf ein Prisma trifft. Das weiße Licht wird in ein Spektrum wunderschöner Farben aufgefächert. Genauso verhält es sich mit Geschichten: Ein und dasselbe Ereignis kann durch verschiedene Linsen betrachtet ganz unterschiedliche Aspekte offenbaren.
Nehmen wir ein aktuelles Beispiel: Als Taylor Swift beim Super Bowl erschien, entstanden tausende von Geschichten. Die offensichtlichen Linsen fokussierten sich auf ihr Outfit, ihre Reaktionen oder ihre Beziehung zum Football-Star. Doch die wirklich interessanten Geschichten entstanden durch ungewöhnliche Perspektiven: Ein Wirtschaftsanalyst betrachtete den Einfluss ihrer Anwesenheit auf die NFL-Einschaltquoten und den damit verbundenen Wertzuwachs. Ein Soziologe untersuchte, wie ihr Erscheinen die traditionelle Football-Fankultur veränderte. Ein Marketing-Experte analysierte die brillante Vernetzung verschiedener Markenwelten.
Deine eigene Story-Linse entwickelt sich aus deiner einzigartigen Kombination von Erfahrungen, Expertise und Perspektiven. Vielleicht bist du Psychologin mit einer Leidenschaft für Gartenarbeit – dann könntest du über die therapeutische Wirkung des Gärtnerns erzählen. Oder du bist Mathematiker und Hobbykoch – dann liegt deine einzigartige Perspektive vielleicht in der Verbindung von Rezepten mit mathematischen Prinzipien.
Das Taylor Swift Beispiel
Als Taylor Swift beim Super Bowl war, gab es tausende Stories. Die meisten konzentrierten sich auf:
ihr Outfit
ihre Reaktionen
ihre Beziehung
Aber die wirklich interessanten Stories nahmen unerwartete Perspektiven ein:
Wie ihr Erscheinen die NFL-Einschaltquoten beeinflusste
Wie sich die Football-Fankultur dadurch veränderte
Welche Marketing-Lektionen sich daraus lernen ließen
Finde deine Linse
Was ist deine spezielle Expertise?
Welche einzigartigen Erfahrungen hast du?
Welche überraschenden Verbindungen siehst du?
Der Hook: Die Kunst des ersten Moments
In der digitalen Welt gleicht jeder erste Moment einem Händedruck. Er entscheidet binnen Sekunden, ob jemand in deiner Geschichte verweilt oder weiterzieht. Dieser entscheidende Moment – der Hook – ist wie der Köder beim Angeln: Er muss so unwiderstehlich sein, dass dein Publikum gar nicht anders kann, als anzubeißen.
Doch was macht einen Hook wirklich effektiv? Die Antwort liegt in der Kombination von zwei kraftvollen Elementen: dem verbalen und dem visuellen Hook. Stell dir vor, du öffnest eine Tür. Der verbale Hook ist, was du sagst, wenn du eintrittst. Der visuelle Hook ist, wie du dabei aussiehst. Beide müssen perfekt harmonieren, um den stärksten ersten Eindruck zu hinterlassen.
Der verbale Hook folgt dabei einer klaren Formel: Er kombiniert ein unerwartetes Element mit einem klaren Versprechen und einem zeitlichen Rahmen. „Diese vergessene Gartentechnik der Maya verdoppelte meine Tomatenernte in nur drei Wochen“ ist weitaus packender als „Heute zeige ich euch, wie ihr mehr Tomaten ernten könnt.“
Noch wichtiger als der verbale ist jedoch der visuelle Hook. Unser Gehirn verarbeitet Bilder 60.000 Mal schneller als Text. Wenn du über einen erfolgreichen Gemüsegarten sprichst, zeige nicht dich beim Reden, sondern direkt die üppigen Pflanzen. Lass die Bilder für sich sprechen, bevor du ein einziges Wort sagst.
Kevin von Epic Gardening macht das meisterhaft: Bevor er auch nur ein Wort über Erdbeeren verliert, zeigt er eine saftig-rote, perfekt gereifte Frucht in Großaufnahme. Das Bild weckt sofort Emotionen und Erinnerungen – vielleicht an den Geschmack frischer Erdbeeren im Sommer oder an den eigenen Garten in der Kindheit. Erst dann beginnt er zu sprechen, aber da hat er sein Publikum bereits emotional gepackt.
Die zwei Säulen eines starken Hooks
1. Verbaler Hook
Schwach: „Heute zeige ich euch etwas…“ Stark: „Diese ungewöhnliche Methode verdoppelte meine Produktivität in einer Woche“
2. Visueller Hook
Der visuelle Hook ist zehnmal wichtiger als der verbale. Warum? Weil unser Gehirn Bilder schneller verarbeitet als Worte.
Beispiel: Bei einem Video über Gartenarbeit zeigst du nicht dich beim Reden, sondern sofort die üppigen Tomaten, über die du gleich sprechen wirst.
Denn während einzelne KI-Agenten bereits beeindruckende Leistungen zeigen können, liegt das wahre Potenzial in ihrer geschickten Kombination. Ähnlich wie in einem gut eingespielten Team können auch KI-Agenten ihre individuellen Stärken am besten ausspielen, wenn sie effektiv zusammenarbeiten. Doch wie organisiert man eine „virtuelle Belegschaft“ so, dass sie optimal funktioniert?
Die größte Herausforderung liegt dabei überraschenderweise nicht in der technischen Umsetzung, sondern in der Wahl der richtigen Organisationsstruktur. Wie in einem Orchester müssen alle Beteiligten perfekt aufeinander abgestimmt sein. Ein falscher Aufbau kann selbst die leistungsfähigsten Agenten ausbremsen – genauso wie ein chaotisches Projektmanagement selbst die besten Mitarbeiter ineffizient macht.
Stellen Sie sich vor, Sie möchten ein komplexes Dokument erstellen. Sie könnten die gesamte Arbeit einem einzigen KI-Modell überlassen – oder Sie nutzen die Stärken verschiedener Spezialisten. So wie in einem erfolgreichen Unternehmen verschiedene Abteilungen Hand in Hand arbeiten, können auch KI-Agenten ihre individuellen Stärken ausspielen.
Die größte Herausforderung liegt dabei nicht in der technischen Umsetzung, sondern in der Wahl der richtigen Organisationsstruktur. Wie in einem Orchester müssen alle Beteiligten perfekt aufeinander abgestimmt sein. Ein falscher Aufbau kann selbst die leistungsfähigsten Agenten ausbremsen – genauso wie ein chaotisches Projektmanagement selbst die besten Mitarbeiter ineffizient macht.
In der Praxis mit Multi-Agent-Systemen haben sich fünf grundlegende Organisationsformen herauskristallisiert, die jeweils ihre ganz eigenen Stärken und optimalen Einsatzgebiete haben. Vielen Dank an dieser Stelle an Aparna Dhinakaran für ihre tollen Visualisierungen.
Der klassische Zwei-Agenten-Dialog
Beginnen wir mit der einfachsten Form: Dem Dialog zwischen zwei Agenten. Stellen Sie sich das wie ein Ping-Pong-Spiel vor, bei dem zwei KIs sich gegenseitig Bälle zuspielen. Ein Agent macht einen Vorschlag, der andere prüft und verbessert ihn, gibt Feedback zurück – und so geht es hin und her, bis das Ergebnis perfekt ist.
Ein praktisches Beispiel: Bei der Erstellung von Marketing-Texten könnte ein Agent als kreativer Autor fungieren, während der andere die Rolle des kritischen Lektors übernimmt. Der erste Agent schreibt einen Text, der zweite prüft ihn auf Stil, Zielgruppenausrichtung und Marketing-Best-Practices. Durch diesen iterativen Prozess entstehen Texte, die sowohl kreativ als auch strategisch optimiert sind.
Die Group-Chat-Revolution
Deutlich komplexer, aber auch leistungsfähiger ist der Group-Chat-Ansatz. Hier übernimmt ein zentraler Manager-Agent die Rolle des Dirigenten, der verschiedene Spezialisten koordiniert. In der Praxis sehen wir das zum Beispiel bei der Entwicklung komplexer Software-Lösungen.
Ein konkretes Beispiel aus meiner eigenen Erfahrung: Bei der Entwicklung eines KI-gestützten Analysesystems hatten wir einen Manager-Agent, der mit drei Spezialisten zusammenarbeitete: einem SQL-Experten für Datenbankabfragen, einem Analyse-Spezialisten für die Auswertung und einem Dokumentations-Agenten für die Aufbereitung der Ergebnisse. Der Manager koordinierte die Aufgaben, stellte sicher, dass alle Informationen richtig flossen und die Ergebnisse den Anforderungen entsprachen.
Sequentielle Prozesse: Der Fließband-Ansatz
Manchmal ist der beste Weg der gradlinigste. Bei der sequentiellen Organisation arbeiten die Agenten wie an einem Fließband: Einer nach dem anderen, jeder mit seiner spezifischen Aufgabe. Das klingt zunächst weniger spannend als der Group-Chat, ist aber für bestimmte Aufgaben genau richtig.
Ein Paradebeispiel ist die Content-Produktion: Der erste Agent erstellt einen Rohentwurf, der nächste optimiert die Struktur, ein dritter feilt am Stil, und der letzte Agent führt die finale Qualitätskontrolle durch. Wie bei einer gut geölten Maschine greift hier ein Zahnrad ins andere.
Direkte Verbindungen: Das Netzwerk-Modell
Besonders spannend wird es beim direkten Agent-zu-Agent-Modell. Hier gibt es keinen zentralen Manager – stattdessen kommunizieren alle Agenten direkt miteinander, ähnlich wie in einem sozialen Netzwerk. Das mag zunächst chaotisch klingen, hat aber einen entscheidenden Vorteil: maximale Flexibilität.
Ein faszinierendes Beispiel dafür erlebte ich bei einem Projekt zur Marktanalyse. Vier spezialisierte Agenten – einer für Finanzdaten, einer für Social-Media-Trends, einer für Nachrichtenanalyse und einer für Verbraucherverhalten – arbeiteten parallel und tauschten kontinuierlich Erkenntnisse aus. Wenn einer eine wichtige Information entdeckte, konnte er sofort alle anderen informieren. Das Ergebnis? Eine deutlich umfassendere und aktuellere Analyse als bei starren Strukturen.
Die klassische Hierarchie
Zu guter Letzt haben wir die hierarchische Organisation – sozusagen das klassische Unternehmensmodell unter den Multi-Agent-Systemen. Ein Manager-Agent an der Spitze, darunter verschiedene Ebenen von spezialisierten Agenten. Dieser Ansatz glänzt besonders bei komplexen Projekten, die klare Verantwortlichkeiten erfordern.
Stellen Sie sich etwa die Entwicklung eines autonomen Fahrzeugs vor: An der Spitze steht ein strategischer Manager-Agent, der die Gesamtentwicklung koordiniert. Darunter arbeiten Agenten für verschiedene Systembereiche wie Sensorik, Navigation und Sicherheit, die wiederum spezialisierte Sub-Agenten für einzelne Komponenten steuern.
Der Schlüssel zum Erfolg
Die Kunst liegt nicht darin, sich für ein System zu entscheiden und dabei zu bleiben. Vielmehr geht es darum, die verschiedenen Ansätze clever zu kombinieren und an die jeweiligen Anforderungen anzupassen. In vielen erfolgreichen Projekten finden wir zum Beispiel sequentielle Prozesse innerhalb einer Group-Chat-Struktur oder hierarchische Elemente in direkten Agent-zu-Agent-Systemen.
Was ich in zahllosen Projekten gelernt habe: Der Erfolg eines Multi-Agent-Systems hängt weniger von der reinen Leistungsfähigkeit der einzelnen Agenten ab, sondern vielmehr von ihrer optimalen Organisation und Zusammenarbeit. Genau wie in einem menschlichen Team macht auch hier die richtige Struktur oft den entscheidenden Unterschied zwischen Mittelmäßigkeit und Exzellenz.
Fazit und Ausblick
Multi-Agent-Systeme sind keine vorübergehende Mode, sondern die Zukunft der KI-Entwicklung. Sie ermöglichen uns, komplexe Aufgaben mit einer Präzision und Effizienz zu bewältigen, die mit einzelnen Agenten kaum denkbar wäre. Der Schlüssel liegt darin, die verschiedenen Organisationsformen zu verstehen und gezielt einzusetzen.
Die spannende Frage für die Zukunft wird sein, wie sich diese Systeme weiterentwickeln. Werden wir noch komplexere Organisationsformen sehen? Werden sich die Grenzen zwischen den verschiedenen Ansätzen weiter verwischen? Die Entwicklung steht erst am Anfang, und ich bin gespannt, welche innovativen Lösungen wir in den nächsten Jahren sehen werden.