GEO: Mit strukturierten Daten / Schema.org in den Knowledge Graph der KI-Suche?

Wer derzeit einen Artikel über KI-SEO oder einen GEO-Audit liest, findet sie fast immer: die Empfehlung, Schema.org Markup einzubauen, „damit Ihre Inhalte mit dem Knowledge Graph verknüpft werden“ und „KI-Suchsysteme Ihre Entitäten besser verstehen“. Sie klingt plausibel, ist technisch sauber formuliert und lässt sich gut verkaufen. Sie ist nur leider in dieser Pauschalform irreführend – und zwar genau für die Systeme, für die sie heute besonders häufig in Stellung gebracht wird: ChatGPT, Perplexity und Claude.

Dieser Beitrag prüft, was die Empfehlung tatsächlich verspricht, was die öffentlich dokumentierte Architektur der relevanten Systeme dazu sagt und was unabhängige Tests zeigen.

Das Ergebnis ist nicht „Schema ist tot“ – sondern: Schema.org wirkt sehr unterschiedlich, je nachdem, in welches System und auf welcher Ebene man hineinschaut. Wer die Empfehlung pauschal ausspricht, verkauft ein Versprechen, das die Evidenz so nicht trägt.

Was die Empfehlung eigentlich behauptet

Die populäre Version geht ungefähr so: Wenn ich auf meiner Website Organization, Article, Product, FAQPage oder Person als JSON-LD ausspielt, werden meine Entitäten und Aussagen in den Knowledge Graph eingespeist. Dadurch erkennt „Die KI“ [sic!] meine Inhalte als „Entitäten“ und ziehen sie als Quellen für KI-Antworten heran. Schema.org wird damit zum semantischen Backbone der KI-Sichtbarkeit erklärt.

Diese Erzählung verschmilzt mindestens drei Annahmen, die einzeln geprüft werden müssen:

Dass es einen einzigen, gemeinsamen „Knowledge Graph“ gibt, in den Inhalte eingespeist werden.
Dass Schema.org-Markup tatsächlich der Eingangskanal in diese Strukturen ist.
Dass die Einspeisung sich in Form von KI-Zitaten und Antwortpräsenz bemerkbar macht.

Alle drei Annahmen sind im Detail brüchiger, als die SEO-Standardrhetorik nahelegt.

„Der Knowledge Graph“ ist eine Fiktion – es gibt mehrere, aber nicht überall einen!

Der erste Punkt ist begrifflich, aber folgenreich. Wenn man die öffentliche Produktdokumentation der relevanten Anbieter sichtet, ergibt sich ein eindeutiges Bild:

Eine dokumentierte produktive Knowledge-Graph-Nutzung lässt sich vor allem bei Google und Microsoft belegen.

Google beschreibt seinen Knowledge Graph ausdrücklich als System mit über 500 Milliarden Fakten zu fünf Milliarden Entitäten, in das Informationen aus dem Web, aus offenen und lizenzierten Datenbanken sowie aus speziellem strukturierten Markup einfließen. Microsoft dokumentiert für Bing seit 2013 Satori als Entity- und Knowledge-Repository und beschreibt im Prometheus-Ansatz die Kombination aus Bing-Index, Ranking-, Answers- und Entity-Systemen.

Bei OpenAI, Perplexity und Anthropic findet sich in der öffentlich zugänglichen Dokumentation nichts Vergleichbares.

Was sich dort findet, ist eine andere Architektur: Search-Index plus Retrieval-Augmented Generation bei Perplexity (Sonar, Search API, Agent API – jeweils mit eigenem Suchindex), Web-Search-Tool plus Contextual Retrieval plus MCP/Connectors bei Anthropic, OAI-SearchBot plus GPTBot plus ChatGPT-User plus Vector Stores plus Product Feeds bei OpenAI.

Das sind RAG-, Index- und Connector-Architekturen, keine offengelegten Knowledge Graphs.

Daraus folgt eine simple, aber für die populäre Empfehlung unangenehme Konsequenz:

Wer „Verknüpfung mit dem Knowledge Graph“ als universellen GEO-Hebel verkauft, suggeriert eine Infrastruktur, die bei drei der fünf großen KI-Systeme schlicht nicht dokumentiert ist. Das macht die Empfehlung nicht automatisch falsch – aber sie ist nicht das, was sie zu sein vorgibt.

Vier Ebenen, auf denen Schema wirken könnte – und wo es das tatsächlich tut

Ein Grund, warum die Schema-Debatte so widersprüchlich verläuft, ist, dass dieselben Tests immer wieder auf falsche Ebenen verallgemeinert werden. Es lohnt sich, vier technische Ebenen sauber zu trennen:

Training und Parametrisierung – fließen strukturierte Daten in die Modellgewichte ein?
Crawling und Indexierung – wird Schema beim Aufbau eines Such-/Entity-Index ausgewertet?
Retrieval und Grounding – nutzt das System Schema, wenn es zur Antwortzeit Dokumente auswählt?
Rendering und Zitation – beeinflusst Schema, wie die Antwort und die Quellenangaben aussehen?

Die meisten populären Schema-Tests messen Ebene 3 und 4 und verallgemeinern dann auf Ebene 1 und 2. Das ist methodisch riskant. Wenn ein Live-Fetch-Test zeigt, dass ChatGPT versteckte JSON-LD-Daten beim Abruf einer einzelnen Seite ignoriert, beweist das nicht, dass strukturierte Daten in Training oder Index nirgendwo eine Rolle spielen. Umgekehrt beweist die Existenz von Googles Knowledge Graph nicht, dass jedes JSON-LD-Snippet auf einer mittelgroßen Website tatsächlich Einfluss auf AI Overviews hat.

Mit dieser Differenzierung ergibt sich folgendes Bild:

Bei Google wirkt Schema vor allem auf Ebene 2 und 4: Beim Verstehen von Seiten, bei der Entity-Disambiguierung, bei Rich Results, Knowledge-Panel-Elementen, Logos und Produkt-/Local-Surfaces. Google sagt zugleich ausdrücklich, dass es keine Sonderanforderungen und kein spezielles Schema-Markup für AI Overviews oder AI Mode gibt. Schema ist hier ein Verstehens-, Appearance- und Entity-Signal – kein eigenständiger Rankingfaktor für generative Antworten.

Bei Microsoft Copilot ist die Lage ähnlich: Bing dokumentiert die Nutzung von Structured Data zum Verstehen, unterstützt JSON-LD, akzeptiert spezielle Formate wie ClaimReview und bindet IndexNow an strukturierte Produktdaten an. Wer in Copilot-Antworten sichtbar werden will, profitiert hier von realer, dokumentierter Architektur – und kann seit Anfang 2026 im AI Performance Dashboard der Bing Webmaster Tools sogar nachvollziehen, welche Grounding Queries Copilot dazu bringen, eigene Inhalte zu zitieren.

Bei ChatGPT gibt es exakt einen klar dokumentierten Fall, in dem strukturierte Daten als Eingangskanal beschrieben sind: Commerce, über Product Feeds und – bei Shopify-Händlern – den Shopify Catalog. Für klassische redaktionelle Webseiten existiert keine vergleichbare offizielle Aussage. Eine Ahrefs-Untersuchung an 1.885 Seiten fand, dass das nachträgliche Hinzufügen von JSON-LD keinen robusten Zitationszuwachs in ChatGPT brachte. Ein searchVIU-Test deutete zusätzlich darauf hin, dass ChatGPT bei Live-Fetches sichtbares HTML verarbeitete, aber versteckte JSON-LD-, Microdata- und RDFa-Daten ignorierte.

Bei Perplexity existiert ebenfalls keine offizielle Aussage, dass Schema.org die Antwortauswahl verbessert. Die unabhängigen Tests zeigen, dass Perplexity primär aus dem eigenen Index antwortet und versteckte Schema-Daten in Antwort-Fetches nicht extrahiert. Spannend ist allerdings: Perplexitys Zitate überlappen stärker mit klassischen Top-Rankings als bei jedem anderen KI-Assistenten – fast ein Drittel der Perplexity-Zitate stammt aus Seiten, die für dieselbe Anfrage auch in Googles Top 10 ranken. Wer Perplexity-Sichtbarkeit will, betreibt also vor allem klassische SEO.

Bei Claude ist die Evidenz am dünnsten und am skeptischsten. Anthropic dokumentiert Web Search, Contextual Retrieval und Connectors/MCP – keinen Knowledge Graph. Im searchVIU-Test konnte Claude selbst sichtbare Preisangaben nicht sauber extrahieren und versteckte JSON-LD/Microdata/RDFa ebenfalls nicht nutzen. Eine dedizierte Webmaster-Dokumentation analog zu OAI-SearchBot oder Bings AI-Performance-Reports existiert nicht.

Was die Studien wirklich zeigen – und was nicht

Drei Befunde aus der unabhängigen Forschung sind für die Bewertung der Schema-Empfehlung besonders relevant.

Erstens die bereits erwähnte Ahrefs-Studie: Sie ist eines der wenigen Quasi-Experimente in diesem Feld und zeigt, dass das bloße Nachrüsten von JSON-LD keinen robusten Effekt auf KI-Zitate in Google AI Mode oder ChatGPT hat. Das widerlegt nicht jede mögliche Wirkung von Schema – aber es widerspricht dem Versprechen, Schema sei der Hebel für KI-Sichtbarkeit, sehr direkt.

Zweitens die Ahrefs-Folgestudie zu 1,4 Millionen ChatGPT-Prompts: ChatGPT ruft viele URLs ab, zitiert aber nur etwa die Hälfte; was am Ende zitiert wird, kommt überwiegend über den allgemeinen Search-Pfad, und Titel- bzw. URL-Relevanz zu internen Fan-out-Fragen scheint wichtiger zu sein als Snippet-Felder. Das ist eine harte Botschaft: Selbst wenn eine Seite in der KI-Antwortpipeline ankommt, entscheidet eher klassische Search-Logik über die Zitation als strukturierte Daten.

Drittens die searchVIU-Direkt-Fetch-Tests: Sie zeigen, dass Live-Fetch-Systeme sichtbares HTML typischerweise besser verarbeiten als verstecktes Schema. Auch hier ist die Reichweite begrenzt – Schema kann in Index oder Training trotzdem genutzt werden – aber für den konkreten Antwortmoment ist sichtbarer Text die belastbarere Wette als versteckte Markup-Ebenen.

Daneben gibt es Beobachtungsstudien wie die GEO-16-Arbeit zu Google AIO und Perplexity, die Korrelationen zwischen Metadata, Freshness, semantischem HTML, Structured Data und Citation-Wahrscheinlichkeit findet. Solche Korrelationen sind interessant, aber keine Kausalbeweise – und die Studien selbst formulieren das deutlich vorsichtiger als die SEO-Kurzfassungen, die später daraus zitieren. Eine medizinische RAG-Untersuchung zeigt zudem, wie stark bereits kleine Formulierungsänderungen in der Query die Quellenauswahl in Google AIO und Perplexity verschieben können – ein weiterer Grund, einzelnen Tests nicht zu viel Erklärungskraft zuzuschreiben.

Eine wichtige Einschränkung gilt für alle diese Befunde: Wir sehen meist nur die finale Zitation, nicht das vollständige Candidate Set. Dass eine Seite nicht zitiert wird, heißt nicht, dass sie keinen Einfluss auf die Antwort hatte. Diese Attributionslücke macht jede Aussage über die Wirkung strukturierter Daten methodisch fragil – auch die kritische.

Wo Schema.org weiter sinnvoll bleibt

Wer aus alldem ableitet, Schema sei nutzlos, überzieht ebenfalls. Es gibt klar belegte, eng umrissene Wirkbereiche, in denen Schema.org weiterhin hohe Priorität verdient – nur eben nicht unter dem Label „Knowledge-Graph-Verknüpfung“, sondern unter ihren tatsächlichen Funktionen.

Für Google und Bing bleibt Schema relevant für Rich Results, Knowledge-Panel-Elemente, Logo-Darstellungen, Local- und Product-Surfaces, Fact-Check-Labels und Entity-Disambiguierung. Organization-Markup wird von Google explizit als Mittel zur Disambiguierung einer Organisation beschrieben. Bei mehrdeutigen Markennamen, internationalen Niederlassungen oder konkurrierenden Wikipedia-Einträgen ist sauberes Organization-Markup mit sameAs-Verweisen und konsistenten IDs ein realer Hebel.

Für ChatGPT-Commerce ist strukturierter, feed-basierter Input eindeutig relevant.

Wer Produkte in ChatGPT-Shopping platzieren will, sollte Produktfeeds, saubere Produktentitäten und aktuelle Katalogdaten priorisieren – das ist der eine Bereich, in dem OpenAI selbst Structured Data als Genauigkeits- und Relevanzsignal adressiert.

Für alle Google-/Bing-orientierten Use Cases sind Snippet-Kontrollen ein unterschätzter Hebel. nosnippet, max-snippet und data-nosnippet wirken bei Google ausdrücklich auch auf AI Overviews und AI Mode; Bing unterstützt data-nosnippet explizit für Search- und Copilot-Antworten und beschreibt dabei einen wichtigen Vorteil: Inhalte bleiben indexierbar und rankingfähig, erscheinen aber nicht in KI-generierten Antworten. Für Paywalls, Rechtstexte, volatile UGC-Blöcke oder sensible Tabellen ist das oft wertvoller als jedes zusätzliche Markup-Feld.

Was die Priorität tatsächlich verdient

Wenn man die Evidenz ernst nimmt, ergibt sich eine ziemlich nüchterne Prioritätenfolge für KI-Sichtbarkeit, in der Schema.org weiter vorkommt – aber nicht an erster Stelle:

Vor allem anderen kommt maschinenlesbare Sichtbarkeit im sichtbaren HTML: indexierbare Seiten, saubere Titel, klare Heading-Struktur, sichtbare Definitionen, Tabellen und FAQ-Blöcke, konsistente Entitätsbenennung im Fließtext, logische Kanonisierung und aktuelle Inhalte. Google sagt in seinem Guide zur Optimierung für generative AI-Suche explizit, dass seine generativen Funktionen auf den normalen Search-Systemen aufbauen; Bing empfiehlt zusätzlich klare Strukturen, Tabellen und FAQs für AI-Zitierbarkeit. Das ist die Schicht, die in Live-Fetch-Szenarien tatsächlich verarbeitet wird.

Dann folgt Aktualitätsinfrastruktur: Merchant Center und Business Profile für Google, IndexNow und Bing Places für Microsoft, direkte Produktfeeds für ChatGPT-Commerce. Wenn Preise, Verfügbarkeit, Öffnungszeiten oder regulatorische Fakten häufig wechseln, ist Aktualität fast immer wichtiger als noch ein weiteres Markup-Feld.

Erst danach kommt strukturierter Entity-Aufbau dort, wo er nachweislich konsumiert wird: Für Google und Bing sind Organization, Product, Article, Review, ClaimReview, Local-/Business-Daten und Knowledge-Panel-nahe Entitätssignale wertvoll. Für OpenAI sind es Product Feeds. Für Claude und Perplexity bleibt strukturierte Webauszeichnung im öffentlichen Web sekundärer als Sichtbarkeit, Frische und Klarheit.

Schließlich Kontrolle statt Totalfreigabe: bewusster Einsatz von nosnippet, max-snippet und data-nosnippet für Inhalte, die zwar ranken sollen, aber nicht in KI-Antworten erscheinen dürfen.

Wer die Empfehlung trotzdem ausspricht, schuldet seinen Kunden drei Klarstellungen

Es gibt gute Gründe, Schema.org weiter zu empfehlen. Es gibt aber keine guten Gründe, die populäre Erzählung von der „Verknüpfung mit dem Knowledge Graph“ als universellen GEO-Hebel unkommentiert weiterzugeben. Wer die Empfehlung 2026 ausspricht, schuldet seinen Kunden mindestens drei Klarstellungen:

Welcher Knowledge Graph eigentlich gemeint ist. Bei Google und Bing ist die Antwort konkret, bei ChatGPT, Perplexity und Claude existiert keine öffentlich dokumentierte Entsprechung.
Auf welcher Ebene Schema wirken soll. Verstehen und Entity-Disambiguierung im Index ist plausibel; direkte Zitations- oder Rankinghebel für generative Antworten sind nicht belegt und werden von Google selbst dementiert.
Welche Hebel daneben mindestens genauso wichtig sind. Sichtbares HTML, Frische-Inhalte und -Infrastruktur, Bot-Zugang, Snippet-Kontrolle und – im Commerce – direkte Produktfeeds liefern in vielen Fällen mehr ROI als ein weiteres JSON-LD-Snippet.

Die ehrliche Empfehlung für 2026 lautet daher nicht „Schema einbauen, damit Sie im Knowledge Graph landen“. Sie lautet: Schema dort einsetzen, wo Suchsysteme es nachweislich konsumieren, mit klarem Bewusstsein dafür, dass „die KI-Suche“ kein einheitliches Ziel ist, sondern fünf unterschiedlich gebaute Systeme mit unterschiedlichen Eingangskanälen. Wer das nicht differenziert, verkauft eine semantisch hübsche Geschichte – und enttäuscht damit Kunden, die in der Praxis messbare Sichtbarkeit suchen.

Die Bühne im Maschinengeist: Was Claude über unser eigenes Denken verraten könnte

Schlechte Prompts, schlechte Texte: Warum mich diese KI-„Studie“ so ärgert

Zitiert heißt nicht empfohlen: Was drei Experimente über Self-Promotional Content in der KI-Suche zeigen

Agenten sind keine Kolleg:innen. Und genau deshalb brauchen sie eine Plattform

Mit Schema.org in den Knowledge Graph der KI-Suche?