Was sind Vektoreinbettungen und ihre Bedeutung für SEO
Vektoreinbettungen (engl. "Vector Embeddings") sind eine der 4 wichtigen Säulen der semantischen Suche. Damit sind auch dafür verantwortlich, dass deine Seiten überhaupt in den Suchergebnissen angezeigt und als Quellen für KI-Übersichten herangezogen werden. In diesem Blog-Beitrag erfährst du anhand eines plakativen und einfach verständlichen Beispiels, was Vektoreinbettungen sind und worauf du bei modernem SEO aufgrund von Vektoreinbettungen achten solltest.
- Warum Vektoreinbettungen für SEO verwendet werden
- Vektoreinbettungen und ihre Auswirkung auf SEO
- Praktische Anwendungsfälle
- Zusammenfassung
Warum Vektoreinbettungen für SEO verwendet werden
Eine Vektor-Einbettung ist eine mathematische Darstellung von Inhalten, wobei der Begriff “Inhalt“ sehr breit gefasst ist. Damit kann eine ganze Website, eine einzelne Seite einer Website, einzelne Passagen einer Seite oder sogar ein Bild oder ein Video gemeint sein.
Das grundlegende Verständnis von Vektoreinbettungen und seiner Auswirkungen ist für modernes SEO wichtig.
Klassische und lexikalische Indexierungs- und Ranking-Algorithmen haben ein Problem: Sie berücksichtigen die inhaltliche Bedeutung von Wörtern oder Phrasen nicht. So werden etwa die beiden inhaltlich identischen Suchanfragen “photo spots” und “photo locations” für solche “Bag of Words” Ranking Algorithmen als zwei unterschiedliche Keywords behandelt..
Beispiele für solche lexikalischen Ranking-Algorithmen sind "TF-IDF" oder "BM25".
Durch Vektoreinbettungen hingegen können Suchmaschinen und KI-Systeme die inhaltliche Bedeutung ("Semantik") von Texten und Suchanfragen verstehen. Daher sind Vektoreinbettungen eine der Säulen der KI allgemein und der semantischen Suche im Speziellen.
Suchmaschinen wie Google nutzen KI nicht erst, seitdem es ChatGPT gibt. Einen Überblick über die Nutzung von KI-Systemen in der Google Suche findest du auf der Google Seite über “Our AI Journey". Damit kann Google die inhaltliche Bedeutung einer Seite als auch einer Suchanfrage besser verstehen und damit relevantere Suchergebnisse liefern.
Vektoreinbettungen und ihre Auswirkung auf SEO
Um die Funktionsweise von Vektoreinbettungen zu verdeutlichen, habe ich in diesem Blog-Beitrag ein plakatives und einfaches Beispiel gewählt:
Nehmen wir an, es gibt eine Seite über “Fotospots in der Geisterstadt Rhyolite in Nevada”. Im klassischen SEO wäre die Seite auf das Keyword “photo spots rhyolite” optimiert.
Jemand gibt in einer KI oder einer Suchmaschine die Suchanfrage “photo locations rhyolite” sein. Also nicht ganz dasselbe "Keyword", auf das die Seite optimiert ist
Für dieses Beispiel ist es wichtig zu wissen, dass der englische Begriff "Rhyolite" mehrere Bedeutungen haben kann. Es kann damit eine Geisterstadt gemeint sein, aber auch eine Gesteinsart (dt. "Rhyolith").
Vektoreinbettungen für die Indexierung
Vektoreinbettungen werden bereits bei der Indexierung einer Seite verwendet. Der Indexierungsalgorithmus erkennt aufgrund der natürlichen Sprachverarbeitung (engl. "Natural Language Processing"), dass es auf der Seite um die Themen "Fotografieren" und die Geisterstadt "Rhyolite" geht. Durch maschinelles Lernen weiß der Indexierungsalgorithmus, dass es aufgrund der Formulierungen im Text um die beiden Themen "Rhyolite" (in der Bedeutung "Geisterstadt) und "Fotografieren" geht.
Wie fokussiert der Inhalt der Seite für die beiden Themen “Rhyolite” und “Fotografieren” ist, wird auf einer Skala zwischen -1 und +1 dargestellt. Je näher der Wert bei +1 liegt, desto stärker ist der Fokus auf die beiden Themen.
Unsere Beispielseite ist sehr fokussiert. Sie liegt daher sowohl auf der “Rhyolite” als auch der “Fotografie” Skala fast bei 1. Sie bekommt daher im sogenannten “Vektorraum” den Vektor “(0.95, 0.90)”.
Ich habe das grafisch dargestellt:
Vektoreinbettung für eine bestimmte Seite
Vektoreinbettungen haben in der Praxis mehr als nur die im vereinfachten Beispiel erwähnten 2 Dimensionen und 2 Nachkommastellen. Im Vektorraum einer Suchmaschine kann ein Vektor 1024 Dimensionen und ein Dutzend Nachkommastellen haben. Die Anzahl der Dimensionen im Vektorraum steigt, sobald die KI-Systeme leistungsfähiger werden.
In diesem vereinfachten Beispiel demonstriere ich die Vektoreinbettung nur für die gesamte Seite. In der Realität werden die Vektoreinbettungen bei der Indexierung nicht nur für die gesamte Seite (als thematische Klassifikation) berechnet, sondern auch für Passagen, Sätze und Wörter.
Aus der Vektoreinbettung der Wörter eines Satzes wird dann die Einbettung für den Satz berechnet. Aus den Einbettungen der einzelnen Sätze dann die Einbettungen einer Passage und daraus wiederum die Einbettungen für eine gesamte Seite.
Einfachheitshalber bleiben wir im Beispiel aber bei Vektoren auf der Seitenebene.
Vektoreinbettungen für das Ranking
Gibt nun jemand in der Suche die Suchanfrage “photo locations rhyolite” ein, wird auch daraus eine Vektoreinbettung erzeugt. Der Algorithmus erkennt in der Suchanfrage Formulierungen rund um das Thema “Fotografie” und “Reisen” und erzeugt damit eine Vektor-Einbettung für die Suchanfrage mit dem Wert “(0.99, 0.98)”.
Vergleich Vektoreinbettung für Seite und Suchanfrage
Die Werte des Vektors für die Suchanfrage sind nun etwas höher als die Werte für die Seite. Auch wenn die Seite perfekt auf den User-Intent fokussiert ist, enthält sie typischerweise inhaltliche Nuancen, die in der Suchanfrage fehlen. Deshalb ist der Vektor der Seite geringfügig anders als der für die Suchanfrage.
Mit mathematischen Methoden bzw. Algorithmen kann eine Suchmaschine nun für eine Suchanfrage die Seiten aus ihrer Vektor-Datenbank bzw. dem Vektor-Index ermitteln, die einen ähnlichen Vektor wie die Suchanfrage haben.
Dadurch kann ein Chatbot oder eine Suchmaschine eine Seite als thematisch relevant für eine Suchanfrage einstufen und somit für das Ranking in Betracht ziehen. Dafür werden allerdings noch weitere Signale berücksichtigt, wie etwa die Suchhistorie, den Standort oder das verwendete Endgerät. Der Einfachheit halber ignoriere ich diese zusätzlichen Signale in diesem Blogbeitrag.
Irrelevante Inhalte verzerren die Vektoreinbettungen
Würde ich nun meinen Text über “Fotospots in Rhyolite” mit thematisch irrelevanten Inhalten (a.k.a “SEO-Blah”) ergänzen, verzerrt das die erzeugte Vektoreinbettung.
Nehmen wir einmal an, ich erzähle in meinem Text auch viel über die Geschichte der Geisterstadt, etwa um eine bestimmte Wortanzahl zu erreichen. Dadurch könnte die thematische Vektor-Einbettung für meinen Text wie im nächsten Screenshot aussehen.
Vergleich Vektoreinbettung Suchanfrage und Seite mit irrelevantem Text
Der Indexierungsalgorithmus erkennt nun vorwiegend Inhalte über die Geschichte der Geisterstadt, weswegen die Vektor-Einbettung nun eher auf der Achse “Geschichte” liegt statt rechts auf “Fotografie”. Natürlich erkennt der Algorithmus auch einige Inhalte zu “Foto Spots”. Aber das irrelevante “SEO-Blah” über die Geschichte in der Seite für “Fotospots” sorgt für eine verzerrte Vektor-Einbettung, die nicht mehr ähnlich zur Vektor-Einbettung der Suchanfrage ist.
Das sorgt dafür, dass die Seite für die Suchanfrage “photo locations rhyolite” nicht mehr als relevant eingestuft und nicht mehr berücksichtigt wird.
Wie Vektoreinbettungen von Suchmaschinen und KI genutzt werden können
Vektoreinbettungen sind nicht neu. Basierend auf den Erkenntnissen von “Word2Vec” (2013) verwendet Google laut den öffentlich verfügbaren Informationen Vector-Embeddings bereits seit 2015 in Ranking-Systemen wie “Rankbrain” und seit 2018 für das “Neural Matching” und “BERT”.
Thematische Autorität
Den Leak im Jahr 2024 hat Google verständlicherweise nicht öffentlich kommentiert. Darin finden sich aber Hinweise, dass Google Vektoreinbettungen auf breiter Ebene nutzen könnte.
Die “siteEmbeddings” deuten darauf hin, dass Google für eine Domain eine oder mehrere Vektoreinbettungen (Themen) ermittelt und speichert. Das kann Google z.B. verwenden, um etwa "Expertise" oder "Experience" zu evaluieren.
Der “siteFocusScore” deutet darauf hin, dass Google die inhaltliche Tiefe bzw. den inhaltlichen Fokus einer Seite erfasst und ggfs. beim Ranking berücksichtigen kann
Der “siteRadius” könnte das Gegenstück zum “siteFocusScore” sein. Damit wird die inhaltliche Breite einer Website erfasst. Das muss aber nicht unbedingt etwas Negatives sein. Klassische Nachrichten-Seiten haben typischerweise einen breiten siteRadius, aber einen geringen “siteFocusScore”. Ein Reisefotoblog hingegen hätte einen hohen “siteFocusScore”, aber einen geringen “siteRadius”.
Das kann Google etwa als Teil zur Berücksichtigung von E-E-A-T verwenden.
Ermitteln von Ranking-Kandidaten
Seit den Google-Anhörungen im Department of Justice der USA wissen wir, dass das Ranking von Seiten bei Google ein mehrstufiger Prozess ist. Im ersten Schritt werden ein paar tausend Seiten (“Ranking Kandidaten”) ermittelt. Diese Seiten bilden den sogenannten “Green Ring”.
Google kann nun Vektoreinbettungen auf der Seitenebene (für eine thematische “Klassifikation”) nutzen, um thematisch relevante Ranking-Kandidaten zu ermitteln. Auf diese Seiten werden dann weitere Ranking-Algorithmen angewandt, woraus der “Blue Ring” entsteht. Das sind die Seiten, die auch in den Suchergebnissen angezeigt werden.
Ist also deine Seite (oder auch die ganze Website) für eine Suchanfrage thematisch nicht ausreichend fokussiert, wird sie für den “Green Ring” nicht berücksichtigt und scheint damit nicht in den Suchergebnissen auf.
Personalisierung
Mit Vektoreinbettungen lassen sich Themen effektiv und effizient speichern. Das kann eine Suchmaschine zur Personalisierung nutzen, um damit für Nutzer oder Nutzerinnen thematische relevante Empfehlungen in den Suchergebnissen oder im Fall von Google auch in Google Discover anzuzeigen.
Bei der Beobachtung von KI-Übersichten in Google ist mir aufgefallen, dass diese stärker als die Suchergebnisse personalisiert zu sein scheinen. Das spricht dafür, dass Google Vektoreinbettungen bereits für KI-Übersichten nutzt.
Passage Level Retrieval bzw. Ranking
Da Vektoreinbettungen nicht nur für ganze Seiten, sondern auch Absätze (“Passagen”) erzeugt werden, kann eine Suchmaschine aufgrund der Vektoreinbettungen für eine Passage eine Seite möglicherweise nur aufgrund einer Passage für KI-Übersichten verwenden.
Ich habe das auf einigen meiner Seiten schon beobachtet. Die Seiten werden in den KI-Übersichten für spezifische Fragen als Quelle angezeigt. Meine Hypothese dazu ist, dass dafür allerdings nur Seiten herangezogen werden, die schon für das allgemeine Thema als relevant eingestuft werden.
Die Existenz von “Passage Ranking” beschreibt Google natürlich sehr abstrakt auf der englischsprachigen Seite zum Passage Ranking.
Erkennung von Duplicate Content
Sind die Vektoreinbettungen von 2 oder mehr Seiten und z.B. ihren Passagen nahezu identisch, kann eine Suchmaschine das als Hinweis auf “Duplicate Content” werten. Eine Konsequenz davon ist, dass thematisch identische Seiten einer Domain gar nicht mehr indexiert werden; etwa Produktlistenseiten, die lediglich eine andere Sortierung haben.
Diesen Effekt haben SEOs Anfang 2025 beobachtet. Wobei es natürlich keine Aussagen von Google gibt, ob die von mir erwähnte Erkennung von Duplicate Content dafür verantwortlich ist.
Beurteilung der Content-Qualität
Wie ich oben erwähnt habe, werden Vektoreinbettungen nicht nur für Seiten, sondern auch für Absätze (Passagen) erzeugt. Das kann eine Suchmaschine für eine Beurteilung der Content-Qualität nutzen. Fehlen etwa in einem Text über die “Fotospots in Rhyolite” Passagen für wichtige Sehenswürdigkeiten (=Entitäten), beurteilt eine Suchmaschine meine Seite als nicht mehr so relevant für eine Suchanfrage.
Wichtig ist dafür aber nicht, möglichst viele Inhalte in eine Seite “zu stopfen”, sondern die Richtigen. Siehe dazu mein obiges Beispiel über die Geschichte in einem Artikel über die Fotospots in Rhyolite. Dafür ist ein ausführlicher Text über die Geschichte irrelevant.
Praktische Anwendungsfälle
Vektoreinbettungen gehen weit über das Ranking hinaus. Sie machen noch viele weitere Anwendungen möglich. Einige davon habe ich in diesem Kapitel beschrieben.
Vektoreinbettungen für den Knowledge-Graph
Gehen wir noch einmal zum obigen Beispiel. Dort habe ich die Vektoreinbettungen für “Ryholite” und “Fotografie” demonstriert. Nun gibt es aber auch noch den Knowledge-Graph, in dem Milliarden Entitäten gespeichert sind. Das sind “Dinge”, deren Bedeutung Google kennt und als vertrauenswürdig einstuft.
Nun hat die Entität “Rhyolite, Nevada” des Knowledge-Graph ebenfalls eine Vektoreinbettung im Vektorraum. Nachdem dieser Vektor nahe am vertrauenswürdigen Vektor der Entität des Knowledge-Graphs liegt, kann das meiner Seite für die entsprechende Suchanfrage einen Rankingboost verschaffen.
Um das zu erreichen, stelle ich sicher, dass ich in meinem Text nicht nur die Entität “Rhyolite, Nevada” verwende, sondern auch damit verknüpfte Entitäten wie etwa “Ghost Town” oder die korrekten Entitäten für die Sehenswürdigkeiten. Damit kommuniziere ich einer Suchmaschine oder einem KI-System ganz unmissverständlich, dass es um “Fotografie” und die Geisterstadt “Rhyolite” geht und nicht um die Gesteinsart. Das steigert meine Chancen für eine gute Platzierung und eine Erwähnung in den KI-Zusammenfassungen drastisch.
Hier siehst du, wie ChatGPT drei meiner Bilder und meine Seite als Quelle gleich beim ersten Suchergebnis anzeigt. Auch in den KI-Übersichten in Google wird die Seite 2x gefeatured.
Referenzen für Artikel in ChatGPT
Referenzen Artikel in Google AIO
Content-Cluster prüfen
Beim Erstellen deiner SEO-Strategie hast du im Idealfall Content-Cluster überlegt. Das sind thematisch verwandte Seiten. Die Seite über die “Foto Spots in Rhyolite” ist auf meiner Website im Cluster “Photo Spots”.
Die Cluster deiner Website kannst du mit einem Tool wie dem Screaming Frog überprüfen und dir die Vektoreinbettungen auf der Seitenebene berechnen lassen. Dazu benötigst du einen API-Key des Google AI Studio oder von ChatGPT und die entsprechende Prompt-Konfiguration in den Crawling-Einstellungen. Schließlich muss in den Crawler-Einstellungen unter “Inhalt” noch die Option “Einbettungen” aktiviert werden. Damit erstellt der Screaming Frog beim Crawling einer Seite eine Vektoreinbettung auf Dokumentenebene
Das Ergebnis sieht dann in etwa so aus:
Content-Cluster basierend auf Vektoreinbettungen im Screaming Frog
Jeder Punkt in diesem Diagramm entspricht einer URL und jede Farbe entspricht einem Thema. Im Idealfall sind die Punkte derselben Farbe gehäuft in einem Bereich geclustert. Das spricht für eine gute Umsetzung von Themenclustern.
Allerdings gibt es im Diagramm z.B. zwei rote Punkte, die sich nicht im Cluster mit den anderen roten Punkten befinden. Das ist ein Hinweis darauf, dass die Vektoreinbettungen dieser beiden Seiten nicht den anderen entsprechen. So wie ich es im Beispiel über die Geschichte der Geisterstadt weiter oben gezeigt habe. Diese beiden URLs muss ich mir genauer ansehen und sie inhaltlich überarbeiten.
Bilderkennung
Weiter oben habe ich erwähnt, dass Vektoreinbettungen nicht nur für Text, sondern auch für Medien wie Bilder erzeugt werden. Das kann man bis zu einem gewissen Grad sogar selbst testen.
Ich habe dazu ein Bild eines Foto Spots in Rhyolite (ohne Metadaten) im Vision AI Test bei Google hochgeladen. Das Ergebnis siehst du hier:
Themen für Vektorembeddings für Bilder
Markiert habe ich die “Themen”, die Google im Bild erkannt hat. Diese Themen kann Google nun verwenden, um daraus Vektoreinbettungen für das Bild zu generieren.
Für SEO bedeutet das, für entsprechende Texte auch inhaltlich passende Bilder statt “Happy People” oder dem hundertsten “Flatlay” zu verwenden.
Zusammenfassung
Vektoreinbettungen sind einer der 4 wichtigen Säulen der semantischen Suche. Die Zeiten mit “2% Keyword-Dichte” sind vorbei. Achte in deinen SEO-Texten lieber auf folgende 3 Punkte:
Hyperfokus auf den User-Intent im Allgemeinen und den Micro-Intent im Speziellen. Suchanfragen nach “Fotospots Rhyolite” und “Geschichte Rhyolite” bedienen zwei ganz unterschiedliche Micro-Intents und Zielgruppen und erzeugen daher unterschiedliche Einbettungen für den Text und die Suchanfrage.
Vermeide thematisch irrelevantes “SEO Blah” nur um auf eine bestimmte Wortanzahl zu kommen. Natürlich kann ich in einem Artikel über Fotospots 2-3 Sätze über die Geschichte der Geisterstadt erwähnen. Aber bitte keine 500 oder 1000 Worte. Dein Text muss nicht länger als der deines Mitbewerbs sein, sondern inhaltlich besser und fokussierter.
Verwende relevante Begriffe, um das Thema zu verdeutlichen und vermeide eine zu bildhafte Sprache. Statt in einem Text z.B. dutzende Male “photo spots” (Keyword-Stuffing) zu verwenden, verwende Synonyme wie “photo locations” oder “photogenic site”, aber vermeide Phrasen wie “beautiful place”.
Das von Google im Jahr 2012 postulierte “Things, not strings” war also schon vor dem KI-Zeitalter für SEO-Texte wichtig. Jetzt im KI-Zeitalter ist es essenziell.