Natural Language Processing für modernes SEO verstehen
Natural Language Processing (Abk. "NLP") verwendet semantische Suchmaschinen, um sowohl eine Suchanfrage als auch deinen Text inhaltlich zu verstehen. Damit ist es eine der Säulen der semantischen Suche. Mit diesem Blogbeitrag bringe ich dir die wichtigsten Aspekte des Natural Language Processing im Kontext von SEO näher.
- Natural Language Processing vs. lexikalische Suche
- Wichtige Aspekte des Natural Language Processing im Kontext von SEO
- Die wichtigste Konsequenz des Natural Language Processings für SEO
- Zusammenfassung
Natural Language Processing vs. lexikalische Suche
Aufgrund des Natural Language Processing kann eine Suchanfrage besonders inhaltlich relevantere Suchergebnisse liefern.
Im Gegensatz zu einer rein lexikalischen Suche versucht das Natural Language Processing die inhaltliche Bedeutung ("Semantik) eines Textes und einer Suchanfrage zu verstehen. Dadurch kann eine Suchmaschine besser beurteilen, ob und wie gut dein Text die verschiedenen Ebenen der Suchintention erfüllt.
Eine lexikalische Suche konnte früher mit klassischen Ranking-Algorithmen prüfen, ob eine Suchanfrage in einem Text vorkommt. Sie konnte etwa nicht unterscheiden, ob mit der Suchanfrage "where to find Rhyolite" die Gesteinsart "Rhyolith" (engl. "Rhyolite") oder die Geisterstadt in Nevada gemeint ist.
Sehen wir uns im nächsten Kapitel die wichtigsten Aspekte des Natural Language Processings im Kontext der Suchnmaschinenoptimierung an.
Wichtige Aspekte des Natural Language Processing im Kontext von SEO
Mit den folgenden Kapiteln möchte ich die wichtigsten Aspekte des NLP für die Suche hervorheben. Sie sollen dir ein High-Level-Verständnis für die Technologie und die Auswirkungen auf die Suchmaschinenoptimierung näherbringen. Sie sind keine wissenschaftliche Abhandlung. Deshalb habe ich etwa das Thema "Tokenisierung" weggelassen.
Die Screenshots zur Verdeutlichung stammen vom "Google NLP Cloud API Demo". Damit stellt Google seinen Kunden und Kundinnen die Funktionen des Natural Language Processings für eigene Anwendungen zur Verfügung. Das Google NLP Cloud API Demo ist allerdings kein SEO-Tool. Mir ist auch kein SEO-Tool bekannt, das diese Funktionen leistbar anbietet-
Entitäten und ihre Bedeutung im Text erkennen
Im ersten Schritt versucht das Natural Language Processing in einem Text möglichst alle Entitäten zu finden. Da Entitäten in der Regel Hauptwörter sind, werden dafür in erster Linie das Subjekt und Objekte eines Satzes verwendet.
In einem zweiten Schritt versucht das NLP nun, die inhaltliche Bedeutung der Entitäten zu ermitteln. Die Bedeutung wird unter anderem durch den Typ einer Entität abgebildet. Auf andere Art formuliert versucht das NLP herauszufinden, ob etwa die Entität "Rhyolite" in einem Text vom Typ "City" (=die Geisterstadt) oder vom Typ "Thing" (=die Gesteinsart) ist.
Durch Natural Language Processing erkannte Entitäten und ihr Typ
Mehr zum Typ und weiteren Eigenschaften einer Entität findest du in meinem Text über Entitäten und ihre Bedeutung für SEO.
Dazu berücksichtigt das Natural Language Processing den sprachlichen Kontext, in dem die Entität vorkommt, wie etwa:
- Welche Verben im Kontext von "Rhyolite" in den Sätzen verwendet werden
- Ob und wie "Rhyolite" sprachlich im Kontext mit anderen Entitäten verwendet wird.
Dafür verwendet das NLP Machine Learning als Grundlage. Hat eine KI etwa gelernt, dass Verben wie "found" oder "discover" häufig im Kontext der Gesteinsart "Rhyolite" in Texten verwendet werden, wird sie das auch in deinem Text so erkennen. Selbst wenn du mit "Rhyolite" die Geisterstadt meinst; etwa im folgenden Satz:
"During my road trip last Summer I discovered Rhyolite!"
Entdeckt das Natural Language Processing aber, dass du die Entität "Rhyolite" sprachlich im Kontext mit der Entität "Ghost Town" verwendest, wird sie die inhaltliche Bedeutung (den Typ der Entität) richtig erkennen. Selbst wenn du im Text das Verb "found" oder "discover" verwendet hast; etwa im folgenden Satz:
"During my road trip last summer I discovered the ghost town of Rhyolite"
Nun berücksichtigt das NLP nicht nur Verben und verknüpfte Entitäten. Es berücksichtigt auch, wo und wie eine Entität vorkommt: etwa in einem Hauptsatz oder einem Nebensatz bzw. als Subjekt oder als Objekt.
Und diese vielen Aspekte machen die Optimierung für NLP etwas schwierig: Möchte ich sprachlich z.B. das Verb "discovered" verwenden, muss ich also darauf achten, die Entität "Rhyolite" zusammen mit "Ghost Town" zu verwenden.
Für eine optimierte Entitätenerkennung des NLP schreibst du deine Sätze am Bestennach folgenden 2 Prinzipien:
- Topic-Comment-Prinzip: Das Thema (das "Topic" und somit die Entität) steht vorwiegend im Hauptsatz. Im Nebensatz folgt dann deine Erklärung oder Anmerkung dazu ("Comment").
- Verwende die Entität, die für das Thema deines Textes (den "Conceptual Intent") steht, sprachlich im Kontext mit einer relevanten verknüpften Entität. Schreibe also nicht nur "Rhyolite", sondern "Ghost Town of Rhyolite" oder "Rhyolite in Nevada".
Die Entitätenerkennung liefert beim NLP allerdings kein eindeutiges Ergebnis im Sinne von "Ja, da geht es um die Geisterstadt" oder "Nein, es geht nicht um die Geisterstadt. Stattdessen ermittelt sie die inhaltliche Bedeutung einer Entität mit einer bestimmten Wahrscheinlichkeit ("Confidence). Eine KI erkennt also dass es in einem Text mit einer bestimmten Wahrscheinlichkeit ("Confidence") um die Entität "Rhyolite" vom Typ "City" geht. Somit ist die Entitätenerkennung im Speziellen und das ganze Natural Language Processing nicht "deterministisch" (ja/Nein) sondern "probabilistisch".
Das wird dir auch in den folgenden Kapiteln immer wieder begegnen.
Aufgrund der Entitätenerkennung hat eine KI ein ziemlich gutes Bild darüber, worum es inhaltlich in deinem Text geht.
Relevanzbewertung der Entitäten
Entitäten werden im NLP nicht nur mit einer Wahrscheinlichkeit im Hinblick auf ihre Bedeutung ("Confidence") bewertet, sondern auch mit der sogenannten "Salienz". Das ist die Relevanz einer Entität im Vergleich zu den anderen erkannten Entitäten eines Textes.
Die Entität, die für den Conceptual Intent und damit für das Thema deines Textes steht, sollte die höchste Salienz haben. Bei einem Text über die "schönsten Fotospots in der Geisterstadt Rhyolite" wäre das die Entität "Rhyolite".
Die Salienz der durch das NLP erkannten Entitäten in einem Text
Die Salienz wird im Google NLP Tool schon seit einiger Zeit nicht mehr angezeigt. Vermutlich, weil die Demo zu oft als SEO-Tool verwendet wurde.
Die Salienz einer Entität hängt aber nicht so sehr davon ab, wie oft du sie in einem Text verwendest, sondern wo du sie im Text verwendest. Die Salienz einer Entität eines Textes für die Suchmaschinenoptimierung steigt, wenn du sie so verwendest:
- Im Seitentitel ( <title>-Tag) als Subjekt
- In der <H1> als Subjekt
- Im ersten Absatz in einem Hauptsatz als Subjekt. Das setzt den Kontext für deinen gesamten Text
- Immer wieder im Text, ohne dass du dabei eine bestimmte "Dichte" erreichen musst. Nutze auch immer wieder ein Synonym für eine Entität.
- In relevanten Unterüberschriften (aber nicht in jeder)
Erkennung des Sentiment ("Tonalität")
Das Natural Language Processing erkennt, ob dein Text eher negativ, neutral oder positiv geschrieben ist. Wie stark ein Text negativ, neutral oder positiv geschrieben ist, wird auf einer Skala angegeben. Die Skala geht typischerweise von -1 (negativ) bis +1 (positiv). Der Wert auf der Skala wird als "Score" bezeichnet. Ein Wert ("Score") von 0 steht dabei für sachlich-neutral.
Auch die Stärke der Tonalität wird beim NLP ermittelt. Sie wird mit der "Magnitude" erfasst.
Hat also ein Text etwa den Score 0,25 ist er eher positiv. Hat er dann etwa die Magnitude 4, ist er deutlich positiv ("überschwänglich").
Sentiment-Erkennung durch NLP
Somit ermittelt das Natural Language Processing etwa, dass ein Text mit einer Wahrscheinlichkeit von z.B. "67%" sachlich-neutral verfasst ist.
Nun sagt Google selbst, dass das Sentiment kein Ranking-Signal ist. Das glaube ich bis zu einem gewissen Grad sogar. Ich glaube nicht, dass ein positiver Text automatisch besser rankt, weil er positiver formuliert als der Text eines Mitbewerbers.
Schreibe ich etwa einen Text der auf die Suchanfrage "Gefahren in der Geisterstadt Rhyolite" optimiert ist, wird dieser Text eher ein negatives Sentiment haben und daher auch für die entsprechende Suchanfrage weiter oben ranken als ein Text der auf "Ist ein Besuch der Geisterstadt Rhyolite sicher" optimiert ist.
Der Grund dafür liegt meinem Erachten nach in der Suchintention. Schreibe ich für einen Text über die Gefahren in der Geisterstadt Rhyolite, will ich eher verhindern, dass Leute sie besuchen. Dafür ist negatives Sentiment passend. Schreibe ich über "Ist ein Besuch der Geisterstadt sicher", will ich die Leute informieren, aber trotzdem zu einem Besuch ermutigen. Dafür würde ich eher neutral bis leicht positiv schreiben.
Für die Optimierung eines Textes bedeutet das:
- Schreibst du über die Lösung eines Problems, dann verwende neutrale bis leicht positive Sprache. Vermeide als Einleitung eine ewig lange Aufzählung, wie negativ alles andere ist ("Angstmarketing").
- Vermeide eine zu übertrieben positive Tonalität. Das könnte als unseriös und als "Marketingtext" interpretiert werden.
- Schreibst du über Probleme, dann verwende auch gerne ein leicht negatives Sentiment.
Inhaltsmoderation
Die Inhaltsmoderation bezeichnet die Klassifizierung von Inhalten nach sensiblen Themen wie beispielsweise "ab 18", "Gesundheit" oder "Finanztipps". Auch dabei kommt wieder eine Wahrscheinlichkeit ("Confidence") zum Einsatz. Welchen Confidence-Schwellwert Google für die Contentmoderation in der Suche verwendet, ist natürlich nicht bekannt.
Klassifizierung eines Textes durch Natural Language Processing
Der Hauptzweck der Inhaltsmoderation steckt schon im Namen. Damit wird der Zugang zu Inhalten entweder erschwert oder sie werden gänzlich aus den Suchergebnissen gefiltert.
Zum Einsatz kommt das etwa beim "SafeSearch" Filter oder um Seiten der allseits bekannten "YMYL"-Kategorie ("Your Money Your Life") zuzuordnen. Solche Seiten werden in den Suchergebnissen speziell behandelt. Sie erfordern beispielsweise mehr E-E-A-T als andere Seiten.
Welche Klassifizierungen Google für die Inhaltsmoderation in der Suche verwendet, ist natürlich nicht bekannt. Es gibt lediglich eine Liste der Textmodation für das Google Natural Language Processing Cloud API.
Textkategorisierung
Aufgrund der bisher erwähnten Funktionen wie Entitätenerkennung kann ein Text durch das Natural Language Processing kategorisiert werden. Dabei können einem Text mehrere Kategorien zugewiesen werden. Die "Confidence" gibt wieder an, mit welcher Wahrscheinlichkeit ein Text zu einer bestimmten Kategorie gehört.
Textkategorisierung mit Natural Language Processing
Bei meinem Text über die Geisterstadt Rhyolite siehst du, dass er in die passenden Kategorien fällt, etwa "Travel Guides" und "Tourist Destination". Wobei die Confidence für "Travel Guides" am höchsten ist.
Der wesentliche Unterschied zur vorhin erwähnten Klassifizierung ist:
- Mittels Klassifizierung ("Moderation") wird ermittelt, ob ein Text sensibel ist
- Mittels "Kategorisierung" wird ermittelt, in welche Kategorie der Text fällt.
Wir wissen mittlerweile, dass das Ranking in einer Suchmaschine ein mehrstufiger Prozess ist. Die Textkategorisierung kann dabei im ersten Schritt zur Ermittlung von "Rankingkandidaten" verwendet werden, um erst einmal thematisch relevante Seiten zu finden.
Auf diese Rankingkandidaten wird dann das "Re-Ranking" angewandt.
Für SEO bedeutet das: Bleibe inhaltlich beim Thema. Schreibst du einen Reisebericht, dann schweife nicht in eine historische Abhandlung ab. Sonst bekommt dein Text möglicherweise für eine andere Kategorie eine höhere "Confidence" und wird nicht mehr für das erste Ranking berücksichtigt.
Die wichtigste Konsequenz des Natural Language Processings für SEO
SEO-Texte noch vielfach wie für die lexikalische Suche oder wie für Social Media geschrieben. Suchmaschinenoptimierung bedeutet im Kern, die Antwort auf eine gestellte Frage zu liefern.
Vermeide also Unmengen an irrelevantem Text, nachdem niemand gefragt hat. Bei einer Suchanfrage wie "Fotospots in Rhyolite" geht es genau um eine Sache: nämlich um die Fotospots in Rhyolite. Es geht nicht um die Geschichte und auch nicht um eine bezahlte Tour nach Rhyolite.
Stelle dir das einmal im realen Leben vor: Wenn du im Supermarkt fragst, wo du das Mineralwasser findest, was willst du hören? Eine Antwort wie "im dritten Gang links", die deine Intention erfüllt? Oder eine 10-minütige Abhandlung, wie Mineralwasser noch genannt wird, seine Geschichte und, wie es hergestellt wird? Wohl eher nicht, denn du willst es kaufen (User Intent!) und nicht "Mineralwasser studieren".
Auch werden viele Texte noch immer mit viel bildhaften Umschreibungen geschmückt. Ein SEO-Text ist kein Roman. Er ist die Antwort auf eine Frage, die Menschen in einer KI oder einer Suchmaschine eingegeben haben. Du musst keine bestimmte Wortzahl erreichen oder ein Keyword mit einer Häufigkeit von 2% in einen Text stopfen. Das ist vorbei.
Würde ich im realen Leben zu einem Freund sagen: "Willst du meine nachhaltigen Erinnerungen einer gespenstischen Gegend in der kargen Wüstenlandschaft im Wesen des drittgrößten Landes der Erde sehen" würde er mich vermutlich sehr fragend ansehen. Frage ich hingegen "Willst du die Fotos der Geisterstadt Rhyolite sehen?" wäre sofort klar, worum es geht.
Die obigen zwei Beispiele sollen verdeutlichen, worum es bei der Optimierung des Natural Language Processing geht. Nämlich einfach eine gestellte Frage zu beantworten. Und zwar unmissverständlich, ohne "Hooks" und ohne "Teaser", mit aussagekräftigen Formulierungen in allgemein verständlicher, natürlicher, Sprache, ohne unverständliche Umschreibungen.
Es heißt nicht um sonst "natural" Language Processing. Lies dir vielleicht deinen Text einmal laut vor und frage dich: "Würde ich das genau so jemandem erzählen?"
Zusammenfassung
Das Natural Language Processing ist eine der Säulen der semantischen Suche. Es hilft einer Suchmaschine, sowohl eine Suchanfrage als auch deinen Text inhaltlich besser zu verstehen und damit relevantere Suchergebnisse anzuzeigen.
Schreibe deine Texte so, dass sie das NLP verstehen kann, in dem du einfache und unmissverständliche Sprache verwendest und einfach die Antwort auf eine gestellte Frage lieferst.
.