Einführung in Reguläre Ausdrücke in Google Analytics

Ein regulärer Ausdruck ist eine Textschablone, die Sie an verschieden Stellen in Google Analytics und im Google Tag Manager verwenden können. In Google Analytics können Sie mit einem regulären Ausdruck zum Beispiel Filter erstellen und im Tag Manager können Sie solche Textschablonen zum Beispiel in Triggern verwenden.

In Google Analytics und im Google Tag Manager werden reguläre Ausdrücke oft als "regex" oder "regexp" abgekürzt.

Reguläre Ausdrücke sehen auf den ersten Blick fürchterlich kompliziert aus – aber nur auf den ersten Blick.

Im ersten Teil dieses Blog Beitrags zeige ich Ihnen, was reguläre Ausdrücke sind und wie sie funktionieren. Gehen Sie bei diesen Beispielen bitte immer davon aus, dass wir in einem Bericht in Google Analytics nach der Dimension Seitentitel filtern.

Im zweiten Teil finden Sie einige Praxisbeispiele mit Screenshots.

Was sind reguläre Ausdrücke?

Stellen Sie sich einen regulären Ausdruck als eine Textschablone vor. Die "Löcher" in der Schablone sind sogenannte Metazeichen, die als Platzhalter für ein oder mehrere andere Zeichen stehen.

Sobald Sie einen regulären Ausdruck als Filter in Google Analytics eingeben, prüft Analytics, ob zum Beispiel der Seitentitel in die Textschablone passt. Ist das der Fall, wird die entsprechende Zeile im Bericht angezeigt.

Sehen wir uns die unterschiedlichen Arten von Platzhaltern an, die Sie in regulären Ausdrücken verwenden können.

Platzhalter für einzelne Zeichen oder Zeichenfolgen in einem regulären Ausdruck

Der einfachste Platzhalter ist der Punkt ("."). Er steht für ein einzelnes, beliebiges, Zeichen. Das kann ein Buchstabe, eine Ziffer, ein Sonderzeichen aber auch ein Leerzeichen sein.

Nehmen wir als Beispiel das Wort "kalt" und ersetzen den zweiten Buchstaben durch das Platzhalterzeichen "Punkt". Damit haben wir schon den ersten regulären Ausdruck:

k.lt

Würden Sie diesen regulären Ausdruck als Filter für den Seitentitel in Google Analytics verwenden, würde Analytics alle Seitentitel anzeigen, in denen z.B. folgende Wörter vorkommen:

  • kalt
  • kult
  • kAlt
  • k lt

Google Analytics zeigt Ihnen also alle Seitentitel an, in denen ein beliebiges Zeichen, inklusive Leerzeichen, an der zweiten Stelle des Wortes "kalt" vorkommt.

Grundsätzlich ist bei regulären Ausdrücken in Google Analytics die Groß-/Kleinschreibung nicht relevant. In manchen Berichten gibt Ihnen Google Analytics allerdings die Möglichkeit mittels einer Checkbox oder Auswahl festzulegen, ob die Groß- und Kleinschreibung berücksichtigt werden soll.

Bleiben wir noch beim Beispiel "k.lt". Soll an der zweiten Stelle nicht ein beliebiges Zeichen, sondern genau ein Zeichen aus einer bestimmten Gruppe an Zeichen stehen, verwenden Sie statt dem Punkt eine "Gruppe" kombiniert mit einem "oder". Als "oder" verwenden Sie dafür den senkrechten Strich, genannt "Pipe Symbol". Das sieht dann so aus:

k(a|u|i)lt

Angewandt auf den Seitentitel würde Ihnen Google Analytics nur Seitentitel anzeigen, die diese Wörter beinhalten:

  • kalt
  • kult
  • kilt

Die runden Klammern definieren in einem regulären Ausdruck die "Gruppe". Der senkrechte Strich bedeutet "oder". Auf Ihrer Mac Tastatur finden Sie den senkrechten Strich, genannt "Pipe Symbol", mit der Tastenkombination "Option - 7" und auf Ihrer Windows Tastatur mit der Tastenkombination "ALT GR" und der Taste mit dem größer/kleiner Zeichen.

In einer Gruppe können Sie aber nicht nur einzelne Zeichen angeben, sondern ganze Zeichenketten:

(eis|bitter)kalt

Mit diesem regulären Ausdruck zeigt Ihnen Google Analytics alle Seitentitel an, die entweder das Wort "eiskalt" oder "bitterkalt" beinhalten.

Es gibt aber noch eine zweite Möglichkeit, Gruppen zu verwenden. Damit legen Sie fest, welche Art von Zeichen oder Zeichenfolgen Google Analytics bei einem Filter berücksichtigen soll.

Sehen wir uns diesen regulären Ausdruck an:

[10] Grad Kalt

Mit diesem regulären Ausdruck würde Google Analytics folgende Seitentitel anzeigen:

  • 1 Grad Kalt
  • 0 Grad Kalt
  • 10 Grad Kalt

Sobald Sie eine Zeichenfolge in eckige Klammern einschließen, berücksichtigt Google Analytics jedes einzelne Zeichen und die Kombinationen der Zeichen in der angegebenen Reihenfolge.

Die angegebene Reihenfolge der einzelnen Zeichen ist wichtig, denn der reguläre Ausdruck "[10] Grad kalt" würde diesen Seitentitel nicht berücksichtigen:

  • 01 Grad Kalt

Google Analytics würde diesen Seitentitel deshalb nicht anzeigen, da die Zeichenfolge "01" in dieser Reihenfolge nicht in der Gruppe "[10]" vorkommt.

In einer Gruppe mit eckigen Klammern können Sie außerdem einen Zeichenbereich angeben, den Google Analytics berücksichtigen soll, wie:

k[a-z]lt

Damit würde Google Analytics in einem Bericht alle Seitentitel anzeigen, in denen an der zweiten Stelle ein Buchstabe im Bereich von "a" bis "z" vorkommt.

Statt den Buchstaben können Sie auch die Ziffern von 0 bis 9 angeben. In diesem Fall würde Google Analytics an dieser Stelle nur die Ziffern von 0 bis 9 als Zeichen berücksichtigen.

Sie können das sogar kombinieren. Geben Sie zum Beispiel [a-z0-9] an, dann dürfen an dieser Stelle Zeichen im Bereich von "a" bis "z" und "0" bis "9" vorkommen.

Sie können der Gruppe sogar ein einzelnes Zeichen, wie einen Bindestrich hinzufügen. Die Gruppe sieht dann so aus:

[a-z0-9-]

Das bedeutet, dass an der Stelle, an der die Gruppe im regulären Ausdruck steht, ein Buchstabe, eine Ziffer (nicht eine Zahl!) oder ein Bindestrich vorkommen darf.

Wiederholungsoperatoren in regulären Ausdrücken

Sowohl für die Platzhalter aus dem vorherigen Kapitel als auch für Zeichenketten können Sie angeben, ob und wie oft diese an einer bestimmten Stelle vorkommen dürfen.

Dazu verwenden Sie eines der drei Symbole "*", "+" und "?".

Der Stern ("*") bedeutet, dass das Zeichen oder die Zeichenkette unmittelbar davor nicht vorkommen muss aber beliebig oft vorkommen darf.

Das Plus ("+") bedeutet, dass das Zeichen oder die Zeichengruppe davor mindestens einmal vorkommen muss und beliebig oft vorkommen darf.

Das Fragezeichen ("?") bedeutet, dass das Zeichen davor entweder gar nicht vorkommen muss oder genau einmal vorkommen darf.

Der reguläre Ausdruck "k.*lt", angewandt als Filter auf die Dimension Seitentitel, würde folgende Zeilen in einem Bericht in Google Analytics anzeigen:

  • klt
  • kalt
  • kult
  • Kommunalanwalt
  • Katzenkult
  • Kreditanstalt

Da der Stern nach dem Punkt steht, bedeutet das, dass an dieser Stelle des Punktes beliebig viele Zeichen vorkommen dürfen.

Verwenden Sie nun statt "*" ein "+"", würde Google Analytics für den regulären Ausdruck "k.+lt" diese Seitentitel anzeigen:

  • kalt
  • kult
  • Kommunalanwalt
  • Katzenkult
  • Kreditanstalt

Das Wort "klt" aus der Liste davor würde Analytics nicht anzeigen, da das Plus-Zeichen definiert, dass das Zeichen unmittelbar davor, also der Platzhalter für ein beliebiges Zeichen, mindestens einmal vorkommen muss.

Verwenden Sie das "?" statt "+", würde Google Analytics diese Seitentitel anzeigen:

  • klt
  • kult
  • kalt

Seitentitel die "Kommunalanwalt", "Katzenkult" oder "Kreditanstalt" enthalten, würden Sie nicht mehr sehen, da Sie mit dem Fragezeichen definiert haben, dass das Zeichen oder die Zeichenkette davor gar nicht oder genau einmal vorkommen darf.

Die Wiederholungsoperatoren können Sie mit beliebigen Zeichen oder Platzhaltern kombinieren, zum Beispiel:

k(a|u|i)?lt

Dieser reguläre Ausdruck bedeutet, dass an der zweiten Stelle der Buchstabe "a" oder "u" oder "i" aufgrund des Fragezeichens entweder gar nicht oder genau einmal vorkommen darf

Übereinstimmung am Anfang oder Ende eines Textes

Grundsätzlich prüft Google Analytics einen regulären Ausdruck dahin gehend, ob er zum Beispiel im Seitentitel vorkommt. Geben Sie den regulären Ausdruck "k.lt" in einem Filter ein, liefert Ihnen Google Analytics Seitentitel wie:

  • Das Wetter morgen: kalt und regnerisch
  • Schotten tragen bei festlichen Anlässen typischerweise einen Kilt
  • Diese Musiktitel der 80er sind Kult!

Sie haben aber auch die Möglichkeit festzulegen, ob ein Zeichen oder eine Zeichenkette in einem regulären Ausdruck am Anfang oder am Ende, zum Beispiel eines Seitentitels, vorkommen darf. Dazu verwenden Sie die beiden Zeichen "^" für Anfang oder "$" für Ende.

.*kalt$

Dieser reguläre Ausdruck würde Ihnen alle Seitentitel liefern, bei denen vor dem Wort "kalt", aufgrund der Platzhalter ".*", eine beliebige Zeichenfolge steht. Das Wort "kalt" aus allerdings aufgrund des "$" am am Ende des Seitentitels stehen, wie:

  • Eiskalt
  • Gefühlskalt
  • Nasskalt

Aber nicht Wörter wie

  • Kaltakquise
  • Kaltfront
  • Kaltmiete

Möchten Sie nur Seitentitel, bei denen das Wort "kalt" am Anfang steht, verwenden Sie das "^" Symbol. Der reguläre Ausdruck sieht dann so aus:

^kalt.*

Dieser reguläre Ausdruck liefert Ihnen diese drei Seitentitel:

  • Kaltakquise ist out. Nutzen Sie stattdessen SEO
  • Kaltfront voraus! Das Wetter am Wochenende
  • Kaltmieten steigen! Die teuersten Wohngegenden im Überblick

Möchten Sie einen regulären Ausdruck erstellen, der exakt mit dem Seitentitel übereinstimmt, kombinieren Sie die Platzhalter "^" und "$":

^kalt(miete|front)$

Dieser reguläre Ausdruck zeigt einen Seitentitel nur dann an, wenn dieser entweder exakt "Kaltmiete" oder "Kaltfront" lautet, ohne irgendwelche Zeichen davor und danach.

Verantwortlich dafür sind das "^" Symbol das festlegt, dass am Beginn des Seitentitel das Wort "kalt" stehen muss und das "$" Symbol, das festlegt, dass am Ende des Seitentitels entweder das Wort "miete" oder "front" stehen muss.

Das Escapezeichen

Nachdem bestimmte Zeichen in regulären Ausdrücken eine besondere Bedeutung haben, müssen Sie das Escapezeichen verwenden, wenn Sie diese Platzhalter in einem regulären Ausdruck als Zeichen ("literal") berücksichtigen möchten.

Angenommen, Sie möchte alle URLs filtern, die einen URL-Parameter aufweisen. Da URL-Parameter mit einem Fragezeichen an die URL angehängt werden, sieht der reguläre Ausdruck dafür so aus:

.*\?.*

Damit das Fragezeichen als Teil des Textes berücksichtigt wird und nicht als Wiederholungsoperator, stellen Sie ein Backslash davor. Mit diesem regulären Ausdruck zeigt Ihnen Google Analytics alle URLs an, die ein "?" beinhalten.

Auch bei einem "Punkt" als Teil des Textes benötigen Sie ein Backslash davor. Zum Beispiel, wenn Sie einen IP-Filter in Google Analytics mit einem regulären Ausdruck definieren.

Wo Sie reguläre Ausdrücke in Google Analytics verwenden können

Reguläre Ausdrücke können Sie an vielen Stellen in Google Analytics verwenden, zum Beispiel:

  • In vielen Berichtsfiltern
  • Zum Erstellen von Content Gruppierungen
  • In Segmenten
  • Zur Definition von Zielgruppen
  • Zur Definition von Zielvorhaben
  • In Filtern für die Datenansicht
  • In der Standard Channel Gruppierung

Achten Sie beim Verwenden von regulären Ausdrücken darauf, dass in der Filterliste die Option "regulärer Ausdruck" oder "regex(p)?" ausgewählt ist.

Nachdem Sie sich nun mit regulären Ausdrücken bereits auskennen: Was bedeutet der reguläre Ausdruck "regex(p)?", den ich im letzten Satz verwendet habe?

Klicken Sie hier für die Antwort! Der reguläre Ausdruck "regex(p)?" Bedeutet, dass in Google Analytics für reguläre Ausdrücke manchmal die Abkürzung "regex" und manchmal mit der Abkürzung "regexp" verwendet wird. Die Klammer ist eine Gruppe mit dem einzigen Zeichen "p". Das Fragezeichen nach der Gruppe legt fest, dass die Zeichen in der Gruppe nicht vorkommen muss, aber einmal vorkommen kann.

3 Praxisbeispiele für reguläre Ausdrücke inklusive Erklärung

Für das erste Beispiel möchten wir die Pageviews der Tag- und Category-Pages eines Blogs in einem Bericht analysieren. Der Pfad für diese beiden Seitenarten besteht jeweils aus 2 Unterverzeichnissen und dem Namen des Tags (Schlüsselwort) oder der Category (Kategorie). Und so sieht der reguläre Ausdruck dafür aus:

^/blog/(tag|category)/.*
Ergebnis des regulären Ausdrucks

Ergebnis des regulären Ausdrucks

Der reguläre Ausdruck wird Google Analytics, nur die URLs anzuzeigen, die:

  • Mit dem Unterverzeichnis "/blog/" beginnen (durch das "^" Symbol)
  • Als zweites Unterverzeichnis entweder das Wort "tag" oder "category" haben (Aufgrund der Gruppe)
  • Danach eine beliebige Zeichenfolge (gekennzeichnet durch ".*")

Als nächstes möchten wir drei Blog Beiträge, die speziell für das Jahr 2020 geschrieben wurden, analysieren. Diese Blog-Beiträge sind im Unterverzeichnis "blog" abgelegt und haben am Ende der URL die Zeichenfolge "2020". Der reguläre Ausdruck dafür sieht so aus:

^/blog/.*2020$
Ergebnis des regulären Ausdrucks

Ergebnis des regulären Ausdrucks

Aufgrund dieses regulären Ausdrucks zeigt Google Analytics, nur URLs an, bei denen:

  • Die URL mit "/blog/" beginnt (Aufgrund des "^")
  • Gefolgt von einer beliebigen Zeichenkette (aufgrund des ".*")
  • Am Ende der Text muss "2020" stehen (definiert durch das Dollarzeichen am Ende)

Für das dritte Beispiel möchten wir uns die Pageviews für Themen-Seiten ansehen. Themenseiten liegen im Hauptverzeichnis der Site. Das bedeutet, die URL beginnt mit einem "/", enthält nur Zeichen von a-z und eventuell einen Bindestrich. Der reguläre Ausdruck dafür lautet:

^/[a-z-]+$
Ergebnis des regulären Ausdrucks

Ergebnis des regulären Ausdrucks

Mit diesem Ausdruck sagen Sie Google Analytics, dass:

  • Nur URLs angezeigt werden sollen, die mit einem "/" beginnen (aufgrund des "^" Zeichens)
  • Danach mindestens ein Zeichen von "a" bis "z" oder ein Bindestrich folgen (aufgrund der Gruppe [a-z-]
  • Die Zeichen "a" bis "z" oder der Bindestrich müssen mindestens einmal und dürfen beliebig oft vorkommen (aufgrund des "+")
  • Eines der Zeichen "a" bis "z" oder der Bindestrich müssen am Ende der URL stehen (aufgrund des "$" Symbols)

Zusammenfassung

Mit regulären Ausdrücken können Sie Berichte in Google Analytics filtern und ersparen sich damit so manche Extrarunde in Excel.

Falls Sie noch nie mit regulären Ausdrücken gearbeitet haben, fangen Sie einfach (in doppelter Bedeutung) an. Probieren Sie die Platzhalter aus. Danach probieren Sie Schritt für Schritt weiter, verwenden die Wiederholungsoperatoren bis hin zu den Symbolen für Anfang und Ende sowie dem Escapezeichen.

Sie werden sehen, dass Sie mit regulären Ausdrücken viel Zeit bei der Analyse Ihrer Site sparen können.

Christian Feichtner

Ich stehe dir mit Rat und Tat zur Seite, um SEO & die Web-Analyse zu entmystifizieren, sodass du SEO & die Web-Analyse selbst in die Hand nehmen kannst.

Zurück
Zurück

Google Search Console: Seitenaktionen vorübergehend deaktiviert

Weiter
Weiter

Seitengeschwindigkeit in Google Analytics analysieren