Hur man skriver och testar Regex-filter för Google Analytics (med exempel)

Regular Expressions Regex Google Analytics-filter

Som med många av mina artiklar här, undersöker jag en klient och skriver sedan om det här. För att vara ärlig finns det ett par anledningar till att ... först är att jag har ett fruktansvärt minne och ofta undersöker min egen webbplats för information. För det andra är det att hjälpa andra som också letar efter information.

Vad är ett reguljärt uttryck (Regex)?

Regex är en utvecklingsmetod för att söka och identifiera ett teckenmönster i texten för att antingen matcha eller ersätta texten. Alla moderna programmeringsspråk stöder Regular Expressions.

Jag älskar vanliga uttryck (regex) men de kan vara lite frustrerande eller upprörande att lära sig och testa. Google analytics har några fantastiska funktioner ... där du kan skapa vyer med reguljära uttryck eller filtrera dina data inom reguljära uttryck.

Om jag till exempel bara vill se trafiken på mina taggsidor kan jag filtrera efter / tagga / i min permalänkstruktur genom att använda:

/tag\/

Syntaxen är kritisk där. Om jag bara använde "tagg" skulle jag få alla sidor med termen tagg i. Om jag använde “/ tagg” inkluderades all webbadress som börjar med tagg, t.ex. / tagghantering eftersom Google Analytics som standard tar med alla tecken efter det reguljära uttrycket. Så jag måste se till att jag har följande snedstreck inkluderat ... men det måste ha en flyktkaraktär på den.

sidfilter regex

Regex Syntax Basics

syntax Beskrivning
^ Börjar med
$ Slutar med
. Ett jokertecken för alla karaktärer
* Noll eller mer av föregående objekt
.* Matchar alla tecken i
? Noll eller en gång för föregående objekt
+ En eller flera gånger av föregående objekt
| OR-operatören
[abc] A eller b eller c (kan bestå av valfritt antal tecken)
[Az] Område a till z (kan bestå av vilket antal tecken som helst)
[AZ] Område från A till Ö (versaler)
[0-9] Område från 0 till 9 (kan vara vilket nummer som helst)
[a-zA-Z] Område a till Z eller A till Z
[a-zA-Z0-9] Alla alfanumeriska tecken
1 {} Exakt 1 instans (kan vara vilket nummer som helst)
{1-4} Område från 1 till 4 instanser (kan vara valfritt antal)
{1,} 1 eller flera instanser (kan vara valfritt nummer)
() Gruppera dina regler
\ Fly specialtecken
\d Siffra karaktär
\D Icke-siffrig karaktär
\s Vitt utrymme
\S Icke-vitt utrymme
\w ord
\W Icke-ord (skiljetecken)

Regex-exempel för Google Analytics

Så låt oss lägga några exempel där ute för några Anpassade filter. En av mina kollegor bad mig om hjälp för att identifiera en intern sida med sökvägen till /index förutom alla blogginlägg som skrevs med året i permalänken:

Mitt anpassade filtermönster för filterfältet Begär webbadress:

^/(index|[0-9]{4}\/)

Det säger i princip att leta efter / indexera ELLER någon fyrsiffrig numerisk sökväg som slutar med en efterföljande snedstreck. Jag skapade en vy i Analytics och lade till detta som filter:

Google Analytics visningsfilter

Här är några fler exempel:

  • Du har en blogg med året i URL-permalänksökvägen och du vill filtrera listan till vilket år som helst. Så jag vill ha fyra numeriska siffror följt av en efterföljande snedstreck. Begär URl-filtermönster:

^/[0-9]{4}\/

  • Du vill jämföra alla dina sidor där titeln har certifikat or certifiering i det. Sidmönster Filtermönster:

(.*)certificat(.*)

  • Du vill jämföra två målsidor baserat på deras kampanjmedium passerat i URL för Google Analytics-kampanj som utm_medium = direkt post or betald sökning.

(direct\smail|paid\ssearch)

  • Du vill jämföra alla produkter som är herrtröjor baserat på URL-sökvägen. Begär URl-filtermönster:

^/mens/shirt/(.*)

  • Du vill jämföra alla sidorna som är numrerade URL-sökvägen som slutar med numret. Begär URl-filtermönster:

^/page/[1-9]*/$

  • Du vill utesluta ett antal IP-adresser. Uteslut IP-adressfiltermönster:

123\.456\.789\.[0-9]

  • Du vill inkludera en thankyou.html-sida där ett inlämnande lyckades baserat på frågesträngen success = true. Begär URl-filtermönster:

thankyou\.html\?success=true

Hur du testar dina Regex-uttryck

I stället för försök och fel inom Google Analytics hoppar jag ofta bara över till regex101, ett fantastiskt verktyg för att testa dina reguljära uttryck. Det bryter till och med ner din syntax åt dig och ger information om ditt vanliga uttryck:

reguljära uttryck regex101

Skapa, testa och felsöka Regex

Vad tror du?

Den här sidan använder Akismet för att minska spam. Läs om hur din kommentardata behandlas.