Dopo il mio ultimo post sui principianti di GA, WendyW ha chiesto informazioni sulla parte regex della guida di studio GAIQ. Questo mi ha spinto a tornare indietro e guardarla di nuovo, solo per scoprire che la presentazione di Google potrebbe certamente usare qualche abbellimento.
Per coloro che non hanno familiarità con Regex, è un sistema per abbinare stringhe di testo, numeri, simboli, ecc. I comandi sono scritti nel linguaggio di Regex, poi abbinati attraverso un processore regex che identifica il testo che corrisponde alle vostre specifiche.
Regex è incredibilmente utile quando si lavora con, beh, quasi tutto. Google permette un Regex (molto) limitato nella ricerca, un regex più robusto in analytics, molte applicazioni notepad hanno dei processori regex incorporati per i loro sistemi find/replace, e htaccess ne fa grande uso.
Oggi vi porterò attraverso le basi del Regex e vi mostrerò come potete usarlo con Google Analytics per migliorare i vostri report, filtri e altro.
Contenuti
- Il linguaggio di Regex
- Cosa puoi fare con Regex e Google Analytics
- Strumenti per testare il tuo Regex
Parte 1: Il linguaggio di Regex
I comandi Regex possono variare da semplici a incredibilmente completi a seconda di quanto “linguaggio” usi con loro. La seguente è una pesante (ma non completa) selezione di termini regex:
. Il punto è un jolly. Può rappresentare qualsiasi carattere.
+ : ripete il carattere precedente 1 o più volte.
* : ripete il carattere precedente 0 o più volte.
() : Le parentesi rappresentano un insieme di “token” o elementi della regola. Per esempio, (.+) corrisponde a qualsiasi insieme di caratteri. Questo vi permette di applicare un operatore a un intero gruppo. Così, per esempio, se si volesse far corrispondere la parola “cosa” si digita “cosa”, ma se si volesse catturare anche “cosa-cosa” allora si potrebbe usare “(cosa)+”.
Le parentesi creano anche un “riferimento posteriore”, che può essere richiamato con un “quot; in molti motori regex.
: Le parentesi quadre rappresentano un intervallo. Per esempio, corrisponderebbe a qualsiasi lettera minuscola tra la a e la t. Potete anche avere più elementi all’interno di una parentesi, come ad esempio che corrisponderebbe a qualsiasi singola lettera, numero, spazio, trattino, segno di numero, citazione o segno di uguale. (Sì, questo sarebbe meglio scritto , ma stavo facendo un punto sugli intervalli)
{} : Le parentesi graffe sono strane. Definiscono la ripetizione. Quindi (what){2} corrisponderebbe solo a due ripetizioni di what (whatwhat). In alternativa (cosa){2,7} conterebbe tra due e sette ripetizioni di cosa (incluse 3 ripetizioni, 4 ripetizioni, 5,6)
\d :Rappresenta qualsiasi cifra
\s : Rappresenta qualsiasi elemento di spazio bianco (spazio, tag, ecc.)
w : Rappresenta qualsiasi carattere alfanumerico o underscore
$ : Il segno del dollaro corrisponde alla fine di una stringa. In htaccess può anche essere usato per richiamare insiemi che sono stati precedentemente definiti da parentesi.
^ : La carota ha due scopi. Può corrispondere all’inizio di una stringa, ma può anche negare i caratteri negli insiemi di caratteri. Così ^$ corrisponderà solo a una stringa che inizia e finisce con un singolo carattere alfa minuscolo, (^) corrisponderà a qualsiasi stringa che non contiene caratteri diversi da una lettera minuscola. Così aaa non corrisponderà, aAa corrisponderà, e AAA corrisponderà.
– : un trattino crea un intervallo. Per esempio, a-z corrisponderà a qualsiasi carattere da a a z (anche se non a qualsiasi carattere maiuscolo)
| : La barra sta per “o”. Così a|b corrisponderà a a o b.
\ : la barra significa “letteralmente”. Così, mentre “.” corrisponderebbe a qualsiasi carattere “\.” corrisponderebbe solo ai punti. Allo stesso modo, mentre “?” corrisponderebbe alla fine di una frase, “\?” corrisponderebbe ad un punto interrogativo. In alcune implementazioni di regex (es. Notepad ++) lo slash può anche essere usato con i numeri per ripetere aree che sono state precedentemente definite da parentesi (come $1, $2, ecc. in htaccess).
? Corrisponde a una stringa che contiene o non contiene questo. Così per esempio “? Howe st” corrisponderebbe a “1080 Howe st.” o “Howe st.” ma non a “64 Howe st.” mentre “64?” corrisponderebbe a “6” o “64”. Il punto interrogativo ha anche il duplice scopo di rendere un’espressione “pigra” (normalmente la regex è avida). L’avidità e la pigrizia mi fanno male alla testa (sia nella vita reale che nella regex) quindi lascerò questo a LunaMetrics (buona avidità e cattiva avidità)
Tutto questo lo avete ricordato? No? Non preoccuparti.
Parte 2: Cosa puoi fare con Regex e Google Analytics
Ora che conosci la sintassi, cosa puoi farci?
Ricerca di immagini
Ani Lopez, sul suo blog, ha un grande esempio di come puoi usare regex per creare un filtro/segmento personalizzato che tiene traccia della ricerca di immagini. Per provarlo, aprite GA, aprite le fonti di traffico, poi andate nella scheda della fonte e selezionate il percorso di riferimento (invece della fonte).
In fondo a questo rapporto aprite i vostri filtri e inserite la seguente stringa:
Ricordando il vostro linguaggio regex, cosa significa la stringa sopra? ^ = la linea inizia con; | = o; () = un insieme; quindi (parole in grassetto che corrispondono ai simboli):
la linea inizia con ‘/imgres’ o ‘/images/view’ o ‘/images/search’.
Keywords
Grazie ad un post di Darcy, abbiamo un sacco di persone che cercano come scoprire chi sta guardando le loro foto/profilo Facebook. Forse voglio filtrarle, o meglio ancora voglio sapere se convertono (o se sono solo traffico spazzatura) così posso ordinarle con il seguente filtro per parole chiave:
Come si legge questo?
Cerca qualsiasi riga che contenga ‘viewed’ o ‘looking’ o ‘looked’ o ‘looks’ o ‘copied’ o ‘viewing’, poi ha qualsiasi carattere alfa-numerico, spazi bianchi, o trattini ripetuti un numero qualsiasi di volte, seguito da ‘face’, uno spazio bianco opzionale, poi ‘book’.
Filtri IP
Diciamo che la tua rete ha un range IP da 123.456.789.1 a 123.456.789.999, e non vuoi che GA conti le visite e le interazioni al tuo sito dall’interno del tuo ufficio. Potresti scrivere un filtro che blocca
o se vuoi essere più preciso&hellip
Nel primo stai affermando che qualsiasi intervallo IP da 123.456.789. a 123.456.789..
Ma rendiamolo più interessante. Diciamo che avete l’intervallo ip 64.281.31.1 a 64.281.31.999. Come scriveresti una regola per questo?
Se hai guardato il mio esempio sopra e hai scritto
o
allora ti sbagli.
Perché?
Perché questo corrisponde anche a 164.281.31.. Sì, i numeri prima della tua stringa contano! Quindi devi scriverlo come:
Parte 3: Strumenti per testare il tuo Regex
Il Regex può essere complesso, e prima di iniziare ad applicarlo vorrai testarlo. Ci sono due facili soluzioni.
- La prima è RegexPal, che ti permette di inserire del testo e testare le regole regex su di esso.
- La seconda è RegExr che fornisce un’interfaccia più complessa di Regexpal, ma ti dà anche un riferimento e la possibilità di salvare i comandi regex. Ha anche una versione scaricabile da Adobe AIR che si trova qui.
Sono sicuro che tutti voi potete fare un uso fantasioso di Regex in GA, e spero che posterete le vostre interessanti espressioni regex.