După ultima mea postare pentru începători GA, WendyW m-a întrebat despre partea de regex din ghidul de studiu GAIQ. Acest lucru m-a determinat să mă întorc și să mă uit din nou la el, doar pentru a descoperi că prezentarea Google ar putea folosi cu siguranță unele înfrumusețări.
Pentru cei care nu sunt familiarizați cu Regex, este un sistem de potrivire a șirurilor de text, numere, simboluri, etc. Comenzile sunt scrise în limbajul Regex, apoi se potrivesc printr-un procesor Regex care identifică textul care se potrivește cu specificațiile dumneavoastră.
Regex este incredibil de util atunci când se lucrează cu, ei bine, aproape orice. Google permite un Regex (foarte) limitat în căutare, un regex mai robust în analiză, multe aplicații de notepad au încorporate procesoare regex pentru sistemele lor de căutare/înlocuire, iar htaccess îl folosește foarte bine.
Astăzi vă voi prezenta toate elementele de bază ale Regex și vă voi arăta cum îl puteți folosi cu Google Analytics pentru a vă îmbunătăți rapoartele, filtrele și multe altele.
Contenit
- Limbajul Regex-ului
- Ce puteți face cu Regex și Google Analytics
- Instrumente pentru testarea Regex-ului
Partea 1: Limbajul Regex-ului
Comandațiile Regex pot varia de la simple și incredibil de complete, în funcție de cât de mult „limbaj” folosiți cu ele. Următoarea este o selecție consistentă (dar nu completă) de termeni regex:
. : Punctul este un wild card. Poate reprezenta orice fel de caracter.
+ : repetă caracterul anterior de 1 sau mai multe ori.
* : repetă caracterul anterior de 0 sau mai multe ori.
() : Parantezele reprezintă un set de „jetoane” sau elemente de regulă. De exemplu, (.+) ar corespunde oricărui set de caractere. Acest lucru vă permite să aplicați un operator unui întreg grup. Astfel, de exemplu, dacă doriți să vă potriviți cu cuvântul „ce”, veți tasta „ce”, dar dacă vreți să prindeți și „ce-ce”, atunci puteți folosi „(ce)+”.
Parentheses creează, de asemenea, o „referință anterioară”, care poate fi reamintită cu un „quot; în multe motoare regex.
: Parantezele pătrate reprezintă un interval. De exemplu, s-ar potrivi cu orice literă minusculă cuprinsă între a și t. De asemenea, puteți avea mai multe elemente în interiorul unei paranteze, cum ar fi care s-ar potrivi cu orice literă, număr, spațiu, cratimă, semn de număr, ghilimele sau semn egal. (Da, acest lucru ar fi mai bine scris , dar făceam o precizare despre intervale)
{} : Parantezele curbe sunt ciudate. Ele definesc repetiția. Deci (what){2} ar corespunde doar la două repetiții ale lui what (whatwhat). Alternativ (what){2,7} ar număra între două și șapte repetiții ale lui what (inclusiv 3 repetiții, 4 repetiții, 5 ,6)
\d :Reprezintă orice cifră
\s : Reprezintă orice element de spațiu alb (spațiu, tag, etc.)
\w : Reprezintă orice caracter alfanumeric sau underscore
$ : Semnul dolarului corespunde sfârșitului unui șir de caractere. În htaccess poate fi folosit, de asemenea, pentru a reaminti seturi care au fost definite anterior prin paranteze.
^ : Morcovul are două scopuri. Se poate potrivi cu începutul unui șir de caractere, dar, de asemenea, poate nega caracterele din seturile de caractere. Astfel, ^$ se va potrivi numai cu un șir care începe și se termină cu un singur caracter alfa minuscul, (^) se va potrivi cu orice șir care nu conține alte caractere decât o literă minusculă. Așadar, aaa nu se va potrivi, aAa se va potrivi, iar AAA se va potrivi.
– : o cratimă creează un interval. De exemplu, a-z se va potrivi cu orice caracter de la a la z (deși nu și cu caracterele majuscule)
| : Bara reprezintă „sau”. Deci a|b se va potrivi cu a sau b.
\ : bara înseamnă „literalmente”. Deci, în timp ce „..” se potrivește cu orice caracter, „\” se potrivește doar cu punctele. În mod similar, în timp ce „?” s-ar potrivi cu sfârșitul unei propoziții, „\?” s-ar potrivi cu un semn de întrebare. În anumite implementări ale regex-ului (de exemplu, Notepad ++), bara oblică poate fi, de asemenea, utilizată cu numere pentru a repeta zone care au fost definite anterior prin paranteze (la fel ca $1, $2, etc. în htaccess).
?: Potrivește un șir de caractere care conține sau nu acest lucru. Astfel, de exemplu, „? Howe st” s-ar potrivi cu „1080 Howe st.” sau „Howe st.”, dar nu cu „64 Howe st.”, în timp ce „64?” s-ar potrivi cu „6” sau „64”. Semnul de întrebare are, de asemenea, scopul dublu de a face o expresie „leneșă” (în mod normal, regex-ul este lacom). Lăcomia și lenea mă fac să mă doară capul (atât în viața reală, cât și în regex), așa că o voi lăsa pe asta pe seama lui LunaMetrics (lăcomia bună și lăcomia rea)
Ai reținut toate astea? Nu? Nu vă faceți griji.
Partea 2: Ce puteți face cu Regex și Google Analytics
Acum cunoașteți sintaxa, ce puteți face cu ea?
Cercetare de imagini
Ani Lopez, pe blogul său, are un exemplu grozav despre cum puteți folosi regex pentru a crea un filtru/segment personalizat care urmărește căutarea de imagini. Pentru a testa acest lucru, deschideți GA, deschideți sursele de trafic, apoi mergeți la fila sursă și selectați calea de trimitere (în loc de sursă).
În partea de jos a acestui raport, deschideți filtrele și introduceți următorul șir de caractere:
Amințindu-vă limbajul regex, ce înseamnă șirul de mai sus? ^ = linia începe cu; | = sau; () = un set; deci (Cuvintele boldate se potrivesc cu simbolurile):
linia începe cu ‘/imgres’ sau ‘/images/view’ sau ‘/images/search’.
Keywords
Datorită unei postări a lui Darcy, primim o mulțime de oameni care caută cum să afle cine se uită la pozele/profilul lor de pe Facebook. Poate că vreau să le filtrez, sau chiar mai bine vreau să știu dacă se convertesc (sau dacă sunt doar trafic de gunoi), astfel încât să le pot sorta cu următorul filtru de cuvinte cheie:
Cum citim asta?
Potrivește orice linie care conține „viewed” sau „looking” sau „looked” sau „looks” sau „looks” sau „copied” sau „viewing”, apoi are orice caractere alfanumerice, spații de albire sau liniuțe repetate de orice număr de ori, urmate de „face”, un spațiu de albire opțional, apoi „book”.
Filtre IP
Să spunem că rețeaua dvs. are un interval IP de la 123.456.789.1 la 123.456.789.999 și nu doriți ca GA it să numere vizitele și interacțiunile către site-ul dvs. din interiorul biroului dvs. Ați putea scrie un filtru care să blocheze
sau dacă vreți să fiți mai exact&hellip
În primul caz precizați că orice interval de IP de la 123.456.789. la 123.456.789..
Dar haideți să facem lucrurile mai interesante. Să spunem că aveți intervalul de IP-uri de la 64.281.31.1 la 64.281.31.999. Cum ați scrie o regulă pentru asta?
Dacă v-ați uitat la exemplul meu de mai sus și ați scris
sau
atunci vă înșelați.
De ce?
Pentru că se potrivește și cu 164.281.31.. Da, numerele dinaintea șirului dvs. vor conta! Așa că trebuie să o scrieți ca:
Partea 3: Instrumente pentru testarea Regex-ului dumneavoastră
Regex-ul poate fi complex și, înainte de a începe să-l aplicați, veți dori să-l testați. Există două soluții ușoare.
- Primul este RegexPal, care vă permite să introduceți text și să testați regulile regex pe acesta.
- Al doilea este RegExr, care oferă o interfață mai complexă decât Regexpal, dar vă oferă, de asemenea, o referință și opțiunea de a salva comenzile regex. Are, de asemenea, o versiune descărcabilă Adobe AIR, localizată aici.
Sunt sigur că puteți folosi cu toții Regex cu imaginație în GA și sper că veți posta propriile expresii regex interesante.