Po moim ostatnim poście dla początkujących GA, WendyW zapytała o część dotyczącą regexu w przewodniku GAIQ. To skłoniło mnie do powrotu i spojrzenia na to ponownie, tylko po to, aby odkryć, że prezentacja Google z pewnością może użyć trochę upiększeń.
Dla tych, którzy nie są zaznajomieni z Regex, jest to system dopasowywania ciągów tekstu, liczb, symboli itp. Polecenia są pisane w języku Regex, a następnie dopasowywane przez procesor regex, który identyfikuje tekst pasujący do specyfikacji.
Regex jest niewiarygodnie użyteczny podczas pracy z, cóż, prawie wszystkim. Google pozwala na (bardzo) ograniczony Regex w wyszukiwaniu, bardziej solidny Regex w analityce, wiele aplikacji notatnika ma wbudowane procesory Regex dla swoich systemów find/replace, a htaccess robi z niego świetny użytek.
Dzisiaj zamierzam zabrać was wszystkich przez podstawy Regex i pokazać, jak można go używać z Google Analytics, aby ulepszyć swoje raporty, filtry i inne.
Spis treści
- Język Regexu
- Co możesz zrobić z Regexem i Google Analytics
- Narzędzia do testowania Regexu
Część 1: Język Regexu
Komendy Regexu mogą być bardzo proste i niewiarygodnie funkcjonalne, w zależności od tego, jak dużo „języka” z nimi używasz. Poniżej znajduje się spory (ale nie kompletny) wybór terminów regex:
. : Kropka jest dziką kartą. Może reprezentować jakikolwiek znak.
+ : powtarza poprzedni znak 1 lub więcej razy.
* : powtarza poprzedni znak 0 lub więcej razy.
() : Nawiasy reprezentują zestaw „tokenów” lub elementów reguły. Na przykład, (.+) dopasuje dowolny zestaw znaków. Pozwala to na zastosowanie operatora do całej grupy. Tak więc na przykład, jeśli chcesz dopasować słowo „co”, wpiszesz „co”, ale jeśli chcesz, aby to również złapało „co-co”, możesz użyć „(co)+”.
Nawiasy tworzą również „odniesienie wstecz”, które może być przywołane za pomocą „quot; w wielu silnikach regex.
: Nawiasy kwadratowe reprezentują zakres. Na przykład pasują do każdej małej litery pomiędzy a i t. Można również mieć wiele elementów w nawiasie, takich jak, które pasują do każdej pojedynczej litery, liczby, spacji, myślnika, znaku liczby, cytatu lub znaku równości. (Tak, to byłoby lepiej napisane , ale chodziło mi o zakresy)
{} : Nawiasy klamrowe są dziwne. Definiują one powtórzenie. Więc (what){2} pasowałoby tylko do dwóch powtórzeń what (whatwhat). Alternatywnie (what){2,7} policzyłoby od dwóch do siedmiu powtórzeń what (w tym 3 powtórzenia, 4 powtórzenia, 5 ,6)
{} :Reprezentuje dowolną cyfrę
{}: Reprezentuje dowolny element białej przestrzeni (spacja, znacznik itp.)
w : Reprezentuje dowolny znak alfanumeryczny lub podkreślenie
$ : Znak dolara oznacza koniec łańcucha. W htaccess może być także użyty do przywołania zbiorów, które zostały wcześniej zdefiniowane przez nawiasy.
^ : Marchewka ma dwa zastosowania. Może dopasować początek łańcucha, ale także może negować znaki w zestawach znaków. Tak więc ^$ będzie pasować tylko do łańcucha, który zaczyna się i kończy pojedynczym małym znakiem alfa, (^) będzie pasować do każdego łańcucha, który nie zawiera znaków innych niż małe litery. Tak więc aaa nie będzie pasować, aAa będzie pasować i AAA będzie pasować.
– : myślnik tworzy zakres. Na przykład, a-z będzie pasować do każdego znaku od a do z (ale nie do żadnych wielkich liter)
| : kreska oznacza „lub”. Więc a|b będzie pasować do a lub b.
| : Ukośnik oznacza „dosłownie”. Więc podczas gdy „.” pasowałoby do każdego znaku „\” pasowałoby tylko do okresów. Podobnie, podczas gdy „?” pasowałoby do końca zdania, „\” pasowałoby do znaku zapytania. W niektórych implementacjach regex (np. Notepad ++) ukośnik może być również użyty z liczbami do powtórzenia obszarów, które zostały wcześniej zdefiniowane przez nawiasy (tak samo jak $1, $2, itd. w htaccess).
? Dopasowuje ciąg znaków, który zawiera lub nie zawiera tego. Tak więc na przykład „? Howe st” pasowałoby do „1080 Howe st.” lub „Howe st.”, ale nie do „64 Howe st.”, podczas gdy „64?” pasowałoby do „6” lub „64”. Znak zapytania ma również podwójny cel uczynienia wyrażenia „leniwym” (normalnie regex jest chciwy). Chciwość i lenistwo sprawiają, że boli mnie głowa (zarówno w prawdziwym życiu, jak i w regex), więc po prostu zostawię to LunaMetrics (dobra chciwość i zła chciwość)
Zapamiętałeś to wszystko? Nie? Nie martw się.
Część 2: Co możesz zrobić z Regex i Google Analytics
Więc teraz znasz składnię, co możesz z nią zrobić?
Wyszukiwanie obrazów
Ani Lopez, na swoim blogu, ma świetny przykład jak możesz użyć regex do stworzenia filtra/niestandardowego segmentu, który śledzi wyszukiwanie obrazów. Aby to przetestować otwórz GA, otwórz źródła ruchu, następnie przejdź do zakładki źródło i wybierz ścieżkę odesłania (zamiast źródła).
Na dole tego raportu otwórz swoje filtry i wprowadź następujący ciąg:
Pamiętając swój język regex, co oznacza powyższy ciąg? ^ = linia zaczyna się od; | = lub; () = zestaw; tak więc (Pogrubione słowa pasujące do symboli):
linia zaczyna się od '/imgres’ lub '/images/view’ lub '/images/search’.
Słowa kluczowe
Dzięki postowi Darcy’ego, dostajemy dużo ludzi szukających jak dowiedzieć się kto ogląda ich zdjęcia/profile na Facebooku. Może chcę je odfiltrować, a jeszcze lepiej chcę wiedzieć, czy konwertują (lub czy są po prostu śmieciowym ruchem), więc mogę je posortować za pomocą następującego filtra słów kluczowych:
Jak to odczytać?
Zapamiętaj każdą linię, która zawiera 'viewed’ lub 'looking’ lub 'looked’ lub 'looks’ lub 'copied’ lub 'viewing’, następnie ma jakiekolwiek znaki alfanumeryczne, spacje lub myślniki powtórzone dowolną liczbę razy, po których następuje 'face’, opcjonalna spacja, a następnie 'book’.
Filtry IP
Powiedzmy, że twoja sieć ma zakres IP od 123.456.789.1 do 123.456.789.999, i nie chcesz, żeby GA liczyła wizyty i interakcje na twojej stronie z twojego biura. Mógłbyś napisać filtr blokujący
lub jeśli chciałbyś być bardziej dokładny&hellip
W pierwszym przypadku stwierdzasz, że każdy zakres IP od 123.456.789. do 123.456.789…
Ale zróbmy to bardziej interesujące. Załóżmy, że masz zakres IP od 64.281.31.1 do 64.281.31.999. Jak napisałbyś dla tego regułę?
Jeśli spojrzałeś na mój przykład powyżej i napisałeś
lub
to jesteś w błędzie.
Dlaczego?
Ponieważ to również pasuje do 164.281.31. Tak, liczby przed twoim ciągiem będą się liczyć! Więc musisz napisać to jako:
Część 3: Narzędzia do testowania Regex
Regex może być skomplikowany, i zanim zaczniesz go stosować, będziesz chciał go przetestować. Istnieją dwa proste rozwiązania.
- Pierwszym z nich jest RegexPal, który pozwala na wprowadzanie tekstu i testowanie na nim reguł regex.
- Drugim jest RegExr, który zapewnia bardziej złożony interfejs niż Regexpal, ale daje także referencje i możliwość zapisywania poleceń regex. Posiada również wersję Adobe AIR do pobrania, która znajduje się tutaj.
Jestem pewien, że wszyscy możecie pomysłowo wykorzystać Regexpal w GA i mam nadzieję, że zamieścicie swoje własne interesujące wyrażenia regex.