Después de mi último post para principiantes de GA, WendyW preguntó sobre la parte de regex de la guía de estudio GAIQ. Esto me impulsó a volver a mirarla, sólo para encontrar que la presentación de Google ciertamente podría utilizar algunos adornos.
Para aquellos que no están familiarizados con Regex, es un sistema para hacer coincidir cadenas de texto, números, símbolos, etc. Los comandos se escriben en el lenguaje de Regex, y luego se comparan a través de un procesador regex que identifica el texto que coincide con su especificación.
Regex es increíblemente útil cuando se trabaja con, bueno, casi cualquier cosa. Google permite (muy) limitado Regex en la búsqueda, más robusto regex en los análisis, muchas aplicaciones de bloc de notas han construido en los procesadores regex para sus sistemas de búsqueda / reemplazo, y htaccess hace un gran uso de ella.
Hoy voy a tomar todo a través de los fundamentos de Regex y mostrar cómo se puede utilizar con Google Analytics para mejorar sus informes, filtros, y más.
Contenido
- El Lenguaje de Regex
- Qué puedes hacer con Regex y Google Analytics
- Herramientas para probar tu Regex
Parte 1: El Lenguaje de Regex
Los comandos de Regex pueden ser desde sencillos hasta increíblemente completos dependiendo de cuánto «lenguaje» uses con ellos. La siguiente es una selección considerable (pero no completa) de términos regex:
. El punto es un comodín. Puede representar cualquier carácter.
+ : repite el carácter anterior 1 o más veces.
* : repite el carácter anterior 0 o más veces.
() : Los paréntesis representan un conjunto de «tokens» o elementos de regla. Por ejemplo, (.+) coincidiría con cualquier conjunto de caracteres. Esto le permite aplicar un operador a todo un grupo. Así que, por ejemplo, si quieres que coincida con la palabra «qué», escribirías «qué», pero si quieres que también coja «qué», entonces podrías usar «(qué)+».
Los paréntesis también crean una «referencia posterior», que se puede recuperar con un «quot; en muchos motores regex.
: Los corchetes representan un rango. Por ejemplo, coincidiría con cualquier letra minúscula entre la a y la t. También puede tener varios elementos dentro de un corchete, como el que coincidiría con cualquier letra, número, espacio, guión, signo de número, cita o signo de igualdad. (Sí, esto sería mejor escrito, pero yo estaba haciendo un punto acerca de los rangos)
{} : Los corchetes son extraños. Definen la repetición. Así que (what){2} sólo coincidiría con dos repeticiones de what (whatwhat). Alternativamente (what){2,7} contaría entre dos y siete repeticiones de what (incluyendo 3 repeticiones, 4 repeticiones, 5 ,6)
\d :Representa cualquier dígito
\s : Representa cualquier elemento de espacio en blanco (espacio, etiqueta, etc.)
\w : Representa cualquier carácter alfanumérico o guión bajo
$ : El signo del dólar coincide con el final de una cadena. En htaccess también se puede utilizar para recuperar conjuntos que han sido previamente definidos por paréntesis.
^ : La zanahoria tiene dos propósitos. Puede coincidir con el inicio de una cadena, pero también puede negar caracteres en conjuntos de caracteres. Así que ^$ sólo coincidirá con una cadena que comience y termine con un solo carácter alfabético en minúscula, (^) coincidirá con cualquier cadena que no contenga caracteres que no sean una letra minúscula. Así, aaa no coincidirá, aAa coincidirá, y AAA coincidirá.
– : un guión crea un rango. Por ejemplo, a-z coincidiría con cualquier carácter de la a a la z (aunque no con ningún carácter en mayúscula)
| : La barra significa «o». Así que a|b coincidirá con a o b.
\ : la barra significa «literalmente». Así, mientras que «.» coincidiría con cualquier carácter, «\» sólo coincidiría con puntos. Del mismo modo, mientras que «?» coincidiría con el final de una frase, «\?» coincidiría con un signo de interrogación. En ciertas implementaciones de regex (p. ej. Notepad ++) la barra oblicua también puede usarse con números para repetir áreas que han sido previamente definidas por paréntesis (igual que $1, $2, etc. en htaccess).
? Coincide con una cadena que contiene o no contiene esto. Así, por ejemplo, «? Howe st» coincidiría con «1080 Howe st.» o «Howe st.» pero no con «64 Howe st.», mientras que «64?» coincidiría con «6» o «64». El signo de interrogación también tiene el doble propósito de hacer que una expresión sea «perezosa» (normalmente la regex es codiciosa). La codicia y la pereza hacen que me duela la cabeza (tanto en la vida real como en el regex), así que dejaré esta a LunaMetrics (codicia buena y codicia mala)
¿Te acuerdas de todo eso? ¿No? No te preocupes.
Parte 2: Lo que puedes hacer con Regex y Google Analytics
Ahora que conoces la sintaxis, ¿qué puedes hacer con ella?
Búsqueda de imágenes
Ani López, en su blog, tiene un gran ejemplo de cómo puedes usar regex para crear un filtro/segmento personalizado que rastrea la búsqueda de imágenes. Para probar esto, abra GA, abra las fuentes de tráfico, luego vaya a la pestaña de origen y seleccione la ruta de referencia (en lugar de la fuente).
En la parte inferior de este informe, abra sus filtros e introduzca la siguiente cadena:
Recordando su lenguaje regex, ¿qué significa la cadena anterior? ^ = línea comienza con; | = o; () = un conjunto; así (Palabras en negrita que coinciden con los símbolos):
línea comienza con ‘/imgres’ o ‘/images/view’ o ‘/images/search’.
Palabras clave
Gracias a un post de Darcy, recibimos un montón de gente que busca cómo averiguar quién está mirando sus fotos/perfil de Facebook. Tal vez quiera filtrarlas, o mejor aún, quiero saber si convierten (o si sólo son tráfico basura) para poder clasificarlas con el siguiente filtro de palabras clave:
¿Cómo se lee esto?
Comparar cualquier línea que contenga «visto» o «mirando» o «mirado» o «copiado» o «viendo», luego tiene cualquier carácter alfanumérico, espacios en blanco, o guiones repetidos cualquier número de veces, seguido de «cara», un espacio en blanco opcional, y luego «libro».
Filtros IP
Digamos que su red tiene un rango de IP de 123.456.789.1 a 123.456.789.999, y no quiere que GA cuente las visitas e interacciones a su sitio desde su oficina. Podrías escribir un filtro bloqueando
o si quieres ser más exacto&hellip
En el primero estás indicando que cualquier rango de IP de 123.456.789. a 123.456.789..
Pero vamos a hacerlo más interesante. Digamos que usted tiene el rango de IP 64.281.31.1 a 64.281.31.999. ¿Cómo escribirías una regla para eso?
Si miraste mi ejemplo anterior y escribiste
o
entonces estás equivocado.
¿Por qué?
Porque eso también coincide con 164.281.31.. Sí, los números antes de la cadena cuentan. Así que tienes que escribirlo como:
Parte 3: Herramientas para probar tu Regex
El Regex puede ser complejo, y antes de empezar a aplicarlo querrás probarlo. Hay dos soluciones sencillas.
- La primera es RegexPal, que le permite introducir texto y probar las reglas regex en él.
- La segunda es RegExr, que proporciona una interfaz más compleja que Regexpal, pero también le ofrece una referencia y la opción de guardar los comandos regex. También tiene una versión descargable de Adobe AIR que se encuentra aquí.
Estoy seguro de que todos ustedes pueden hacer un uso imaginativo de Regex en GA, y espero que publiquen sus propias expresiones regex interesantes.