La nueva medición de sesiones de Google Analytics, a fondo

Como sabéis, Google anunció el viernes un cambio en el sistema de medición de las sesiones, que Oriol Farré nos explicó a las pocas horas en su blog. Desde entonces todo han sido dolores de cabeza. No nos cuadra nada, y nos cuesta mucho entender (y explicar a nuestros jefes) lo que los datos nos dicen.

El caso es que desde el viernes, GA está funcionando de manera bastante buggy: Informes que muestras datos y graficas diferentes, segmentos mágicos que arruinan los informes, discrepancias entre la version 4 y 5 en algunos reports (bueno, esto ya pasaba pero ahora más)… en fin, que “la han liado Panda” como ha asegurado Sergio Simarro en algún foro.

Vamos a ver qué ha pasado y cómo nos afecta, pero antes de empezar, déjame avisar que este Post es bastante técnico y requiere conocer como funciona Google Analytics a nivel de implementación.

Definición de Visita/Sesión

Pues bien, para entender el cambio, debemos empezar por lo más básico. El concepto de Visita y el Concepto de sesión.

Visita y Sesión son la misma cosa en Google Analytics. Si alguna vez no lo fueron, ahora lo son.

De ésta manera se alinéan a la definicion de la WAA  en su manual de métricas en el que dice que visitas y sesiones son la misma cosa: Una interacción de un usuario con un site que termina a los 3o minutos de inactividad.

Con el cambio del viernes 12 de Agosto de 2011, podemos re-definir visita/sesión en GA como:

Un conjunto de 1 o más interacciones de un usuario en un sitio web que se termina a la media hora de inactividad o cuando el usuario vuelve al sitio web desde otra fuente de tráfico (con atribución de campaña*) distinta a la inicial .

* Fuente de tráfico con atribución: Cualquier fuente de trafico exceptuando directo y referal sin utm’s. Luego hablaremos de esto.

Atención. En esta definición hay dos cambios importantísimos respecto a cómo se medían las visitas/sesiones anteriormente en GA:

  1. La visita se termina cuando se cambia la fuente de trafico (excepto directo y referal limpio)
  2. La visita NO se termina al cerrar el navegador.

Cambio 1: Nueva fuente,  nueva visita

Éste es el cambio más novedoso. Hasta ahora la segunda y sucesivas visitas al mismo site ántes de media hora y sin cerrar el navegador, contaban como la misma visita inicial. Un ejemplo de como funcionaba (hasta ahora):

  1. Pestaña 1: Llegas a Top-Rankin.com desde Google / Orgánico con palabra clave “como funciona google”. Ves 3 páginas.
  2. Pestaña 2: El Reader. Ves un post de Top-Rankin.com y haces click en el título. Ves 2 páginas.
  3. Vuelves a la pestaña 1 y realizas una compra.

El resultado de esto en Google Analytics era:

  • 1 visita/sesión
  • 1 conversión atribuída a Feedburner / feed

¿Y la visita de SEO? ¿Desaparecía? No, está, ya que se realizaron 3 GA Push con esta info, pero no generan una visita. Para obtener información sobre esta KW debemos usar informes cuya métrica sean páginas vistas y no visitas.

Lo puedes comprobar tú mism@ con un sencillo ejemplo. Carga este informe personalizado en Google Analytics. Ordena los datos por visitas ASC, y selecciona una fecha anterior al viernes 12. Verás varias KW que generan 0 visitas. En cambio esto ya no ocurre si aplicas el informe a una fecha posterior la cambio.

Lo dicho, que esto era antes. Ahora TODA visita con una fuente distinta a la actual que sobreescriba la info de la cookie _utmz quedará grabada como una visita.

Hasta ahora la cookie _utmz se usaba principalmente para la atribución de fuente de tráfico. Ahora será también la encargada (junto a la _utma) de controlar las visitas, ya que cada vez que se sobreescribe ahora, además de incrementar el “Campaign Count” incrementará el contador de visitas (Lo que antes hacía sólo la cookie _utma cuando creaba una cookie _utmb o _utmc). Si en vez de cambiar de fuente de tráfico terminamos la visita por inactividad, se actualiza el valor

Es decir… que tenemos más visitas. Si somos un site de e-commerce, muchas más.

Cambio 2: Cerrar el navegador ya no termina la visita

El segundo cambio importante está en la definición que hace Google en su post de Visita/Sesion.  No habla en absoluto de que se termine al cerrar el navegador. Antes una sesión se terminaba cuando el usuario cerraba el navegador y se destruía la Cookie de sesión _utmc, cuya misión era esa, desaparecer al cerrar el navegador y servir para incrementar el contador de visitas. Esta Cookie, por lo tanto, queda depreciada desde este momento, aunque se sigue escribiendo. Es decir, que ya podemos cerrar el navegador todo lo que queramos, que hasta que no se destruya la _utmb o se sobreescriba la _utmz se tomará todo lo que pase en todas las pestañas como la misma visita.

A todo esto, no se tiene en cuenta la pestaña o ventana del navegador que uséis. Solo hay una cookie por site/navegador, por lo que un cambio desde cualquier pestaña afectará a los siguientes GA Push del resto de las pestañas. Siempre manda la última que sobreescriba la información, de modo que si entro desde una nueva fuente en la pestaña 3, lo que navege a partir de ese momento en las pestañas 1 y 2 será parte de la misma visita/sesion. Esto no ha cambiado.

Para cerrar este apartado, recordar que tenemos dos cambios en la medicion de visitas/sesiones:

  • Nueva fuente: Nueva cookie _utmz y esta es a que manda ahora para contar sesiones.
  • Cerrar la ventana: Ya no termina la sesión, ya que no sobreescribe la cookie _utmz ni la _utma.

¿Facil? ¿Si? Bueno, pues… vamos a ver eso de “cualquier fuente de tráfico con atribución”. Para ello hablaremos del temido… Modelo de atribución de Google Analytics.

EL Modelo de atribución de Google Analytics

Todo esto de que nueva fuente = nueva visita tiene un pero. Ya lo sabéis… el tráfico directo y el tráfico de medio referal que no tengan un etiqutado de UTM’s  NO sobreescribe la _utmz (en este post de Enrique Del Valle lo explica perfectamente). Por lo que no hay incremento en el “campaign count”, por lo que no hay nueva visita. Me estas diciendo Xavier, que… Un usuario llega a mi web desde Google Orgánico, después vuelve desde Facebook, compra, me pone en favoritos, vuelve, compra otra vez, después de media hora… ¿y al final tengo 2 visitas con conversiones atribuidas a SEO? Pues si. Así son las mejoras de Google Analytics. Pero esto ya pasaba, no seamos demagogos.

Un ejemplo vale más que mil palabras

Vamos con la parte práctica. Vamos a borrar todas las cookies del navegador y entrar a Top Rankin desde Google.

Para el experimento usamos este blog con un navegador Chrome con Google Analytics Code Debugger o vuestro sistema preferido de debuggeo.

Como se puede apreciar, es la primera visita y a escrito una cookie _utma nueva y una _utmz que no se ve en la captura pero está ahí. Recuerda que anteriormente se pasa el número de la visita a GA en el último parámetro de la cookie _utma

(imágenes via Analytics Ninja)

Volvamos al ejemplo. Ahora vamos a abrir otra pestaña y entrar desde el Reader:

Como se puede apreciar, se ha incrementado el contador de Campaign Count, pero NO el de sesiones, ni la cookie _utma que antes contaba las visitas. ¿No nos habías dicho que ahora esto cerraba la visita anterior? Pues sí, pero la lógica imagino que debe ser:

  • Cada vez que el Campaign Count se incrementa: Nueva visita
  • Cada vez que el Session Count se incrementa (sesion caducada a los 30 min): Nueva visita

Es decir: el cálculo de visitas ya no se lee del contador de la cookie _utma… parece (insisto, es especular) que lo computa internamente el servidor de Google Analytics, así que cuidado a la hora de debuggear.

Si ahora entramos en una tercera pestaña y vamos a Top Rankin desde Bing, es previsible el resultado:

Poco que comentar. Es la tercera visita, pero no porque lo diga el “session count” si no porque lo dice la cookie _utmz. Ahora ponemos a prueba el modelo de atribuciones: Abrimos la cuarta pestaña y entramos desde Directo y desde Facebook (un link sin tagear). El resultado:

Nótese la cuarta pestaña arriba del todo. En este caso NO se incrementa el Campaign Count, por lo que NO hay nueva visita ni rastro del origen (facebook, directo, referal….). Por eso más que nunca es VITAL etiquetar las URL’s de nuestras campañas: redes sociales, bloggers, afiliados, etc… Para terminar, dejamos que caduque la sesión. Cerrando el navegador o sin cerrarlo (he probado ambos casos) al volver al site desde directo después de media hora podemos preveer que NO se actualizará la _utmz:

Atención aquí… Como era de esperar, la cookie _utmz no se ha sobreescrito por lo que no hay incremento de Campaign Count. Lo que si hay es el incremento de sesión debido a la desaparición y creación de la cookie _utmb y así se refleja  en la _utma.

Tras unas horas, el resultado en Google Analytics es el siguiente: Es decir, que aunque el contador de sesión sea 2, las visitas que contabiliza son 4.

  • 3 visitas de incremento de Campaign Count (con origen en google, feedburner y bing)
  • 1 visita de incremento de Session Count (con origen directo atribuido a bing)

Es decir, que tenemos 2 visitas de Bing, 1 de Feedburner y 1 de Google:

La visita de Feedburner no la he podido filtrar porque entré e mismo día haciendo pruebas y aparece duplicada ;) Pero, a diferencia de antes, ahora tenemos la visita con la KW de Google, que es la visita nueva (era la primera).

That’s it!

¿Se ha entendido? Es complicadillo, ya lo sé… pero es MUY importante entender cómo se recogen los datos para poder realizar el mejor análisis posible. Y como veis, al final la realidad y lo que nos muestra Google Analytics se parece como un nuevo a una castaña.

¿Porqué ahora, porqué el cambio?

Los conspiranoicos dirán que este cambio se produce , casualmente, pocas horas antes de que se anunciaría el lanzamiento internacional de Panda… Algunos pueden pensar: ¿Lo comido por lo servido? Bueno, algo de eso habrá, pero no es sólo eso, por lo que se realiza el cambio. El motivo real es que es un cambio necesario para poder implementar correctamente los Funnels Multi Channel, sobre los que Google Analyitics está depositando gran parte de sus esfuezos y esperanzas. Sin este cambio los embudos multicanal sólo nos daban información de las fuentes de tráfico que habían generado visitas en el plazo de media hora, o tras cerrar el navegador.

¿Cómo afectará a mis informes?

  1. Lo bueno es que hay algunos informes que hasta hoy eran casi completamente inútiles, como el de Frecuencia y Fidelización y que según el sector está teniendo cambios espectáculares. En frecuencia el segmento “1 visita” estaba sobredimensionado y ahora es más exacto.
  2. Lo malo es que aumenta MUCHO las visitas, sobre todo en sites de e-commerce. Por eso todos KPI’s computados con visitas (rebote, tiempo por visita, paginas vistas por visita, y tasa de conversión) se ven alterados y caen. Este post sirve, entre otras cosas, para explicar al jefe que cae la tasa de conversión por culpa de un cambio de GA. :P
  3. Lentitud. Entre cambios y nuevos sistemas, en los sites con más volumen los datos de GA están tardando muchísimo en salir (más de 24h). Durante el día tienes datos del día anterior pero no están completos.
  4. La versión 5 es más fiable. Me sabe mal decirlo, pero parece que con este cambio también quieren “forzar” a que la gente empiece a usar la nueva versión de GA.

¿Y tú que piensas?

A mi personalmente me parece que todo es una gran chapuza. Un cambio sin avisar, y sin probar, precisamente el día que sale Panda de manera internacional. Sin apenas documentación… Por no decir que el cambio es un parche temporal ya que alguien se ha agobiado con los Funnels Multichannel que no salen. Debemos atacar el problema de raiz… la medición de visitas y sesiones, que NO pueden seguir siendo lo mismo. La analítica web aún no se ha enterado de que la gente navega por pestañas. Cada pestaña, cada ventana, debería ser tratada como una instancia (como una visita) dentro de una sesión, con su fuente de tráfico, su navegación, conversión etc… Pero con GA actualmente esto no es posible, desconozco si alguna herramienta ya lo ofrece. Con razón nos encontramos cosas tan raras en los funnels…

No os ha pasado de ver en un paso de checkout entradas surealistas? No es que entren desde ahí, es que es la pagina que han visto antes en otra pestaña, pero que se interpreta como la misma visita.

Por otro lado, no se pueden hacer las cosas a medias. Si cambias el sistema, hazlo bien y cambia el sistema de atribución para que el tráfico directo sea considerado como fuente de tráfico que sobreescribe la cookie _utmz. Esto acabará con un cambio de GATC, y si no, al tiempo.

Recomendaciones

Antes de terminar, vamos a repasar algunas recomendaciones que hay que tener en cuenta.

  • Hay vida más allá de Google Analytics. Tener otra fuente de datos en semanas como esta es una verdadera maravilla, porque tienes una fuente que no ha cambiado sobre la que medir la subida de trafico, rebote, paginas vistas, etc…  Las tienes de todo tipo, muchas gratuitas, y puedes consultar algunas de ellas en este post sobre herramientas de Analitica Web.
  • Si tienes otra fuente de datos, mide la diferencia de trafico respecto a GA para cuantificar cuanto te ha subido el trafico con este cambio. Si no la tienes usa como referencia los datos de Usuarios Unicos (Visitors) de GA, que al estar medido por la cookie _utma no ha cambiado.
  • Pon una señora nota en todos los perfiles de GA y revisa los paneles de control, principales segmentos e informes personalizados de tu site. Si tienes problemas consulta la v5.
  • Ya lo hemos dicho, pero ahora más que nunca, etiqueta los enlaces de tus campañas: Facebook, twitter, Feeds… tienes un monton de maneras automáticas de hacerlo.
  • Eso si, elimina todos los UTMs internos que tengas, ya que te contaran como visitas nuevas.
  • Revisa los informes de Frecuency y Recency: Descubriras que ahora son mucho más útiles que antes.

Cerrando sesión

Para terminar agradecerte que hayas llegado hasta el final y espero haber sido de ayuda. Si crees que algo no está correcto o tienes dudas, te invito a usar los comentarios del blog. Si no funcionan, también puedes comentar en facebook.

Para más información te recomiendo este Post de Analytics Ninja

, ,

21 Responses to La nueva medición de sesiones de Google Analytics, a fondo

  1. Christian Oliveira 20 agosto, 2011 at 10:51 #

    Xavier, gracias por este gran resumen detallado! En general creo que existe bastante desconocimiento de cómo funciona realmente Google Analytics, por eso también resulta más difícil entender el último cambio.

    En cualquier caso, los datos desde el viernes pasado hasta el lunes/martes de esta semana están “mal” debido al bug que tuvieron que hacía que al visitar por 2ª,3ª,etc. vez una misma página durante una misma visita se terminaba esa visita y se empezaba una nueva (aumento brutal de visitas en webs con mucho ‘engament’ en las que los usuarios revisitan varias veces la misma página, con descenso en páginas vistas, tiempo por visita y visitas nuevas).

    Para los lectores, recomiendo este post (en inglés) con una explicación también bastante completa sobre el cambio: http://www.analytics-ninja.com/blog/2011/08/how-google-analytics-calculates-visits.html

    De nuevo, gracias!

    • Xavier Colomés 20 agosto, 2011 at 10:56 #

      Si, parece que tenian problemas con KW de mas de una palabra… El post de analytics ninja es imprescindible! Gracias por tu aportacion!

  2. Julio 20 agosto, 2011 at 11:46 #

    Hola Xavier,

    Si no te he entendido mal, los que tenemos tienda online, debemos notar una bajada. Porque en mi caso lo que he notado es bajada según lo poco que yo se y que puedo ver en GA.

    Muy buen post.

    Gracias.

    • Xavier Colomés 20 agosto, 2011 at 11:53 #

      Hola Julio, lo mas normal seria que notases una subida. Lo que tienes que hacer es mirar los Usuarios unicos (visitors) y su ratio de visitas por visitante. Si sube desde el viernes 12 es porque te suman mas visitas que antes. Si baja es porque te suman menos visitas que antes. Si no cambia, es que la bajada es organica y puede ser debida al Panda

      Un saludo

  3. Julio 20 agosto, 2011 at 12:28 #

    Xavier, hay un poco de baja, y ayer subida :D , creo que esto esta un poco loco, jejeje.

    De todas formas no hay mucha diferencia, se mantiene más o menos igual, 10 visitas arriba/abajo.

    Ten en cuenta que tiene 2 días la tienda y no soy Zara como para conseguir un tráfico de la hostia el primer día ;)

    Gracias por tu respuesta.

  4. Pedro 20 agosto, 2011 at 19:22 #

    Muy buen post, claro y muy detallado! Enhorabuena!

  5. Ricardo Tayar 21 agosto, 2011 at 18:23 #

    Hola Xavier,

    Sencillamente buenísimo este post que ye has currado (junto con la recopilación de enlaces de información, tan imprescindibles o más que el propio post).

    Gracias por poner todo esto “en limpio” y adornarlo con datos de tu propia cosecha.

    Ahora, por lo menos para mi, el principal reto es saber explicar el cambio y las implicaciones que tiene en aquellos datos obtenidos de GA sobre todo para los perfiles de empresa que ya están habituados a leer la información de ua manera ya estandarizada y que tienen que entender muy bien el cambio para que no caigan en malas interpretaciones de la información. A corto plazo esto es muy importante.

    Nos vemos! Un saludo!

    Ricardo

  6. Vseo 21 agosto, 2011 at 21:16 #

    Acojoanante post . Muy bien explicado

  7. Fernando Maciá 22 agosto, 2011 at 7:13 #

    Excelente y completo post que nos ayuda a entender mejor el nuevo comportamiento de Google Analytics. Hay un problema añadido en España, y es la coincidencia de estas implementaciones con un mes atípico en cuanto a tráfico. Identificar correlaciones y causalidades hubiera sido mucho más fácil en cualquier mes menos afectado por los patrones de tráfico estacionales, pero agosto es un mes complicado si no podemos comparar con patrones estables de años anteriores. Muchas gracias por el curro que te has pegado para explicarlo tan bien y por compartir la información.

  8. Gianluca 22 agosto, 2011 at 8:29 #

    Gran post Xavier,
    super completo y seguramente me va a ser de gran ayuda.

    Mira, creo que es tan util, que lo he citado en mi comentario al post publicado hoy mismo en SEOmoz, que tambien habla de esta maldada novedad de Analytics (relacionandola a Panda 2.4).

    Ciao y sigue así.

  9. Cristina Mataix 22 agosto, 2011 at 9:35 #

    Felicidades Romeu por un post tan completo! ;)

    Sólo comentar que quizá para que algunas métricas no sufran tanta variación, a partir de ahora deberemos utilizar los UU, por ejemplo para el cálculo del % de conversión. Cómo lo ves?

    • Xavier Colomés 22 agosto, 2011 at 9:42 #

      Gracias Cristina! ;) Pues qué te voy a contar a tí! los UU es una referencia para medir el tamaño del cambio en nuestro site, ya que la cookie _utma no la han tocado… Sobre hacer una tasa de conversion por usuarios y no visitas no es ninguna tontería, en los funnels de GA se miden UU (mucha gente no lo sabe) y no visitas

      Un abrazo! :)

  10. David Carrero 22 agosto, 2011 at 9:45 #

    Ya estoy recomendado tu post en mi sitio de SEO ;-) http://seocretos.com :)

  11. Luis Alejandro Ramírez Gallardo 22 agosto, 2011 at 11:39 #

    Muy buen articulo, voy a hacer un breve post sobre esto pero refiriendo el ejemplo a su página no tiene mucho sentido que yo haga otro ejemplo si este es bastante explicativo. Lo pondré en seotallica.com

    Si me dan un anchor intento utilizarlo así.

    Saludos,

  12. Ferran 22 agosto, 2011 at 11:42 #

    Impresionante artículo Xavier, muy claro y bien explicado.

    Entre Panda y los cambios en Analytics menudo mes de agosto llevamos.

  13. Francesc Gómez Morales 22 agosto, 2011 at 13:25 #

    Brillante! Felicidades!

  14. Charlie 22 agosto, 2011 at 15:59 #

    Excelente aporte Xavier! Llegué aquí por medio de SEOmoz…

    Bien que había notado algunas inconsistencias en la interpretación de datos de Google Analytics… veremos qué sucede en los próximos días!
    Panda y este suceso están haciendo algo (más) complicado nuestro trabajo… solo queda aprender de los ejemplos y casos reales como el que presentas.
    De nuevo; muchas gracias!

    Ah; por cierto que siempre utilizo fuentes paralelas de tráfico como Mint y StatCounter -pago por ellas en ambos casos- También creo que es lo mejor pues como siempre he dicho: quién controla a Google y sus servicios “gratuitos”? :P

  15. Javi 23 agosto, 2011 at 8:21 #

    Hola Xavi,

    Senzillament boníssim post. Feia temps que no entrava pero em torno a enganxar… :D

  16. Enrique del valle 29 agosto, 2011 at 20:38 #

    Muy buen articulo , a mi todo esto me ha pillado con las vacaciones por medio y algun cliente justo me comentaba en mis vacaciones que habia tenido incrementos de trafico grandes. Le dije que lo miraria a la vuelta y ahora entiendo el porque.

    Que mala idea hacer tantos cambios en agosto , es un mal mes para todas estas cosas.

    Por cierto gracias por citar mi articulo sobre la cockie utmz.

Trackbacks/Pingbacks

  1. Google Analytics cambia la forma de medir sesiones – SEOcretos - 22 agosto, 2011

    [...] los cambios en la definición de sesión que hace ahora Google Analytics, pero hay un artículo de Top-Rankin que lo define y explica realmente bien. Lo que tenemos claro que el cambio de Google no están [...]

  2. Panda 2.4 y cambios en Analytics: Google golpea 2 veces | megustaelturismo - 22 agosto, 2011

    [...] Para saber todavía más, os recomiendo el fantástico artículo de Xavier Colomés, donde explica detalladamente este cambio en Analytics. [...]

Deja un comentario