¿Por qué lo llaman personas cuando quieren decir cookies?

Diferencias entre distintos sistemas de medición online

Hace algunos meses decidí cambiar el análisis web en un medio, por el análisis de audiencias en un proveedor de mediciones online.

Ambas disciplinas tienen como esencia la “recopilación, medición, evaluación, presentación y explicación racional de los datos obtenidos de Internet, con el propósito de entender y optimizar el uso de un sitio web o de una iniciativa de marketing en Internet” pero con pequeños matices

Una de las principales diferencias es el tipo de fuente con la que venían históricamente trabajando cada una de las disciplinas.

Sin embargo, desde que la mayoría de sites y no solo de e-commerce han empezado a darle a la analítica web la importancia que merece ambas disciplinas empiezan a ser complementarias y por tanto, es crucial conocer las distintas fuentes de información/herramientas, su utilidad, ventajas, inconvenientes, metodología y limitaciones

Durante estos primeros meses he tenido la gran oportunidad de trabajar con distintos profesionales  directores de marketing, directores de contenidos, web managers, planificadores, redactores, SEOs, técnicos de investigación y  conocidos analistas web, pero lamentable y sorprendentemente en más de una ocasión me he encontrado con un absoluto desconocimiento de los  distintos sistemas de medición , llegando a conclusiones equivocadas y tomando decisiones poco acertadas.

Esto me ha demostrado que al contrario de lo que yo creía la diferencias entre lo que es un sistema site centric (sistema censal) y user centric (panel)  es desconocida para gran parte de los profesionales 2.0.

Tradicionalmente, en los medios de comunicación, otros sites de contenido y agencias de medios, el análisis de los sites recaía en la figura del técnico/departamento de investigación de mercados o analista de audiencias, sin embargo desde hace algunos años muchos de estos profesionales han asumido las funciones de analistas web y en otros casos dichos profesionales se han incorporado a la estructura ya existente, produciéndose el choque y encuentro de dos mundos.

Los paneles de audiencias no  es novedoso para los técnicos de investigación pero resulta novedoso para los analistas web que se incorporan a estas empresas, mientras que por el contrario cuando los analistas web introducen en estas empresas términos como tasa de rebote, de conversión, embudo de conversión son vistos como “bichos raros”.

Pero,  ¿Qué es de un sistema de medición user centric ?: Es el sistema de medición tradicional, basado en el comportamiento de navegación del usuario, esto es posible gracias a la captación de un  panel (obtención de información periódica a través de una muestra representativa de la población, en este caso online).

Este sistema ofrece información demográfica detallada sobre los panelistas (sexo, edad,etc)  además, generalmente los datos muestrales se extrapolan a un universo similar a la que utilizan otros medios tradicionales, en caso de España se utiliza EGM Estudio General de Medios, permitiendo un marco comparativo entre los distintos medios.

Al ser un sistema de medición basado en los datos de comportamiento del usuario, no es necesario ninguna implementación por parte de los sites  y por tanto ofrece datos de todos los sites visitados por los panelistas, permitiendo de esta forma obtener datos propios y de la competencia.

Algunas personas se preguntan cómo es posible captar datos sin implementación en el site, la respuesta es mediante audímetros online (software) descargado por los panelistas en el que se recogen todo el comportamiento online de los panelistas.

Generalmente los datos se presenta agrupados por categorías (viajes, finanzas, información, portales, blogs, redes sociales, televisiones, periódicos, etc) obteniendo de esta forma un ranking de sites para cada categoría y ranking de medios según las principales métricas (visitantes únicos, páginas vistas, minutos, etc)

La explotación de estos datos tienen diversas finalidades, siendo la más relevante la de la planificación publicitaria (agencia) y comercialización publicitaria (medios), sin embargo, en los últimos años son cada vez más los sites de e-commerce que desean conocer su posición frente a la competencia.

Frecuentemente leemos o escuchamos que un site se autodeclara  líder del mercado o categoría y cuando investigamos en base a qué datos hace esas afirmaciones, nos encontramos  fuentes como Alexa o alguna herramienta de analítica web no auditada, estas declaraciones carecen de credibilidad porque rankings como Alexa carecen de una transparencia en la captación de datos (datos únicamente de las personas que descargan su toolbar) y las herramientas de analítica web a menos que todos los sites de la categoría tengan la misma herramienta con una implementación comparable y los datos de todos los sites de la categoría sean públicos, no pueden ser comparables además de los sesgos y la falta de un tercero neutral que certifique esos datos.

Por tanto las agencias planifican las campañas publicitarias mediante paneles online que les ofrecen información neutral, del total universo, de personas ycon demográficos, aquí la respuesta a la pregunta de  por qué la agencia X no les ha incluido en su planificación publicitaria.

Es como si en un concurso de salto, todo los competidores se proclamaran campeón absoluto, pero.. ¿de qué categoría?, ¿en qué modalidad?, ¿cómo se midió la longitud del salto?,  ¿qué herramienta se utilizo?,  ¿quién midió la longitud? , ¿todos los participantes participaron en las mismas condiciones?, ¿cómo pueden declararse campeones si  no han visto los resultados de sus competidores?,¿quién certifica la transparencia de los medidores?

Por otro lado el sistema site centric. Es un sistema censal basado en la actividad registrada en el site. Hay varias modalidades:

A través de ficheros de logs: Mediante el registro de un archivo de texto que contiene todos los eventos en un servidor web, incluidas las consultas y respuestas. Los archivos de registro son archivos generados por los servidores web en cada una de sus transacciones

Etiquetados de las páginas del site a través de un código script, cada vez que una página es visitada, este script se comunica con una base de datos a la que comunica la impresión de la página junto con, potencialmente, datos adicionales procedentes de las cookies

Son diferencias con el sistema user centric pero la esencial radica en que mientras que en user centric hablamos de personas en site centric hablamos realmente de cookies.

Pero ¿qué es una cookie?, no es más que un fragmento de información que se almacena en el disco duro del visitante de una página web a través de su navegador, a petición del servidor de la página. Esta información puede ser luego recuperada por el servidor en posteriores visitas

Por tanto aunque se aproxime mucho a una persona no lo es y además nos encontramos ante el problema del borrado de cookies

Por ejemplo

Un usuario visita un site 4 veces en un mes,elimina  las cookies dos veces durante el mes, por tanto hay 3 cookies distintas para un único usuario.

Ejercicio más profundo de la estimación de los efectos de la eliminación de  cookies

La eliminación de cookies puede ocurrir cuando:

  • El usuario elimina manualmente las cookies de sus archivos.
  • El usuario elimina las cookies de su navegador a través de las opciones del propio navegador.
  • El usuario ejecuta programas de seguridad que borran sistemáticamente las cookies
  • El usuario configura su navegador para rechazar cookies.

Además es importante recordar que si  un único usuario que accede al mismo dominio utilizando dos navegadores diferentes tendrá dos cookies separadas, una para cada navegador.

Muchos estudios independientes han demostrado el elevado porcentaje de eliminación de cookies:

Nielsen Research

Forrester

Pero el estudio más reciente es el realizado por comScore, muestra que un 30-40% de los usuarios eliminan cookies y el ratio de cookies por usuario es de al menos 5 cookies por usuario. The Impact of Cookie Deletion on Site-Server and Ad-Server Metrics

 

 

Los sistemas de medición censal ofrecen muchas ventajas sobre el sistema panel pero siempre hay que tener en cuenta que no estamos hablando de personas.

Es por eso que en coincidiendo con el lanzamiento mundial de Digital Analytix herramienta de analítica web de comScore (ex Nedstat),   fue pionera en adoptar los estándares de la IAB para la medición de audiencias renombrando a los visitantes únicos como navegadores únicos

Históricamente, las herramientas de análisis web han utilizado la terminología de “visitantes únicos” para denominar a lo que realmente son”cookies únicas.”

La confusión entre ambos sistemas  ha provocado que la confusión sea  crónica afectando negativamente a la  ya tambaleante confianza de la medición digital.

Es por esta razón que organizaciones como IAB  entre otros han emitido directrices para la ordenación de las métricas basadas cookies “navegadores únicos” en lugar de “visitantes únicos”, que en su opinión, debe reservarse para la medición de individuos únicos.

Por tanto, es necesario tener la visión completa de la foto cuando analizamos un site, por ello, varias empresas han desarrollado sistemas de medición híbridos que combinan ambos sistemas, comScore fue pionero en el mercado español en lanzar su sistema de medición híbrido conocido como UDM Unified Digital Measurement en febrero del año pasado ofreciendo grandes resultados y permitiendo ofrecer nuevas soluciones de medición basadas en la combinación de ambos métodos (necesitaría otro post para explicar la metodología del sistema híbrido)

Finalmente un breve resumen de las diferencias,ventajas e inconvenientes entre ambos sistemas



Si te interesa el tema debes leer:

Site Centric + User Centric = ¿Sistema Híbrido? por  Adrián Segovia

Diferencias entre Google Analytics, Omniture vs. Comscore, Nielsen por Cristina Mataix

¿ Dos herramientas de analítica web devuelven datos diferentes? por Carlos M. Lebrón

 

Pamela Vásquez @pametrics

Licenciada de Administración de Empresas e Investigación y Técnicas de Mercado por la Universidad Autónoma de Madrid.Accesit Premio AEDEMO Mejor Licenciado de Investigación de Mercados promoción 2009.

Inició su carrera profesional  en 2007  como técnico de Investigación de Mercados y empezó su andadura en el mundo digital como  Market Research  Assistant & Insights en Yahoo!,  fue responsable de analítica web para Windows Live/Microsoft ,  Antena 3 Multimedia y actualmente es Client Service Analyst para comScore España.

 

 

Pamela es Licenciada de Administración de Empresas e Investigación y Técnicas de Mercado por la Universidad Autónoma de Madrid.Accesit Premio AEDEMO Mejor Licenciado de Investigación de Mercados 2009 y Master en Digital Analytics por la Universidad British Columbia .Inició su carrera profesional en 2007 como técnico de Investigación de Mercados y empezó su andadura en el mundo digital como Market Research Assistant & Insights en Yahoo! Spain, fue responsable de analítica web para Windows Live/Microsoft , Antena 3 Multimedia y actualmente es la responsable del equipo de Client Service Analysts para la empresa líder de medición digital comScore Iberia.

Twitter LinkedIn Google+ 

6 Responses to ¿Por qué lo llaman personas cuando quieren decir cookies?

  1. Justo abril 27, 2011 at 2:18 pm #

    Estimada Pamela:

    Tengo bastante experiencia trabajando con herramenientas de analítica web y en menor medida he utilizado el panel de comScore MediaMetrix.

    Existen dos problemas fundamentales en cuanto a la precisión de los datos, que en parte tu ya haz mencionado:

    – Las herramientas de analítica web basan mayormente sus datos sobre los usuarios en las cookies y esto genera las impresiciones que mencionas.

    – Las herramientas como comScore también tienen importantes imprecisiones y el problema es que estas no son tan conocidas y mucho menos debatidas entre los profesionales

    Como todos saben el valor de un panel de usuarios como el de comScore está dado por la representatividad estadística que tengan sus integrantes.
    En sencillas palabras, es todo un tema en estadística, establecer con un nivel de precisión aceptable, a cuantas personas usuarios de interntet, equivale un integrante del panel, y esto en función de sus características sociodemográficas.

    El panel de comScore adolece de dos problemas básicos fundamentales. El primer problema es que no existe un dato censal confiable sobre el universo al cuál se extrapola la información del panel, por el sencillo hecho de que no existe información censal sobre usuarios de internet y sus características demográficas. Sin este parámetro poblacional no se pueden establecer criterios probabilísticos de representatividad válidos para realizar las extrapolaciones de los datos del panel al total de usuarios (lo que en definitiva es el dato ofrecido por comScore).

    Dejando de lado este primer problema, que afecta profundamente la calidad de la información ofrecida por comScore, existe un segundo nivel del problema y es que comScore tampoco ofrece datos de “personas” sino de dispositivos que tienen instalado su software de monitoreo.

    El problema en este nivel es que excepto en caso que un dispositivo sea empleado pura y exclusivamente por una misma persona, los datos de navegación y comportamiento de usuarios corresponderán a múltiples personas que comparten el mismo dispositivo (por caso una PC hogareña que usan varios miembros de la familia).

    O sea, que no solo los datos son extrapolados al universo empleando criterios “no probabilísticos” sino que son meramente son estimaciones más o menos criteriosas, sino que además existe una atribución de panelistas a personas que es menos clara aún.

    Finalmente y como entiendes algo de estadística queda un tercer problema y es el grado de precisión de las estimaciones. Es sabido que a mayor nivel de granularidad de la información el nivel de precisión en las estimaciones disminuye, por lo que se requiere un número elevado de panelistas para lograr un umbral mínimo de precisión en los datos extrapolados.

    En resumen los problemas que afectan a comScore son mucho más graves que los que afectan a los datos de una plataforma de webanalytics, y lo peor es que muy pocas personas tienen el nivel suficiente de conocimiento técnico como para percatarse de ello.

    Saludos cordiales,

  2. Ana mayo 3, 2011 at 9:00 pm #

    Pam,

    Un post muy bueno, tu visión de como aceptamos los diferentes tipos de datos para una de las partes que componemos la analítica web me ha parecido muy acertada.

    Sigue escribiendo!!

    Ana

  3. Xavier Guilera mayo 13, 2011 at 2:50 pm #

    La empresa MediaMind ha hecho un estudio con el objetivo de identificar la incidencia del borrado de cookies. Así llegan a estimar la audiencia neutralizando el efecto de borrado, acercándose al concepto de persona. Aunque entiendo que siguen estando en el lado de “site centric”, con todo lo que ello conlleva.

    Así, se considera que en España la sobreestimación de usuarios únicos tiene un factor de 2,2. En otras palabras, se deberían dividir entre 2,2 los usuarios únicos para acercarse a la audiencia real. Lógicamente, esto es una media estimada. Pero considero que puede ser una referencia de interés para los lectores. Dejo el link del estudio:

    http://www.mediamind.com/Data/Uploads/ResourceLibrary/MediaMind_Global_Benchmarks_2011_SP.pdf

Trackbacks/Pingbacks

  1. mktfan.com - abril 25, 2011

    Madrid Girl Geek Dinners » Blog Archive » ¿Por qué lo llaman personas cuando quieren decir cookies?…

    Diferencia, ventajas y desventajas entre los sistemas de medición online.Site centric vs User centric  …

  2. COOKIES | alexanderrojasdelariva - abril 7, 2012

    […] ¿Por qué lo llaman personas cuando quieren decir cookies? […]

  3. Madrid Girl Geek » Blog Archive » ¿Tienes todo bajo control? - julio 25, 2012

    […] Como era previsible esta situación ha provocado que más medios/redes/agencias se han interesado por la medición de comScore cuya metodología de medición de audiencias es unificada, es decir, tiene en cuenta la medición panel (personas) y la medición censal (cookies). Si quieres profundizar sobre estas metodologías no dejes de visitar mi anterior post. […]

Hecho con cariño desde Madrid por las Madrid Geek Girls.