Diferencias entre distintos sistemas de medición online
Hace algunos meses decidí cambiar el análisis web en un medio, por el análisis de audiencias en un proveedor de mediciones online.
Ambas disciplinas tienen como esencia la «recopilación, medición, evaluación, presentación y explicación racional de los datos obtenidos de Internet, con el propósito de entender y optimizar el uso de un sitio web o de una iniciativa de marketing en Internet” pero con pequeños matices
Una de las principales diferencias es el tipo de fuente con la que venían históricamente trabajando cada una de las disciplinas.
Sin embargo, desde que la mayoría de sites y no solo de e-commerce han empezado a darle a la analítica web la importancia que merece ambas disciplinas empiezan a ser complementarias y por tanto, es crucial conocer las distintas fuentes de información/herramientas, su utilidad, ventajas, inconvenientes, metodología y limitaciones
Durante estos primeros meses he tenido la gran oportunidad de trabajar con distintos profesionales directores de marketing, directores de contenidos, web managers, planificadores, redactores, SEOs, técnicos de investigación y conocidos analistas web, pero lamentable y sorprendentemente en más de una ocasión me he encontrado con un absoluto desconocimiento de los distintos sistemas de medición , llegando a conclusiones equivocadas y tomando decisiones poco acertadas.
Esto me ha demostrado que al contrario de lo que yo creía la diferencias entre lo que es un sistema site centric (sistema censal) y user centric (panel) es desconocida para gran parte de los profesionales 2.0.
Tradicionalmente, en los medios de comunicación, otros sites de contenido y agencias de medios, el análisis de los sites recaía en la figura del técnico/departamento de investigación de mercados o analista de audiencias, sin embargo desde hace algunos años muchos de estos profesionales han asumido las funciones de analistas web y en otros casos dichos profesionales se han incorporado a la estructura ya existente, produciéndose el choque y encuentro de dos mundos.
Los paneles de audiencias no es novedoso para los técnicos de investigación pero resulta novedoso para los analistas web que se incorporan a estas empresas, mientras que por el contrario cuando los analistas web introducen en estas empresas términos como tasa de rebote, de conversión, embudo de conversión son vistos como “bichos raros”.
Pero, ¿Qué es de un sistema de medición user centric ?: Es el sistema de medición tradicional, basado en el comportamiento de navegación del usuario, esto es posible gracias a la captación de un panel (obtención de información periódica a través de una muestra representativa de la población, en este caso online).
Este sistema ofrece información demográfica detallada sobre los panelistas (sexo, edad,etc) además, generalmente los datos muestrales se extrapolan a un universo similar a la que utilizan otros medios tradicionales, en caso de España se utiliza EGM Estudio General de Medios, permitiendo un marco comparativo entre los distintos medios.
Al ser un sistema de medición basado en los datos de comportamiento del usuario, no es necesario ninguna implementación por parte de los sites y por tanto ofrece datos de todos los sites visitados por los panelistas, permitiendo de esta forma obtener datos propios y de la competencia.
Algunas personas se preguntan cómo es posible captar datos sin implementación en el site, la respuesta es mediante audímetros online (software) descargado por los panelistas en el que se recogen todo el comportamiento online de los panelistas.
Generalmente los datos se presenta agrupados por categorías (viajes, finanzas, información, portales, blogs, redes sociales, televisiones, periódicos, etc) obteniendo de esta forma un ranking de sites para cada categoría y ranking de medios según las principales métricas (visitantes únicos, páginas vistas, minutos, etc)
La explotación de estos datos tienen diversas finalidades, siendo la más relevante la de la planificación publicitaria (agencia) y comercialización publicitaria (medios), sin embargo, en los últimos años son cada vez más los sites de e-commerce que desean conocer su posición frente a la competencia.
Frecuentemente leemos o escuchamos que un site se autodeclara líder del mercado o categoría y cuando investigamos en base a qué datos hace esas afirmaciones, nos encontramos fuentes como Alexa o alguna herramienta de analítica web no auditada, estas declaraciones carecen de credibilidad porque rankings como Alexa carecen de una transparencia en la captación de datos (datos únicamente de las personas que descargan su toolbar) y las herramientas de analítica web a menos que todos los sites de la categoría tengan la misma herramienta con una implementación comparable y los datos de todos los sites de la categoría sean públicos, no pueden ser comparables además de los sesgos y la falta de un tercero neutral que certifique esos datos.
Por tanto las agencias planifican las campañas publicitarias mediante paneles online que les ofrecen información neutral, del total universo, de personas ycon demográficos, aquí la respuesta a la pregunta de por qué la agencia X no les ha incluido en su planificación publicitaria.
Es como si en un concurso de salto, todo los competidores se proclamaran campeón absoluto, pero.. ¿de qué categoría?, ¿en qué modalidad?, ¿cómo se midió la longitud del salto?, ¿qué herramienta se utilizo?, ¿quién midió la longitud? , ¿todos los participantes participaron en las mismas condiciones?, ¿cómo pueden declararse campeones si no han visto los resultados de sus competidores?,¿quién certifica la transparencia de los medidores?
Por otro lado el sistema site centric. Es un sistema censal basado en la actividad registrada en el site. Hay varias modalidades:
A través de ficheros de logs: Mediante el registro de un archivo de texto que contiene todos los eventos en un servidor web, incluidas las consultas y respuestas. Los archivos de registro son archivos generados por los servidores web en cada una de sus transacciones
Etiquetados de las páginas del site a través de un código script, cada vez que una página es visitada, este script se comunica con una base de datos a la que comunica la impresión de la página junto con, potencialmente, datos adicionales procedentes de las cookies
Son diferencias con el sistema user centric pero la esencial radica en que mientras que en user centric hablamos de personas en site centric hablamos realmente de cookies.
Pero ¿qué es una cookie?, no es más que un fragmento de información que se almacena en el disco duro del visitante de una página web a través de su navegador, a petición del servidor de la página. Esta información puede ser luego recuperada por el servidor en posteriores visitas
Por tanto aunque se aproxime mucho a una persona no lo es y además nos encontramos ante el problema del borrado de cookies
Por ejemplo
Un usuario visita un site 4 veces en un mes,elimina las cookies dos veces durante el mes, por tanto hay 3 cookies distintas para un único usuario.
Ejercicio más profundo de la estimación de los efectos de la eliminación de cookies
La eliminación de cookies puede ocurrir cuando:
- El usuario elimina manualmente las cookies de sus archivos.
- El usuario elimina las cookies de su navegador a través de las opciones del propio navegador.
- El usuario ejecuta programas de seguridad que borran sistemáticamente las cookies
- El usuario configura su navegador para rechazar cookies.
Además es importante recordar que si un único usuario que accede al mismo dominio utilizando dos navegadores diferentes tendrá dos cookies separadas, una para cada navegador.
Muchos estudios independientes han demostrado el elevado porcentaje de eliminación de cookies:
Pero el estudio más reciente es el realizado por comScore, muestra que un 30-40% de los usuarios eliminan cookies y el ratio de cookies por usuario es de al menos 5 cookies por usuario. The Impact of Cookie Deletion on Site-Server and Ad-Server Metrics
Los sistemas de medición censal ofrecen muchas ventajas sobre el sistema panel pero siempre hay que tener en cuenta que no estamos hablando de personas.
Es por eso que en coincidiendo con el lanzamiento mundial de Digital Analytix herramienta de analítica web de comScore (ex Nedstat), fue pionera en adoptar los estándares de la IAB para la medición de audiencias renombrando a los visitantes únicos como navegadores únicos
Históricamente, las herramientas de análisis web han utilizado la terminología de «visitantes únicos» para denominar a lo que realmente son»cookies únicas.»
La confusión entre ambos sistemas ha provocado que la confusión sea crónica afectando negativamente a la ya tambaleante confianza de la medición digital.
Es por esta razón que organizaciones como IAB entre otros han emitido directrices para la ordenación de las métricas basadas cookies «navegadores únicos» en lugar de «visitantes únicos», que en su opinión, debe reservarse para la medición de individuos únicos.
Por tanto, es necesario tener la visión completa de la foto cuando analizamos un site, por ello, varias empresas han desarrollado sistemas de medición híbridos que combinan ambos sistemas, comScore fue pionero en el mercado español en lanzar su sistema de medición híbrido conocido como UDM Unified Digital Measurement en febrero del año pasado ofreciendo grandes resultados y permitiendo ofrecer nuevas soluciones de medición basadas en la combinación de ambos métodos (necesitaría otro post para explicar la metodología del sistema híbrido)
Finalmente un breve resumen de las diferencias,ventajas e inconvenientes entre ambos sistemas
Si te interesa el tema debes leer:
Site Centric + User Centric = ¿Sistema Híbrido? por Adrián Segovia
Diferencias entre Google Analytics, Omniture vs. Comscore, Nielsen por Cristina Mataix
¿ Dos herramientas de analítica web devuelven datos diferentes? por Carlos M. Lebrón
Pamela Vásquez @pametrics
Licenciada de Administración de Empresas e Investigación y Técnicas de Mercado por la Universidad Autónoma de Madrid.Accesit Premio AEDEMO Mejor Licenciado de Investigación de Mercados promoción 2009.
Inició su carrera profesional en 2007 como técnico de Investigación de Mercados y empezó su andadura en el mundo digital como Market Research Assistant & Insights en Yahoo!, fue responsable de analítica web para Windows Live/Microsoft , Antena 3 Multimedia y actualmente es Client Service Analyst para comScore España.
Estimada Pamela:
Tengo bastante experiencia trabajando con herramenientas de analítica web y en menor medida he utilizado el panel de comScore MediaMetrix.
Existen dos problemas fundamentales en cuanto a la precisión de los datos, que en parte tu ya haz mencionado:
– Las herramientas de analítica web basan mayormente sus datos sobre los usuarios en las cookies y esto genera las impresiciones que mencionas.
– Las herramientas como comScore también tienen importantes imprecisiones y el problema es que estas no son tan conocidas y mucho menos debatidas entre los profesionales
Como todos saben el valor de un panel de usuarios como el de comScore está dado por la representatividad estadística que tengan sus integrantes.
En sencillas palabras, es todo un tema en estadística, establecer con un nivel de precisión aceptable, a cuantas personas usuarios de interntet, equivale un integrante del panel, y esto en función de sus características sociodemográficas.
El panel de comScore adolece de dos problemas básicos fundamentales. El primer problema es que no existe un dato censal confiable sobre el universo al cuál se extrapola la información del panel, por el sencillo hecho de que no existe información censal sobre usuarios de internet y sus características demográficas. Sin este parámetro poblacional no se pueden establecer criterios probabilísticos de representatividad válidos para realizar las extrapolaciones de los datos del panel al total de usuarios (lo que en definitiva es el dato ofrecido por comScore).
Dejando de lado este primer problema, que afecta profundamente la calidad de la información ofrecida por comScore, existe un segundo nivel del problema y es que comScore tampoco ofrece datos de «personas» sino de dispositivos que tienen instalado su software de monitoreo.
El problema en este nivel es que excepto en caso que un dispositivo sea empleado pura y exclusivamente por una misma persona, los datos de navegación y comportamiento de usuarios corresponderán a múltiples personas que comparten el mismo dispositivo (por caso una PC hogareña que usan varios miembros de la familia).
O sea, que no solo los datos son extrapolados al universo empleando criterios «no probabilísticos» sino que son meramente son estimaciones más o menos criteriosas, sino que además existe una atribución de panelistas a personas que es menos clara aún.
Finalmente y como entiendes algo de estadística queda un tercer problema y es el grado de precisión de las estimaciones. Es sabido que a mayor nivel de granularidad de la información el nivel de precisión en las estimaciones disminuye, por lo que se requiere un número elevado de panelistas para lograr un umbral mínimo de precisión en los datos extrapolados.
En resumen los problemas que afectan a comScore son mucho más graves que los que afectan a los datos de una plataforma de webanalytics, y lo peor es que muy pocas personas tienen el nivel suficiente de conocimiento técnico como para percatarse de ello.
Saludos cordiales,
Pam,
Un post muy bueno, tu visión de como aceptamos los diferentes tipos de datos para una de las partes que componemos la analítica web me ha parecido muy acertada.
Sigue escribiendo!!
Ana
La empresa MediaMind ha hecho un estudio con el objetivo de identificar la incidencia del borrado de cookies. Así llegan a estimar la audiencia neutralizando el efecto de borrado, acercándose al concepto de persona. Aunque entiendo que siguen estando en el lado de «site centric», con todo lo que ello conlleva.
Así, se considera que en España la sobreestimación de usuarios únicos tiene un factor de 2,2. En otras palabras, se deberían dividir entre 2,2 los usuarios únicos para acercarse a la audiencia real. Lógicamente, esto es una media estimada. Pero considero que puede ser una referencia de interés para los lectores. Dejo el link del estudio:
http://www.mediamind.com/Data/Uploads/ResourceLibrary/MediaMind_Global_Benchmarks_2011_SP.pdf