Antes de ir al grano con el título del post, conectar R con SiteCatalyst de Adobe, me gustaría poner un poco el contexto para que se entienda como he llegado hasta aquí.
Creo que todas las personas que trabajamos con datos llegamos a un punto en el que excel se nos queda pequeño. Nos sirve para tratar datos y visualizarlos, pero con muchas limitaciones que a veces nos llevan a frustrarnos mucho. 500.000 filitas de nada procesadas en excel nos pueden tostar el pc un buen rato
Hace ya muchos meses que empecé a oir hablar de R, primero con intensidad moderada pero con el paso del tiempo, R aparecía en un porcentaje más elevado de las conversaciones profesionales con analistas.
Este otoño, me he lanzado a la piscina para aprender algo de R de la mano de Kschool y Carlos Gil Bellosta. Mi objetivo era claro, encontrar la forma de tratar mis datos de Analítica Digital de manera más profesional y sofisticada a la vez que ganar eficiencia en el camino.
Para empezar a trabajar con R, necesitamos instalar RStudio y cran. RStudio es la interfaz en la que programamos (o algo parecido) y cran contiene el repositorio oficial con todos los paquetes disponibles de R (hoy son 7.630). Un paquete es simplemente un programa de R que alguien ha preparado previamente y que ha tenido a bien compartir con el mundo. Es una de las maravillas que he descubierto de R, la comunidad que existe alrededor y la solidaridad para compartir conocimiento.
Para conectar R con SiteCatalyst, lo primero que tenemos que hacer es instalar el paquete RSiteCatalyst. Desde el menú superior Tools -> Install packages, nos conectamos al repositorio de CRAN para buscar el paquete. Al comenzar a escribir directamente se nos muestran las coincidencias en la búsqueda.
Tras instalar el paquete, tenemos que cargarlo en el entorno para que se pueda utilizar. La instalación no tendremos que repertirla, pero la carga de la librería tendremos que hacerla en cada nueva sesión de Rstudio. El comando es library, igual que para cargar cualquier otro paquete.
A continuación, tenemos que autenticarnos con el usuario, compañía y las credenciales de acceso a la API. R guardará las credenciales y ya estamos dentro.
Lanzar consultas a SiteCatalyst desde R es bastante sencillo, simplemente debemos recordar que estamos utilizando la API aunque sea desde la interfaz de R. Tendremos las mismas limitaciones de disponibilidad de métricas que desde cualquier otra aplicación que acceda via API pero con la interfaz de RStudio, más amigable que la API según dicen los usuarios habituales de la API.
Para empezar a traer datos, podemos realizar una consulta sencilla que nos devuelva métricas básicas de tráfico por ejemplo del mes de noviembre.
Aquí dejo como texto el código utilizado, las lines que empiezan con # no se ejecutan, son pistas que vamos dejando en el programa.
# Instalar paquete RSitecatlyst desde Tools -> Install Packages
# Para cargar librerías
library(RSiteCatalyst)
# Autenticar
#SCAuth(«your_username:your_company», «your_shared_secret»)
SCAuth(«usuario1:company1″, «732734734234287342bsbdsb»)
#Inlcuir ID de ReportSuite con métricas básicas
date.from <- «2015-01-01″
date.to <- «2015-11-30″
reportsuite.id <- «turepositorio»
metrics <- c(«visits»,»uniquevisitors»,»pageviews»)
report.data <- QueueOvertime(reportsuite.id, date.from, date.to, metrics)
Y si os ha sabido a poco, os dejo unos cuantos enlaces con mas información de como utilizar el paquete RSiteCatalyst:
https://github.com/randyzwitch/RSiteCatalyst
http://randyzwitch.com/rsitecatalyst/
https://cran.rstudio.com/web/packages/RSiteCatalyst/RSiteCatalyst.pdf
Hola Ana,
muchas gracias por la info, muy útil
¿sabes si es posible hacer la consulta a la API aplicando directamente segmentos/filtros, o sólo se pueden aplicar una vez cargados los datos en R?
gracias!
Hola Nacho,
Yo no tengo experiencia en el uso de la API directamente, siempre me he conectado a la API desde otra herramienta con interfaz propia que si me ha permitido usar segmentos.
Siento no poder ayudarte con tu duda.
Saludos
Ana