jueves, 11 de octubre de 2012

¿Existe correlación entre las redes sociales y encuestas tradicionales?

Comparación Brandmetric / Adimark

El siguiente artículo presenta una comparación entre los niveles de aprobación presidencial del Presidente Sebastián Piñera de la encuesta Adimark y el monitoreo de redes sociales de Brandmetric en los últimos dos años (desde septiembre de 2010 hasta septiembre de 2012).

El índice de aprobación de Brandmetric se calcula a partir de la relación que hay entre menciones positivas y negativas respecto a Sebastian Piñera en redes sociales.

Para poder determinar si una mención tiene un tono determinado respecto a una entidad, utilizamos un algoritmo desarrollado por brandmetric que utiliza una combinación de diccionarios de términos y funciones bayesianas. Este algoritmo es optimizado para el castellano e incluye el lenguaje coloquial de Chile. Mas detalles aquí.


La fórmula es la siguiente:  #pos / (#neg + #pos)



#pos = número de menciones con tono positivo en determinado período de tiempo
#neg = número de menciones con tono negativo en determinado período de tiempo

La fórmula no considera los neutros y los falsos positivos que existen en los tonos tienden a eliminarse entre sí. Es decir el tono tiende a fallar por igual medida entre los positivos y negativos.

Para efectos de este estudio calculamos el índice de aprobación de Sebastián Piñera mensual ya que es una ventana de tiempo equivalente a la del índice de aprobación entregada por encuesta Adimark. Hemos filtrado los resultados de la herramienta Brandmetric a los días específicos de muestreo que realiza la encuesta Adimark para no desvirtuar los resultados y hacer la comparación más exacta, debido a la posibilidad de que existan fenómenos de importante impacto dentro de los días que quedan fuera del muestreo. Generalmente la encuesta Adimark presenta un tiempo en terreno cercano a los 25 días por cada mes.

En relación a la encuesta Adimark, esta es una encuesta telefónica con una muestra probabilística con selección aleatoria de hogares y de entrevistados. La encuesta tiene un error muestral de +/-3% con un intervalo de confianza del 95%.

El tamaño de la muestra las encuestas Adimark es cercano a un N de 1100 casos. La herramienta de Brandmetric entrega flujos de menciones en redes que oscilan (en el caso de este análisis) entre las 21000 y las 88578 menciones (en abril de 2011 y septiembre de 2011 respectivamente). Con tal flujo de menciones se logra un promedio cercano a las 45000 menciones entre los meses estudiados (septiembre 2010/septiembre 2012).

El siguiente gráfico presenta la comparación entre los datos entregados por las encuestas mensuales Adimark y los datos recogidos con la herramienta de monitoreo y análisis de redes sociales de Brandmetric. Se puede apreciar que, en general, los datos comparados entre las dos mediciones son bastante similares, sobre todo tomando en cuenta el error muestral.


¿Y cuál es la correlación?

Calculamos la correlación de Pearson y es de 0.565