El BigData destroza a las Encuestas políticas

Amigos, ya es un hecho. Las encuestas fallan más que una escopeta de feria. Desde 2011 la Demoscopia no ha hecho más que pronosticar resultados muy alejados al resultado final. Teniendo en cuenta el dineral que cuestan, el planteamiento es bastante inútil y caro. Sería más útil hacer un seguimiento a una serie de electores durante la campaña. Analizando su comportamiento, podemos extraer datos muy interesantes y sobre todo reales.

Desde hace unos años, no han acertado ni una. Y creo, es una opinión personal, que parte de su fracaso se pueden deber a que no son anónimas. Vamos, que mentimos un montón cuando nos preguntan en la calle o por teléfono.

¿Formamos parte del Big Data y no lo sabemos?

Esto suena un poco a MATRIX pero bueno. La verdad es que es así. Desde la NSA hasta navegadores como GOOGLE o plataformas como FACEBOOK. Robots que van recogiendo millones de datos de todo lo que hacemos en Internet. Y por mucho que pongamos programas para bloquearlos, borrar las cookies o nuestros datos. Incluso navegando por la Internet Profunda. No hay escapatoria, asumirlo.

Un ejemplo que muchos de vosotros ni lo sabéis (si no usáis iTunes no claro). Es el organizador de canciones de iTunes que se llama Genius. Sabe nuestros gustos y nos aconseja artistas basándose en nuestra biblioteca musical. Genius descubre que hay otros como tú, sin que ni tu ni ellos lo sepáis, y después aplica la regla de oro: quienes coincidieron antes, coincidirán después.

¿Eso del Big Data que es?

Los códigos crípticos que encierra cada una de tus células revelan significados profundos cuando se comparan con los demás, y de pronto emerge de la mera acumulación ciega un patrón, una pauta que te retrata y que sería imposible inferir de otro modo. Lo que informa sobre ti no es lo que tienes ni lo que piensas, sino tu posición en el gran esquema de las cosas. Big data (datos masivos) suena un poco como Big Brother (el Gran Hermano de Orwell, que todo lo vigilaba), y por eso se está imponiendo en la calle, y por eso lo está haciendo en inglés. Guardianes del lenguaje: ¡Toda resistencia será fútil!

Fuente (El Pais)

Como resumen, podemos definir al Big Data como el arte de poder leer a miles de personas, recoger sus datos e interpretarlos. Un tesoro de información, que nos hacen pensar en que como individuo solo no valemos gran cosa. El colectivo es el que nos da la información que realmente importa.

Esta mañana, viendo un programa de TV de ciencia, explicaban la fuerza y el misterio de los datos cuando se ven en un conjunto. La prueba era muy sencilla. Se preguntaba a un numero de personas cuantos caramelos hay en un frasco. Sin abrirlo, a ojo. Muchos se quedaron por encima, otros por debajo. Creo que solo acertaron dos encuestados: 1415 caramelos.

Pero el experimento no acabo ahí. Sumaron todos los numero de las respuestas y lo dividieron por el número de encuestados. Curiosamente salió de media 1425 caramelos :) Parece una tontería, pero esto explica muy bien el concepto de Inteligencia Colectiva o la Sabiduría de Masas. Un ejemplo muy claro, como dato, es la Wikipedia.

El Big Data es el Rey

Yo ya lo tenía claro después del referendum del Brexit. Ya hice un artículo sobre el Proyecto Sensei y su acierto en el referendum. Escuchar, monitorizar y analizar las Redes Sociales, buscadores y sitios web es vital. Dejemos los pronósticos a un lado y observemos y analicemos su comportamiento.

La verdad es que es un tema que me apasiona y me gustaría aprender en profundidad. Es un mundo complejo, donde gracias a la IA (Inteligencia Artificial) se puede hacer modelos que analicen millones de datos. Los desmenuce y nos de un pronostico imparcial y aséptico (libre de emociones). Es puro arte tecnológico.

Ya os he comentado el proyecto Sensei en el tema de las elecciones del Brexit. Ahora tenemos un proyecto que lleva funcionando 12 años sin fallar ni una vez. Ha sabido augurar la derrota de una señora con tanto poder como Clinton, que lo ha sido todo en el Establishment de Washington, frente a un millonario excéntrico, racista, maleducado y con incontinencia verbal. “Toma del frasco, Carrasco”.

El modelo se llama MogIA. Creado por el indio Sanjiv Rai, un verdadero genio en la creación de modelos de IA. Ya lo dijo muy claro en una entrevista a la CNBC: “Si Trump pierde, esto desafiará la tendencia de los datos por primera vez en los últimos 12 años desde que se inició la participación de Internet a pleno”. Y afirmaba, contradiciendo a todas las cadenas de TV y periódicos, que el Engagement (impacto) de Trump era superior al de Obama en 2008. Todo basándose en su modelo de IA.

¿Qué es eso del modelo MogIA?. Este sistema, llamado así por Mowgli de “El Libro de la Selva”,comparte una característica fundamental con el personaje central de la obra de Kipling: aprende de su entorno y de los comportamientos que lo rodean. El creador explicó que este sistema de IA recolectó durante semanas más de 20 millones de datos públicos de plataformas como Twitter, Facebook, Google y Youtube para crear un pronóstico imparcial de cara a las elecciones. (Fuente: CNBC).

¿Tiene limitaciones? Como bien dice su creador, cuanto más información tenga el sistema mejores serán sus pronósticos. Tampoco puede discriminar si los comentarios que analiza son positivos o negativos. Por ejemplo, un usuario podría usar el #trump para ponerlo verde o besarle los pies. Solo mide el concepto, no el contexto.

Si sistemas como Google diesen acceso a sus datos (como se lo han cedido a la NSA), todavía podría predecir más cosas.

¿Qué os parece este tema del Big Data?. En mi mundo del Marketing es un tema de gran calado. Charlas, papers, … de todo. Si tenéis curiosidad podéis leer un post muy interesante al respecto : Qué es el Big Data y usos en el Marketing de Contenidos.

Espero que os haya gustado.

CC BY-SA 4.0 Esta obra está licenciada bajo una Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *