El principal enemigo de los algoritmos es… el sarcasmo

El uso del análisis de datos en las elecciones presidenciales de Estados Unidos se complica porque los ordenadores no están del todo preparados para reconocer los tweets y entradas de Facebook más irónicos.

Hoy en día, el análisis de datos se utiliza en muchísimos campos distintos. La popularización de las redes sociales y los avances en los métodos de recolección de información se han combinado para que sólo haya que programar unos algoritmos que reconozcan el tema de interés y clasifiquen lo que sobre él se está escribiendo. De este modo se pueden extraer valiosas conclusiones que emplear, entre otras cosas, como herramientas para un marketing mucho más directo. Pero el ser humano no siempre se puede clasificar bajo unos sencillos parámetros.

¿Qué pasa cuando un ordenador se encuentra con uno de esos usuarios de twitter, el reinado del más ingenioso, que hacen del sarcasmo su principal enseña? Este es el problema de los analistas que están ahora preparando el terreno para las elecciones presidenciales del año que viene en Estados Unidos, como cuenta Reuters. Ahora que se trata de identificiar audiencias cada vez más segmentadas en base a sus opiniones en las redes sociales, el uso de sarcasmos e ironías puede llevar a confusiones que vuelvan inservibles, o poco efectivos, los dólares invertidos en la campaña. Y eso que, como se recuerda en el artículo de la agencia de noticias, las firmas de análisis de datos insisten que son una de las ayudas más importantes a la hora de invertir el dinero de la forma más eficiente.

En un momento en que los candidatos en Estados Unidos buscan a sus votantes a través de micro nichos, analizando lo que se escribe sobre temas muy concretos para hacerles llegar anuncios con sus propuestas, esto puede suponer un gran problema.

Por eso los analistas estadounidenses están al acecho de las convenciones usadas en redes sociales para poder definir mejor el mercado de cada partido. Se está intentando introducir combinaciones que les permiten saber cuando un usuario habla en serio o cuando está siendo sarcástico. Lo explica para Reuters un experto de la firma de análisis HaystaqDNA, con la que contó Obama en 2008, con un curioso ejemplo. Si se busca sólo la palabra “classy” (que quiere decir con estilo) en twitter, en un 72% de las veces se usa con un significado positivo. Sin embargo, si se relaciona con el (posible) candidato republicano Donald Trump, es en tres cuartas partes de los casos con un sentido negativo.

En la batalla del algoritmo contra el sarcasmo, el humano desempeña un papel clave. En las firmas de análisis de datos, los mensajes son clasificados automáticamente, pero hay categorías en las que se engloba los menos claros para las máquinas, para que un técnico los revise después. Es ahí cuando los analistas deben identificar el sentido y aportar nuevas claves para la automatización del proceso de recogida. Un constante proceso de renovación para que los políticos estadounidenses lleguen a sus votantes sin ningún margen de error.