Atrás

Ya es posible hacer una predicción de los Emoji que le corresponden a un texto

Ya es posible hacer una predicción de los Emoji que le corresponden a un texto

Gracias a un modelo automático computacional elaborado por Francesco Barbieri y Horacio Saggion, miembros del Grupo de Investigación en Tratamiento Automático del Lenguaje Natural, y Miguel Ballesteros, investigador en IBM. Lo han presentado en el congreso EACL 2017, celebrado en Valencia del 3 al 7 de abril.

11.04.2017
Imatge de Francesco Barbieri: l'eix de les "x" mostra a l'esquerra els emojis més fàcils de predir i a la dreta els més difícils

Los Emoji son ideogramas que, de forma natural, se combinan con un texto para complementar visualmente o condensar el significado de un mensaje Con el advenimiento de las redes sociales ha surgido una nueva forma de comunicación en la que el significado viene dado por la combinación de mensajes cortos de texto, acompañados por iconos que ayudan visualmente a transmitir el mensaje deseado. Este lenguaje visual se ha posicionado ampliamente y está abastecimiento presente en las redes sociales más populares: Twitter, Facebook, WhatsApp o Instagram. Es por eso que los Emoji, desde el punto de vista lingüístico, han atraído la atención de los que se dedican al estudio del procesamiento del lenguaje natural.

Miembros del laboratorio que lidera Horacio Saggion al Grupo de Investigación Tratamiento Automático del Lenguaje Natural (TALN) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF, han estado estudiando este fenómeno lingüístico emergente y recientemente han producido toda una serie de trabajos sobre el uso y las diferentes interpretaciones que los Emoji adoptan en diferentes colectivos y culturas, trabajos que se han convertido de referencia sobre este tema.
 
La ambigüedad que plantea el uso de los Emoji identificada por los mismos autores en trabajos anteriores suscitó la cuestión de cómo se podría enseñar a un agente artificial interpretar y reconocer el uso de estos ideogramas. Un nuevo trabajo de Francesco Barbieri y Horacio Saggion, investigadores del Large Scale Texto Understanding Systems Lab del grupo de investigación TALN, del DTIC de la UPF, con la colaboración de Miguel Ballesteros, ahora investigador en la empresa estadounidense IBM, ha sido presentado en el congreso EACL 2017 (European Chapter of the Association for Computational Linguistics) celebrado del 3 al 7 de abril en Valencia.
 
De una muestra compuesta por 40 millones de mensajes geolocalizados extraídos de Twitter, emitidos entre octubre de 2015 y mayo de 2016 en Estados Unidos, los autores han estudiado la relación entre las palabras y los Emoji y muestran cómo mediante la inteligencia artificial, de un texto se pueden inferir y predecir los Emoji que evoca el contenido de su mensaje. Es decir, los resultados experimentales del trabajo indican que disponen de un buen modelo computacional capaz de captar mejor que los humanos la semántica subyacente Emoji y por tanto, capaz de captar el significado y hacer predicciones de los ideogramas que evoca un determinado mensaje.
 
Como manifiestan sus autores, "En este trabajo, proporcionamos una arquitectura neuronal que modela la semántica de los Emoji y la exploración de la relación entre las palabras y los ideogramas, con lo cual proponemos por primera vez un robusto método automático de predicción" .
 
Trabajo de referencia: 
 
Francesco Barbieri, Miguel Ballesteros, Horacio Saggion (2017), "Are Emoji predictable?", EACL 2017.

Categorías: