Un método automático extrae el significado de los populares emoji
Un método automático extrae el significado de los populares emoji
Desarrollado por Francesco Barbieri, Francesco Ronzano y Horacio Saggion, investigadores del Grupo de Investigación en Tratamiento Automático del Lenguaje Natural que se presenta al Language Resource and Evaluation Conference 2016 (Eslovenia).
Francesco Barbieri, Francesco Ronzano y Horacio Saggion, investigadores del Grupo de Investigación en Tratamiento Automático del Lenguaje Natural (TALN) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF, han hecho un análisis automático de 10 millones de mensajes de Twitter publicados por usuarios estadounidenses y han desarrollado un método para caracterizar de manera automática el significado de los populares emoji. Un trabajo que presentarán como comunicación al Language Resource and Evaluation Conference 2016, que se celebrará del 23 al 28 de mayo en Portoroz (Eslovenia).
Caracteritzar el significado de los ideogramas
Con el análisis automático de 10 millones de mensajes de Twitter y el método ideado por los investigadores Saggion, Barbieri y Ronzano en el Grupo de Investigación TALN, se puede caracterizar de manera automática el significado de los emoji, con lo cual ahora se pueden comparar los ideogramas "semánticamente", es decir según su significado.
Por ejemplo, el método es capaz de discernir la proximidad semántica que puede haber entre los emoji y
, o entre los emojis
y
. Además, el modelo permite entender el significado de los emoji y propone las palabras que se encuentran más cerca de un ideograma concreto. Por ejemplo, el emoji
apunta hacia "soccer", "fútbol" "regionales", y así sucesivamente. Y al revés, el método desarrollado por estos investigadores, a partir de un determinado texto permite sugerir los ideogramas asociados más apropiados para complementar y enriquecer de manera gráfica su significado.
Los nuevos modelos desarrollados se han contrastado con experimentos de similitud semántica, "comparando los resultados de nuestros modelos con la evaluación humana, así como también llevando a cabo una evaluación cualitativa exhaustiva", manifiestan los autores del trabajo.
En definitiva, los emoticonos e ideogramas no son sólo un asunto de adolescentes en sus mensajes de texto, sino que se han posicionado como un tipo de expresión matizada que tiene la capacidad de traspasar las barreras idiomáticas.
Trabajo de referencia:
Francesco Barbieri, Francesco Ronzano and Horacio Saggion (2016), “What does this Emoji Mean? A Vector Space Skip-Gram Model for Twitter Emojis”, Language Resource and Evaluation Conference 2016, 23 - 28 de mayo, Portoroz (Eslovènia).