Atrás Un método automático extrae el significado de los populares emoji

Un método automático extrae el significado de los populares emoji

Desarrollado por Francesco Barbieri, Francesco Ronzano y Horacio Saggion,  investigadores del Grupo de Investigación en Tratamiento Automático del Lenguaje Natural que se presenta al Language Resource and Evaluation Conference 2016 (Eslovenia).

20.04.2016

 

Francesco Barbieri, Francesco Ronzano y Horacio Saggion, investigadores del Grupo de Investigación en Tratamiento Automático del Lenguaje Natural (TALN) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF, han hecho un análisis automático de 10 millones de mensajes de Twitter publicados por usuarios estadounidenses y han desarrollado un método para caracterizar de manera automática el significado de los populares emoji. Un trabajo que presentarán como comunicación al Language Resource and Evaluation Conference 2016, que se celebrará del 23 al 28 de mayo en Portoroz (Eslovenia).

En los últimos tiempos, los emoji o ideogramas de origen japonés se han popularizado enormemente y han sido publicados ampliamente en comunicación por web. Incluyen todo un universo de significados que va más allá de las tradicionales emoticonos o símbolos gráficos utilizados para transmitir estados de ánimo formados habitualmente a partir de caracteres ASCII. Los emoji nos permiten describir objetos, situaciones y sentimientos incluso con pequeñas imágenes, proporcionando una forma visual y rápida de comunicarse. De aquí que los emoji los encontremos en las aplicaciones de los teléfonos inteligentes, en la mensajería instantánea, en las redes sociales, los social media, en los populares Twitter, Facebook, Whatsapp, etc.
 

Caracteritzar el significado de los ideogramas

Con el análisis automático de 10 millones de mensajes de Twitter y el método ideado por los investigadores Saggion, Barbieri y Ronzano en el Grupo de Investigación TALN,  se puede caracterizar de manera automática el significado de los emoji, con lo cual ahora se pueden comparar los ideogramas "semánticamente", es decir según su significado.

Por ejemplo, el método es capaz de discernir la proximidad semántica que puede haber entre los emoji  heart y heart , o entre los emojis   y Además, el modelo permite entender el significado de los emoji y propone las palabras que se encuentran más cerca de un ideograma concreto. Por ejemplo, el emoji   apunta hacia "soccer", "fútbol" "regionales", y así sucesivamente. Y al revés, el método desarrollado por estos investigadores, a partir de un determinado texto permite sugerir los ideogramas asociados más apropiados para complementar y enriquecer de manera gráfica su significado.

Los nuevos modelos desarrollados se han contrastado con experimentos de similitud semántica, "comparando los resultados de nuestros modelos con la evaluación humana, así como también llevando a cabo una evaluación cualitativa exhaustiva", manifiestan los autores del trabajo.

En definitiva, los emoticonos e ideogramas no son sólo un asunto de adolescentes en sus mensajes de texto, sino que se han posicionado como un tipo de expresión matizada que tiene la capacidad de traspasar las barreras idiomáticas.

Trabajo de referencia:

Francesco Barbieri, Francesco Ronzano and Horacio Saggion (2016),  “What does this Emoji Mean? A Vector Space Skip-Gram Model for Twitter Emojis”, Language Resource and Evaluation Conference 2016, 23 - 28 de mayo, Portoroz (Eslovènia). 

Multimedia

Categorías:

ODS - Objetivos de desarrollo sostenible:

Els ODS a la UPF

Contact