Atrás Descifrando la ironía y la semántica de los emoticonos

Descifrando la ironía y la semántica de los emoticonos

Es la línea de investigación en la que ha trabajado Francesco Barbieri para su tesis doctoral, bajo la supervisión de Horacio Saggion y que se ha considerado la mejor tesis doctoral en el 35º congreso de Sociedad Española de Procesamiento del Lenguaje Natural 2019, celebrado del 24 al 27 de septiembre en la Universidad del País Vasco.

01.10.2019

Imatge inicial

La tesis Machine Learning Methods for Understanding Social Media Communication:  Modeling Irony and Emojis  que defendió Francesco Barbieri el 25 de enero del 2018 en la Universidad Pompeu Fabra, estudia desde una perspectiva computacional dos fenómenos importantes para entender la comunicación en la red social Twitter: la detección de ironía y la comprensión de los emoticonos o emojis. La tesis fue dirigida por Horacio Saggion, coordinador del Large Scale Text Understanding Systems Lab y miembro del Grupo de Investigación en Tratamiento del Lenguaje Natural (TALN) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) de la UPF.

Basándose en métodos de aprendizaje automático y de inteligencia artificial, la tesis propone sistemas de clasificación para la identificación de lenguaje figurado como la ironía. Ganó el premio como mejor tesis doctoral, en el 35º congreso de Sociedad Española de Procesamiento del Lenguaje Natural, celebrado del 24 al 27 de septiembre del 2019 en la Universidad del País Vasco.

Propusimos nuevos sistemas automáticos, basados ​​en algoritmos de aprendizaje automático, capaces de reconocer e interpretar estos dos fenómenos: ironía y emoticonos

Como explican Saggion y Barbieri: “propusimos nuevos sistemas automáticos, basados ​​en algoritmos de aprendizaje automático, capaces de reconocer e interpretar estos dos fenómenos. La detección de ironía se abordó como un problema de clasificación binaria, donde, dado un tweet, la tarea fue reconocer si el tweet era irónico o no. Para resolver esta tarea, propusimos un enfoque de aprendizaje automático en el que un tweet se representa con varias características calculadas según su longitud y número de palabras”

Pudimos reconocer automáticamente si un tweet pertenecía a una cuenta de Twitter satírica o no satírica

“También probamos nuestro enfoque de detección de ironía para reconocer si una publicación de noticias en Twitter era satírica o real, y en varios idiomas: inglés, español e italiano, y obtuvimos resultados significativos. Pudimos reconocer automáticamente si un tweet pertenecía a una cuenta de Twitter satírica o no satírica”, añade Barbieri.

Además, la tesis propone, utilizando métodos de semántica distribucional, un modelo para estudiar la semántica de los emojis.  Para ello Barbieri ha explorado si el significado y el uso de los emojis varían de un idioma a otro y de qué manera, así como también si esta variación se ve afectada según sea la época del año (primavera, verano, otoño e invierno). “Para ello, utilizamos modelos semánticos distribucionales para representar el significado de los emojis en cada idioma, ubicación y estación, respectivamente”, comenta su autor.

El significado de los emojis puede variar según idioma y época del año

Los resultados ponen de manifiesto que algunos emojis tienen diferentes significados en diferentes países o épocas del año. Como indica Barbieri, esto está en línea con muchos hallazgos anteriores que sugerían que los emojis se usan de una manera muy subjetiva y que los interpretamos de manera diferente.

Por ejemplo, el emoji del trébol se usa en un contexto de amistad y de amor en España, mientras que en otros países se usa principalmente en relación con la suerte y el símbolo de Irlanda

“Nuestros resultados sugieren que incluso aunque la semántica general del emoji sea similar en diferentes idiomas, hemos podido identificar algunos emojis que no se usan de la misma manera de un idioma a otro”, este hecho podría estar relacionado con las diferencias culturales que existen entre países, indica.

Por ejemplo, el emoticón del trébol  ? se usa en un contexto de amistad y de amor en España, mientras que en otros países se usa principalmente en relación con la suerte y el símbolo de Irlanda. En cuanto a variaciones del significado según las estaciones, “descubrimos que incluso aunque la mayoría de los emojis conservan su semántica, se identifican diferencias específicas. Dos ejemplos son los emojis de regalo ? y de pino ?, que en invierno se usan como emojis relacionados con la Navidad pero que en primavera y en verano se usan para señalar un regalo de cumpleaños y un árbol, respectivamente”.

Este trabajo de investigación podría ser útil en futuros estudios para comprender el lenguaje de las redes sociales. “En el futuro, estamos planeando realizar análisis más extensos para detectar e interpretar automáticamente las diferencias más finas en la semántica de los emojis”, comenta Barbieri.

Detectar cambios en la semántica a tiempo real según eventos y tendencias sociales; investigar a fondo el significado compositivo de los emojis, o predecir los emoticonos más probables a aplicar a un texto, son algunas de los temas a desarrollar de esta línea de investigación. “Esta no es una tarea fácil, ya que hemos visto que los emojis se usan de una manera muy subjetiva, y todos los usamos de manera diferente”, concluye Barbieri.

Trabajo de referencia:

Francesco Barbieri (2018), Machine Learning Methods for Understanding Social Media Communication:  Modeling Irony and Emojis,  tesis doctoral dirigida por Horacio Saggion, defendida el 25 de enero en la Universidad Pompeu Fabra. Mejor tesis doctoral según la Sociedad Española para el Procesamiento del Lenguaje Natural 2019. Publicada en el repositorio TDX.

Multimedia

Perfiles de los protagonistas:

Horacio Saggion

Categorías:

ODS - Objetivos de desarrollo sostenible:

Els ODS a la UPF

Contact

Para más información

Noticia publicada por:

Oficina de Comunicación