Vés enrere Un mètode automàtic extrau el significat dels populars emojis

Un mètode automàtic extrau el significat dels populars emojis

Desenvolupat per Francesco Barbieri, Francesco Ronzano i Horacio Saggion, investigadors del Grup de Recerca en Tractament Automàtic del Llenguatge Natural que es presenta al Language Resource and Evaluation Conference 2016 (Eslovènia).

20.04.2016

 

Francesco Barbieri, Francesco Ronzano i Horacio Saggion, investigadors del Grup de Recerca en Tractament Automàtic del Llenguatge Natural (TALN) del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, han fet una anàlisi automàtica de 10 milions de missatges de Twitter publicats per usuaris nord-americans i han desenvolupat un mètode per caracteritzar de manera automàtica el significat dels populars emojis. Un treball que presentaran com a comunicació al Language Resource and Evaluation Conference 2016, que se celebrarà del 23 al 28 de maig a Portoroz (Eslovènia).

En els darrers temps, els emojis o ideogrames d’origen japonès s’han popularitzat enormement i han estat publicats abastament en comunicació per web. Inclouen tot un univers de significats que va més enllà de les tradicionals emoticones o símbols gràfics emprats per transmetre estats d’ànim formats habitualment a partir de caràcters ASCII. Els emojis ens permeten descriure objectes, situacions i sentiments fins i tot amb petites imatges, proporcionant una forma visual i ràpida de comunicar-se. D’aquí que els emojis els trobem a les aplicacions dels telèfons intel·ligents, en la misstageria instantània, les xarxes socials, els social media, en els populars Twitter, Facebook, Whatsapp, etc.

Caracteritzar el significat dels ideogrames

Amb l’anàlisi automàtica de 10 milions de missatges de Twitter i el mètode ideat pels investigadors Saggion, Barbieri i Ronzano en el Grup de Recerca TALN es pot caracteritzar de manera automàtica el significat dels emojis,  amb la qual cosa ara es poden comparar els ideogrames “semànticament”, és a dir segons el seu significat.

Per exemple, el mètode és capaç de discernir la proximitat semàntica que hi pot haver entre els emojis heart i heart , o entre els emojis  i

A més a més, el model permet entendre el significat dels emojis i proposa les paraules que es troben més a prop d’un ideograma concret. Per exemple, l’emoji  apunta cap a “soccer”, “futbol” “regionals”, i així successivament. I a l’inrevés,  el mètode desenvolupat per aquests investigadors, a partir d’un determinat text permet suggerir els ideogrames associats més apropiats per complementar i enriquir de manera gràfica el seu significat.

Els nous models desenvolupats s’han contrastat amb experiments de similitud semàntica, “comparant els resultats dels nostres models amb l'avaluació humana, així com també duent a terme una avaluació qualitativa exhaustiva”, han manifestat els autors del treball.

En definitiva, les emoticones i els ideogrames no són només un assumpte d’adolescents en els seus missatges de text, sinó que s’han posicionat com un tipus d’expressió matisada que té la capacitat de traspassar les barreres idiomàtiques.

Treball de referència:

Francesco Barbieri, Francesco Ronzano and Horacio Saggion (2016),  “What does this Emoji Mean? A Vector Space Skip-Gram Model for Twitter Emojis”, Language Resource and Evaluation Conference 2016, 23 - 28 de maig, Portoroz (Eslovènia). 

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

Els ODS a la UPF

Contact