Vés enrere Ja és possible fer una predicció dels emojis que li corresponen a un text

Ja és possible fer una predicció dels emojis que li corresponen a un text

Gràcies a un model automàtic computacional elaborat per Francesco Barbieri i Horacio Saggion, membres del Grup de Recerca en Tractament Automàtic del Llenguatge Natural, i Miguel Ballesteros, investigador a IBM. L'han presentat al congrés EACL 2017, celebrat a Valencia del 3 al 7 d’abril. 

11.04.2017

 

Imatge de Francesco Barbieri: l'eix de les "x" mostra a l'esquerra els emojis més fàcils de predir i a la dreta els més difícils

Els emojis són ideogrames que, de forma natural, es combinen amb un text per complementar visualment o condensar el significat d'un missatge  Amb l'adveniment de les xarxes socials ha sorgit una nova forma de comunicació en què el significat bé donat per la combinació de missatges curts de text, acompanyats per icones que ajuden visualment a transmetre el missatge desitjat. Aquest llenguatge visual s’ha posicionat àmpliament i està abastament present a les xarxes socials més populars: Twitter, Facebook, WhatsApp o Instagram. És per això que els emojis, des del punt de vista lingüístic, han atret l’atenció dels que s’hi dediquen a l’estudi del processament del llenguatge natural.

Membres del laboratori que lidera Horacio Saggion al Grup de Recerca Tractament Automàtic del Llenguatge Natural (TALN) del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, han estat estudiant aquest fenomen lingüístic emergent i recentment han produït tota una sèrie de treballs sobre l’ús i les diferents interpretacions que els emojis adopten en diferents col·lectius i cultures, treballs que han esdevingut de referència sobre aquest tema.

L'ambigüitat que planteja l’ús dels emojis identificada pels mateixos autors en treballs anteriors va suscitar la qüestió de com es podria ensenyar a un agent artificial a interpretar i reconèixer l’ús d’aquests ideogrames. Un nou treball de Francesco Barbieri i Horacio Saggion, investigadors del Large Scale Text Understanding Systems Lab del grup de recerca TALN, del DTIC de la UPF, amb la col·laboració de Miguel Ballesteros, ara investigador a l’empresa nord-americana IBM, ha estat presentat al congrés EACL 2017 (European Chapter of the Association for Computational Linguistics) celebrat del 3 al 7 d’abril a València.

D’una mostra composta per 40 milions de missatges geolocalitzats extrets de Twitter, emesos entre octubre del 2015 i maig del 2016 als Estats Units, els autors han estudiat la relació entre les paraules i els emojis i mostren com mitjançant la intel·ligència artificial, d’un text es poden inferir i predir els emojis que evoca el contingut del seu missatge. És a dir, els resultats experimentals del treball indiquen que disposen d’un bon model computacional capaç de captar millor que els humans la semàntica subjacent dels emojis i per tant, capaç de captar el significat i fer prediccions dels ideogrames que evoca un determinat missatge.

Com manifesten els seus autors, “En aquest treball, proporcionem una arquitectura neuronal que modela la semàntica dels emojis i l'exploració de la relació entre les paraules i els ideogrames, amb la qual cosa proposem per primera vegada un robust mètode automàtic de predicció”.

Treball de referència:

Francesco Barbieri, Miguel Ballesteros, Horacio Saggion (2017), “Are emojis predictable?”, EACL 2017.

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

Els ODS a la UPF

Contact