Vés enrere Crear un nou model d’IA que interpreti millor el significat de les paraules en cada context, objectiu d’un projecte de recerca de la UPF

Crear un nou model d’IA que interpreti millor el significat de les paraules en cada context, objectiu d’un projecte de recerca de la UPF

A dia d’avui, les eines d’intel·ligència artificial encara no són capaces de comprendre amb precisió la intenció amb què cada persona fa servir determinades paraules o expressions en un context específic. Aquest és el repte que ha motivat el projecte LIFE (Learning Intentions Following Evolution) del grup de recerca  COLT (Computational Linguistics and Linguistic Theory) del Departament de Traducció i Ciències del Llenguatge de la UPF.

14.09.2023

Imatge inicial

En els últims temps, l’evolució de la intel·ligència artificial ha fet possible la creació de diferents eines tecnològiques per generar continguts textuals o audiovisuals en diferents llengües, en base a les indicacions facilitades per un interlocutor humà. Però, a dia d’avui, aquestes tecnologies encara no han desenvolupat suficientment la seva capacitat per  comprendre la intenció amb què les persones fan servir certes paraules o expressions en una situació específica.

Aquest és el repte que ha motivat el projecte de recerca europeu LIFE (Learning Intentions Following Evolution) de la UPF, que vol perfeccionar les actuals tecnologies d’intel·ligència artificial (IA) basades en l’aprenentatge automàtic, per avançar en la comprensió genuïna del llenguatge natural de l’ésser humà, a partir d’una millor interpretació dels contextos comunicatius. El projecte, que s’ha iniciat aquest mes de setembre i tindrà dos anys de durada, està finançat per una beca Marie Sklodowska-Curie, finançada per la Comissió Europea en el marc del programa Horizon de la UE.

Un model basat en l’aprenentatge continuat, a diferència de la majoria de models d’aprenentatge automàtics actuals, entrenats d’un sol cop

L’objectiu és desenvolupar un model de procés evolutiu obert, que sigui capaç d’aprendre de forma progressiva i continuada a partir de l’experiència, a diferència de la majoria de models d’aprenentatge automàtics actuals, entrenats d’un sol cop, a partir de dades d’un període de temps determinat.  El model computacional formularia hipòtesis sobre les diferents intencions amb què es pot servir una expressió en un context concret, que anirà corroborant o descartant a partir de l’observació de la realitat.

El desenvolupament d’aquest model anirà a corre a càrrec del grup de recerca COLT (Computational Linguistics and Linguistic Theory) del Departament de Traducció i Ciències del Llenguatge de la UPF, amb una llarga experiència i reconeixement en l’àmbit de la lingüística computacional. L’investigador principal del projecte és Germán Kruszewski, del grup de recerca COLT. Kruszewski  és investigador postdoctoral en aquest grup de recerca, codirigit per Gemma Boleda, que també participarà en aquest projecte. LIFE comptarà amb el suport del Santa Fe Institute (Nou Mèxic), especialitzat en  ciència de la complexitat, amb què es volen trobar mecanismes comuns per analitzar la complexitat de qualsevol sistema en què interactuen molts agents, que s’adapten els uns als altres i als seus entorns (físics, biològics, socials, comunicatius, tecnològics...).

Germán Kruszewski, investigador principal del projecte LIFE: “Aquest model computacional formularà noves hipòtesis sobre el significat de les paraules en un context determinat i només aquelles que resultin útils en la comunicació es reproduiran”

Per comprendre les característiques del model plantejat, es podria fer una comparació amb el procés de l’evolució natural. “De la mateixa manera que les espècies generen adaptacions noves, que es posen a prova mitjançant el seu èxit reproductiu, aquest model computacional formularà noves hipòtesis sobre el significat de les paraules en un context determinat i només aquelles que resultin útils en la comunicació es reproduiran, cosa que permetrà que es reutilitzin en el futur” -explica Germán Kruszewski. L’investigador principal resumeix així els objectius del projecte: investigar les condicions amb què un sistema és capaç de seguir un procés evolutiu que generi novetats de forma continuada, dissenyar i implementar un sistema d’aprenentatge per reforç que guiï el procés evolutiu i investigar les aplicacions d'aquest sistema d'aprenentatge automàtic en situacions que requereixin inferir el significat d'expressions lingüístiques en contextos específics.

Un sistema d’aprenentatge per reforç: la màquina rebrà recompenses si la seva hipòtesi sobre el significat social d’una paraula és correcta

El projecte es basarà en el model d’aprenentatge per reforç, en què les màquines reben una resposta positiva (reforç o recompensa) o negativa per part d’interlocutors humans, en funció de si estan interpretant o no correctament el significat social d’una paraula. En base a aquest aprenentatge progressiu, el sistema anirà mutant els seus algoritmes per maximitzar la probabilitat de trobar conceptes útils per interpretar el significat social de les paraules. Així per exemple, aquest sistema d’aprenentatge per reforç permetria que les màquines poguessin aprendre que els missatges sexistes, racistes o, en general, discriminatoris no són adequats, per la reacció negativa dels seus interlocutors.

El sistema es testejarà amb el denominat repte de Hanabi, a partir d’un joc de cartes. L'objectiu és crear piles ordenades de cartes del mateix color. A cada torn, els jugadors han de decidir si posen la carta del següent número en algunes de les piles o bé deixar passar el seu torn. Cada agent coneix les cartes dels altres agents, però no coneix les seves. Per resoldre el joc amb èxit, els diferents agents poden donar consells a d’altres jugadors sobre les cartes que tenen, però el nombre de les pistes que poden donar són limitades i referir-se a una única característica. La clau és que els agents comprenguin per què i amb quina intenció un altre jugador dona una pista específica.

Potencials aplicacions de futur

L’objectiu és que el posterior desenvolupament d’aquest model computacional pugui contribuir a millorar els sistemes d’IA que processen el llenguatge natural, perquè siguin més eficients i adequats a les necessitats de les persones. Com que el sistema proposat no requereix de grans bases de dades inicials per desenvolupar noves eines d’IA, en aprendre sobre la marxa, podria facilitar l’arrencada o desbloquejar nous projectes en aquest àmbit. A llarg termini, la línia de recerca endegada per aquest projecte podria permetre que els humans poguessin programar ordinadors amb llenguatge natural i no exclusivament amb els codis propis de la programació com fins ara.

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

09. Indústria, innovació i infraestructures
Els ODS a la UPF

Contact

Per a més informació

Notícia publicada per:

Oficina de Comunicació