Vés enrere Neurocientífics de la UPF desenvolupen una nova teoria per programar robots amb IA generativa amb un comportament més semblant a l'humà

Neurocientífics de la UPF desenvolupen una nova teoria per programar robots amb IA generativa amb un comportament més semblant a l'humà

El desenvolupament de robots cada cop més semblants als humans pot tenir aplicacions en múltiples camps (mobilitat, salut, educació…). Segons el nou principi neurocientífic, les persones i els robots amb xarxes neuronals artificials que intenten emular les humanes no actuen per maximitzar les seves recompenses, sinó per experimentar el màxim d'estats possibles.

12.09.2024

Imatge inicial

Neurocientífics de la UPF han desenvolupat un nou principi de comportament, que pot suposar un gran avenç per desenvolupar agents virtuals que es comportin cada cop de forma més semblant als humans i siguin capaços d'interactuar amb les persones per ajudar-les a satisfer les seves necessitats en múltiples camps (educació, salut, mobilitat…). Aquests agents virtuals es desenvolupen a partir de models d'intel·ligència artificial (IA) generativa, el vessant més conegut dels quals són les aplicacions generadores de text, vídeo o àudio, però que també s'està utilitzant per reproduir el comportament humà.

Perquè els agents virtuals siguin cada cop més semblants a les persones, és fonamental determinar quin paradigma s'ajusta millor a la conducta humana i tenir-ho en compte per dissenyar els algorismes i els sistemes de Deep learning amb xarxes neuronals artificials amb què es creen aquests robots. En aquest sentit, un grup d'investigadors del Center for Brain and Cognition (CBC) de la UPF ha elaborat un nou paradigma en neurociència sobre el comportament humà que desafia la teoria majoritària fins al moment, segons la qual les persones actuen per maximitzar les recompenses externes. Han definit el nou Principi d'Ocupació Màxima (MOP per les sigles en anglès), segons el qual les persones tenen motivacions intrínseques que les porten a ocupar el màxim d'espais possibles i a experimentar el major nombre d'estats. Les recompenses externes (menjar, diners…) serien un mitjà per poder continuar vivint noves experiències, no un objectiu per si mateix.

L´equip de la UPF ha demostrat el nou principi de comportament amb un agent virtual amb xarxes neuronals artificials

Tot i que el MOP presenta paral·lelismes amb paradigmes ja teoritzats en psicologia o estudis de conducta, aquesta és la primera vegada que es demostra en el camp de la neurociència, a partir d'agents virtuals amb xarxes neuronals artificials basades en l'estructura del cervell humà. De fet, l'equip de recerca ha posat a prova i demostrat aquest nou paradigma en neurociència amb un agent virtual, els algorismes del qual li permetien fer el que volgués, en funció de les reaccions de les seves xarxes neuronals artificials als estímuls de l'entorn, excepte pels límits marcats pels tradicionals principis de la robòtica d'Isaac Asimov (que fonamentalment prohibeixen que els robots puguin danyar els éssers humans).

Els investigadors, del grup de Neurociència Teòrica i Cognitiva (TCN) del CBC de la UPF, han examinat la conducta d'aquest agent virtual en diversos entorns virtuals on se li presentaven diversos estímuls (objectes, joguines…). Aquest estudi, divulgat recentment a la revista Nature Communications, els ha permès constatar que l'agent no actuava per maximitzar les seves recompenses, sinó que fonamentalment experimentava, provant el major nombre d'accions i estats possibles (saltar, fer tombarelles, ballar de diferents maneres, tocar i fer servir els objectes o joguines virtuals de diferents formes…). També es desplaçava al màxim de llocs possibles en funció de les condicions i les limitacions de l'entorn.

Un principi que explica la curiositat humana

Més enllà del món de la robòtica, els investigadors defensen que el MOP dona una explicació més racional i plausible a la curiositat i la variabilitat del comportament humà, en funció de les condicions del context. Aquest model de comportament es posa clarament de manifest amb la conducta dels nadons, ja que durant els primers mesos de vida no deixen d'explorar constantment el seu entorn, moure el seu cos de diferents maneres, balbucejar per provar diferents sons… Aquesta curiositat i capacitat de exploració és fonamental per al procés de desenvolupament i aprenentatge.

En el cas dels adults, aquest afany per explorar i provar noves experiències continua existint. Però, atès els condicionants del context social i econòmic del món en què vivim, les persones adultes comprendrien que necessiten mitjans, recursos i energia (feina, diners, menjar…) per poder seguir provant noves experiències o viatjar a diferents llocs.

Rubén Moreno-Bote (UPF): "el Principi d'Ocupació Màxima constitueix un avenç rellevant per millorar els models d'IA generativa del comportament humà, el potencial de futur dels quals és enorme en múltiples camps"

Així doncs, si aquest nou principi neurocientífic explica millor el comportament humà, també hauria de servir per dissenyar agents virtuals que reprodueixin millor la seva conducta. Per a Rubén Moreno-Bote, director del grup de recerca en Neurociència Teòrica i Cognitiva (TCN) del CBC de la UPF, “el Principi d'Ocupació Màxima constitueix un avenç rellevant per millorar els models d'IA generativa del comportament humà, el potencial de futur dels quals és enorme en múltiples camps”. En el futur, els agents no només podran interactuar amb una persona per identificar i satisfer les necessitats concretes (per moure's, aprendre, fer exercici físic, organitzar l'economia domèstica…), sinó que també poden servir per fer experiments sociològics. Per exemple, es podrien agrupar diversos agents virtuals en un context concret per analitzar si col·laborarien, competirien, etc. Així doncs, també pot tenir aplicacions en el camp de la sociologia o l'economia, entre d'altres disciplines.

Article de referència:

Ramírez-Ruiz, J., Grytskyy, D., Mastrogiuseppe, C. et al. Complex behavior from intrinsic motivation to occupy future action-state path space. Nat Commun 15, 6368 (2024). https://doi.org/10.1038/s41467-024-49711-1

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

09. Indústria, innovació i infraestructures
Els ODS a la UPF

Contact

Per a més informació

Notícia publicada per:

Oficina de Comunicació