Descoberta una nova tècnica d'intel·ligència artificial amb el potencial de comprendre nous conceptes al mateix nivell que els humans
Descoberta una nova tècnica d'intel·ligència artificial amb el potencial de comprendre nous conceptes al mateix nivell que els humans
Descoberta una nova tècnica d'intel·ligència artificial amb el potencial de comprendre nous conceptes al mateix nivell que els humans
Investigadors de la Nova York University i la UPF han publicat recentment un article a la revista Nature, on exposen les característiques del model tècnic que han creat amb aquesta finalitat.
Les persones tenim la capacitat d'aprendre un concepte nou i, una vegada adquirit, comprendre els diferents contextos i expressions en què es fa servir. Per exemple, quan un nen o nena aprèn què significa “saltar”, també és capaç de comprendre immediatament què vol dir "saltar dues vegades al voltant de l'habitació" o "saltar amb les mans enlaire". Aquesta capacitat es denomina “generalització composicional”.
Investigadors de la Nova York University (NYU) i de la Universitat Pompeu Fabra (UPF) acaben de crear una tècnica pionera que té el potencial de desenvolupar la “generalització composicional” en els sistemes computacionals al mateix nivell que en els éssers humans o, en alguns casos, fins i tot a un nivell superior. Aquest descobriment, que pot servir per millorar les capacitats d'eines d'intel·ligència artificial generativa com el ChatGPT, s'exposa en un article publicat aquest dimecres 25 d’octubre per la revista Nature.
La tecnologia desenvolupada pels investigadors de la NYU i la UPF arriba després de prop de quatre dècades de treball de la comunitat científica per desenvolupar la capacitat de “generalització composicional” entre les màquines. A finals de la dècada de 1980, Jerry Fodor i Zenon Pylyshyn, filòsofs i científics cognitius, ja van plantejar que les xarxes neuronals artificials -els motors que impulsen la intel·ligència artificial i l'aprenentatge automàtic- no són capaços de fer aquestes connexions, conegudes com a "generalitzacions composicionals". Des de llavors, s'han desenvolupat diferents maneres d'incentivar aquesta capacitat en les xarxes neuronals i tecnologies afins, però amb resultats desiguals. Així doncs, avui dia, encara es manté viu el debat sobre com aconseguir-ho.
Brenden Lake (NYU): “Hem demostrat, per primera vegada, que una xarxa neuronal genèrica pot imitar o superar la generalització sistemàtica humana en una comparació cara a cara”
En aquest sentit, el descobriment publicat per la revista Nature és fonamental, tal com explica Brenden Lake, professor adjunt del Centre de Ciència de Dades i del Departament de Psicologia de la NYU i un dels autors de l'article: "Durant 35 anys, els investigadors de les ciències cognitives, la intel·ligència artificial, la lingüística i la filosofia han debatut si les xarxes neuronals poden aconseguir una generalització sistemàtica similar a la humana". "Hem demostrat, per primera vegada, que una xarxa neuronal genèrica pot imitar o superar la generalització sistemàtica humana en una comparació cara a cara”– afegeix Lake.
La nova tècnica, Meta-learning for Compositionality (MLC), parteix de mètodes d'entrenament diferents als de la majoria d'eines actuals d’IA
La tècnica desenvolupada pels investigadors es denomina Meta-learning for Compositionality (MLC). El MLC se centra en l'entrenament de xarxes tecnològiques neuronals per millorar la generalització composicional dels sistemes computacionals a través de la pràctica. Els creadors dels sistemes existents fins avui, inclosos els models lingüístics usats per tecnologies d’IA generativa, partien del supòsit que la “generalització composicional” de les tecnologies sorgiria a partir de mètodes d'entrenament estàndard, o bé havien desenvolupat arquitectures especials per aconseguir que les màquines adquirissin aquestes capacitats. En canvi, el MLC mostra que les màquines poden desenvolupar les habilitats de “generalització composicional” a partir de la pràctica explícita d'exercicis que l'ajudin a adquirir-la.
Marco Baroni (UPF): “creiem que el MLC pot millorar encara més les habilitats composicionals dels grans models lingüístics”
"Els grans models lingüístics com el de ChatGPT continuen tenint problemes amb la generalització composicional, encara que han millorat en els últims anys. Però creiem que el MLC pot millorar encara més les habilitats composicionals dels grans models lingüístics" - assegura Baroni, professor i investigador ICREA del Departament de Traducció i Ciències del Llenguatge (DTCL) de la UPF, en el qual forma part del grup Computational Linguistics and Linguistic Theory (COLT).
El MLC parteix d'un procediment d'aprenentatge innovador en què una xarxa neuronal s'actualitza contínuament per millorar les seves habilitats al llarg d'una sèrie de fases. En una fase, la tecnologia MLC rep una paraula nova i se li demana que la utilitzi en noves composicions. Per exemple, se li demana que prengui la paraula "saltar" i després creï noves combinacions com "saltar dues vegades" o "saltar dues vegades a la dreta". A continuació, el MLC rep, en una nova fase, una paraula diferent, i així successivament, millorant cada vegada les habilitats composicionals de la xarxa.
Per provar l'eficàcia del MLC, Brenden Lake (NYU) i Marco Baroni (UPF) han realitzat una sèrie d'experiments amb participants humans on els plantejaven tasques idèntiques a les realitzades pel sistema MLC. A més, en lloc d'aprendre el significat de paraules reals -termes que les persones ja coneixerien-, van haver d'aprendre el significat de termes sense sentit (per exemple, "zup" i "dax"), definits pels investigadors i aprendre a aplicar-los de diferents maneres. El rendiment del MLC va ser tan bo -i en alguns casos millor- com el dels participants humans. Tant el MLC com les persones també van superar el ChatGPT i el GPT-4, que, malgrat mostrar capacitats sorprenents en termes generals, van mostrar dificultats amb aquesta tasca d'aprenentatge vinculada a la “generalització composicional”.
Article de referència:
Lake, B.M., Baroni, M. Human-like systematic generalization through a meta-learning neural network. Nature (2023). https://doi.org/10.1038/s41586-023-06668-3