5. Calidoscopi

La recerca sobre IA i llenguatge encara té grans reptes, més enllà del potencial del ChatGPT

min
Horacio Saggion

Horacio Saggion,
Catedràtic d'Informàtica i Intel·ligència Artificial del Departament de Tecnologies de la Informació i les Comunicacions

En els darrers mesos, els portals de notícies i les xarxes socials han anat farcides de notícies sobre el ChatGPT, sistema entrenat per generar seqüències de paraules (o de codi font) a partir d’un context o d’un text que li serveixi com a estímul. 

En l'article científic que descriu aquesta tecnologia, es posa clarament de manifest que aquest sistema de generació de textos generalistes és capaç de millorar, amb escreix, els resultats dels seus predecessors en diverses tasques que requereixen l'ús del llenguatge (resumir textos, respondre preguntes, traduir un text…). Això es deu, d'una banda, a l'arquitectura computacional adoptada (l'arquitectura del deep learning de Google, Transformers, àmpliament adoptada per la comunitat científica), i, de l’altra, al gran nombre de paràmetres que compilen el coneixement sobre el llenguatge que el sistema ha adquirit i als quals s’ha entrenat amb milions de textos. A diferència d'altres sistemes, el model de llenguatge GPT-3, en què es basa el ChatGPT, és generalista i no està especialitzat en tasques específiques.

Si bé no es poden considerar proves formals de les capacitats del model, unes poques interaccions amb l'aplicació ChatGPT impressionen positivament a qualsevol. Els textos generats semblen coherents i gramaticalment correctes. El sistema surt airós també a l'hora de proposar solucions a un problema de programació simple. Encara va més enllà d’això, ja que sembla que no hi ha cap tema sobre el qual el ChatGPT no tingui res a dir. Per exemple, si se li consulta sobre temes com l'homosexualitat en l'esport, és capaç de donar informació fefaent sense matisos discriminatoris i, a més, parafrasejar les normatives existents sobre discriminació en l'esport. També és capaç de reconèixer alguns dels seus errors quan se’l qüestiona. 

Aquest sistema suposa grans avenços en l'àrea de la generació automàtica de textos, que durant molts anys va ser considerada la germana pobra del processament del llenguatge natural, i ara resulta que n’és la més rica

Aquest sistema suposa grans avenços en l'àrea de la generació automàtica de textos, que durant molts anys va ser considerada la germana pobra del processament del llenguatge natural, i ara resulta que n’és la més rica. Segons el meu parer, aquest no és un cas de molt soroll per a res, sinó de molt soroll per a una eina de gran potencial per a molts sectors de la societat, com les centenars de startups que estan aprofitant aquest nou sistema, com ha demostrat el recent Barcelona Mobile World Congress.

Això no obstant, el ChatGPT no és el final del camí de la recerca en processament de llenguatge natural. Hi ha moltíssimes àrees encara per explorar, en particular per  proveir solucions tecnològiques per a aquells idiomes dels quals no hi ha prou dades per  desenvolupar sistemes de processament del llenguatge natural (llengües de signes, llengües minoritàries…) o per a aplicacions que requereixen la producció d'informació fefaent i contrastada (documents científics, informes mèdics, documents legals d'alta complexitat…). La col·laboració home-màquina i la cura pels aspectes ètics serà fonamental en els propers anys. 

De la mateixa manera que ens hem acostumat a les calculadores electròniques, als robots en la indústria, a la tecnologia en la medicina, només per citar-ne alguns exemples, veurem aquests sistemes conversacionals avançats, ens sorprendrem de les seves capacitats i també ens queixarem dels seus errors; alhora que ens hi acostumarem.