5. Calidoscopi

Lingüística i intel·ligència artificial: per què no?

min
Gemma Boleda

Gemma Boleda, professora d'investigació ICREA del Departament de Traducció i Ciències del Llenguatge i cap del Grup de Recerca COLT: Computational Linguistics and Linguistic Theory

Tot just començar la meva llicenciatura en Filologia Hispànica, el primer any, vaig descobrir la lingüística, i me'n vaig enamorar. Per fi havia trobat la meva vocació! Des de llavors, m'he dedicat a entendre com funciona el llenguatge. Cap a finals de la llicenciatura, vaig començar a virar cap a mètodes quantitatius i computacionals, i vaig acabar fent un doctorat en Lingüística Computacional, és a dir, a cavall entre la lingüística i la intel·ligència artificial.

El que em va atreure de la intel·ligència artificial va ser la possibilitat d'analitzar grans quantitats de dades, com ara els milions de textos que estan disponibles a internet. Extreure coneixement sistemàtic d'una quantitat tan gran de dades no es pot fer a mà; la intel·ligència artificial em va donar eines per fer-ho. En particular, aplico un mètode anomenat "aprenentatge automàtic" ("machine learning", en anglès), en què li dones a l'ordinador gran quantitat de dades i li demanes que n'extregui patrons que li permetin fer alguna tasca, com ara traduir un text de l'anglès al català. Perquè l'ordinador pugui fer una tasca tan complexa, ha d'adquirir molt de coneixement lingüístic; per tant, examinar el seu comportament pot ser molt il·luminador sobre com funciona el llenguatge. Aquesta metodologia s'ha utilitzat, per exemple, per investigar com les paraules expressen diferents significats en diferents contextos, o per determinar relacions genealògiques entre llengües.

La intel·ligència artificial, però, no només té un potencial immens per a l'estudi científic del llenguatge, sinó que també és la base de la tecnologia lingüística amb què interactuem diàriament: quan escrivim missatges al WhatsApp i ens suggereix paraules, quan utilitzem la correcció automàtica del Word, quan traduïm textos amb Google Translate, i un llarg etcètera.

La intel·ligència artificial, però, no només té un potencial immens per a l'estudi científic del llenguatge, sinó que també és la base de la tecnologia lingüística amb què interactuem diàriament: quan escrivim missatges al WhatsApp i ens suggereix paraules, quan utilitzem la correcció automàtica del Word, quan traduïm textos amb Google Translate, i un llarg etcètera.

Tant el desenvolupament de tecnologia lingüística com la recerca en lingüística computacional requereixen coneixements de lingüística i d'intel·ligència artificial; però, en el nostre sistema educatiu, és molt difícil cobrir els dos fronts. Per exemple, al màster en Lingüística Teòrica i Aplicada de la Universitat Pompeu Fabra, on faig docència, la meitat dels estudiants es volen especialitzar en lingüística computacional. El problema és que la majoria tenen una formació "de lletres", i la distància entre la formació que necessiten i la que han rebut fins al màster és immensa. Per això, tot i que estan motivadíssims, hauran d'invertir molt de temps i esforços addicionals per adquirir els coneixements "de ciències" que els calen. I això, al seu torn, dificulta que tot el coneixement que tenen sobre el llenguatge arribi a la tecnologia o a la recerca. És, clarament, una doble oportunitat perduda.

Aquest és un exemple (entre molts) dels problemes que causa la rígida divisió entre ciències i lletres al nostre sistema educatiu. Sovint es diu que la interdisciplinarietat és clau per a la societat del segle XXI, i, en el cas de la lingüística computacional, això és claríssim. Però, en canvi, el nostre sistema educatiu no només no encoratja la interdisciplinarietat, sinó que la impedeix activament. Per exemple, a mi, a l'institut m'agradaven les matemàtiques i la literatura; però als setze anys vaig haver de triar entre l'una i l'altra. Per als qui enguany trien batxillerat, trenta anys després, la situació és essencialment la mateixa. Cal flexibilitzar les estructures per permetre que les noves generacions puguin adquirir una formació interdisciplinària ja des de secundària; i cal que entre tots bastim ponts ben sòlids entre disciplines i mètodes que són complementaris. Per sort, som molts els qui estem aportant el nostre granet de sorra a la construcció d'aquests ponts.