Vés enrere L’Observatori de Neologia de la UPF posa en marxa el Garbell, una eina digital que avalua les paraules que no són al diccionari

L’Observatori de Neologia de la UPF posa en marxa el Garbell, una eina digital que avalua les paraules que no són al diccionari

El Garbell, desenvolupat a l’Observatori de Neologia de la UPF, en el marc del Programa de Recerca de l’Institut d’Estudis Catalans, analitza les paraules que no són al diccionari normatiu però que fem servir en el dia a dia i ens diu si són més o menys diccionaritzables. Aquesta eina tecnològica és la primera al món capaç de fer aquesta avaluació i podria inspirar eines semblants per a altres llengües. De moment ja funciona en obert per al català.

01.02.2023

Imatge inicial

Hiperactivitat, flipar, xarxa social, metavers, sostenibilitat, canvi climàtic, guacamole, parafarmàcia, sudoku, hip-hop o poliamor són exemples dels milers de paraules que fem servir en la nostra comunicació diària, formal o informal, i que no són al diccionari normatiu. Mentre la Secció Filològica de l’Institut d’Estudis Catalans va actualitzant aquest diccionari, el Garbell ens ajuda a saber si els mots que encara no hi són tenen una probabilitat més alta o més baixa d’aparèixer al diccionari en un futur. Serà l’IEC qui decidirà finalment quins mots hi entren i en quin moment, però l’Observatori de Neologia ha desenvolupat una eina que avalua aquesta probabilitat en funció de criteris relacionats amb l’ús, amb l’estructura de la llengua i amb altres aspectes lexicogràfics.

Per què el nom de Garbell?

Igual com tradicionalment el garbell ha servit per separar el gra de la palla, el Garbell de la UPF analitza els neologismes documentats durant els darrers anys en textos de premsa, de revistes, de ràdio i televisió i de xarxes socials, i els separa segons si són més o menys diccionaritzables, és a dir, si són més o menys aptes per entrar al diccionari. Per fer-ho, aquest programa aplica una vintena de criteris agrupats en blocs.

Judit Freixa, directora de l’Observatori de Neologia de la UPF: “hem volgut (...) centrar-nos en l’elaboració d’una eina innovadora, sostenible i, sobretot, útil, tant per als parlants, ajudant-los a valorar les paraules que utilitzen i que no són al diccionari, com per a l’IEC, aportant-los la nostra expertesa en neologia”

“Hem volgut fugir de la discussió sobre si l’IEC incorpora al diccionari massa paraules o massa poques i centrar-nos en l’elaboració d’una eina innovadora, sostenible i, sobretot, útil, tant per als parlants, ajudant-los a valorar les paraules que utilitzen i que no són al diccionari, com per a l’IEC, aportant-los la nostra expertesa en neologia”. Així ho resumeix Judit Freixa, directora de l’Observatori de Neologia i investigadora principal del projecte.

Com es pot consultar el Garbell?

Qualsevol pot accedir a la versió pública del Garbell (http://garbell.upf.edu/) i cercar-hi mots concrets o segments (que comenci per, que acabi en, que contingui). En aquest moment hi ha gairebé 10.000 unitats revisades, que es reparteixen força equitativament en tres categories: unitats diccionaritzables (marcades de color verd), prediccionaritzables (sense marca) i no diccionaritzables (marcades de color vermell). Així doncs, quan consultem una paraula se’ns mostra l’estat de diccionariabilitat i un resum del valor obtingut en cada bloc de criteris. A més, es pot veure el valor de cada criteri concret i també un diagrama amb la freqüència i l’estabilitat del mot al llarg dels anys.

Com s’ha desenvolupat el Garbell?

El Garbell ha estat desenvolupat per investigadores de l’Observatori de Neologia, del grup de recerca de IULATERM, de l’Institut de Lingüística Aplicada de la UPF.  Es tracta d’un projecte del Programa de Recerca de l’IEC.  L’equip, liderat per Judit Freixa, està format per especialistes en lexicografia, neologia i informàtica, i han treballat intensament en aquest projecte des de l’any 2018. En una primera etapa, l’equip de lingüistes ha treballat en la identificació dels criteris que es podrien aplicar automàticament, partint del NADIC (“Neologismes per al diccionari normatiu”), un projecte anterior desenvolupat pel mateix grup i amb la participació de la xarxa d’observatoris de neologia del territori català (NEOXOC) i també finançat per l’IEC.

En els criteris d’ús, el Garbell té en compte la freqüència del mot, l’antiguitat, l’estabilitat al llarg del temps i la distribució en diferents tipus de textos, entre altres criteris. Des del punt de vista lingüístic, el programa valora el tipus de neologisme, la regularitat de la formació i la variabilitat formal. I, a més, el valor final s’estableix tenint també en compte la presència del mot en altres diccionaris catalans o d’altres llengües romàniques. La vintena de criteris que s’apliquen no tenen el mateix valor ni s’apliquen linealment, sinó que el valor final de cada mot s’atribueix amb un algoritme especialment dissenyat per a aquest projecte i que es va ajustant a mesura que el programa va garbellant.

En aquesta primera fase de funcionament públic del Garbell, els resultats han estat revisats per l’equip de lingüistes, que encara hi treballa per anar augmentant la quantitat de neologismes que s’hi poden consultar.

En què és innovador el Garbell?

Judit Freixa (Observatori de Neologia de la UPF): “No coneixem cap eina que faci una tasca semblant a la del Garbell. No ens hem inspirat en cap eina coneguda. Hem estat innovadores simplement seguint el camí que ens permet la tecnologia i mirant de resoldre les necessitats lingüístiques del català”

“No coneixem cap eina que faci una tasca semblant a la del Garbell. No ens hem inspirat en cap eina coneguda. Hem estat innovadores simplement seguint el camí que ens permet la tecnologia i mirant de resoldre les necessitats lingüístiques del català”, afirma Judit Freixa.

De moment el Garbell treballa a partir de les dades del BOBNEO, la base de dades on l’Observatori de Neologia ha estat recollint els neologismes detectats en l’àmbit general des de l’any 1989. Però en la mesura que el programa incorpori estratègies d’intel·ligència artificial, podrà funcionar sense la base de dades ja recollides i analitzades i es podrà desenvolupar en altres llengües.

El més innovador d’aquesta eina és que va més enllà de la dicotomia entre correcte i incorrecte, i el que fa és separar les unitats en tres categories clarament diferenciades: són diccionaritzables els neologismes compleixen tots o la majoria dels requisits proposats pel Garbell, que ja tenen recorregut en l’ús social i que no mostren cap característica que pugui qüestionar-ne la sanció lexicogràfica. En canvi, són prediccionaritzables els neologismes que encara no tenen un recorregut suficient i que, alhora, no presenten cap característica que els impedeixi ser-ho en un futur proper. Finalment, són no diccionaritzables els neologismes que es troben a l’inici del recorregut (i, per tant, no compleixen el mínim de requisits) o que ja han avançat en aquest recorregut i ja han mostrat característiques que els fan candidats no adequats.

El Garbell ja ha estat presentat en diversos fòrums internacionals, com el CINEO, el Congrés de Neologia de les Llengües Romàniques (Gènova, 2 de setembre del 2022), i ha tingut molt bona acollida. També s’acaba de publicar a la revista Terminàlia un article on es presenta el funcionament i els resultats del Garbell.

Garbell, un diccionari complementari, progressiu i que orienta l’ús

En definitiva, el Garbell és també un recurs lingüístic que serveix com a diccionari complementari, descriptiu, progressiu i que orienta l’ús. És complementari, perquè recull precisament allò que no inclou el diccionari normatiu; progressiu, perquè situa els candidats a neologismes en diferents punts més o menys allunyats de la meta de poder ser incorporats al diccionari; i orienta l’ús, perquè informa també de les unitats excloses.

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

04. Educació de qualitat
Els ODS a la UPF

Contact

Per a més informació

Notícia publicada per:

Oficina de Comunicació