Atrás El Observatorio de Neología de la UPF pone en marcha el Garbell, una herramienta digital que evalúa las palabras que no están en el diccionario

El Observatorio de Neología de la UPF pone en marcha el Garbell, una herramienta digital que evalúa las palabras que no están en el diccionario

El Garbell, desarrollado en el Observatorio de Neología de la UPF, en el marco del Programa de Investigación del Institut d'Estudis Catalans, analiza las palabras que no están en el diccionario normativo pero que usamos en el día a día y nos dice si son más o menos diccionarizables. Esta herramienta tecnológica es la primera en el mundo capaz de hacer esta evaluación y podría inspirar a herramientas parecidas para otras lenguas. De momento ya funciona en abierto para el catalán.

01.02.2023

Imatge inicial

Hiperactivitat, flipar, xarxa social, metavers, sostenibilitat, canvi climàtic, guacamole, parafarmàcia, sudoku, hip-hop o poliamor son ejemplos de las miles de palabras que se usan en la comunicación diaria, formal o informal en catalán y que no están en el diccionario normativo de lengua catalana. Mientras la Sección Filológica del Institut d’Estudis Catalans va actualizando este diccionario, el Garbell nos ayuda a saber si las palabras que todavía no están en el diccionario tienen una probabilidad más alta o más baja de aparecer en él en un futuro. Será el IEC quien decidirá finalmente qué palabras entran y en qué momento, pero el Observatorio de Neología ha desarrollado una herramienta que evalúa esta probabilidad en función de criterios relacionados con el uso, con la estructura de la lengua y con otros aspectos lexicográficos.

¿Por qué el nombre de Garbell?

Garbell es la palabra catalana con la que tradicionalmente se ha denominado el utensilio para separar el grano de la paja. De la misma manera que este utensilio, el Garbell de la UPF analiza los neologismos documentados durante los últimos años en textos de prensa, de revistas, de radio y televisión y de redes sociales, y los separa según sí son más o menos diccionarizables, es decir, si son más o menos aptos para entrar en el diccionario. Para hacerlo, este programa aplica unos veinte criterios agrupados en bloques.

Judit Freixa, directora del Observatorio de Neología de la UPF: “hemos querido (...) centrarnos en la elaboración de una herramienta innovadora, sostenible y, sobre todo, útil, tanto para los hablantes, ayudándolos a valorar las palabras que utilizan y que no están en el diccionario, como para el IEC, aportándolos nuestro conocimiento experto en neología”

“Hemos querido huir de la discusión sobre si el IEC incorpora en el diccionario demasiadas  palabras o demasiado pocas y centrarnos en la elaboración de una herramienta innovadora, sostenible y, sobre todo, útil, tanto para los hablantes, ayudándolos a valorar las palabras que utilizan y que no están en el diccionario, como para el IEC, aportándolos nuestro conocimiento experto en neología”. Así lo resume Judit Freixa, directora del Observatorio de Neología e investigadora principal del proyecto.

¿Cómo se puede consultar el Garbell?

Cualquiera puede acceder a la versión pública de Garbell (http://garbell.upf.edu/) y buscar palabras concretas o segmentos (que empiece por, que acabe en o que contengan). En este momento, hay casi 10.000 palabras revisadas, que se reparten bastante equitativamente en tres categorías: unidades diccionarizables (marcadas en color verde), prediccionaritzables (sin marca) y no diccionarizables (marcadas en rojo). Así pues, cuando consultamos una palabra, se nos muestra el estado de diccionariabilidad y un resumen del valor obtenido en cada bloque de criterios. Además, se puede ver el valor de cada criterio concreto y también un diagrama con la frecuencia y la estabilidad de la palabra a lo largo de los años.

¿Cómo se ha desarrollado Garbell?

Garbell ha sido desarrollado por investigadoras del Observatorio de Neología, del grupo de investigación de IULATERM, del Instituto de Lingüística Aplicada de la UPF. Se trata de un proyecto del Programa de Investigación del IEC.  El equipo, liderado por Judit Freixa, está formado por especialistas en lexicografía, neología e informática y ha trabajado intensamente en este proyecto desde el año 2018. En una primera etapa, el equipo de lingüistas trabajó en la identificación de los criterios que se podrían aplicar automáticamente, partiendo del NADIC (Neologismos para el diccionario normativo), un proyecto anterior desarrollado por el mismo grupo y con la participación de la red de observatorios de neología del territorio catalán (NEOXOC) y también financiado por el IEC.

En los criterios de uso, el Garbell tiene en cuenta la frecuencia de la palabra, la antigüedad, la estabilidad a lo largo del tiempo y la distribución en diferentes tipos de textos, entre otros criterios. Desde el punto de vista lingüístico, el programa valora el tipo de neologismo, la regularidad de la formación y la variabilidad formal. Y, además, el valor final se establece teniendo también en cuenta la presencia de la palabra en otros diccionarios catalanes o de otras lenguas románicas. La veintena de criterios que se aplican no tienen el mismo valor ni se aplican linealmente, sino que el valor final de cada palabra se atribuye con un algoritmo especialmente diseñado para este proyecto y que se va ajustando a medida que el programa va cribando.

En esta primera fase de funcionamiento público del Garbell, los resultados han sido revisados por el equipo de lingüistas, que todavía trabaja para ir aumentando la cantidad de neologismos que se pueden consultar.

¿En qué es innovador el Garbell?

Judit Freixa (Observatorio de Neología de la UPF): “No conocemos ninguna herramienta que haga una tarea parecida a la del Garbell. No nos hemos inspirado en ninguna herramienta conocida. Hemos sido innovadoras simplemente siguiendo el camino que nos permite la tecnología y mirando de resolver las necesidades lingüísticas del catalán”

“No conocemos ninguna herramienta que haga una tarea parecida a la del Garbell. No nos hemos inspirado en ninguna herramienta conocida. Hemos sido innovadoras simplemente siguiendo el camino que nos permite la tecnología y mirando de resolver las necesidades lingüísticas del catalán”, afirma Judit Freixa.

De momento, el Garbell trabaja a partir de los datos del BOBNEO, la base de datos donde el Observatorio de Neología ha estado recogiendo los neologismos detectados en el ámbito general desde el año 1989. Pero en la medida que el programa incorpore estrategias de inteligencia artificial, podrá funcionar sin la base de datos ya recogidas y analizadas y se podrá desarrollar en otras lenguas.

Lo más innovador de esta herramienta es que va más allá de la dicotomía entre correcto e incorrecto, y lo que hace es separar las unidades en tres categorías claramente diferenciadas: son diccionarizables los neologismos que cumplen todos o la mayoría de los requisitos propuestos por el Garbell, que ya tienen recorrido en el uso social y que no muestran ninguna característica que pueda cuestionar la sanción lexicográfica. En cambio, son prediccionarizables los neologismos que todavía no tienen un recorrido suficiente y que, a la vez, no presentan ninguna característica que los impida serlo en un futuro próximo. Finalmente, son no diccionarizables los neologismos que se encuentran al inicio de su recorrido (y, por lo tanto, no cumplen el mínimo de requisitos) o que ya han avanzado en este recorrido y ya han mostrado características que los hacen candidatos no adecuados.

El Garbell ya ha sido presentado en varios foros internacionales, como el CINEO, el Congreso de Neología de las Lenguas Románicas (Génova, 2 de septiembre del 2022), y ha tenido muy buena acogida. También se acaba de publicar en la revista Terminàlia un artículo donde se presenta el funcionamiento y los resultados del Garbell.

El Garbell, un diccionario complementario, progresivo y que orienta el uso

En definitiva, el Garbell es también un recurso lingüístico que sirve como diccionario complementario, descriptivo, progresivo y que orienta el uso. Es complementario, porque recoge precisamente aquello que no incluye el diccionario normativo; progresivo, porque sitúa los candidatos a neologismos en diferentes puntos más o menos alejados de la meta de poder ser incorporados en el diccionario; y orienta el uso, porque informa también de las unidades excluidas.

Multimedia

ODS - Objetivos de desarrollo sostenible:

04. Educación de calidad
Els ODS a la UPF

Contact

Para más información

Noticia publicada por:

Oficina de Comunicación