L’objectiu del projecte TERMMED és analitzar el canvi terminològic en textos mèdics, amb la finalitat de detectar pistes que expliquin l’evolució del coneixement.

El coneixement científic creix permanentment en medicina, a causa de la identificació de noves malalties, el desenvolupament de nous mètodes i tecnologies, l’aparició de nous tractaments, i sobretot per la descripció més acurada dels fenòmens. Una de les pistes que ens permeten detectar aquest coneixement és l’anàlisi de les produccions (orals i) escrites de metges i experts, de les quals la terminologia és un factor clau. L’anàlisi del lèxic dels textos mèdics, i en concret de la variació terminològica detectada al llarg del temps (presència o absència d’unitats, modificacions en paradigmes lèxics o canvis de significat), és determinant per a la representació d’aquesta evolució (amagada) del coneixement. 

Ens centrem en la terminologia de la medicina en castellà. Els fenòmens de canvi lèxic que volem abordar inclouen la selecció de variants, la polisèmia, la fixació de reduccions, la lexicalització de sintagmes, conversions, nominalitzacions, la neologia o la desaparició de formes obsoletes. La metodologia combina l’anàlisi lingüística, l’exploració de corpus textuals segmentats per períodes temporals, l’extracció automàtica de terminologia, la consulta d’ontologies i altres fonts lèxiques, l’anàlisi estadística de variants terminològiques i l’experimentació en la detecció automàtica de neologia semàntica.

Disposar de recursos lingüístics adequats per al desenvolupament de tecnologies del llenguatge adaptats a la documentació mèdica en llengua castellana és un dels reptes del s. XXI. La constitució d’aquests recursos permet pensar en aplicacions que cobriran necessitats dels professionals de la salut i dels investigadors en biomedicina (sistemes de recuperació d’informació, predicció de dades, classificadors de textos mèdics, resumidors i codificadors automàtics, assistentes de redacció, etc.), però també dels pacients (sistemes de simplificació de textos, reelaboració de textos adaptats, etc.). Davant de la proliferació natural de variació terminològica, les tecnologies del llenguatge precisen dades contrastades que els permetin automatitzar la presa de decisions. Amb els resultats del projecte, els tecnòlegs podran inferir models de comportament de la variació terminològica en medicina. En aquest projecte no desenvolupem tecnologia sinó que estem construint recursos lèxics accessibles en obert, perquè puguin integrar-se en aplicacions lingüístiques adaptades a domini.