El objetivo del proyecto TERMMED es analizar el cambio terminológico en textos médicos, con el fin de detectar pistas que expliquen la evolución del conocimiento.

El conocimiento científico crece permanentemente en medicina, a causa de la identificación de nuevas enfermedades, el desarrollo de nuevos métodos y tecnologías, la aparición de nuevos tratamientos, y sobre todo por la descripción más detallada de los fenómenos. Una de las pistas para detectar este conocimiento es el análisis de las producciones (orales y) escritas de médicos y expertos, dentro de las cuales la terminología es un factor clave. El análisis del léxico de los textos médicos, y en concreto de la variación terminológica detectada a lo largo del tiempo, atendiendo a la presencia o la ausencia de unidades, a las modificaciones que se producen entre paradigmas o a los cambios que se detectan en cuanto al contenido, es determinante para representar esta evolución (oculta) del conocimiento.

Nos centramos en la terminología de la medicina en español. Los fenómenos de cambio léxico que queremos abordar incluyen la selección de variantes, la polisemia, la fijación de reducciones, la lexicalización de sintagmas, conversiones, nominalizaciones, la neología o la desaparición de formas. La metodología combina el análisis lingüístico, la exploración de corpus textuales segmentados por períodos temporales, la extracción automática de terminología, la consulta de ontologías y otras fuentes léxicas, el análisis estadístico de variantes terminológicas y la experimentación en la detección automática de neología semántica.

La disposición de recursos lingüísticos adecuados para el desarrollo puntero de tecnologías del lenguaje adaptados a la documentación médica en lengua española es uno de los retos del s. XXI. La constitución de estos recursos permite pensar en aplicaciones que cubrirán múltiples necesidades de los profesionales de la salud y de los investigadores en biomedicina (sistemas de recuperación de información, predicción de datos, clasificadores de textos médicos, resumidores, codificadores, asistentes de redacción, etc.), pero también de los pacientes (sistemas de simplificación de textos, reelaboración de textos adaptados a niveles cognitivos, etc.). Ante la proliferación natural de variación terminológica, las tecnologías del lenguaje precisan datos contrastados que les permitan automatizar la toma de decisiones. Con los resultados, las tecnologías del lenguaje podrán inferir modelos de comportamiento de la variación terminológica en medicina. En este proyecto no desarrollaremos tecnología sino que haremos accesibles los recursos léxicos en abierto, derivados de nuestros análisis, para que puedan implementarse en tecnologías lingüísticas adaptadas a dominio.