Banco de Conocimiento sobre Genoma Humano
Banco de Conocimiento sobre Genoma Humano
Banco de Conocimiento sobre Genoma Humano
Aplicación desarrollada en el marco de los proyectos anteriores.
El banco de conocimiento está concebido como una estructura modular formada por los siguientes elementos: a) Corpus textual: constituido por textos especializados sobre genoma humano, multilingües, marcados según el estándar SGML, preprocesados, lematizados, etiquetados morfosintácticamente y desambiguados. b) Base de datos documental y factográfica: formada, por una parte, por datos bibliográficos que forman parte del corpus textual, de las obras de referencia de la base de datos terminológica y otras obras seleccionadas por especialistas del ámbito; por otra parte, por datos de personas, instituciones, empresas, productos, métodos, relacionados con la temática. c) Base de datos terminológica. d) Ontología: se utiliza el gestor Ontoterm©; incorporación de conceptos a partir del corpus textual y de la base de datos terminológica.