|
|
|
|
ReferenciaURN TDX-0319102-135659
Depósito legal/ISBN B.14059-2002 /84-699-8512-4
Título: Extracción de terminología: elementos para la construcción de un SEACUSE (Sistema de Extracción Automática de Candidatos a Unidades de Significación Especializada) [Traducción al castellano]
Universitat Pompeu Fabra, Institut Institut Universitari de Lingüística Aplicada
Dirección de la tesi: M. Teresa Cabré Castellví
Fecha de defensa 26-07-1999
Tribunal: Josep Lluís Barona, Cristian Jacquemin, Toni Badia, Mercè
Lorente, Horacio Rodríguez.
Calificación: Sobresaliente Cum Laude por una unanimidad
Palabras clave: Terminología, Aplicaciones terminológicas, Unidad terminológica, Unidad de Significación Especializada, Extracción automática de terminología, Sistemas de extracción automática de terminología, Perfiles profesionales de necesidades terminológicas
ResumemEl objetivo principal de esta tesis es diseñar un modelo de un Sistema de Extracción Automática de Candidatos a Unidades de Significación Especializada (SEACUSE) basado en fundamentos lingüísticos diferentes y adecuado a las necesidades de unas actividades profesionales concretas. En el primer capítulo se describen los sistemas de extracción automática de candidatos a término (SEACAT) y se analizan y valoran los principales SEACAT con el objetivo de elaborar un estado de la cuestión en este campo que evidencie las características y sobre todo las limitaciones de estos sistemas. En el segundo capítulo, primeramente, se validan las hipótesis que postulamos en el proyecto de investigación previo a la tesis doctoral sobre los patrones estructurales de las UTP y después se comprueba las principales limitaciones de los SEACAT que se basan en patrones morfosintácticos. Estas limitaciones se manifestar en dos aspectos: el silencio (unidades pertinentes no detectadas por el extractor) y el ruido (unidades no pertinentes presentadas como si lo fueran). Los datos que se desprenden del análisis del silencio y del ruido se estudian en los capítulos tercero y cuarto, respectivamente. Así, primero se analizan los tipos y las causas de silencio que producen los SEACAT, y seguidamente los tipos y las causas del ruido generado por estos sistemas. El quinto propone elementos y estrategias para que un sistema de extracción automática reduzca el silencio y el ruido, y de esta manera consiga que sus resultados se aproximen más al reconocimiento y delimitación manuales de las unidades de significación especializada. El sexto capítulo introduce el punto de vista del usuario y plantea el hecho de que no todas las actividades profesionales requieren los mismos tipos ni el mismo número de unidades especializadas de un texto. Esta hipótesis se verifica a través de una prueba experimental basada en las necesidades de cuatro actividades profesionales diferentes. Y, finalmente, en el último capítulo, se expone una propuesta de un modelo de SEACUSE que, además de las estrategias planteadas en el quinto capítulo, tiene en cuenta las finalidades de los profesionales en la presentación de los resultados.
PremiosAccesito de los Premios Internacionales de Terminología para la investigación aplicada y el desarrollo en el campo de la Terminología. Asociación Europea de Terminología y INFOTERM (International Information Centre for Terminology), Copenhague, agosto de 2001.
Publicaciones
vinculadas
Cabré,
M. T.; Estopà, R. ; Vivaldi, J. "Automatic term detection: a review of current
systems" En: D. Bourigault, C. Jacquemin, M.-C. L'Homme (eds.) Recent Advances
in Computational Terminology. Amsterdam, John Benjamins, Natural Language
Processing, 2, 2001, 53-87. ISBN: 90-272-4984-9.
Estopà,
R. "Elementos lingüísticos de las unidades terminológicas para su extracción
automática" En: Cabré, M. T.; Feliu, J. (eds.) La terminología científico-técnica.
Barcelona, Instituto Universitario de Lingüíistica Aplicada; IULATERM,
2001, 67-80, ISBN: 84-477-0744-X
Cabré,
M. T.; Estopà, R. "On the units of specialised meaning uses in professional
communication". Terminology Science and Research, 2003, 1, Viena, ISSN
0929-9971
Cabré,
M. T.; Estopà, R. "El conocimiento especializado y sus unidades de representación:
diversidad cognitiva". Sendébar, 2002, 13, 141-153, Granada, ISSN: 1130-5509
Estopà,
R.; Valero, T. "Adquisición de conocimiento especializado y unidades de significación
especializada en medicina". Panace@ - Boletín de Medicina y Traducción, 2002,
3 (9-10), 72-82 http://www.medtrad.org/panacea ISSN: 1537-1964 Clave: A
Estopà,
R. "Extracción de terminología: elementos para la construcción de un extractor".
Tradterm, 7, 2002, 225-250, Sao Paulo, ISSN: 0104-693X Clave: A
Estopà,
R. "Les unités de signification spécialisées: élargissant l'objet du travail
en terminologie". Terminology, 7, 2, 2001, 217-237, Amsterdam-Philadelphia,
ISSN : 0929-9971 Referenciado en Linguistic Abstracts, 18, 4,2002, 681, ISSN
: 0267-5498
Estopà,
R. "Los adjetivos en las unidades terminológicas poliléxicas: un análisis
morfosemántico". Organon, 2000, 14, 28/29, 233-246, Porto Alegre, ISSN
0102-6267
Estopà,
R.; Vivaldi, J.; Cabré, M.T. "Use of Greek and Latin forms for terms
detection". Second International Conference on Language Resoureces and
Evaluation, Atenas Any: 2000
Cabré,
M.T.; Estopà, R.; Vivaldi, J. "Extraction of monolexical terminological
units: requirements analysis". Second International Conference on Language
Resoureces and Evaluation Terminology. Atenas, 2000
Estopà,
R. "Eficiencia en la extracción automática de terminología" Perspectives:
Studies in Traductology, 7, 2, 277-286, 1999, Copenhagen, ISBN: 87-7289-540-3.
ISSN: 0997 676X
Tesina
vinculadaLes unitats terminològiques polilexemàtiques en els lèxics especialitzats (dret i medicina). Directora: M. Teresa Cabré. Tribunal: Mercè Lorente, Toni Badia i M. Teresa Cabré. Defensa: novembre de 1996. [trabajo inédito]