Rosa Estopà Bagot
Español | English

iniciReferència

URN TDX-0319102-135659
Dipòsit legal/ISBN B.14059-2002 /84-699-8512-4

Títol: Extracció de terminologia: elements per a la construcció d'un SEACUSE (Sistema d'Extracció Automàtica de Candidats a Unitats de Significació Especialitzada)

Títol: Extracción de terminología: elementos para la construcción de un SEACUSE (Sistema de Extracción Automática de Candidatos a Unidades de Significación Especializada) [Traducció al castellà]

Universitat Pompeu Fabra, Institut Institut Universitari de Lingüística Aplicada
Direcció de la tesi: M. Teresa Cabré Castellví
Data de defensa 26-07-1999
Tribunal: Josep Lluís Barona, Cristian Jacquemin, Toni Badia, Mercè Lorente, Horacio Rodríguez.
Qualificació: Excel·lent Cum Laude per una unanimitat

Paraules clau: Terminologia, Aplicacions terminològiques, Unitat terminològica, Unitat de Significació Especialitzada, Extracció automàtica de terminologia, Sistemes d’extracció automàtica de terminologia, Perfils professionals de necessitats terminològiques

iniciResum

L’objectiu principal d’aquesta tesi és dissenyar un model d’un Sistema d’Extracció Automàtica de Candidats a Unitats de Significació Especialitzada (SEACUSE) basat en fonaments lingüístics de diferents tipus i adequat a les necessitats d’unes activitats professionals concretes. Per fer-ho, en el primer capítol es descriu els sistemes d’extracció automàtica de candidats a terme (SEACAT) i s’analitza i valora els principals SEACAT amb l’objectiu d’elaborar un estat de la qüestió en aquest camp que evidenciï les característiques i sobretot les limitacions d’aquests sistemes. En el segon capítol, en primer lloc, es validen les hipòtesis que vam postular en el treball de recerca sobre els patrons estructurals de les UTP i en segon lloc a comprovar les principals limitacions dels SEACAT que es basen en patrons morfosintàctics. Aquestes limitacions es manifesten en dos aspectes: el silenci (unitats pertinents no detectades per l’extractor) i el soroll (unitats no pertinents presentades com si ho fossin). Les dades que es desprenen de l’anàlisi del silenci i el soroll s’estudien en el tercer i quart capítol, respectivament. Així, primer s’analitzen els tipus i les causes de silenci que produeixen els SEACAT, i tot seguit els tipus i les causes del soroll generat per aquests sistemes. El cinquè proposa elements i estratègies perquè un sistema d’extracció automàtica redueixi el silenci i el soroll, i d’aquesta manera aconsegueixi que els seus resultats s’acostin més al reconeixement i delimitació manuals de les unitats de significació especialitzada. El sisè capítol introdueix el punt de vista de l’usuari i planteja el fet que no totes les activitats professionals requereixen els mateixos tipus ni el mateix nombre d’unitats especialitzades d’un text. Aquesta hipòtesi és verificada a través d’una prova experimental basada en les necessitats de quatre activitats professionals diferents. I, finalment, en el setè capítol, s’exposa una proposta de model de SEACUSE que, a més de les estratègies plantejades en el capítol cinquè, té en compte les finalitats dels professionals a l’hora de presentar els resultats.

iniciPremis

Accèssit dels Premis Internacionals de Terminologia pera a la investigació aplicada i el desenvolupmanet en el camp de la Terminologia. Associació Europea de Terminologia i INFOTERM (International Information Centre for Terminology), Copenhague, agost de 2001.

iniciPublicacions vinculades

Cabré, M. T.; Estopà, R. ; Vivaldi, J. "Automatic term detection: a review of current systems" En: D. Bourigault, C. Jacquemin, M.-C. L'Homme (eds.) Recent Advances in Computational Terminology. Amsterdam, John Benjamins, Natural Language Processing, 2, 2001, 53-87. ISBN: 90-272-4984-9.

Estopà, R. "Elementos lingüísticos de las unidades terminológicas para su extracción automática" En: Cabré, M. T.; Feliu, J. (eds.) La terminología científico-técnica. Barcelona, Instituto Universitario de Lingüíistica Aplicada; IULATERM, 2001, 67-80, ISBN: 84-477-0744-X

Cabré, M. T.; Estopà, R. "On the units of specialised meaning uses in professional communication". Terminology Science and Research, 2003, 1, Viena, ISSN 0929-9971

Cabré, M. T.; Estopà, R. "El conocimiento especializado y sus unidades de representación: diversidad cognitiva". Sendébar, 2002, 13, 141-153, Granada, ISSN: 1130-5509

Estopà, R.; Valero, T. "Adquisición de conocimiento especializado y unidades de significación especializada en medicina". Panace@ - Boletín de Medicina y Traducción, 2002, 3 (9-10), 72-82 http://www.medtrad.org/panacea ISSN: 1537-1964 Clave: A

Estopà, R. "Extracción de terminología: elementos para la construcción de un extractor". Tradterm, 7, 2002, 225-250, Sao Paulo, ISSN: 0104-693X Clave: A

Estopà, R. "Les unités de signification spécialisées: élargissant l'objet du travail en terminologie". Terminology, 7, 2, 2001, 217-237, Amsterdam-Philadelphia, ISSN : 0929-9971 Referenciado en Linguistic Abstracts, 18, 4,2002, 681, ISSN : 0267-5498

Estopà, R. "Los adjetivos en las unidades terminológicas poliléxicas: un análisis morfosemántico". Organon, 2000, 14, 28/29, 233-246, Porto Alegre, ISSN 0102-6267

Estopà, R.; Vivaldi, J.; Cabré, M.T. "Use of Greek and Latin forms for terms detection". Second International Conference on Language Resoureces and Evaluation, Atenas Any: 2000

Cabré, M.T.; Estopà, R.; Vivaldi, J. "Extraction of monolexical terminological units: requirements analysis". Second International Conference on Language Resoureces and Evaluation Terminology. Atenas, 2000

Estopà, R. "Eficiencia en la extracción automática de terminología" Perspectives: Studies in Traductology, 7, 2, 277-286, 1999, Copenhagen, ISBN: 87-7289-540-3. ISSN: 0997 676X

iniciTesina vinculada

Les unitats terminològiques polilexemàtiques en els lèxics especialitzats (dret i medicina). Directora: M. Teresa Cabré. Tribunal: Mercè Lorente, Toni Badia i M. Teresa Cabré. Defensa: novembre de 1996. [treball inèdit]

 

Adreça de contacte: rosa.estopa@upf.edu
Data d'actualització: 27-03-2006