Vés enrere Un treball ha avaluat la qualitat de diferents mètodes de traducció automàtica

Un treball ha avaluat la qualitat de diferents mètodes de traducció automàtica

La línia de recerca en què està treballant Clara Ginovart, investigadora del Grup de Recerca en Lingüística Computacional  del Departament de Traducció i Ciències del Llenguatge. Ha comparat mètodes d’avaluació estadístics i neuronals en un treball publicat a Translating and the Computer 40.

26.11.2018

 

La traducció automàtica és el procés en què un programari converteix un text d’un llengua a una altra. La post-edició consisteix en la correcció de traduccions automàtiques per tal d’assegurar-ne la qualitat. Entre les expectatives de la post-edició hi ha la d’aconseguir una qualitat semblant a la traducció humana. A mesura que més proveïdors de serveis lingüístics inclouen la post-edició de traducció automàtica en el seu flux de treball, “veiem com els estudis sobre avaluació de la qualitat de la traducció automàtica es tornen cada vegada més importants”, afirma Clara Ginovart, autora d’un treball recentment publicat a Translating and the Computer 40 que aplega les ponències presentades al congrés The International Association for Advancement in Language Tehcnology (AsLing), celebrat els dies 15 i 16 de novembre a Londres (Regne Unit).

Els estudis sobre avaluació de la qualitat de la traducció automàtica es tornen cada vegada més importants

Clara Ginovart està duent a terme un Doctorat Industrial a l’empresa Datawords, a París (França), sota la supervisió de Carme Colominas, investigadora del Grup de Recerca en Lingüística Computacional GLICOM (UR-LING), al Departament de Traducció i Ciències del Llenguatge (DTCL) de la UPF, i d’Antoni Oliver (UOC),  dins del programa de doctorat en Traducció i Ciències del Llenguatge de la UPF.

La recerca de Clara Ginovart ha consistit en l’anàlisi del resultat d’un estudi de cas que avalua tres motors de traducció automàtica del francès a l’espanyol i a l’italià, dos d’ells mètodes estadístics i un tercer un mètode neuronal, una tecnologia novedosa en el món de la traducció automàtica per basar-se en la intel·ligència artificial (deep learning, recurrent neural networks, etc.) i que ha demostrat en publicacions recents apropar-se més a la qualitat de traducció humana. Però, en tots els casos?, es pregunta Ginovart.

El treball que ha estat recentment publicat descriu els resultats de la traducció automàtica en dos tipus de text d’una web dedicada al motociclisme que va ser traduïda per Datawords.

“Utilitzem l'avaluació basada en tasques de post-edició i l’avaluació humana a través d’un rànquing, i així establim quin mètode requereix menys tasca de post-edició”, afirma l’autora de l’article

En definitiva, la recerca conclou que, per alguns parells de llengües i àmbits d’especialització, els corpus paral·lels són insuficients per a què els nous sistemes neuronals arribin a igualar la qualitat dels estadístics;  per tant, a la llum dels resultats, “haurem de ser prudents i precisos al parlar de qualitat de traducció automàtica per no crear falses esperances”, alerta l’autora de la recerca.

Treball de referència:

Clara Ginovart Cid (2018), “Statistical & Neural MT Systems in the Motorcycling Domain for Less Frequent Language Pairs – How Do Professional Post-editors Perform?”, Translating and the Computer 40, Proceedings 15-16 November 2018, One Birdcage Walk, London, pp. 66-78.

Articles en accés obert des de l'e-Repositori UPF:

Ginovart Cid C. Statistical & neural MT systems in the motorcycling domain for less frequent language pairs – how do professional post-editors perform?. In: Translating and the Computer 40: proceedings; 2018 Nov 15-16; London, United Kingdom. Geneva: Editions Tradulex; 2018. p. 66-78.

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

Els ODS a la UPF

Contact