Atrás Un trabajo ha evaluado la calidad de diferentes métodos de traducción automática

Un trabajo ha evaluado la calidad de diferentes métodos de traducción automática

La línea de investigación en la que está trabajando Clara Ginovart, miembro del Grupo de Investigación en Lingüística Computacional del Departamento de Traducción y Ciencias del Lenguaje. Ha comparado métodos de evaluación estadísticos y neuronales en un trabajo publicado en Translating and the Computer 40.

26.11.2018

 

La traducción automática es el proceso en el que un software convierte un texto de un idioma a otro. La post-edición consiste en la corrección de traducciones automáticas para asegurar su calidad. Entre las expectativas de la post-edición está la de conseguir una calidad similar a la traducción humana. A medida que más proveedores de servicios lingüísticos incluyen la post-edición de traducción automática en su flujo de trabajo, "vemos como los estudios sobre evaluación de la calidad de la traducción automática se vuelven cada vez más importantes", afirma Clara Ginovart, autora de un trabajo recientemente publicado en Translating and the Computer 40 que reúne las ponencias presentadas en el congreso The International Association for Advancement in Language Tehcnology (AsLing) celebrado los días 15 y 16 de noviembre en Londres (Reino Unido).

Los estudios sobre evaluación de la calidad de la traducción automática se vuelven cada vez más importantes

Clara Ginovart está llevando a cabo un Doctorado Industrial en la empresa Datawords, en París (Francia), bajo la supervisión de Carme Colominas, investigadora del Grupo de Investigación en Lingüística Computacional GLiCom (UR-LING), en el Departamento de Traducción y Ciencias del Lenguaje (DTCL) de la UPF, y de Antoni Oliver (UOC), dentro del programa de doctorado en Traducción y Ciencias del Lenguaje de la UPF.

La investigación de Clara Ginovart ha consistido en el análisis del resultado de un estudio de caso que evalúa tres motores de traducción automática del francés al español y al italiano, dos de ellos métodos estadísticos y un tercero un método neuronal, una tecnología novedosa en el mundo de la traducción automática por basarse en la inteligencia artificial (deep learningrecurrente neural networks, etc.) y que ha demostrado en publicaciones recientes acercarse más a la calidad de traducción humana. Pero, ¿en todos los casos? se pregunta Ginovart.

El trabajo que ha sido recientemente publicado describe los resultados de la traducción automática en dos tipos de texto de una web dedicada al motociclismo que fue traducida por Datawords.

"Utilizamos la evaluación basada en tareas de post-edición y la evaluación humana a través de un ranking, y así establecemos qué método requiere menos trabajo de post-edición", afirma la autora del artículo

En definitiva, la investigación concluye que, para algunos pares de lenguas y ámbitos de especialización, los corpus paralelos son insuficientes para que los nuevos sistemas neuronales lleguen a igualar la calidad de los estadísticos; por tanto, a la luz de los resultados, "tendremos que ser prudentes y precisos al hablar de calidad de traducción automática para no crear falsas esperanzas", alerta la autora de la investigación.

Trabajo de referencia:

Clara Ginovart Cid (2018), “Statistical & Neural MT Systems in the Motorcycling Domain for Less Frequent Language Pairs – How Do Professional Post-editors Perform?”,  Translating and the Computer 40, Proceedings 15-16 November 2018, One Birdcage Walk, London, pp. 66-78.

Multimedia

Categorías:

ODS - Objetivos de desarrollo sostenible:

Els ODS a la UPF

Contact