Enriching low resource SMT using induced bilingual lexicons

  • Authors
  • Han, Jingyi; Bel, Núria
  • UPF authors
  • BEL RAFECAS, NÚRIA;
  • Type
  • Scholarly articles
  • Journal títle
  • Procesamiento del lenguaje natural
  • Publication year
  • 2017
  • Number
  • 59
  • Pages
  • 91-98
  • ISSN
  • 1135-5948
  • Publication State
  • Published
  • Abstract
  • En este artículo presentamos un m etodo para ampliar la tabla de frases de un traductor automático estadístico con entradas biling ues creadas autom aticamente con un clasificador supervisado. El clasificador es entrenado con una representaci on vectorial en la que se concatenan el vector distribuido (Word Embed-dings, WE) y una representación de agrupaciones de Brown (Brown clusters, BC) de 2 palabras equivalentes de traducción. El clasificador alcanza una F1 de 0,94 y el resultado de la evaluación del sistema de traducción automática entre chino y español muestra una mejora de hasta +0,70 BLEU, demostrando que las malas traducciones producidas por el clasi cador son controladas bien por el sistema de traducción.
  • Complete citation
  • Han, Jingyi; Bel, Núria. Enriching low resource SMT using induced bilingual lexicons. Procesamiento del lenguaje natural 2017; (59): 91-98.
Bibliometric indicators
  • Índex Scimago de 0.21 (2017)