Atrás

¿Qué nos aporta la simplificación automática de textos?

¿Qué nos aporta la simplificación automática de textos?

Un libro de Horacio Saggion, miembro del Grupo de Investigación en Tratamiento Automático del Lenguaje, analiza las tendencias en este campo y dibuja múltiples aplicaciones sociales futuras.

16.05.2017

Gracias a la gran cantidad de textos que Internet ofrece ha aumentado exponencialmente la información y el conocimiento disponible para el gran público.

Sin embargo, la manera en como está redactado un texto (su vocabulario, su sintaxis...) puede dificultar su lectura y su comprensión para muchas personas, especialmente aquellas con bajo nivel de alfabetización, con déficits lingüísticos o con un conocimiento limitado del idioma del texto.

Los textos que contienen palabras poco comunes o frases largas y complicadas pueden ser difíciles de leer y entender por la gente, así como difíciles de analizar por las máquinas.

Horacio Saggion, coordinador del Large Scale Text Understanding Systems Lab e investigador del Grupo de Investigación en Tratamiento del Lenguaje Natural (TALN) del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC), acaba de publicar Automatic Text Simplification, una recopilación de la investigación realizada hasta ahora en el campo de la simplificación de textos que explora los principales temas objeto de estudio de este ámbito: evaluación automática de la legibilidad, simplificación léxica, simplificación sintáctica...

El libro, editado por Morgan & Claypool, también proporciona una descripción detallada de las técnicas de aprendizaje automático que se están utilizando actualmente en el campo de la simplificación, describe sistemas completos diseñados para lenguajes específicos y audiencias concretas, y ofrece recursos disponibles para la investigación y el desarrollo de este campo, junto con técnicas de evaluación de simplificación de textos.

Un ámbito de investigación con múltiples aplicaciones sociales

La simplificación automática de textos es el proceso de transformación de un texto a otro que transmita el mismo mensaje, pero que sea mucho más fácil de leer y de entender para un público más amplio.

Normalmente, el procedimiento implica cambiar frases difíciles o desconocidas por otras equivalentes más simples, y transformar frases largas y complejas sintácticamente en otras más cortas y menos complejas.

La simplificación automática de textos es un tema que se empezó a investigar hace veinte años, y ahora ha conseguido tener un rol central en la investigación vinculada al procesamiento del lenguaje natural, no sólo por los retos que supone, sino también por las implicaciones sociales que puede llegar a tener.