Crear un nuevo modelo de IA que interprete mejor el significado de las palabras en cada contexto, objetivo de un proyecto de investigación de la UPF

Atrás Crear un nuevo modelo de IA que interprete mejor el significado de las palabras en cada contexto, objetivo de un proyecto de investigación de la UPF

Crear un nuevo modelo de IA que interprete mejor el significado de las palabras en cada contexto, objetivo de un proyecto de investigación de la UPF

A día de hoy, las herramientas de inteligencia artificial todavía no son capaces de comprender con precisión la intención con la que las personas utilizan determinadas palabras o expresiones en un contexto específico. Este es el reto que ha motivado el proyecto LIFE (Learning Intentions Following Evolution) del grupo de investigación COLT (Computational Linguistics and Linguistic Theory) del Departamento de Traducción y Ciencias del Lenguaje de la UPF.

14.09.2023

Imatge inicial

En los últimos tiempos, la evolución de la inteligencia artificial ha hecho posible la creación de diferentes herramientas tecnológicas para generar contenidos textuales o audiovisuales en diferentes lenguas, en base a las indicaciones facilitadas por un interlocutor humano. Pero, a día de hoy, estas tecnologías todavía no han desarrollado suficientemente su capacidad para comprender la intención con la que las personas usan ciertas palabras o expresiones en una situación específica.

Este es el reto que ha motivado el proyecto de investigación europeo LIFE (Learning Intentions Following Evolution) de la UPF, que quiere perfeccionar las actuales tecnologías de inteligencia artificial (IA) basadas en el aprendizaje automático, para avanzar en la comprensión genuina del lenguaje natural del ser humano, a partir de una mejor interpretación de los contextos comunicativos. El proyecto, que se ha iniciado este mes de septiembre y tendrá dos años de duración, está financiado por una beca Marie Sklodowska-Curie, financiada por la Comisión Europea en el marco del programa Horizon de la UE.

Un modelo basado en el aprendizaje continuado, a diferencia de la mayoría de modelos de aprendizaje automáticos actuales, entrenados de una sola vez

El objetivo es desarrollar un modelo de proceso evolutivo abierto, que sea capaz de aprender de forma progresiva y continuada a partir de la experiencia, a diferencia de la mayoría de modelos de aprendizaje automáticos actuales, entrenados de una sola vez, a partir de datos de un periodo de tiempo determinado. El modelo computacional formularía hipótesis sobre las diferentes intenciones con las que se puede utilizar una expresión en un contexto concreto, que irá corroborando o descartando a partir de la observación de la realidad.

El desarrollo de este modelo corre a cargo del grupo de investigación COLT (Computational Linguistics and Linguistic Theory) del Departamento de Traducción y Ciencias del Lenguaje de la UPF, con una larga experiencia y reconocimiento en el ámbito de la lingüística computacional. El investigador principal del proyecto es Germán Kruszewski, del grupo de investigación COLT. Kruszewski es investigador postdoctoral en este grupo de investigación, codirigido por Gemma Boleda, que también participará en este proyecto. LIFE contará con el apoyo del Santa Fe Institute (Nuevo México), especializado en ciencia de la complejidad, con la que se quieren encontrar mecanismos comunes para analizar la complejidad de cualquier sistema en el que interactúan muchos agentes que se adaptan los unos a los otros y a sus entornos (físicos, biológicos, sociales, comunicativos, tecnológicos...).

Germán Kruszewski, investigador principal del proyecto LIFE: “Este modelo computacional formulará nuevas hipótesis sobre el significado de las palabras en un contexto determinado y solo aquellas que resulten útiles en la comunicación se reproducirán”

Para comprender las características del modelo planteado, se podría hacer una comparación con el proceso de la evolución natural. “Del mismo modo que las especies generan adaptaciones nuevas, que se ponen a prueba mediante su éxito reproductivo, este modelo computacional formulará nuevas hipótesis sobre el significado de las palabras en contexto determinado y solo aquellas que resulten útiles en la comunicación se reproducirán, cosa que permitirá que se reutilicen en el futuro” – explica Germán Kruszewski. El investigador principal resume así los objetivos del proyecto: investigar las condiciones con las que un sistema es capaz de seguir un proceso evolutivo que genere novedades de forma continuada, diseñar e implementar un sistema de aprendizaje por refuerzo que guíe el proceso evolutivo e investigar las aplicaciones de este sistema de aprendizaje automático en situaciones que requieran inferir el significado de expresiones lingüísticas en contextos específicos.

Un sistema de aprendizaje por refuerzo: la máquina recibirá recompensas si su hipótesis sobre el significado social de una palabra es correcta

El proyecto se basará en el modelo de aprendizaje por refuerzo, en el que las máquinas reciben una respuesta positiva (refuerzo o recompensa) o negativa por parte de interlocutores humanos, en función de si están interpretando o no correctamente el significado social de una palabra. El sistema irá mutando sus algoritmos para maximizar la probabilidad de encontrar conceptos útiles para interpretar el significado social de las palabras. Así por ejemplo, este sistema puede facilitar que las máquinas aprendan que los mensajes sexistas, racistas o discriminatorios en general no son adecuados, por la reacción negativa de sus interlocutores.

El sistema se probará con el denominado reto de Hanabi, a partir de un juego de cartas. El objetivo es crear pilas ordenadas de cartas del mismo color. En cada turno, los jugadores tienen que decidir si ponen la carta del siguiente número en algunas de las pilas o bien dejar pasar su turno. Cada agente conoce las cartas de los otros agentes, pero no conoce las suyas. Para resolver el juego con éxito, los diferentes agentes pueden dar consejos a otros jugadores sobre las cartas que tienen, pero el número de las pistas que pueden dar son limitadas y referirse a una única característica. La clave es que los agentes comprendan por qué y con qué intención otro jugador da una pista específica.

Potenciales aplicaciones de futuro

El objetivo es que el posterior desarrollo de este modelo computacional pueda contribuir a mejorar los sistemas de IA que procesan el lenguaje natural, para que sean más eficientes y adecuados a las necesidades de las personas. Como el sistema propuesto no requiere de grandes bases de datos iniciales para desarrollar nuevas herramientas de IA, al aprender sobre la marcha, podría facilitar el arranque o desbloquear nuevos proyectos en este ámbito. A largo plazo, la línea de investigación emprendida por este proyecto podría permitir que los humanos pudieran programar ordenadores con lenguaje natural y no exclusivamente con los códigos propios de la programación como hasta ahora.

Multimedia

Categorías:

Investigación

ODS - Objetivos de desarrollo sostenible:

09. Industria, innovación e infraestructura

Els ODS a la UPF

Contact

Para más información

Noticia publicada por:

Oficina de Comunicación

Focus UPF

Crear un nuevo modelo de IA que interprete mejor el significado de las palabras en cada contexto, objetivo de un proyecto de investigación de la UPF

Crear un nuevo modelo de IA que interprete mejor el significado de las palabras en cada contexto, objetivo de un proyecto de investigación de la UPF

Un modelo basado en el aprendizaje continuado, a diferencia de la mayoría de modelos de aprendizaje automáticos actuales, entrenados de una sola vez

Un sistema de aprendizaje por refuerzo: la máquina recibirá recompensas si su hipótesis sobre el significado social de una palabra es correcta

Potenciales aplicaciones de futuro

Multimedia

Categorías:

ODS - Objetivos de desarrollo sostenible:

Contact

Contenidos relacionados