5. Calidoscopio

La investigación sobre IA y lenguaje aún tiene grandes retos, más allá del potencial del ChatGPT

min
Horacio Saggion

Horacio Saggion,
Catedrático de Informática e Inteligencia Artificial del Departamento de Tecnologías de la Información y las Comunicaciones

En los últimos meses, los portales de noticias y  las redes sociales se han visto inundadas con noticias sobre ChatGPT, sistema entrenado para generar secuencias de palabras (o de código fuente) dado un contexto o un texto que le sirva como estímulo. 

En el artículo científico que describe esta tecnología, queda bastante claro que este sistema de generación de textos generalistas es capaz de mejorar, con creces, los resultados de sus predecesores en varias tareas que requieren el uso del lenguaje (resumir textos, responder a preguntas, traducir un texto…).  Esto se debe, por un lado, a la arquitectura computacional adoptada (la arquitectura de deep learning de Google, Transformers, ampliamente adoptada por la comunidad científica), y, por otro, al gran número de parámetros que compilan  el conocimiento sobre el lenguaje que el sistema ha adquirido y  que han sido entrenados con millones de textos. A diferencia de otros sistemas, el modelo de lenguaje GPT-3, en el que se basa el ChatGPT, es generalista y no especializado en tareas específicas.

Si bien no son una prueba formal de las capacidades del modelo, unas pocas interacciones con la aplicación ChatGPT impresionan positivamente a cualquiera.  Los textos generados parecen coherentes y gramaticalmente correctos. El sistema sale airoso también a la hora de proponer soluciones a un problema de programación simple.  Más aún, parece que no hay tema para el cual ChatGPT no tenga algo que decir, por ejemplo, consultado sobre temas como la homosexualidad en el deporte, es capaz de dar información fehaciente sin matices discriminatorios y además parafrasear las normativas existentes sobre discriminación en el deporte.  También es capaz de reconocer algunos de sus errores cuando se le cuestiona.   

Este sistema supone grandes avances en el área de generación automática de textos, que durante muchos años fue considerada la hermana pobre del procesamiento del lenguaje natural y ahora resulta que es la más rica

Este sistema supone grandes avances en el área de generación automática de textos, que durante muchos años fue considerada la hermana pobre del procesamiento del lenguaje natural y ahora resulta que es la más rica.  En mi opinión, este es un claro caso de mucho ruido y potencialmente muchas nueces para muchos sectores de la sociedad, con cientos de startups aprovechando este nuevo sistema, como ha demostrado el reciente Barcelona Mobile World Congress.

Sin embargo, ChatGPT no es el final del camino en la investigación en procesamiento de lenguaje natural.  Hay sin embargo muchísimas áreas todavía por explorar, en particular para proveer soluciones tecnológicas para aquellos idiomas de los cuales no hay suficientes datos para desarrollar sistemas de procesamiento del lenguaje natural (lenguas de signos, lenguas minoritarias…) o para aplicaciones que requieren la producción de información fehaciente y contrastada (documentos científicos, informes médicos, documentos legales de alta complejidad…). La colaboración hombre-máquina y el cuidado por los aspectos éticos será fundamental en los próximos años.  

Del mismo modo que nos hemos acostumbrado a las calculadoras electrónicas, a los robots en la industria, a la tecnología en la medicina, sólo por nombrar algunos ejemplos, veremos y nos acostumbraremos a estos sistemas conversacionales avanzados, nos asombraremos de sus capacidades y también nos quejaremos de sus errores.