La representación lingüística del conocimiento y su relevancia en la ingeniería lingüística

Autora: Lidia Cámara de la Fuente (STAR Servicios Lingüísticos )

Citación recomendada: Lidia Cámara de la Fuente. La representación lingüística del conocimiento y su relevancia en la ingeniería lingüística [en linea]. "Hipertext.net", núm. 2, 2004. <http://www.hipertext.net>

  1. Prefacio
  2. Introducción
  3. Acerca del método de representación y transferencia
  4. De la información al conocimiento
    4.1. Tipos de conocimiento
    4.2. Tareas vinculadas a la gestión del conocimiento
  5. Formas de representación del conocimiento: la fuerza del lenguaje
  6. Disciplinas vinculadas a la representación lingüística del conocimiento
  7. Relevancia de la representación del conocimiento en la ingeniería lingüística y del conocimiento
  8. A modo de conclusión
  9. Bibliografía
  10. Anexo: Glosario sobre representación lingüística del conocimiento e ingeniería de enfoque cognitivo

 

1. Prefacio

La motivación para escribir este artículo nace tras un encuentro de profesionales e investigadores de ámbitos disciplinarios diversos, convocados a participar en un curso sobre gestión del conocimiento. Durante este encuentro, pude constatar que documentalistas , informáticos , lingüistas y no así los economistas , en muchas ocasiones, estábamos hablando de lo mismo, pero la comunicación sufría interferencias. Las torpezas dadas en la comunicación eran sobre todo de naturaleza semántica, sólo salvables tras el esclarecimiento verbal de lo que cada uno entendía por un concepto. De ahí nació la idea de escribir un artículo que ejemplificara la confluencia de varias disciplinas en torno al conocimiento y a la representación de éste.

 

2. Introducción

El presente artículo tiene como principal objetivo, inferible fácilmente del título, contextualizar el concepto de representación del conocimiento dentro de sus posibles marcos de estudio y aplicación.

Para ello, enumeraremos qué tipos de conocimiento existen, en función tanto de su contenido como de su transferencia. Seguidamente, para poder contextualizar el dominio de la representación del conocimiento, tipificaremos las tareas relacionadas con la gestión del conocimiento.

Una vez que hayamos contextualizado los términos conocimiento , representación lingüística (textual y sintética) del conocimiento y gestión del conocimiento, nos ocuparemos de las disciplinas troncales y específicas vinculadas a la representación lingüística del conocimiento y sus implicaciones en el desarrollo de aplicaciones informatizadas (productos de ingeniería lingüística y del conocimiento).

Nuestra aportación a la investigación vinculada al conocimiento representado mediante términos concluye con un breve glosario que contiene las unidades terminológicas que hemos considerado especialmente relevantes y novedosas en este contexto

No obstante, antes de abordar los temas previstos, hemos considerado pertinente introducir brevemente algunas propuestas y decisiones relacionadas con la metodología empleada para plasmar el conocimiento que deseamos transferir a nuestros lectores. Esta concisa explicación pretende ser un método de transferencia de conocimiento que sirva de ejemplo, y su aplicación en el desarrollo de este artículo se traduce en un conjunto de muestras de cómo se puede representar el conocimiento para su mejor gestión.

 

3. Acerca del método de representación y transferencia

La transferencia del saber se complica, especialmente, si ese saber es difícil de anclar a un método científico empírico. Eso hace que el nivel de abstracción sea mayor y, por tanto, que la comprensión pueda ser a veces ardua. Por ello, hemos querido documentar el presente artículo no únicamente mediante el relato verbal o exposición (lenguaje natural plagado de términos), sino mediante mapas mentales que sinteticen la matriz conceptual que subyace al texto.

Los mapas mentales son diagramas de nodos conceptuales relacionados entre sí que sirven para representar conocimiento. Mediante estos instrumentos, se establecen relaciones entre el nuevo conocimiento transferido y el conocimiento del que dispone la persona que los interpreta.

Éste es, pues, un potente instrumento de representación lingüística sistemática y visual de conocimiento. (En el apartado Formas de representación del conocimiento se explica con detalles qué son este tipo de representaciones.)

Así mismo, se trata de un método gráfico que fomenta y aviva las posibilidades del procesamiento de los conocimientos explícitos e implícitos que se desarrollan en el encéfalo, como la activación y organización de la memoria , la capacidad del aprendizaje y el desarrollo semántico del lenguaje (Buzan, 1996).

 

4. De la información al conocimiento

Desde la aplicación sistemática de la tecnología para procesar información , una de las definiciones más extendidas de información es la aportada por Shannon y Weaver (1963), padres de la teoría de la información que más peso ha tenido en los últimos años. Para éstos, el concepto información es un producto vinculado a la cantidad de datos de un mensaje y, por tanto, tiene un enfoque estadístico. La información es, además, un proceso secuencial identificable con un paradigma lineal subyacente. El contenido de la información, el mensaje codificado, tiene, pues, un emisor y un receptor, se transmite a través de un canal y está incluido en un contexto.

Figura 1: Modelo de Shannon y Weaver para la comunicación de información

10000000000002580000010B67E5E286

El esquema anterior representa un modelo de comunicación de información entendida como producto de generación y transmisión lineal de datos ya codificados o representados de forma simbólica utilizando, sobre todo, el lenguaje.

El conocimiento es todo aquello susceptible de saberse o creerse acerca de un mundo real o ficticio. Desde el punto de vista neurocientífico , para que haya conocimiento, basta con que se activen las neuronas y desarrollen las relaciones sinápticas que generan a su vez posibles relaciones semánticas. Esta actividad no es lineal, porque pueden establecerse muchas relaciones al mismo tiempo en diferentes zonas del encéfalo que pueden variar en función del contexto y la percepción individual y social del agente (Kandel, 1997:345-349). Todo este complejo procesamiento de asociación y conexión de tipo físico es conocido como conocimiento humano o también bioconocimiento para diferenciarlo del conocimiento del que puede procesarse mediante artefactos. El bioconocimiento es, pues, un producto dinámico de un proceso neuronal no lineal con muchas variables que dificultan su gestión.

Desde el punto de vista de la gestión empresarial del conocimiento (gestión organizativa), que entiende el conocimiento como parte integrante de un proceso, este término se define como la suma de lo que es conocido, un cuerpo de verdades, principios e información, que, en el contexto de los negocios, guía las operaciones (Bassie, 1997). Esta definición de conocimiento como guía de las tareas relacionadas - entre otras cosas, con la gestión de la información - que deben ejecutarse en el marco de una entidad, refleja también la particularidad de tener como objetivo influir en los procesos del agente y tiene, por tanto, un sentido dinámico.

La vaga línea que separa información de conocimiento depende, pues, de diferentes variables, difícilmente tangibles, ya que no es factible dar una respuesta definitiva a preguntas como las siguientes: qué influjo debe existir en el receptor de la información, qué predominio y caudal de información relevante para el receptor es concluyente para su progreso cognitivo y qué aplicaciones prácticas obtiene el receptor de la información recibida en forma de mensaje. La respuesta a estos interrogantes depende no sólo de la percepción de la información que tenga cada agente o receptor, sino del momento en que ese agente la interprete, si es que lo hace. Para Davenport y Prusak (1999), que no llegan a hablar de conocimiento, consideran que es el receptor - y no el emisor- quien decide si el mensaje que ha recibido es realmente información. Un informe lleno de tablas con símbolos donde no exista una leyenda puede ser considerado información que representa conocimiento por quien lo escribe, pero, a su vez, puede ser juzgado como ruido por el receptor, porque no es capaz de interpretar lo que recibe.

En el ámbito de la semántica léxica y computacional , Díez (1999, 3-1) hace la distinción entre conocimiento y razonamiento :

"Además, tenemos que distinguir también entre conocimiento y razonamiento, ya que el primero está ligado a los sistemas de representación y almacenamiento de la información y el segundo a la recuperación, conexión e inferencias y cálculos hechos con esa información (motores de inferencia), creando información nueva. A priori, cualquier sistema de representación del conocimiento ha de servir para realizar tareas de razonamiento."

La distinción de Díez es aplicable a los entornos de la ingeniería del conocimiento , en los que el conocimiento se concibe entonces como la información preparada para que los motores de inferencia puedan "razonar" y, por lo tanto, el resultado sería un razonamiento.

Nosotros seguiremos llamando conocimiento también al razonamiento en el contexto de una aplicación o un sistema, puesto que, concretamente en el proceso del acceso a la información, ésta se convierte en conocimiento si el acto comunicativo a través de una interfaz es satisfactorio para el usuario o receptor, responsable de la primera parte de la emisión del mensaje, en forma de entrada de datos al sistema de acceso a la información y, por último, responsable también de la satisfacción obtenida, con independencia del proceso inferencial que haya realizado el sistema. El sistema de información interactúa como receptor y emisor con el humano ofreciéndole una respuesta al humano (emisor y receptor) que siempre está supeditada al mensaje introducido, sin tener en cuenta el contexto.

Concluyendo, datos , información y conocimiento , y su diferenciación son, para nuestros fines, elementos inseparables e integrantes de un proceso que influye en el procesamiento cognitivo humano: el de la gestión de conocimiento. Esta idea la asumimos de Cornella (2000:7), quien la sintetiza y resume de la siguiente forma.

"la metabolización de la información, su conversión en estructuras mentales, generalmente permanentes, lleva a la creación de conocimiento en nuestras mentes. Así si un determinado contexto nos lleva a interpretar los datos de una determinada manera, en ese acto hemos creado información. La combinación de esa información con otras informaciones no puede llevar a crear un modelo de interpretación (reflexión y análisis), nos permite llegar a conclusiones (síntesis), hace que nos surjan ideas nuevas (abstracción), de manera que puede decirse que hay un antes y un después de nuestro estado mental."

4.1. Tipos de conocimiento

A pesar de las variables definitorias que explican qué es el conocimiento, en este apartado nos proponemos diseñar un esquema de su tipología siguiendo criterios que atañen a su contenido y a su transferencia.

En lo que respecta al contenido semántico que puede englobar el saber, se pueden tipificar cinco tipos de conocimiento (Kirakowski, 1988, 2-1).

  • Conocimiento de procedimientos

    También se conoce como conocimiento procedural , y se refiere a cómo se hacen las cosas. Este tipo de conocimiento es un paradigma para representar el conocimiento para su aplicación en entornos de inteligencia artificial.

  • Conocimiento de objetos y hechos

    También se conoce como conocimiento declarativo , y se refiere al conocimiento sensorial. Éste es esencial tanto para interpretar el mundo externo como para ubicar su propio yo en un contexto. Este tipo de conocimiento es un paradigma para representar el conocimiento para su aplicación en entornos de inteligencia artificial.

  • Conocimiento de consecuencias

    También se conoce como conocimiento de razonamiento , y se refiere al que se infiere a partir del conocimiento de procedimientos y del conocimiento de objetos y de hechos. Asimismo este tipo de conocimiento sienta las bases para generar razonamiento basado en casos y para facilitar el aprendizaje en conocimiento procedural y declarativo. Este tipo de conocimiento es un paradigma para representar el conocimiento para su aplicación en entornos de inteligencia artificial.

  • Conocimiento de definiciones

    Es el conocimiento articulado, elaborado, asentado, sintetizado y formulado derivado del conocimiento de procedimientos, de hechos y de consecuencias. Este tipo de conocimiento tiene fundamentos epistemológicos y se representa de forma textual mediante la descripción de sus características y la estructuración de las relaciones que existen entre los conceptos (estructuras conceptuales) que subyacen al texto de la definición. Este conocimiento se utiliza como recurso lingüístico lexicográfico para adquirir conocimiento de forma automatizada, extrayéndolo de las estructuras conceptuales. Así mismo, este conocimiento contribuye al modelado del conocimiento dando pautas para la organización de la macroestructura y de la microestructura del conocimiento de un dominio.

  • Metaconocimiento

    Es el conocimiento acerca del conocimiento que tiene como objetivo automatizar la gestión del conocimiento, es decir, guiar la planificación y la aplicación del conocimiento en el entorno de un sistema. Este tipo de conocimiento, por tanto, incluye información acerca del conocimiento de definiciones, de procedimientos, de objetos y de hechos que posee un sistema. Este término determina la existencia de un nivel de conocimiento abstracto que identifica los fundamentos implícitos y explícitos del conocimiento en un sistema. Este tipo de conocimiento es una metodología y técnica utilizada en ingeniería lingüística para desarrollar sistemas basados en conocimiento (ingeniería del conocimiento).

Figura 2: Tipos de conocimiento en cuanto al contenido

100000000000024700000130970A82F2

En este mapa, se ha tipificado el conocimiento en los cinco grupos que acabamos de describir. Sin embargo, es frecuente encontrar diferentes tipos de conocimiento combinados.

Si clasificamos el conocimiento en cuanto a su transferencia , cabría agruparlo en dos categorías, a saber:

  • Conocimiento tácito es el saber que tienen un individuo u entidad compuesta de individuos. Este conocimiento responde a preguntas sobre cómo se hacen las cosas: cómo se resuelven problemas, cuándo resolverlos y de dónde se obtienen los recursos para poder solventarlos. Está orientado a la experiencia y tiene un motor consciente y otro inconsciente : por eso, es difícil hacerlo explícito en su totalidad. Este saber engloba todas las habilidades que tienen las personas y se transfiere de manera informal.

    Según Reber (1995:15), el término conocimiento tácito aparece por primera vez en dos obras de Polanyi (1958/1974). Sin embargo, el concepto implícito en el término de proceso intelectual (cognitivo) y emocional (de conducta) con dos niveles de percepción , el consciente y el inconsciente , es una idea formulada por Lashley (1956, 1-18).

Figura 3: Dificultad de transferencia de los niveles de conocimiento

10000200000001F4000000C137CC3BBF

  • El conocimiento explícito, también llamado conocimiento convencional , es aquel que ya está representado o documentado y se utiliza como medio para transmitir los procedimientos que se han que seguir para resolver de forma óptima cualquier trabajo, problema o proceso, en general. Por tanto, este conocimiento está orientado conscientemente a la resolución de problemas y se haya siempre representado, lo que supone poder acceder a él conscientemente. Todo el conocimiento representado es conocimiento explícito y se genera a partir de conocimiento tácito o de conocimiento previo explícito. Esta representación del conocimiento es la interfaz entre el cerebro y el mundo exterior.

    El conocimiento representado se convierte en producto tangible , con respecto al conocimiento que se crea, se infiere, se interpreta, se deduce, se desprende, se dilucida, y que engloba el conocimiento tácito. Más adelante explicaremos de qué formas y mediante qué recursos se puede representar el conocimiento.

    El conocimiento que no es representado y, por tanto, no es explícito es un proceso difícil de medir debido a su intangibilidad. La representación del saber puede someterse a un modelado relativo, es decir, se puede partir de términos, estructuras conceptuales comunes o procedimientos que ayuden a codificar el conocimiento para desarrollar y gestionar de forma más eficiente el conocimiento individual y colectivo. Otro término que identifica el mismo concepto englobado en gestión de conocimiento explícito y es gestión de contenidos. Aquí utilizamos indistintamente ambos términos.

4.2. Tareas vinculadas a la gestión del conocimiento

Desde que la gestión del conocimiento se ha incorporado como asignatura en muchos estudios relacionados con la administración y dirección de empresas, el término ha logrado notables cuotas de popularidad, hasta el punto de que a menudo se llega a pensar que se trata de algo nuevo.

Sin embargo, si consideramos que la gestión del conocimiento es un concepto que engloba la generación , la representación , la adquisición -término también conocido como gestión del aprendizaje -, y la transferencia de saber , es obvio inferir que, de hecho, las tareas vinculadas a la gestión del conocimiento no son algo reciente.

En este sentido, las universidades y cualquier centro de formación son centros de gestión del conocimiento por tener como objetivo la generación y la transferencia del saber , en beneficio de la adquisición de ese mismo saber. Sin ir más lejos, los seminarios, cursos, conferencias son modelos de transferencia de conocimiento.

Así mismo, desde su origen, las bibliotecas están concebidas para almacenar y clasificar conocimiento explícito para facilitar su transferencia. Las bibliotecas y cualquier centro de documentación gestiona el conocimiento una vez que está representado, es decir, cuando ya se ha convertido en texto, imagen o sonido, o en alguna combinación de tales elementos.

Al elaborar la tipología de las clases de conocimiento según el criterio del contenido que representa, hemos asumido una clasificación de entidades no estancas que permiten su combinatoria. En cuanto a las tareas relacionadas con la gestión del conocimiento, se debe partir de lo mismo. Las siguientes categorías -generación, adquisición, representación y transferencia- que representamos en el siguiente mapa, tampoco son entidades invariables e inmóviles. Estas entidades representan actos relacionados con la gestión del conocimiento e interconectados entre sí, y dan cuenta de su propia naturaleza, proceso muy dinámico y complejo no lineal.

Figura 4: Tareas vinculadas al complejo proceso de la gestión del conocimiento

100002000000025800000175B6D985D3

  • La adquisición de conocimiento es el acto en el que el agente incorpora nuevos procesos de decisión para resolver problemas o para optimizar procedimientos. La dificultad estriba en la obtención del conocimiento tácito de otros expertos. Mucho menos arduo resulta, sin embargo, adquirir conocimiento ya representado, es decir, explícito. La generación de conocimiento difiere poco de la adquisición de conocimiento, ya que cuando el agente adquiere saber, ese conocimiento tácito se genera en el cerebro. Ahora bien, si el agente convierte ese saber en conocimiento explícito, entonces el agente también se convierte en generador de conocimiento explícito. En el ámbito de la ingeniería del conocimiento la adquisición es la primera fase necesaria antes de diseñar una herramienta basada en conocimiento (sistema experto). En esta fase el gestor de la información o el ingeniero de conocimiento debe hacer una prospección de datos sobre los procesos de decisión usados por el experto humano y debe analizar los protocolos relacionados con los procesos que debe realizar el sistema de gestión para poder hacer una síntesis de los conocimientos relevantes para el sistema. En esta fase se identifica el proceso de estrategias naturales de decisión que posee el experto humano.

  • La representación de conocimiento es un proceso en el que interviene también el acto de la transferencia de ese mismo conocimiento para su posterior plasmación en algún lenguaje simbólico para representar, así, contenidos. Es un mecanismo para transformar el lenguaje tácito en lenguaje explícito. La representación del conocimiento, además de un proceso, es un producto dependiente del saber que identifica que sirve para la transferencia de conocimiento. Así mismo, este producto sirve de materia prima para la adquisición de conocimiento y también para la generación de nuevo conocimiento. Más adelante dedicamos parte de este trabajo a identificar las formas en las que se puede representar el conocimiento.

  • La transferencia de conocimiento es la parte del acto comunicativo en la que se establece una transmisión de contenidos, a través de algún canal auditivo o visual, a un agente receptor. Existe transferencia de contenidos, si existe una representación previa del conocimiento. En el ámbito de la ingeniería del conocimiento, las interfaces de los sistemas expertos sirven para transferir el conocimiento que se desea obtener del sistema.

5. Formas de representación del conocimiento: la fuerza del lenguaje

A través del arte, la ciencia y la tecnología se manifiesta y se representa el conocimiento. Estar dotados de esta capacidad cognitiva de crear, transferir y representar conocimiento es lo que nos hace diferentes con respecto a otros seres.

La ciencia utiliza, sobre todo, el lenguaje como mediador del conocimiento estructurándolo y representándolo, y la tecnología desarrolla artefactos que son productos derivados de conceptualizaciones cognitivo-lingüísticas. Los desarrollos tecnológicos son aparatos o máquinas resultantes de pensamientos organizados con un objetivo concreto. En este sentido, se podría decir, que, en parte, cualquier máquina es una aplicación de conocimiento especializado y, por tanto, una representación aplicada del conocimiento.

El arte es también otra de las manifestaciones para la representación de conocimiento. Sin embargo, la transferencia de sus contenidos es mucho más difícil de consensuar. La razón de esta dificultad estriba en el papel que desempeña la percepción, es decir, el conocimiento sensorial o emocional, con respecto al peso que adquiere el conocimiento cognitivo o intelectual. Esto supone que los mecanismos argumentativos para defender el significado que contiene la obra representada, de alguna manera, estén sesgados igualmente por la percepción del agente que interpreta la pieza representada.

La poesía, la pintura, la escultura y, en general, todas las modalidades que se engloban en el concepto de arte son representaciones de conocimiento que se alimentan, a su vez, del conocimiento generado en todas las disciplinas científicas y que se sirven también de los desarrollos tecnológicos.

El contenido producido y representado mediante el arte utilizando arte, ciencia y tecnología también es otra forma de representación del conocimiento. La materia prima utilizada para estos fines es muy diversa y no es patrimonio específico de un ámbito. Así, pueden encontrase recursos lingüísticos, visuales y auditivos en cualquier manifestación de arte, ciencia y tecnología.

Sin embargo, y, a pesar del afán interdisciplinar de este artículo, dejaremos a un lado las representaciones del conocimiento en el ámbito del arte y la tecnología, para concentrarnos en la representación del conocimiento científico.

Dentro de los recursos que se pueden utilizar para la representación de conocimiento, nos centraremos en destacar el papel del lenguaje por su relevancia particular. El lenguaje es básico en el desarrollo y transferencia de contenidos. Se ha demostrado que las tareas vinculadas a la gestión del conocimiento están íntimamente relacionadas con los procesos cognitivo-lingüísticos que tienen lugar en el cerebro, y se materializan en forma de conocimiento representado a través del lenguaje (Kandel, 1995, y Jorba y Sanmarti, 1996). El lenguaje es el reflejo del modelo de procesamiento del pensamiento humano. Y, visto desde esta perspectiva, el lenguaje empieza a entenderse y a explicarse más allá de las limitaciones impuestas por la lingüística tradicional, marcada por el entendimiento del lenguaje como fenómeno lineal.

El lenguaje es un fenómeno complejo y dinámico en el sentido de que está siempre en movimiento: por ser una herramienta universalmente utilizada que siempre está siendo actualizada por los agentes que intervienen e interactúan en el acto de la comunicación, y porque produce manifestaciones de formas espontáneas dependientes de las condiciones sicológicas, fisiológicas y sociales. Esta diversidad compleja siempre creciente debe buscar una coherencia dentro de la misma estructura del sistema y dentro de un entramado aparentemente caótico (Steels, 1996 y 2000). Esta concepción del lenguaje responde a un paradigma complejo como un mapa abierto, conectable, descentralizado y con múltiples jerarquías variables, reflejo de las estructuras y la organización del conocimiento humano (bioconocimiento). Se trata de un paradigma de conocimiento complejo alternativo al paradigma lineal de los modelos inductivos y deductivos (causa-efecto).

En el esquema que sigue mostramos las formas de representación del conocimiento atendiendo a la materia prima utilizada para esa representación (recursos lingüísticos, imágenes y sonido) y las formas que ésta adopta.

Figura 5: Recursos y formas de representación del conocimiento

1000020000000258000001CB9E664FBC

Por recursos lingüísticos, entendemos el lenguaje natural y los términos cuya naturaleza de representación también es lingüística. La relevancia de los términos en la representación de contenidos la analizamos más adelante. Estas son las formas en las que pueden aparecer estos recursos lingüísticos representando extractos de conocimiento:

  • La representación lingüística textual aglutina el lenguaje natura l y los términos , que conjuntamente dan forma a cualquier tipo de documento presentado en forma de relato verbal, como el artículo, la guía, el informe, el manual o la tesis, entre otros. Este tipo de representación la consideramos de carácter analítico o explicativo, frente a las representaciones estructurales, que son la síntesis de un análisis.

  • La representación lingüística sintética se abastece para la producción de sus contenidos, ante todo, de los términos estructurados para representar sistemas conceptuales (tesauros, ontologías, glosarios, etc). Así mismo, los términos pueden aparecer en diagramas y mapas, como único recurso lingüístico o en combinación con otros recursos de tipo visual o auditivo.

  • Los documentos estructurados en forma de relato verbal pueden abastecerse de lenguaje natural y términos para la representación de sus contenidos y pueden utilizar otros recursos, como representaciones estructurales, abastecidas de imágenes, símbolos o iconos.

  • Las representaciones multimedia son una combinación de materia prima y tipo de representación; en cuanto a la materia prima utilizada, pueden hacer uso de lenguaje natural, términos, imagen o sonido, y pueden aparecer en extractos de conocimiento de tipo analítico o de tipo sintético.

Lo que llamamos conocimiento son conceptualizaciones representadas que explican la naturaleza de nuestro mundo real y abstracto, pero el conocimiento en sí, no existe en la naturaleza (Galinsky, 2001). Se representa el contenido de nuestros razonamientos. Como ya hemos visto, la representación se hace a través de símbolos de tipo lingüístico , de tipo visual o de tipo auditivo. Los símbolos son transportadores de conocimiento que pueden apelar a cualquiera de nuestros sentidos para hacernos llegar el contenido semántico y el sentido perceptivo que encierran.

El lenguaje natural , la palabra y el texto, son la forma más potente de representación del conocimiento y, por tanto, de gestionar la información (Codina, 2001:201); es más, la generación, representación y transferencia del conocimiento a través del lenguaje es uno de los factores determinantes para la supervivencia de nuestra especie sobre otros homínidos (Junyent, 2003:40-41).

Los términos son unidades de naturaleza lingüística que representan conocimiento de un determinado dominio y son consensualizaciones para denominar conceptos a fin de poderlos transmitir. Ya hemos aludido a la trascendencia del lenguaje como fenómeno determinante para el desarrollo de conocimiento. Si, además, esto lo unimos a la funcionalidad de los términos, que acabamos de explicar, podemos afirmar que no existe conocimiento sin terminología.

Los términos son parte fundamental de la estructura textual que representa el conocimiento y se presentan tanto en la microestructura como en la macroestructura de cualquier representación lingüística de contenidos.

Por microestructura, entendemos el conjunto de unidades que:

  • componen la matriz cognitiva (sistema conceptual) sobre la que se construye un texto (documento);

  • sirven de elementos identificadores, o descriptores para identificar el contenido de un documento;

  • materializan las presentaciones estructurales (gráficos, esquemas, mapas mentales, tesauros, ontologías...) de conocimiento;

  • integran los nodos, vértices de los diferentes esquemas de representación del conocimiento (mapas conceptuales, marcos, redes semánticas...) utilizados en el ámbito de la inteligencia artificial;

Y por macroestructura, entendemos:

  • los productos textuales finales: el texto adaptado a diferentes tipos de documentos: material didáctico, tesis, informes de proyecto, informes anuales, guía, manual, etc.;

  • los sistemas de representación estructural para gestionar los productos textuales finales y para gestionar el conocimiento de una disciplina.

6. Disciplinas vinculadas a la representación lingüística del conocimiento

En el apartado anterior hemos visto que los términos desempeñan un papel preferente en la representación del conocimiento. Si consideramos cuál es su naturaleza (lingüística), lo que representan (conocimiento) y su función (comunicar y transferir conocimiento), no es difícil deducir qué disciplinas troncales intervienen en su estudio.

En el siguiente esquema hemos representado de qué disciplinas se obtienen los fundamentos en los que se apoyan toda la investigación y el método relacionados con la representación lingüística del conocimiento (lingüística , ciencias del conocimiento, y ciencias de la información y la comunicación). Así mismo, en el esquema, apuntamos qué disciplinas interdisciplinares se han derivado de las fundamentales y dan respuestas a las incógnitas relacionadas con la representación de contenidos, en cuanto unidades que representan tanto la microestructura como la macroestructura que subyacen a cualquier representación lingüística de conocimiento.

Figura 6: Fundamentos disciplinares de la representación lingüística del conocimiento

10000000000001F7000001D836680066

La terminología es una ciencia interdisciplinar que se nutre de un conjunto específico de conocimientos conceptualizado en otras disciplinas (lingüística , ciencia del conocimiento y ciencias de la información y la comunicación). Así mismo, es una ciencia transdisciplinar porque los productos terminológicos son las piezas de representación lingüística en las que debe apoyarse cualquier campo de conocimiento científico para poder adquirir, generar y transferir el conocimiento específico de cualquier dominio (Cabré 1998a:70). Eso quiere decir que en el campo del derecho, de la medicina, o de la física, por ejemplo, la disciplina de la terminología desempeña un papel fundamental como proveedora de términos transportadores de conocimiento que median en la comunicación, como identificadora de reglas subyacentes en la generación y relación de los términos, y como método y habilidad de trabajo.

La práctica terminológica y su aplicación para conceptuar los avances científicos y técnicos data de hace tres siglos (Cabré, 1993:21). Sin embargo, no será hasta 1931 cuando se publique el primer trabajo de sistematización metodológica para el desarrollo de técnicas terminologías y terminográficas, a cargo de Wüster. En su obra póstuma, Einführung in die allgemeine Terminologielehre und terminologische Lexikographie (Eugen Wüster , 1979/ 1998), este ingeniero austriaco desarrolla planteamientos teóricos (Teoría General de la Terminología) que han servido de base para fundamentar la terminología moderna, de la que ya se han derivado nuevas concepciones (Cabré, 1999:122-124).

La organización del conocimiento es una disciplina de formación reciente que estudia las leyes, los principios y los procedimientos para estructurar el conocimiento especializado e identificar y establecer la arquitectura en la que se sustenta el conocimiento de cualquier dominio.

Mucho antes de que la organización del conocimiento alcance el estado de disciplina, es tratada por Aristóteles en su empeño por fragmentar el mundo para entenderlo y, así, poder clasificarlo. Desde entonces, esta actividad ha sufrido cambios espectaculares. De concepciones puramente metafísicas y especulativas, desarrolladas en el terreno de la filosofía, la epistemología y la ontología, se ha pasado a concepciones físicas y informático-pragmáticas, desarrolladas desde diversas ramas (biblioteconomía, documentación, epistemología, informática , inteligencia artificial , semiótica , terminología , etc.), desplegadas a partir de las ciencias fundamentales: lingüística, ciencias del conocimiento y ciencias de la información y la comunicación.

Los inicios de esta disciplina como tal coinciden con los avances de la documentación y la biblioteconomía. La publicación en Viena del tratado sobre documentación Handbuch der Klassifikation (1947) del austriaco Paul Otlet da pautas para generar instrumentos fundamentales para la gestión de conocimiento científico, basando toda su estrategia en la organización (clasificación) de los contenedores (documentos) donde se guarda el conocimiento representado, es decir, la información. Los trabajos del alemán Wilhelm Ostwald , premio Nobel de química en 1906, son también transcendentales en el desarrollo de la disciplina de la organización del conocimiento. Ostwald plantea por primera vez soluciones para la organización del trabajo intelectual (el trabajo intelectual es conceptualmente igual a lo que denominados conocimiento científico). Con su propuesta de que el conocimiento debe organizarse de forma fragmentada, estandarizada, normalizada e internacionalizada, Ostwald se convierte en el precursor de la web semántica (Ostwald, 1912).

Este campo de estudio es de naturaleza interdisciplinar y se nutre de los aportes recibidos de la lingüística , las ciencias del conocimiento y las ciencias de la información y la comunicación. El objeto de esta disciplina es, por una parte, la organización del conocimiento explícito (conocimiento representado), es decir, socializado o registrado a fin de optimizar la circulación del conocimiento en la sociedad y, por otra, el desarrollo de metodologías que sustenten paradigmas de conocimiento válidos, escalables y ampliables. También se considera una disciplina científica, esto es, sujeta al método científico, de carácter aplicado (García Marco, 1998)

En el siguiente mapa, representamos el despliegue de disciplinas que, desde las ciencias fundamentales, pueden vincularse al ámbito de la representación del conocimiento, desde la perspectiva de su microestructura (terminología) y de su macroestructura (representación del conocimiento).

Figura 7: Interdisciplinariedad de la representación lingüística del conocimiento

1000020000000258000001862AA86613

La esfera que representa las disciplinas de la terminología y la organización del conocimiento tiene flechas en su interior en varias direcciones. Con ellas, queremos representar que estas materias están vinculadas a todas las disciplinas derivadas de las ciencias troncales resaltadas en círculos mayores. El mapa quiere, ante todo, dar cuenta de la interdisciplinariedad y complejidad del ámbito en el que nos movemos.

Si partimos de nuestra propuesta (Cámara, 2000:20-49), derivada de una propuesta clasificatoria de García Gutiérrez (1984 y 2002), el mapa que apuntamos a continuación muestra las disciplinas de las que se parte para el estudio de la representación, organización y aplicación del conocimiento (lingüística documental y ciencias del conocimiento). Esta clasificación es una prueba más de las diferentes formas de ordenar el saber, y de disponer de etiquetas que representen nuestras categorías con fines específicos y especializados.

Figura 8: La lingüística documental y las ciencias del conocimiento en la representación, organización y aplicación del conocimiento

1000020000000258000001B6634FEE50

7. Relevancia de la representación del conocimiento en la ingeniería lingüística y del conocimiento

Desde que la sociedad de la información global y multilingüe -caracterizada por la omnipotente influencia de las tecnologías de la información y de la comunicación- ha expandido su influencia vertiginosamente, la gestión de los recursos lingüísticos se ha convertido en una necesidad ineludible para la mayoría de las entidades públicas y privadas.

La industria del conocimiento irrumpe con fuerza ofreciendo respuestas que acaben con la infotoxicación y que contribuyan a la creación de más conocimiento a partir de información codificada como simples datos. Esta industria, por su estrecha relación con la codificación del conocimiento como información textual, depende de métodos, herramientas y recursos lingüísticos que han venido desarrollando las industrias de la lengua.

Cada año se crean nuevas asociaciones, comunidades y grupos de interés que se involucran como usuarios o como desarrolladores en actividades relacionadas con la gestión de recursos lingüísticos. Para abastecer de materia prima al mercado son necesarios nuevos lenguajes relacionados con dominios de especial interés, relacionados también con los diferentes registros de la lengua, con una dimensión diferente entre el lenguaje escrito y el oral (chat), y por último, relacionados con la tipología y estructuración textual. De esta materia prima lingüística se abastecen ámbitos tan diversos como el de la traducción e interpretación, el reconocimiento de voz, la recuperación de información en entornos abiertos (Internet) y cerrados (Intranet), y la gestión del conocimiento. Todas estas aplicaciones a las que se dedica la ingeniería lingüística están relacionadas con la gestión de la información y del conocimiento. Son aplicaciones que precisan trabajar con el conocimiento representado en forma de productos terminográficos , sistemas conceptuales y otros recursos lingüísticos , así como métodos , herramientas y experiencia acumulada en este sector de la industria de la lengua.

Desde el punto de vista cognitivo, los sistemas desarrollados en el ámbito de la ingeniería lingüística están estrechamente vinculados a la ingeniería del conocimiento, porque sus planteamientos se basan en estructuras lingüísticas que conforman sistemas conceptuales variables que ofrecen respuestas probables. Esta visión cognitiva se está aplicando en muchos de los retos asociados al procesamiento del lenguaje natural. En este sentido, los nuevos sistemas de traducción automatizada, por ejemplo, se basan en corpus textuales paralelos (memorias de traducción) que se indizan utilizando bases de conocimiento que ayudan a estructurar y desambiguar los posibles resultados que ofrece la máquina (Hutchins y Somers, 1995:417-422). Es un planteamiento diferente con respecto a las primeras épocas de la ingeniería lingüística. La primera época parecía ser meramente estadística hasta que se introdujeron estrategias basadas en conocimiento lingüístico de tipo morfológico y después sintáctico. El renacimiento de la relevancia de la semántica en los desarrollos de la ingeniería lingüística es el resultado de los avances aportados por la ciencia del conocimiento. Esta evolución de planteamientos corresponde a un cambio de paradigma del conocimiento, de uno lineal a otro complejo. Los sistemas de recuperación de información también han sufrido una transformación cuya evolución también ha repercutido en su denominación: sistemas de recuperación de conocimiento , sistemas de gestión de conocimiento. De Mey ha tipificado cuatro etapas en el desarrollo del tratamiento de la información que coindican las que determinan la evolución de la ingeniería lingüística (De Mey, 1980).

La ingeniería lingüística es una actividad eminentemente aplicada. Es el resultado de representar en forma de artefactos y lenguajes artificiales las deducciones que se obtienen del área de trabajo de la lingüística textual, de la lingüística computacional, de la informática, de la terminología y de la organización del conocimiento.

Las áreas de la ingeniería lingüística vinculadas al diseño y desarrollo de sistemas basados en conocimiento son:

  • Adquisición de conocimiento (knowledge acquisition)

-Identificación de unidades o grupos de conocimiento

-Extracción de datos que representan unidades o grupos de conocimiento

  • Modelado de conocimiento (knowledge modelling)

-Desarrollo de metadatos interpretables e intercambiables de forma digital

-Arquitectura del conocimiento (metodología para la macroestructura)

-Macroestructura: Estructura para la clasificación, indización y recuperación del conocimiento (sistemas conceptuales)

  • Representación de conocimiento (knowledge representation)

-Creación de términos

-Recopilación de unidades o grupos de conocimiento

-Identificación de las relaciones semánticas entre unidades o grupos de conocimiento

-Microestructura: estructuración de unidades o grupos de conocimiento

-Macroestructura: estructura para la clasificación, indización y recuperación del conocimiento (sistemas conceptuales)

  • Infraestructura para el desarrollo de ingeniería de conocimiento (knowledge engineering development infrastructure)

-Bases de conocimiento (knowledge base)

-Reglas de inferencia (inference rules)

-Recuperación de conocimiento (knowledge retrieval)

-Interacción y diseño de interfaces humano-máquina (human-computer interaction /human-computer interface design)

Todas estas áreas enumeradas de forma secuencial están relacionadas entre sí, como intentamos representar en el siguiente esquema:

Figura 9: Ramas de la ingeniería lingüística vinculadas al diseño y desarrollo de sistemas basados en conocimiento

10000200000002260000014A763BCA5C

La adquisición de conocimiento está relacionada con una actividad humana que corresponde a la prospección de información (conocimiento) que se obtiene de un experto. En el ámbito de la ingeniería lingüística, y más específicamente de la ingeniería de conocimiento, también se desarrollan herramientas para la extracción automatizada de datos que representan conocimiento, por ejemplo, de tipo léxico o terminológico. Esta extracción se puede realizar de forma manual, a partir de diccionarios electrónicos y de córpora textuales digitalizados (Moreno, 2000:2-3)

La construcción y el mantenimiento de conocimiento sobre un dominio mediante diccionarios (enciclopedias), ontologías, clasificaciones (epistemografías), están vinculados a la representación del conocimiento. Ésta puede beneficiarse de la adquisición del conocimiento, influye en el modelado del conocimiento y, por último, es una pieza insustituible para definir infraestructuras de desarrollo para la ingeniería de conocimiento.

De las tareas correspondientes a la representación del conocimiento, se deben desprender los parámetros (Cámara, 2000) vinculados a las propiedades:

  • que nos ofrecen las estructuras semánticas descritas en el sistema conceptual decidido en el modelado del conocimiento, y

  • pragmáticas generadas a partir del input de los usuarios, ya sea de forma directa, ya mediante una interfaz de consulta y alimentación.

De estas propiedades se pueden derivar reglas para el desarrollo del motor de inferencia y de control, dos de los módulos que integran un sistema de gestión basado en conocimiento, como veremos más adelante. La forma que tengamos de presentar el conocimiento, es decir, de publicarlo, dependerá de los criterios adoptados para la representación de la microestructura y de la macroestructura. Por tanto, la publicación del conocimiento está vinculado a su representación y modelado.

La importancia de la representación del conocimiento en redes multiasociativas basadas en probabilidades marca una etapa cognitiva que también repercute en la ingeniería lingüística. Se trata de que los sistemas simulen la forma de procesar la información en el cerebro, lo que supone representar previamente esa forma de clasificar y estructurar el cerebro para alimentar el sistema con información que pueda generar instrumentos de gestión de conocimiento.

Para ello, la estructuración del conocimiento representado que conforma la llamada base de conocimiento de cualquier sistema experto es esencial. Eso quiere decir que cualquier proyecto de inteligencia artificial que utilice el conocimiento como clave de la resolución automatizada de problemas cognitivos deberá confeccionar en primera instancia un proyecto de representación de conocimiento de un ámbito concreto de especialidad para poder generar una buena base de conocimiento de donde se pueda inferir y transferir nuevo conocimiento.

Cualquier sistema cuyo objeto sea gestionar conocimiento tiene que contar con una base de conocimiento, que es un módulo que contiene la memoria estructurada de un determinado dominio experto y, por tanto, uno de los dispositivos esenciales de cualquier sistema basado en conocimiento (SBC).

  • Base de conocimiento experto

  • La base de conocimiento experto, como se puede ver en la ilustración que sigue, es el módulo de mayor capacidad de memoria , pues es ahí donde se almacenan las estructuras lingüísticas con sus relaciones semánticas. Estas estructuras conceptuales son la representación del conocimiento experto mediante términos , y deben servir para la resolución de problemas específicos. Del conocimiento morfológico y semántico aportado por las relaciones semánticas, se obtienen algunas reglas predictivas que anticipan las consultas de los usuarios y proponen soluciones basadas en ecuaciones de probabilidad. Estas reglas son dependientes del dominio experto y de la información almacenada sobre ese dominio, aunque algunas puedan considerarse reglas genéricas, aplicables, por tanto, a cualquier dominio.

Los otros dispositivos genéricos de cualquier SBC son los siguientes:

  • Motor de inferencia y de búsqueda

    El motor o máquina de inferencia activa el proceso que hace a la máquina razonar a partir de los datos. Las relaciones conceptuales representadas en la base de conocimiento se utilizan como motor inferencial. Este proceso se realiza mediante reglas de control y razonamiento que activan la propiedades de la base de conocimiento. El motor de inferencia cuenta también con una memoria de trabajo donde se almacenan los datos de entrada y las conclusiones intermedias que se van generando durante el proceso de razonamiento.

  • Interfaces de usuario (interfaces humano-máquina)

    Las interfaces son el puente que permiten la comunicación entre el humano y la máquina. Ofrecen al usuario una posibilidad de entrada y de salida del sistema. En la interfaz de consulta , el usuario debe introducir las unidades de conocimiento a las que desee relacionar su consulta. Como resultado de hacer interactuar las reglas del motor de inferencia con un término de la estructura de la base de conocimiento, el sistema debe proporcionar opciones de consulta. Y estas opciones dependerán siempre del material almacenado en la base de conocimiento experto, y no de las reglas del motor de inferencia.

Figura 10: Arquitectura de un sistema basado en conocimiento (SBC)

100002000000024F0000016CCB6FD2DB

Los sistemas basados en conocimiento se apartan de otros modelos tradicionales por separar el conocimiento según el modo en que se usa ese conocimiento. De esta manera, la probabilidad de las respuestas satisfactorias obtenidas por el sistema aumenta, de tal modo que se reducen las respuestas deterministas que no se corresponden con el paradigma del conocimiento humano (paradigma de conocimiento complejo), ya explicado.

Los SBC son sistemas que resuelven problemas utilizando una representación simbólica del conocimiento humano mediante el lenguaje (Jackson, 1999). Separan el conocimiento especifico del problema (base de conocimiento representado de forma textual) de las bases de reglas para solucionarlo (máquina de inferencia). Mediante esta separación, consiguen un alto rendimiento en un dominio especifico haciendo uso de heurísticas y de inferencia simbólica (Morales y Sucar, 1999).

La diversidad y posibilidad combinatoria del conocimiento nos obliga a usar el conocimiento sobre campos altamente específicos. Así, los SBC usan el conocimiento sobre un campo específico para hallar la solución de un problema de ese campo. La solución encontrada debe estar vinculada a la que extrae una persona con conocimiento sobre el campo del problema, enfrentada a ese mismo problema.

Las ventajas de los SBC estriban en que amplían la difusión y conservación del conocimiento, pueden modificarse y, además, pueden resolver problemas disponiendo de información incompleta con ayuda del motor de inferencia.

Los inconvenientes a los que se enfrenta un SBC están vinculados a que las repuestas ofrecidas no indican siempre una solución de búsqueda deseada; más aún, el conocimiento que pueda tener el sistema se concentra en el dominio experto y ese conocimiento experto es difícil de extraer del humano experto para sistematizarlo.

El rendimiento de los sistemas basados en conocimiento experto depende de la cantidad y la calidad del conocimiento representado de un dominio especifico, es decir, de una base de conocimiento experto. Así, el papel de las técnicas de soluci