Introducción

El objetivo principal de este proyecto es estudiar el uso contextualizado de un grupo de nombres y adjectivos tal como se presentan en un corpus informatizado para poder desarrollar nuevos tipos de descripción que pudieran presentarse en el formato de diccionario. El uso contextualizado del léxico es importante, porque sin información del contexto, la mayoría de las palabras del léxico común evidencian un significado indeterminado; es decir, tienen un potencial de significado que se especifique en cuanto se establezca el contexto de uso. Según esta visión del signficado léxico, las palabras que coocurren con una determinada unidad léxica son imprescindibles para poder determinar el significado de la unidad, porque sin estas palabras empleadas en contexto, la unidad léxica podría tener varios significados. Esta aproximación, que recuerda la frase conocida de Firth ″you shall know a word by the company it keeps″ (″conocerás una palabra por la compañía que tiene″), plantea un reto serio para la descripción lexicográfica tradicional que encontramos en los diccionarios generales de lengua, que lista acepciones como ítems aislados bajo un lema, sin prestar atención a la información contextual o a la combinatoria. Para superar el problema planteado, el proyecto propone estudiar detalladamente los datos de corpus para varios grupos semánticos de sustantivos y adjetivos—de cara a identificar maneras para incluir información contextual e redes colocaciones en nuevos productos lexicográficos. Los datos estudiados vienen del español, del catalán y del inglés.