Introducció

L'objectiu principal d'aquest projecte és estudiar l'ús en context d'un grup de noms i adjectius, tal com apareixen a grans corpus, per desenvolupar nous tipus de descripcions lingüístiques que puguin presentar-se en un diccionari. L'ús "en context" del lèxic és important perquè sense la informació sobre el context, la majoria de les paraules del vocabulari general d'una llengua tenen un significat indeterminat; és a dir, que tenen un potencial de significat que s'especifica un cop se n'estableix el context d'ús. Tenint en compte aquesta visió del significat de les paraules, les paraules que co-ocorren amb certs elements lèxics són essencials per determinar el significat de la unitat lèxica, ja que sense les paraules concurrents en context, l'element lèxic pot tenir diversos significats. Aquesta aproximació, que va d'acord amb l'observació de Firth que estableix que "you shall know a word by the company it keeps" ("pots conèixer una paraula gràcies a les seves companyies"), planteja un desafiament seriós a la descripció lexicogràfica tradicional que es troba als diccionaris de llengua general, que donen llistes dels significats de les paraules com a ítems sota un encapçalament, amb poca consideració per la informació del context o les col·locacions. Per superar aquest repte, el projecte proposa estudiar detalladament les dades provinents de corpus per als diferents camps semàntics dels substantius i adjectius per identificar maneres d'incloure informació contextual sobre els sentits de la paraula i xarxes colocacionales en nous productes lexicogràfics. Les dades provindran del castellà, el català i l'anglès.