Por la necesidad de actualización constante de los datos, la metodología de trabajo del Observatori de Neologia tiene como base la actividad de vaciado de textos para la extracción de nuevos neologismos. El Observatori compatibiliza esta actividad con los trabajos de análisis y de difusión de los neologismos.

Vaciado

El vaciado consiste en la detección de neologismos y creación de un corpus de neologismos para el catalán y para el castellano, a partir del vaciado de textos (fuentes de vaciado). Esta detección se realiza manualmente, y semiautomáticamente, con la herramienta Buscaneo. La ficha de vaciado incorpora información lingüística y pragmática de los neologismos.

Definición de neologismo

El criterio con el que trabaja el Observatori de Neologia para establecer la neologicidad de las palabras es el criterio lexicográfico: se considera neologismo cualquier palabra que no aparezca en el corpus lexicográfico de exclusión.

Se aplican diversas restricciones al criterio lexicográfico: por una parte, se consideran neologismos, aunque se documenten en el corpus de exclusión, las palabras con marcas de neologicidad. Por otra parte, no se consideran neologismos aunque no se documenten en el corpus de exclusión, diversos tipos de unidades como los aumentativos, diminutivos y superlativos, los adverbios en -mente, etc. Actualmente, en OBNEO trabaja en la aplicación de filtros que completen el criterio lexicográfico y que permitan distinguir unidades más o menos neológicas dentro del conjunto de unidades consideradas neológicas desde el punto de vista lexicográfico.

Corpus lexicográfico de exclusión

El corpus lexicográfico de exclusión es el conjunto de diccionarios utilizados para determinar si las unidades son neológicas desde un punto de vista lexicográfico.

Para el catalán, actualmente se consideran obras de referencia:

  • Institut d'Estudis Catalans. Diccionari de la llengua catalana [DIEC2]. Barcelona: Enciclopèdia Catalana, Edicions 62, 2007.
  • Gran diccionari de la llengua catalana [GDLC]. Barcelona: Enciclopèdia Catalana, 1998.

Hasta la aparición de estos diccionarios, se consideraban obras de exclusión:

  • Institut d'Estudis Catalans. Diccionari de la llengua catalana [DIEC]Barcelona, Palma de Mallorca, València: Edicions 3 i 4, Edicions 62, Editorial Moll, Enciclopèdia Catalana, Publicacions de l'Abadia de Montserrat, 1995.
  • Diccionari General de la Llengua Catalana [DGLC] de Pompeu Fabra. Barcelona: Llibreria Catalònia, 1932.
  • Diccionari de la llengua catalana [DLC3]. 3a ed. Barcelona: Enciclopèdia Catalana, 1993.
  • Gran Enciclopèdia Catalana [GEC2]2a ed. Barcelona: Enciclopèdia Catalana, 1992.

Para el castellano, actualmente se consideran obras de referencia:

  • Diccionario de la Lengua Española [DRAE]. 23a. ed. Madrid: Espasa Calpe, 2015.
  • Diccionario de uso del español de América y España [VOXUSO]. Barcelona: Spes Editorial SL, 2003.

Hasta la aparición de estos diccionarios, se consideraban obras de exclusión:

  • LEMA. Diccionario de la Lengua Española. Barcelona: SPES editorial SL, 2001.
  • Real Academia Española. Diccionario de la lengua española (DRAE). 21a. ed. Madrid: Espasa Calpe, 1992.
  • Real Academia Española. Diccionario manual e ilustrado de la lengua española (MRAE). 4a ed. Madrid: Espasa-Calpe, 1989.

Fuentes de vaciado

Actualmente del Observatori de Neologia lleva a cabo tres tipos de vaciado según las fuentes de trabajo: vaciado de periódicos, vaciado de textos orales y vaciado de revistas.

  • Vaciado de periódicos
Para el catalán
ARA.cat El Periódico
Ara
desde 2010
El Periódico
desde 1998
El Punt AVUI La Vanguardia
El Punt Avui
desde 2011
La Vanguardia
desde 2011
Per al castellano
El País La Vanguardia
El País
desde 1989
La Vanguardia
desde 1989

Anteriormente también se han vaciado para el catalán: Avui, Diari de Barcelona, Nou Diari, El Punt de GironaEl Temps y Diari de Mallorca.

El número de diarios que se vacían cada año ha variado con el tiempo; actualmente, entre las dos lenguas, se vacían aproximadamente 150 periódicos.

  • Vaciado de textos orales
    Desde el año 1999 se trabaja también con textos orales de la radio en catalán y en castellano; algunos les espacios vaciados son, en catalán: Els millors anys de la nostra vida [Catalunya Radio], El matí de Catalunya Ràdio [Catalunya Radio], Minoria absoluta [Rac1], El món a RAC1 [Rac1], Extraradi [COMRadio], etc. Y en castellano: Es la mañana Cowboys de medianoche [ESRadio], Tolerancia cero [Radio 5], La Mañana [COPE],El Vestuario [RNE], etc.

 

  • Vaciado de revistas
    Desde el año 2000 se trabaja también con textos no necesariamente revisados por servicios de corrección lingüística; algunas de las fuentes de vaciado son las siguientes: Barcelona InformacióTeatre BCNTribuna Bit, etc.

 

La descripción detallada de la metodología está disponible en formato PDF en la publicación Metodología del trabajo en neología: criterios, materiales y procesos. Barcelona, IULA, 2004.