Per la necessitat d'actualització constant de les dades, la metodologia de treball de l'Observatori de Neologia té com a base l'activitat de buidatge de textos per a l'extracció de nous neologismes. L'Observatori compatibilitza aquesta activitat amb els treballs d'anàlisi i de difusió dels neologismes, i amb la recerca sobre la innovació lèxica.

El buidatge consisteix en la detecció i l’extracció de les unitats lèxiques considerades neològiques seguint el criteri lexicogràfic, és a dir, considerant neològiques les paraules que no apareixen consignades de manera idèntica (de forma, significat i funcionament sintàctic) en el corpus lexicogràfic d’exclusió que, actualment, per al català és el Diccionari de la llengua catalana - DIEC2 i, per al castellà, el Diccionario de la llengua española - DLE.

Els neologismes s’extreuen de textos de premsa general, però també (i en menor mesura) de revistes de temes generals, textos orals audiovisuals, textos de xarxes socials, etc. I el buidatge d’aquestes fonts es fa semiautomàticament amb l’eina BUSCANEO, o bé manualment.

L’any 2022, després de 33 anys de feina ininterrompuda, l’Observatori de Neologia ha començat a treballar amb un protocol de buidatge actualitzat que es pot consultar aquí, tant per al buidatge en català (Protocol 2022 CAT), per al buidatge en castellà (Protocol 2022 CAST).