Vés enrere Les empreses que cometen frau es delaten als seus informes anuals

Les empreses que cometen frau es delaten als seus informes anuals

Investigadors de la UPF i de la Queen Mary University of London analitzen les cartes de directors de grans companyies espanyoles i troben que les que cometen frau solen utilitzar més adjectius i tenir un to més negatiu que les que no.
21.12.2021

Imatge inicial

“S'agafa abans un mentider que un coix”. Aquesta dita, força coneguda, sol utilitzar-se quan es descobreix la mentida o al que ha mentit. Doncs una cosa semblant és el que han fet investigadors del Departament de Traducció i Ciències del Llenguatge (DTCL) de la UPF i de l'Escola d'Economia i Finances de la Queen Mary University of London. Els resultats s'han publicat a la revista Information.

“De la mateixa manera que els gestos, tics, reflexos o actituds ens delaten quan diem alguna mentida, el que diem o escrivim també ens pot delatar”, comenta Núria Bel, investigadora de l'Institut de Lingüística Aplicada (IULA) de la UPF i catedràtica del DCTL, autora de l'estudi.

Els investigadors van analitzar textos escrits pels directors de grans empreses espanyoles. “La base del nostre estudi van ser les cartes dels directius als accionistes de l'empresa que es publiquen als informes anuals. Vam identificar les cartes de les empreses que havien estat condemnades per frau comptable o que havien incorregut en una mala conducta financera durant el període 2011-2018”, explica la professora Bel.

“La base del nostre estudi van ser les cartes dels directius als accionistes de l'empresa que es publiquen als informes anuals. Vam identificar les cartes de les empreses que havien estat condemnades per frau comptable o que havien incorregut en una mala conducta financera durant el període 2011-2018”

Utilitzant mètodes d'aprenentatge automàtic (machine learning) i Anàlisi de Sentiments (AS), podien avaluar la informació subjectiva del text, com la polaritat, és a dir, si el text utilitzava paraules amb sentits positius ('fantàstica'), negatius ('difícil') o neutres ('setmanal'), i altres manifestacions de les emocions de l'escriptor expressades als textos. Les tècniques d'anàlisi de sentiment permeten induir informació sobre l'opinió de qui escriu sobre el tema de què escriu, per exemple, per analitzar en grans quantitats de tweets l'opinió del públic sobre marques, polítics, etc.

Van recol·lectar els informes financers anuals de companyies grans, on es presenten els resultats econòmics de l'any anterior i es va analitzar en concret la carta del president de la companyia on es resumeix l'activitat de l'any i s'esmenten els plans de futur per a la companyia. També es van analitzar els principals mitjans d'informació d'Espanya i les decisions judicials entre el 2011 i el 2018 per identificar les empreses que van ser sancionades per frau comptable o tergiversació de dades durant aquest període.

Per a l'anàlisi, van utilitzar 95 textos provinents de disset companyies sancionades per frau comptable i tretze no fraudulentes. Un dels problemes de l'estudi era la quantitat de dades disponibles, que no pot ser prou gran com per utilitzar altres mètodes daprenentatge més potents, com les xarxes neuronals que aprenen de milions de documents.

Perquè el sistema aprengui si el text és fraudulent o no es va fer servir la presència i l'absència d'una llista de més de 600 paraules seleccionades. Per exemple, al quadre 1 hi ha una llista d'adjectius que el sistema va aprendre que tenen més pes a l'hora d'induir si un text és d'una empresa fraudulenta o no. Paraules com a “favorables” i “optimistes” apareixen onze vegades als textos no fraudulents, però cap als fraudulents estudiats.

“A la bibliografia s'havia documentat que els textos enganyosos tendeixen a ser menys positius que els que són veritables, el to és més negatiu. És a dir, se sabia que l'elecció d'expressions com això no és fàcil i això és difícil, passa de manera inconscient i afecta el to general del missatge. Semblarien iguals, però no ho són”, continua la professora Bel.

"Gràcies als mètodes d'anàlisi de sentiments amb aprenentatge automàtic es poden classificar aquests textos amb una alta precisió, del 84%, és a dir, el sistema deixaria sense identificar com a fraudulents 2 textos de cada deu"

En els estudis anteriors, aquestes anàlisis es feien sobre textos espontanis, com ara una conferència, correus electrònics o les publicacions en xarxes socials. Però en aquest cas es tractava de textos editats o repassats en molts casos per diverses persones. "Valia la pena preguntar-se aleshores si en aquests textos editats es podien trobar indicis, és a dir, si es mantenia l'ús d'un to negatiu als textos fraudulents i l'estudi diu que sí", continua. "Gràcies als mètodes d'anàlisi de sentiments amb aprenentatge automàtic es poden classificar aquests textos amb una alta precisió, del 84%, és a dir, el sistema deixaria sense identificar com a fraudulents 2 textos de cada deu".

No podem parlar d'una aplicació per descobrir qui menteix com suggereix la dita, però sí que ens permet saber que el classificador pot servir com un primer filtre per reduir el volum de textos a estudiar, per exemple. El mecanisme aprendrà més com més cartes es facin servir, cosa que es farà en una etapa posterior de la investigació

Treball de referència:

 Bel,N.; Bracons,G.; Anderberg, S. Finding Evidence of Fraudster Companys in the CEO's Letter to Shareholders with Sentiment Analysis. Information 2021, 12, 307. https://doi.org/10.3390/info12080307

Multimèdia

ODS - Objectius de desenvolupament sostenible:

16. Pau, justícia i institucions sòlides
Els ODS a la UPF

Contact

Per a més informació

Notícia publicada per:

Oficina de Comunicació