Atrás Las empresas que cometen fraude se delatan en sus informes anuales

Las empresas que cometen fraude se delatan en sus informes anuales

Investigadores de la UPF y la Queen Mary University of London analizan las cartas de directores de grandes compañías españolas y encuentran que aquellas que cometen fraude suelen utilizar más adjetivos y tener un tono más negativo que las que no.

21.12.2021

Imatge inicial

“Se pilla antes a un mentiroso que a un cojo”. Este dicho, bastante conocido, suele utilizarse cuando se descubre la mentira o al que ha mentido. Pues algo similar es lo que han hecho investigadores del Departamento de Traducción y Ciencias del Lenguaje (DTCL) de la UPF y de la Escuela de Economía y Finanzas de la Queen Mary University of London. Los resultados se han publicado en la revista indexada Information.

“De la misma manera que los gestos, tics, reflejos o actitudes nos delatan cuando decimos alguna mentira, lo que decimos o escribimos también puede delatarnos”, comenta Núria Bel, investigadora del Instituto de Lingüística Aplicada (IULA) de la UPF y catedrática del DCTL, autora del estudio.

Los investigadores analizaron textos escritos por los directores de grandes empresas españolas. “La base de nuestro estudio fueron las cartas de los directivos a los accionistas de la empresa que se publican en los informes anuales. Identificamos las cartas de las empresas que habían sido condenadas por fraude contable o que habían incurrido en una mala conducta financiera durante el período 2011-2018”, explica la profesora Bel.

“La base de nuestro estudio fueron las cartas de los directivos a los accionistas de la empresa que se publican en los informes anuales. Identificamos las cartas de las empresas que habían sido condenadas por fraude contable o que habían incurrido en una mala conducta financiera durante el período 2011-2018”

Utilizando métodos de aprendizaje automático (machine learning) y de Análisis de Sentimientos (AS), podían evaluar la información subjetiva del texto, como la polaridad, es decir, si el texto utilizaba palabras con sentidos positivos (‘fantástica’), negativos (‘difícil') o neutros (‘semanal’), y otras manifestaciones de las emociones del escritor expresadas en los textos. Las técnicas de análisis de sentimiento permiten inducir información sobre la opinión de quien escribe sobre el tema del que escribe, por ejemplo, para analizar en grandes cantidades de tweets la opinión del público sobre marcas, políticos, etc.

Recolectaron los informes financieros anuales de compañías grandes, donde se presentan los resultados económicos en el año anterior y se analizó en concreto la carta del presidente de la compañía en la que se resume la actividad del año y se mencionan los planes de futuro para la compañía. También se analizaron los principales medios de información de España y las decisiones judiciales entre 2011 y 2018 para identificar aquellas empresas que fueron sancionadas por fraude contable o tergiversación de datos durante ese periodo.

Para el análisis utilizaron 95 textos provenientes de 17 compañías sancionadas por fraude contable y 13 no fraudulentas. Uno de los problemas del estudio era la cantidad de datos disponibles, que no puede ser lo suficientemente grande como para utilizar otros métodos de aprendizaje más potentes, como las redes neuronales que aprenden de millones de documentos.

Para que el sistema aprenda si el texto es o no fraudulento se usó la presencia y la ausencia de una lista de más de 600 palabras seleccionadas. Por ejemplo, en el cuadro 1 hay una lista de adjetivos que el sistema aprendió que tienen más peso a la hora de inducir si un texto es de una empresa fraudulenta o no. Palabras como “favorables” y “optimistas” aparecen 11 veces en los textos no fraudulentos, pero ninguna en los fraudulentos estudiados.

“En la bibliografía se había documentado que los textos engañosos tienden a ser menos positivos que los que son verdaderos, su tono es más negativo. Es decir, se sabía que la elección de expresiones como “esto no es fácil” y “esto es difícil”, ocurre de manera inconsciente y afecta el tono general del mensaje. Parecerían iguales, pero no lo son”, continua la profesora Bel.

“Gracias a los métodos de análisis de sentimientos con aprendizaje automático se pueden clasificar esos textos con una precisión alta, del 84%, es decir, el sistema dejaría sin identificar como fraudulentos 2 textos de cada diez”

En los estudios anteriores, estos análisis se hacían sobre textos espontáneos, como pueden ser una conferencia, correos electrónicos o las publicaciones en redes sociales. Pero en este caso se trataba de textos editados o repasados en muchos casos por varias personas. “Valía la pena preguntarse entonces si en esos textos editados se podían encontrar indicios, es decir, si se mantenía el uso de un tono negativo en los textos fraudulentos y el estudio dice que sí”, continúa. “Gracias a los métodos de análisis de sentimientos con aprendizaje automático se pueden clasificar esos textos con una precisión alta, del 84%, es decir, el sistema dejaría sin identificar como fraudulentos 2 textos de cada diez”.

No podemos hablar de una aplicación para descubrir al que miente como sugiere el dicho, pero sí nos permite saber que el clasificador puede servir como un primer filtro para reducir el volumen de textos a estudiar, por ejemplo. El mecanismo aprenderá más cuantas más cartas se usen, algo que se hará en una etapa posterior de la investigación

Trabajo de referencia:

 Bel,N.; Bracons,G.; Anderberg, S. Finding Evidence of Fraudster Companys in the CEO's Letter to Shareholders with Sentiment Analysis. Information 2021, 12, 307. https://doi.org/10.3390/info12080307

Multimedia

ODS - Objetivos de desarrollo sostenible:

16. Paz, justicia e instituciones sólidas
Els ODS a la UPF

Contact

Para más información

Noticia publicada por:

Oficina de Comunicación