Vés enrere Els textos escrits delaten el gènere de la seva autoria

Els textos escrits delaten el gènere de la seva autoria

Un treball de Juan Soler-Company, membre del Grup de Recerca en Tractament Automàtic del Llenguatge Natural, proposa un mètode automàtic en un treball que ha guanyat el Best Poster Presentation Award STAIRS a l'European Conference on Artificial Intelligence que se celebra a la Haia (Països Baixos).

31.08.2016

 

La identificació dels perfils de gènere de l'autoria de textos escrits atreu l'interès de determinats sectors professionals i socials, quan s'aplica, per exemple, al màrqueting o la investigació forense. 

Aquest ha estat el tema de la investigació de Juan Soler-Company, membre del Grup de Recerca en Tractament Automàtic del Llenguatge Natural (TALN) del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, amb el qual ha guanyat el Best Poster Presentation Award STAIRS (European Starting AI Researchers  Symposium) en la 22a. edició de l'European Conference on Artificial Intelligence, que s'està celebrant a l'Haia (Països Baixos), del 28 d'agost al 2 de setembre.

Amb una precisió del 84%, l'estudi demogràfic de Soler- Company ha aconseguit predir de manera automàtica el gènere, femení o masculí, de l'autoria d'articles d'opinió publicats en línia en diaris de llengua anglesa: The Sun, The Times i New York Daily. Un total de 7.148 textos, d'unes 350 paraules de promig, escrits per 51 autors diferents i de temàtica diversa (esports, política, economia i temes generals).

En la seva recerca, l'autor ha analitzat aquests textos a diferents nivells i ha arribat a la conclusió que l'anàlisi profunda del llenguatge, pel que fa a la seva estructura, tant sintàctica com discursiva, en lloc de l'anàlisi tradicional de contingut a través de característiques merament lèxiques, condueix a una major eficàcia en la identificació de patrons de gènere d'autoria de textos escrits. Aquest nou mètode és capaç de discernir efectivament patrons d'escriptura femenins i masculins.

Soler-Company afegeix que el següent pas de la seva investigació serà buscar patrons d'escriptura segons edat, orientació sexual, professió, llengua materna i altres característiques demogràfiques dels seus autors.

Treball de referència:

Juan Soler-Company (2016),"Use of Discourse and Syntactic Features for Gender Identification", Best Poster Presentation Award Stairs, 22a European Conference on Artificial Intelligence, l'Haia (Països Baixos), 28 d'agost al 2 setembre , doi: 10.3233 / 978-1-61499-682-8-215. Frontiers in Artificial Intelligence and Applications, vol. 284, pp. 215-220.

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

Els ODS a la UPF

Contact