Algorismes de classificació conseqüents per millorar els serveis en línia
Algorismes de classificació conseqüents per millorar els serveis en línia
Resultat d’una metodologia desenvolupada en un treball en què ha participat Vicenç Gómez, investigador del grup de recerca en Artificial Intelligence and Machine Learning del DTIC, presentat a: International Workshop on Misinformation, Computational Fact-Checking and Credible Web, maig 14, San Francisco (EUA); Alan Turing Institut, 3 i 4 de juny a Londres (Regne Unit).
Els models de classificació o rànquings són omnipresents en una gran varietat de serveis a Internet, des de motors de cerca, comerços, sistemes de recomanació, mitjans de comunicació social i cites en línia. En conseqüència, s'ha tornat molt més fàcil per a l’usuari trobar informació, productes de consum, ofertes de feina, opinions etc. Els sistemes de classificació han augmentat els serveis disponibles per als usuaris en línia. No obstant això, se’ls ha atribuït també fonts de desinformació, de polarització i de discurs inapropiat o antidemocràtic.
Un treball en què ha participat Vicenç Gómez, investigador del grup de recerca en Artificial Intelligence and Machine Learning, al Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, ha tingut com a objectiu principal dissenyar models de classificació conseqüents capaços de tenir en compte les conseqüències de les seves propostes de classificació a llarg termini. El treball s'ha presentat en dos certàmens internacionals: International Workshop on Misinformation, Computational Fact-Checking and Credible Web, maig 14, San Francisco (EUA); Alan Turing Institut, en un worshop celebrat el 3 i 4 de juny a Londres (Regne Unit).
Com explica Gómez: “Normalment, els models de classificació actuals es dissenyen per optimitzar les mesures immediates d’utilitat per als usuaris. Premien la gratificació instantània sense tenir en compte les conseqüències a llarg termini. Com a resultat acaben comportant costos inesperats per al benestar del sistema”. Per exemple, en la integritat de la informació, el benestar té a veure amb el nombre mitjà de publicacions que, tot i classificar-se en les primeres posicions del rànquing, comporten desinformació al llarg del temps.
Els models de classificació conseqüents, derivats de la metodologia presentada en aquest treball, proporcionen rangs que poden mitigar la propagació de la desinformació i millorar la civilitat dels debats en línia sense desviacions significatives de les classificacions proporcionades per models que maximitzen les mesures d’utilitat immediates
Aleshores, l’objectiu dels autors ha estat construir models de classificació conseqüents que compensin de manera òptima la fidelitat al model de classificació original maximitzant la utilitat immediata i també el benestar a llarg termini. Presenten un algorisme pràctic i eficient per aprendre models de classificació conseqüents parametritzats de manera que s’aproximen de manera més efectiva als òptims. Els investigadors mostren que aquesta representació simplifica enormement la construcció de models de classificació conseqüents que compensen la fidelitat als rànquings proporcionats per un model que maximitza la utilitat immediata i el benestar a llarg termini.
En aquest treball, per primera vegada, es presenta una representació que contempla conjuntament els models de classificació i les dinàmiques dels usuaris, emprant un procés de control probabilístic anomenat Procés de Decisió de Markov (en anglès, MDP), “una estratègia especialment ben equipada per caracteritzar fidelment el problema esmentat anteriorment”, afirmen els autors.
Un marc matemàtic per a la modelització de la presa de desicions
Un procés de decisió de Markov proporciona un marc matemàtic per a la modelització de la presa de decisions en situacions en què els resultats són parcialment aleatoris i en part sota el control d’un decisor. Els autors han mostrat la seva metodologia utilitzant dades sintètiques i reals recollides de Reddit, un lloc web de marcadors socials i agregador de notícies en què els usuaris poden afegir continguts que queden més o menys destacats segons siguin les votacions dels altres usuaris.
“Els nostres resultats mostren que els models de classificació conseqüents derivats de la nostra metodologia proporcionen rangs que poden mitigar la propagació de la desinformació i millorar la civilitat dels debats en línia sense desviacions significatives de les classificacions proporcionades per models que maximitzen les mesures d’utilitat immediates”, conclou Gómez.
Treball de referència:
Behzad Tabibian, Vicenç Gómez, Abir De, Bernhard Schölkopf, Manuel Gomez Rodriguez (2019), “Consequential ranking algorithms and long-term welfare”, International Workshop on Misinformation, Computational Fact-Checking and Credible Web, 14 de maig, San Francisco, CA, EUA. The Alan Turing Institute, Artificial Intelligence & society: From principles to practice, Londres, 3-4 de juny.