Vés enrere Somien les xarxes neuronals amb il·lusions visuals?

Somien les xarxes neuronals amb il·lusions visuals?

És la qüestió que han estudiat investigadors de el Departament de Tecnologies de la Informació i les Comunicacions, dirigits per Marcelo Bertalmío juntament amb Jesús Malo, investigador de la Universitat de València. Els resultats de la recerca es publiquen en l'edició avançada en línia de Vision Research.

02.10.2020

Imatge inicial

Una xarxa neuronal de convolució és un tipus de xarxa neuronal artificial en què les neurones s'organitzen en camps receptius d'una manera molt similar a les neurones en l'escorça visual d'un cervell biològic. Avui dia, les xarxes neuronals de convolució (CNN) es troben en una varietat de sistemes autònoms (per exemple, en sistemes de detecció i reconeixement de cares, en cotxes de conducció automàtica, etc.). Aquest tipus de xarxa resulta molt efectiva en moltes tasques de visió artificial, com per exemple en classificació i segmentació d'imatges, entre moltes altres aplicacions.

Les xarxes de convolució van néixer inspirades en el comportament del sistema visual humà, en particular en la seva estructura bàsica formada per la concatenació de mòduls compostos per una operació lineal seguida per una operació no lineal. Un estudi publicat en l'edició avançada en línia de la revista Vision Research estudia el fenomen de les il·lusions visuals en les xarxes de convolució en comparació al seu efecte en la visió dels éssers humans. Un treball d'Alexander Gómez Vila, Adrian Martín, Javier Vázquez-Corral, Marcelo Bertalmío, membres del Departament de Tecnologies de la Informació i les Comunicacions (DTIC) i realitzat amb la participació de l'investigador Jesús Malo de la Universitat de València.

Les il·lusions visuals són imatges que el nostre cervell percep de manera diferent al que són en realitat

"Donada aquesta connexió de les CNN amb el nostre sistema visual, en aquest treball hem volgut veure si les xarxes de convolució pateixen de problemes similars al nostre sistema visual. Per a això ens hem centrat en les il·lusions visuals. Les il·lusions visuals són imatges que el nostre cervell percep de manera diferent al que són en realitat", explica Gómez Vila, primer autor de l'estudi.

Les xarxes CNN també són "enganyades" per il·lusions visuals de brillantor i color de la mateixa manera que les il·lusions visuals enganyen els humans

Els autors, en el seu estudi, van entrenar CNN per a tasques simples que la visió humana també desenvolupa, com ara l'eliminació de soroll i de l'efecte de difuminació (blur, en anglès). El que han observat ha estat que, aquestes xarxes CNN entrenades en aquestes circumstàncies experimentals també són "enganyades" per il·lusions visuals de brillantor i color de la mateixa manera que les il·lusions visuals enganyen als humans.

A més, explica Gómez Vila "per al nostre treball analitzem també quan aquest tipus d'il·lusions causen respostes a la xarxa que no són les esperades físicament, però que tampoc coincideixen amb la percepció humana", és a dir, casos en què la CNN obté una il·lusió òptica que és diferent de la il·lusió que percebria l'ésser humà.

Els resultats d'aquest treball són consistents amb la hipòtesi que les il·lusions visuals són un subproducte de l'optimització de la visió humana a imatges naturals (aquelles que un humà veu en el seu dia a dia). Al mateix temps, aquests resultats mostren les limitacions i les diferències del sistema visual humà i les xarxes neuronals artificials CNN. 

Treball de referència:

Alexander Gómez Vila, Adrian Martín, Javier Vázquez-Corral, Marcelo Bertalmío, Jesús Malo (2020), "Color illusions also deceive CNNs for low-level vision tasks: Analysis and Implications", setembre, Vision Research, edició avançada en línia. https://doi.org/10.1016/j.visres.2020.07.010

 

Multimèdia

Categories:

ODS - Objectius de desenvolupament sostenible:

Els ODS a la UPF

Contact

Per a més informació

Notícia publicada per:

Oficina de Comunicació