Vés enrere Wikipedia, una font d’informació sobre desastres naturals esbiaixada cap els països rics

Wikipedia, una font d’informació sobre desastres naturals esbiaixada cap els països rics

Són els resultats d’un treball liderat per Valerio Lorini, estudiant del programa de doctorat en TIC, dirigit per Carlos Castillo, coordinador del Grup de Ciència en web i Computació Social, amb Javier Rando, estudiant del grau en Enginyeria Matemàtica en Ciència de Dades de la UPF, centrat en les inundacions com a estudi de cas. El treball es presentarà a l ‘ISCRAM 2020, del 24 al 27 de maig a Virginia (EUA).

31.01.2020

Imatge inicial

Les inundacions són el desastre natural que més danys provoca anualment al món. Valerio Lorini (JRC-UPF), Javier Rando (UPF), Diego Saez-Trumper (Wikimedia), Carlos Castillo (UPF) són els autors d’un treball que presentaran a la 17a. International Conference on Information Systems for Crisis Response and Management (ISCRAM 2020), Virginia Tech in Blacksburg, Virginia (USA), del 24 al 27 de maig, amb el títol: “Uneven Coverage of Natural Disasters in Wikipedia: the Case of Floods”.

Un treball que correspon a una línia de recerca que lidera Carlos Castillo, coordinador del Grup de Ciència en web i Computació Social (WSSC) en el Departament de Tecnologies de la Informació i les Comunicacions (DTIC) de la UPF, dins d'una col·laboració activa que té amb el Joint Research Center (JRC), l'organisme que assessora en temes científics i tècnics a la Comissió Europea. L’investigador principal de la comunicació és Valerio Lorini (JRC-UPF), estudiant del programa de doctorat en TIC de la UPF que està sent supervisat per Carlos Castillo, amb Javier Rando, coautor i estudiant del grau en Enginyeria Matemàtica en Ciència de Dades de la UPF.

Wikipedia és una valuosa font de dades gratuïta que podria ser beneficiosa per a investigadors que treballen en la reducció del risc de desastres si s’identifiquen, mesuren i pal·lien els biaixos

En la gestió de desastres naturals, l’accés a dades no oficials ofereix l’oportunitat de tenir un tipus d’informació diferent al disponible per altres mitjans. Pot servir també per detectar biaixos en els continguts informatius. “Pensem que Wikipedia és una font valuosa de dades gratuïtes, i que podria ser beneficiosa per a investigadors que treballen en la reducció del risc de desastres si s’identifiquen, mesuren i pal·lien els biaixos”, afirma Castillo.

En el seu estudi, els autors s’han centrat en la versió anglesa de Wikipedia, la que consideren, amb diferència, la versió més completa d’aquesta enciclopèdia. Wiquipèdia, una enciclopèdia produïda de manera col·laborativa, conté informació detallada sobre molts desastres naturals i humans, sobretot quan els incidents tenen un gran nombre de víctimes mortals, i els seus editors són especialment destres en afegir informació a temps real, a mesura que es va produint la crisi.

La tendència a cobrir els esdeveniments en països benestants és major que la que es dona en països pobres

Com a font d'informació relacionada amb desastres naturals, els autors mostren que a la Wikipedia la tendència a cobrir els esdeveniments en països benestants és major que en països pobres. Efectuant una anàlisi de contingut automàtic acurat a gran escala, “mostrem com la cobertura de les inundacions a la Wikipedia és decanta cap els països rics de parla anglesa, en particular dels EUA i el Canadà”, afirmen en el seu treball. “Observem igualment que la cobertura de les inundacions dels països amb ingressos més baixos, així com la dels països de l’Amèrica del Sud, és substancialment inferior a la cobertura de les inundacions dels països de renda mitjana”, afegeixen.

Per aquesta recerca els autors han estimat la cobertura de les inundacions a la Wikipedia tenint en compte moltes variables: el producte interior brut (PIB), la renda nacional bruta (PNB), la ubicació geogràfica, el nombre de parlants anglesos, les víctimes mortals i diversos índexs que descriuen el nivell de vulnerabilitat d’un país.

Han identificat un conjunt de referències fiables sobre inundacions

Amb el suport d’hidròlegs, una de les aportacions d’aquest treball són un conjunt de referències validades de diverses organitzacions independents que recopilen dades sobre inundacions amb diferents finalitats: asseguradores, organismes governamentals, ONU, etc. Tots ells recopilen dades sobre inundacions a escala global i tenen disponibles bancs de dades fiables per treballar i comparar.

Un cop identificades les fonts d’informació, els autors van passar a la fase experimental de l’estudi. Emprant 458 esdeveniments que havien estat qualificats de manera fefaent com a inundacions, segons els registres de dues o tres fonts de dades fiables: l’europea Floodlist; The Emergency Events Database (EM-DAT) de les Nacions Unides, i la Dartmouth Flood Observatory (DFO) de la Universitat de Califòrnia (EUA), els autors van comparar aquestes dades amb les entrades a la Wikipedia per localitzar aquests  esdeveniments i veure si hi havia o no concordança amb les fonts de dades contrastades en termes d’ubicació i referències temporals.

“Els resultats de la nostra anàlisi són coherents al llarg de diverses dimensions, i dibuixen un quadre en què la cobertura de Wiquipedia està esbiaixada cap a alguns països, particularment aquells que estan més industrialitzats i tenen grans poblacions de parla anglesa, i en detriment d’altres països, particularment amb menys ingressos i alhora més vulnerables”, indiquen els autors.

Els resultats assenyalen a que les eines que utilitzen dades de les xarxes socials o plataformes col·laboratives han de ser avaluades acuradament per evitar biaixos, i que els editors de Wikipedia han de fer un major esforç per cobrir els desastres dels països amb més necessitats. Aquests resultats corresponen només a un possible tipus de desastre natural, les inundacions, però es podrien igualment considerar per al seu estudi altres tipus d’esdeveniments.

Treball de referencia:

Valerio Lorini, Javier Rando, Diego Saez-Trumper, Carlos Castillo (2020), “Uneven Coverage of Natural Disasters in Wikipedia: the Case of Floods”. Comunicació que es presentarà al congrés ISCRAM 2020, 17th International Conference on Information Systems for Crisis Response and Management, Virginia Tech in Blacksburg, Virginia (USA), del 24 al 27 de maig.

Multimèdia

Perfils dels protagonistes:

Carlos Castillo

Categories:

ODS - Objectius de desenvolupament sostenible:

Els ODS a la UPF

Contact

Per a més informació

Notícia publicada per:

Oficina de Comunicació