Atrás Google Scholar invisibiliza los documentos que no están en inglés

Google Scholar invisibiliza los documentos que no están en inglés

Afecta a artículos científicos, ponencias y comunicaciones a congresos, según una investigación reciente publicada en la revista Future Internet, a cargo de Cristòfol Rovira, Lluís Codina i Carlos Lopezosa, investigadores del Departamento de Comunicación.

04.02.2021

Imatge inicial

La visibilidad de los artículos científicos, ponencias o comunicaciones a congresos está condicionada a que sean encontrados fácilmente en los buscadores académicos, especialmente en Google Scholar. Para ello, en los últimos años se está aplicando la optimización de los motores de búsqueda o SEO en los buscadores académicos (ASEO) con la finalidad de optimizar los documentos para que aparezcan antes en los listados de resultados.

Una investigación reciente, publicada en Future Internet, ha determinado si el idioma del documento es un factor que interviene en el algoritmo de ordenación de los resultados de las búsquedas en Google Scholar. Los autores del trabajo són Cristòfol Rovira, Lluís Codina y Carlos Lopezosa, miembros del Departamento de Comunicación de la UPF.

En Google Scholar  relega a posiciones que los hacen totalmente invisibles la inmensa mayoría (90%) de los documentos en idiomas diferentes del inglés

"Para llevar a cabo esta optimización es necesario avanzar en el conocimiento del algoritmo de ordenación por relevancia de Google Scholar para luego, a partir de este conocimiento, hacer más evidentes las características que ya tienen los documentos y que encajan con los criterios de ordenación", afirma Rovira, primer autor del estudio. Google Scholar no explica como es este algoritmo para evitar prácticas fraudulentas y por tanto este tipo de investigaciones son necesarias.

Para el estudio, los autores han aplicado una metodología de investigación de ingeniería inversa basada en el análisis estadístico con el coeficiente de correlación de Spearman. Se ha analizado una muestra de 45 búsquedas de 1.000 resultados (45.000 documentos) de tres tipos: por autor, por palabras clave y por años. 

Se discriminan artículos de calidad con cientos de citas

Los resultados obtenidos indican que cuando se hace una búsqueda en Google Scholar con resultados en diversos idiomas, la inmensa mayoría (90%) de los documentos en idiomas diferentes al inglés quedan sistemáticamente relegados a posiciones que los hacen totalmente invisibles. Estos documentos ocupan casi siempre posiciones por encima de la 900 aunque sean artículos de calidad que hayan recibido cientos de citas. Por tanto, se puede afirmar que Google Scholar discrimina los documentos que no son en lengua inglesa en búsquedas con resultados multilingües.

La ignorancia de este factor puede estar perjudicando a investigadores de todo el mundo de habla no inglesa

La ignorancia de este factor puede estar perjudicando a investigadores de todo el mundo de habla no inglesa, ya que pueden creer que no existen artículos en su lengua materna al llevar a cabo búsquedas con resultados multilingües.

"Esto es así singularmente en las búsquedas por año, las búsquedas con resultados multilingües más frecuentes. No obstante, también ocurrirá con algunas palabras clave que se usan de la misma forma en todo el mundo, como por ejemplo marcas comerciales, compuestos químicos, productos industriales, siglas, medicamentos, enfermedades, covid, sin ir más lejos", comentan los autores del estudio.

Y añaden "por otra parte, a la luz de los resultados, desde un punto de vista enfocado al ASEO, resultará evidente que mientras no se solucione este sesgo, las posibilidades de posicionarse en Google Scholar en las búsquedas multilingües aumentan de manera extrema si se publica en inglés".

Gráfica de los resultados del estudio

El gráfico de dispersión que se muestra arriba resume los resultados de la investigación. Hay 45.000 puntos, uno por documento. Los puntos grises representan los documentos escritos en inglés, los rojos en otras lenguas y los azules son las medianas de las posiciones.

El gráfico muestra cómo los artículos escritos en lenguas que no son el inglés aparecen por encima de la posición 900 en el ranking de Google Scholar. Esto es así aunque sean documentos de calidad, tengan cientos de citas recibidas y en el ranking por número de citas ocupen buenas posiciones.

Los casos más llamativos son los puntos rojos situados en el extremo inferior derecho. Corresponden a documentos escritos en lenguas distintas al inglés que tienen un ranking por el número de citas inferior a 100 y un ranking de Google Scholar superior a 900. Esto significa que todos ellos reciben más de mil citas y aparecen en Google Scholar en las mismas posiciones que documentos en inglés con solo decenas de citas.

Artículo de referencia:

Cristòfol Rovira, Lluís Codina, Carlos Lopezosa (2021),  "Language Bias in the Google Scholar Ranking Algorithm." Future Internet 13.2 (2021): 31. https://doi.org/10.3390/fi13020031 

Multimedia

Categorías:

ODS - Objetivos de desarrollo sostenible:

Els ODS a la UPF

Contact

Para más información

Noticia publicada por:

Oficina de Comunicación