
Sauvayre, Romy. «Types of Errors Hiding in Google Scholar Data». Journal of Medical Internet Research, vol. 24, n.o 5, mayo de 2022, p. e28354. http://www.jmir.org, https://doi.org/10.2196/28354.
Google Scholar (GS) es una herramienta gratuita que puede ser utilizada por los investigadores para analizar las citas; encontrar la bibliografía adecuada; o evaluar la calidad de un autor o de un aspirante a la titularidad, la promoción, un puesto en la facultad, la financiación o las becas de investigación. GS se ha convertido en una importante base de datos bibliográfica y de citas. Para evaluar la literatura, se pueden utilizar bases de datos como PubMed, PsycINFO, Scopus y Web of Science en lugar de GS porque son más fiables. El objetivo de este estudio era examinar la exactitud de los datos de citación recogidos a partir de GS y proporcionar una descripción exhaustiva de los errores y los recuentos erróneos identificados. Para ello, se recuperaron 281 documentos que citaban 2 trabajos específicos mediante el software Publish or Perish (PoP) y se examinaron.
Este trabajo estudió el problema de los falsos positivos inherente al análisis de datos de neuroimagen. Los resultados revelaron una tasa de error sin precedentes, ya que 279 de 281 (99,3%) referencias examinadas contenían al menos un error. Los documentos no académicos tendían a contener más errores que las publicaciones académicas (U=5117,0; P<.001).
Este artículo de opinión, basado en un estudio de caso que examina la exactitud de los datos de GS, muestra que los datos de GS no sólo no son exactos, sino que además exponen potencialmente a los investigadores, que utilizarían estos datos sin verificarlos, a sesgos sustanciales en sus análisis y resultados. Hay que seguir trabajando para evaluar las consecuencias del uso de los datos de GS extraídos por PoP.