Archivo de la categoría: Investigación

El papel de las plataformas de búsqueda online en la difusión científica

Drivas, Kyriakos. 2024. «The Role of Online Search Platforms in Scientific Diffusion». Journal of the Association for Information Science and Technology, octubre, asi.24959. https://doi.org/10.1002/asi.24959.

Desde el lanzamiento de Google Scholar, los trabajos más antiguos han experimentado un aumento en sus citas, un fenómeno que se relaciona con la disminución de los costos de búsqueda y la introducción de algoritmos de clasificación. A partir de esta observación, analizo cómo se produce la recombinación del conocimiento científico en la era de las plataformas de búsqueda en línea. Los resultados muestran que, a medida que los artículos se vuelven más accesibles, sus ideas se difunden más allá de su campo original. Sin embargo, dentro de un mismo campo, la difusión del conocimiento presenta variaciones. Estos hallazgos aportan al debate sobre el posible estrechamiento de la ciencia: aunque es posible que haya ocurrido una reducción en la recombinación de conocimientos entre campos distantes en las últimas décadas, las plataformas de búsqueda en línea no son responsables de ello.

Este estudio examina el impacto del lanzamiento de Google Scholar, observando cómo los investigadores respondieron a los conocimientos presentes en trabajos más antiguos. Los resultados muestran que las citas de estos trabajos aumentaron, especialmente en artículos de campos diferentes al original. No obstante, cuando se observan las citas dentro del mismo campo, los resultados son mixtos. Este hallazgo sugiere que el acceso a través de plataformas como Google Scholar fomenta la diseminación del conocimiento entre campos distintos.


Revistas con altos índices de artículos sospechosos señalados por una start-up de integridad científica



Van Noorden R. Journals with high rates of suspicious papers flagged by science-integrity start-up. Nature. 2024 Oct 23;doi: 10.1038/d41586-024-03427-w. Available from: https://www.nature.com/articles/d41586-024-03427-w

El artículo de Richard Van Noorden analiza el impacto de investigaciones científicas fraudulentas o sospechosas en revistas académicas, señaladas por la herramienta Argos, desarrollada por la empresa tecnológica Scitility. Esta plataforma, lanzada en septiembre de 2024, asigna a los artículos un puntaje de riesgo basado en los antecedentes de los autores y en las citas a investigaciones previamente retractadas. Un puntaje alto no prueba que un artículo sea de baja calidad, pero sugiere que debe investigarse más a fondo.

Entre las editoriales con más artículos de alto riesgo, destaca Hindawi, un sello ahora cerrado, subsidiario de Wiley, con más de 10.000 retractaciones en dos años (alrededor del 4% de su cartera en la última década). Aunque Wiley ha limpiado una gran parte de su catálogo, Argos señala que todavía persisten más de 1.000 artículos de alto riesgo. Otras editoriales, como Elsevier, MDPI y Springer Nature, también figuran con miles de artículos sospechosos, pero con proporciones más bajas en relación a su volumen de publicaciones.

Argos es parte de una creciente cantidad de herramientas diseñadas para detectar señales de alerta en la integridad científica, como Papermill Alarm y Signals, que ayudan a identificar posibles fraudes en manuscritos. Aunque algunas editoriales han implementado tecnologías para detectar irregularidades, la proporción de artículos problemáticos aún es considerable. Las editoriales Impact Journals, Spandidos e Ivyspring presentan las mayores proporciones de artículos de alto riesgo, con cifras superiores al 0.6%.

Además de analizar la situación a nivel de editorial, Argos también proporciona datos sobre revistas específicas. La revista Scientific Reports de Springer Nature, por ejemplo, cuenta con 450 artículos de alto riesgo y 231 retractaciones, lo que representa el 0.3% de su producción total. Otras revistas con grandes brechas entre artículos retractados y sospechosos son Sustainability de MDPI y Materials Today Proceedings de Elsevier.

El crecimiento del fraude científico se debe en parte a la proliferación de «fábricas de artículos» y contenido generado por inteligencia artificial. Las editoriales están aumentando su inversión en supervisión humana y tecnología para enfrentar estos desafíos.

Argos se apoya en datos abiertos, como la base de datos de Retraction Watch, y también rastrea redes de autores con antecedentes de mala conducta. No obstante, una de las dificultades más grandes que enfrentan las herramientas de integridad es la correcta distinción entre autores con nombres similares, lo que puede sesgar los resultados.

Integridad Científica e Inteligencia Artificial

CONFERENCIA: Integridad académica e Inteligencia Artificial
Martes 22 de octubre a las 17 h. de España. 9 h. Ciudad de México
con Julio Alonso Arévalo
III Seminario de Integridad Académica y Producción Científica



La inteligencia artificial está teniendo un impacto significativo en la escritura académica al ofrecer herramientas y recursos que facilitan el proceso de investigación, redacción y edición de documentos. Mediante el uso de algoritmos avanzados, los sistemas de inteligencia artificial pueden analizar grandes cantidades de información, extraer patrones y generar ideas para el desarrollo de un texto académico. Estas herramientas pueden ayudar a los estudiantes y profesores a ahorrar tiempo y esfuerzo al proporcionar sugerencias de vocabulario, estructura de párrafos y citas bibliográficas adecuadas. Además, la inteligencia artificial también puede contribuir a mejorar la calidad de los escritos académicos, al detectar errores gramaticales y de estilo, así como proporcionar recomendaciones para una redacción más clara y coherente. Sin embargo, es importante tener en cuenta que la inteligencia artificial no debe reemplazar el pensamiento crítico y la creatividad inherentes a la escritura académica, sino que debe utilizarse como una herramienta complementaria para mejorar y enriquecer el proceso de escritura.

Adopción y barreras en la puesta en común de datos abiertos entre comunidades de investigación física

Holst, Faye. «IOP Publishing Study Reveals Varied Adoption and Barriers in Open Data Sharing among Physical Research Communities». IOP Publishing, 21 de octubre de 2024. https://ioppublishing.org/news/iop-publishing-study-reveals-varied-adoption-and-barriers-in-open-data-sharing-among-physical-research-communities-copy/.

Un estudio realizado por IOP Publishing (IOPP) ha puesto de manifiesto las diferencias en la adopción de la compartición de datos abiertos en las comunidades de investigación en ciencias físicas y las diversas barreras que enfrentan.

El acceso a los datos permite la replicación de la investigación y fortalece la confianza en los resultados. Los principios FAIR se introdujeron en 2016 para estandarizar los metadatos, asignar identificadores persistentes y proporcionar licencias de uso claras, asegurando que los datos de investigación sean fácilmente localizables, accesibles, combinables y reutilizables con la debida atribución.

Desde 2022, IOPP exige a todos los autores que incluyan una declaración de disponibilidad de datos en sus artículos, especificando si y cómo se pueden acceder a los datos que respaldan su investigación. Esta política se amplió en 2023, exigiendo a los autores que no puedan o no deseen compartir sus datos públicamente que expliquen las razones.

El análisis incluyó más de 30,000 artículos de investigación, cuyos hallazgos fueron publicados en el documento de IOPP titulado “Bringing researchers on board: Navigating the barriers to sharing data publicly”.

Hallazgos clave:

  1. Científicos ambientales:
    • Más del 80% comparte sus datos de investigación abiertamente.
    • Casi el 60% sigue los principios de Findability, Accessibility, Interoperability, and Reusability (FAIR).
    • Mayor barrera: restricciones legales relacionadas con la propiedad de datos de terceros.
  2. Físicos:
    • Más del 70% comparte datos de investigación abiertamente.
    • Solo el 18% adhiere a los principios FAIR.
    • Mayor barrera: los formatos de datos son considerados inaccesibles, incluso si están disponibles.
  3. Ingenieros:
    • Solo el 55% comparte sus datos abiertamente.
    • Menos del 8% sigue los principios FAIR.
    • Mayor barrera: falta de un repositorio conocido para enviar datos.
  4. Científicos de materiales:
    • Más del 70% comparte sus datos abiertamente.
    • Solo cerca del 5% sigue los principios FAIR.
    • Mayor barrera: datos confidenciales o sensibles.

El número de artículos indexados ha aumentado un 47% mientras que el número de científicos no ha crecido

Mark A. Hanson, Pablo Gómez Barreiro, Paolo Crosetto, Dan Brockington; The strain on scientific publishing. Quantitative Science Studies 2024; doi: https://doi.org/10.1162/qss_a_00327

Se analiza el creciente volumen de publicaciones científicas, un fenómeno que ha generado una sobrecarga en la comunidad científica. Desde 2016, el número de artículos indexados ha aumentado aproximadamente un 47%, mientras que el número de científicos no ha crecido a la misma velocidad, lo que ha incrementado significativamente la carga de trabajo por investigador.



La publicación académica enfrenta un problema: el número de artículos revisados por pares ha crecido exponencialmente en los últimos años, mientras que el número de investigadores capacitados para evaluarlos no ha aumentado al mismo ritmo. Esto ha generado dificultades para encontrar revisores cualificados y ha sobrecargado a los científicos con la cantidad de artículos publicados. Parte de este crecimiento se debe a iniciativas inclusivas que fomentan la participación de investigadores de regiones como el Sur Global. Si bien estas iniciativas son positivas, el crecimiento excesivo amenaza con comprometer la rigurosidad científica.

Los autores presentan cinco métricas basadas en datos que muestran el crecimiento de las editoriales, los tiempos de procesamiento y las conductas de citación. Observan que algunas editoriales han impulsado este crecimiento mediante la publicación de «números especiales» con tiempos de revisión más cortos, lo que responde a la presión de «publicar o perecer» a la que se enfrentan los investigadores para obtener financiamiento. Además, han notado una inflación de los factores de impacto de las revistas, lo cual distorsiona las señales de calidad científica. Los autores concluyen que este crecimiento exponencial no es sostenible.

Algunos hallazgos importantes incluyen:

Inflación del factor de impacto: Se ha observado una inflación en el factor de impacto, particularmente en las revistas de MDPI y Hindawi, debido a una alta tasa de autocitación y citación entre revistas del mismo editor. MDPI muestra una tasa de autocitación significativamente mayor que otras editoriales, lo que ha contribuido al aumento de su factor de impacto.

Contribución desigual de las editoriales al crecimiento: Entre 2016 y 2022, MDPI, Elsevier, Frontiers, Springer y Wiley han sido responsables de más del 70% del aumento en la cantidad de artículos publicados. Mientras Elsevier y Springer distribuyen sus publicaciones a través de un gran número de revistas, MDPI y Frontiers concentran el aumento en un número más pequeño de revistas, resultando en una mayor cantidad de artículos por revista.

Aumento en el uso de «special issues»: Editoriales como Hindawi, Frontiers y MDPI han incrementado drásticamente la proporción de artículos publicados a través de «special issues» desde 2016. Este modelo ha generado preocupación por la posibilidad de que se priorice la cantidad sobre la calidad, ya que los artículos en estas ediciones suelen ser revisados por editores invitados, en lugar del cuerpo editorial regular.

Disminución en los tiempos de procesamiento: MDPI, Frontiers y Hindawi han reducido significativamente los tiempos de procesamiento de artículos, con MDPI registrando tiempos mucho menores en comparación con otros editores (37 días en promedio). Además, estos editores han mostrado una homogeneización en los tiempos de revisión, lo que podría indicar una revisión menos rigurosa.

Tasas de rechazo dependientes del editor: Los datos sugieren que las tasas de rechazo varían significativamente según el editor, sin una correlación clara con el crecimiento en el número de artículos o el tamaño de las revistas. En particular, MDPI ha mostrado una disminución en sus tasas de rechazo a medida que ha aumentado el uso de «special issues».

Penguin Random House prohíbe expresamente que sus libros sean usados para entrenar tecnologías de IA.



Battersby, Matilda. «Penguin Random House Underscores Copyright Protection in AI Rebuff.» The Bookseller, October 18, 2024. https://www.thebookseller.com/news/penguin-random-house-underscores-copyright-protection-in-ai-rebuff.

Penguin Random House (PRH), el mayor editor comercial del mundo, ha modificado el texto en sus páginas de derechos de autor para proteger la propiedad intelectual de sus autores frente al uso no autorizado de sus obras para entrenar modelos de inteligencia artificial (IA). El nuevo texto, que se aplicará globalmente en todas las nuevas publicaciones y reimpresiones, prohíbe expresamente que sus libros sean usados para entrenar tecnologías de IA. Esto responde a casos de infracción de derechos de autor en los EE.UU., donde se han utilizado libros pirateados para entrenar IA sin autorización.

El CEO de PRH UK, Tom Weldon, afirmó que la empresa «defenderá vigorosamente» los derechos de propiedad intelectual de sus autores, mientras que elogiaron la actualización de PRH desde la Sociedad de Autores y otras organizaciones. Sin embargo, pidieron que también se modifiquen los contratos de los autores para asegurar que su consentimiento sea requerido antes de utilizar IA en la creación o producción de sus obras.

Expertos legales indicaron que el verdadero riesgo está en el entrenamiento de los modelos de IA, y no tanto en los resultados que estos generan. La industria editorial busca establecer mejores prácticas en medio de un panorama de IA en rápida evolución, donde el uso no autorizado de contenido afecta los ingresos de autores y editores.

Adopción de la IA Generativa por investigadores de Biomedicina

Adoption of Generative AI by Academic Biomedical Researchers”. Ithaka S+R, 2024

Texto completo

El informe «Adopción de la IA Generativa por Investigadores Biomédicos Académicos» fue publicado por Ithaka S+R el 17 de octubre de 2024. Este estudio analiza cómo los investigadores en el campo biomédico están utilizando la IA generativa, así como las percepciones y barreras que enfrentan en su adopción.

Desde el lanzamiento de ChatGPT en noviembre de 2022, ha surgido un debate nacional sobre el papel de la IA generativa en diversos sectores del trabajo intelectual, aunque la atención se ha centrado principalmente en su impacto en la enseñanza. El ámbito de la investigación biomédica presenta casos prometedores de uso, pero también riesgos significativos asociados a esta tecnología.

Los hallazgos del informe revelan que la adopción de la IA generativa es mixta. Muchos investigadores han experimentado con su uso, pero este es limitado en alcance y frecuencia. Las principales barreras para su adopción incluyen preocupaciones sobre la precisión de los resultados y cuestiones éticas. Debido a la calidad actual de las salidas de la IA generativa y la falta de mejores prácticas, es posible que su adopción se estabilice.

Ithaka S+R realizó una encuesta a investigadores biomédicos académicos sobre sus actitudes y uso de la IA generativa en contextos de investigación, que se llevó a cabo entre el 20 de febrero y el 29 de marzo de 2024, con 770 participantes.

Aunque la mayoría de los investigadores biomédicos han utilizado la IA generativa en el pasado, pocos la usan actualmente y casi ninguno lo hace de manera regular. De los investigadores que han utilizado la IA generativa:

  • 6 de cada 10 han empleado esta tecnología en su investigación.
  • El 31% la ha utilizado para revisar o editar gramática.
  • El 25% la ha usado para extraer información de la literatura científica.
  • El 22% la ha aplicado en tareas administrativas.
  • El 22% la ha usado para escribir código.

Sin embargo, solo el 40% de los investigadores biomédicos la utiliza actualmente. Las principales barreras para la adopción son:

  • El 55% reportó que los resultados no son suficientemente precisos o confiables.
  • Menos de 1 de cada 10 investigadores la utiliza regularmente.
  • El 47% señaló que hay falta de claridad sobre las mejores prácticas para la integridad de la investigación y el uso de la IA generativa.
  • El 56% expresó un gran interés en productos de IA generativa específicos para biomedicina.
  • Solo el 14% había utilizado herramientas o modelos de lenguaje específicos para biomedicina existentes.

Este informe es una contribución importante a la comprensión de las implicaciones de la IA generativa, y se anticipa que se publicará un análisis cualitativo más profundo sobre su uso en la educación superior más adelante en el año.

El libro de divulgación científica en Chile 2015-2020

«El libro de divulgación científica en Chile 2015-2020». s. f. Cerlalc (blog). Accedido 9 de octubre de 2024. https://cerlalc.org/publicaciones/el-libro-de-divulgacion-cientifica-en-chile-2015-2020/.

Este documento presenta un diagnóstico del estado y características de los libros de divulgación científica publicados en Chile en el periodo 2015-2020. Para ello, se realizó una aproximación a partir de la base de datos de la Agencia ISBN Chile. A partir de una serie de criterios de selección, se rastrearon un total de 338 libros de divulgación científica con ISBN chileno. Estos libros fueron caracterizados, entre otras variables, por la disciplina científica más fuertemente asociada, utilizando como referencia las categorías disciplinares de la OCDE. Posteriormente, se generó una muestra intencionada de 102 libros, buscando mantener la diversidad y proporcionalidad de las diferentes disciplinas. Esta muestra fue analizada cualitativamente considerando cuatro dimensiones de análisis: los recursos editoriales desplegados, las herramientas lingüísticas utilizadas, las estrategias de inclusión, los modelos de comunicación de la ciencia y elementos científicos dentro de los libros.

Conjuntos de datos de alto valor – Posibilidad de encontrar y comparar metadatos entre países

 Eendenburg, L., Fernández Nebreda, B., Suárez, J. and Rozbroj Jasinskaja, N., High-value datasets – Cross-country findability and comparability of metadata, Fernández Nebreda, B.(editor) and Rozbroj Jasinskaja, N.(editor), Publications Office of the European Union, 2024, https://data.europa.eu/doi/10.2830/0033148

El estudio analiza la implementación de conjuntos de datos de alto valor (HVDs) en los Estados miembros de la Unión Europea, cruciales para impulsar las iniciativas de datos abiertos y promover la reutilización de datos entre países. Aunque el progreso varía entre los Estados, es necesario un enfoque estandarizado para asegurar la comparabilidad e interoperabilidad de estos conjuntos de datos a nivel de la UE. El estudio aborda los desafíos en la armonización de metadatos y la mejora de la accesibilidad y localización de los HVDs, guiado por los principios FAIR (facilidad de localización, accesibilidad, interoperabilidad y reutilización) y las directrices DCAT-AP HVD. Esta investigación piloto, realizada entre abril y mayo de 2024, antes de la entrada en vigor del Reglamento de Implementación de la Comisión (UE) 2023/138 en junio de 2024, evalúa la localización y comparabilidad de los metadatos de los HVDs en países seleccionados (Dinamarca, Estonia, Letonia y Finlandia). La evaluación se basa en una muestra de 24 conjuntos de datos bajo seis categorías temáticas: geoespacial, observación de la Tierra y medio ambiente, meteorología, estadísticas, empresas y propiedad empresarial, y movilidad. El estudio también ofrece recomendaciones para mejorar la estandarización de los metadatos y la localización de los conjuntos de datos.

Las publicaciones en acceso abierto generan pocas visitas desde los resultados de búsqueda de Google a los repositorios institucionales

Orduña-Malea, E., Font-Julián, C.I. & Serrano-Cobos, J. Open access publications drive few visits from Google Search results to institutional repositoriesScientometrics (2024). https://doi.org/10.1007/s11192-024-05175-0

El estudio resalta la importancia de Google Search en la generación de visitas a los repositorios institucionales (IR). La falta de visibilidad en los resultados de los motores de búsqueda puede afectar negativamente la posibilidad de que las publicaciones depositadas en estos repositorios sean encontradas, leídas, descargadas y citadas. Para mejorar esta situación, las instituciones deben evaluar la visibilidad de sus repositorios y determinar las acciones necesarias para optimizarla. No obstante, medir la visibilidad en términos de optimización de motores de búsqueda (SEO) requiere un método preciso y técnicamente viable.

Este trabajo es el primer intento de diseñar un método de este tipo, aplicado específicamente a la medición de la visibilidad de los IR de las universidades nacionales de España en Google Search, utilizando métricas SEO derivadas de la herramienta Ubersuggest. Se analizó un extenso conjunto de datos durante tres meses, que incluyó 217,589 registros bibliográficos y 316,899 palabras clave orgánicas.

Los resultados revelan que muchos registros en estos repositorios no aparecen en los primeros puestos de los resultados de búsqueda de Google. Los registros más visibles suelen ser trabajos académicos (tesis y disertaciones) en español, particularmente en Humanidades y Ciencias Sociales. Sin embargo, la mayoría de las visitas provienen de un número reducido de registros. Estos hallazgos cuestionan el papel de los IR en atraer lectores a través de Google Search, destacando que su enfoque principal sigue siendo la preservación más que la difusión en línea.

El estudio sugiere que mejoras potenciales podrían lograrse mediante esquemas de metadatos mejorados y prácticas de descripción normalizadas, así como la adopción de otras estrategias que fortalezcan la visibilidad en línea de los IR. Este trabajo resulta relevante para defensores del acceso abierto, agencias de investigación, bibliotecarios, desarrolladores de repositorios y administradores de sitios web, ya que contribuye a una mejor comprensión del impacto web de los resultados de investigación depositados en los IR.