Cambios lingüísticos entre los preprints y las publicaciones

Nicholson DN, Rubinetti V, Hu D, Thielk M, Hunter LE, Greene CS (2022) Examining linguistic shifts between preprints and publications. PLoS Biol 20(2): e3001470. https://doi.org/10.1371/journal.pbio.3001470

Los preprints permiten a los investigadores poner sus hallazgos a disposición de la comunidad científica antes de que hayan sido sometidos a la revisión por pares. Los estudios sobre preprints en bioRxiv se han centrado en gran medida en los metadatos de los artículos y en la frecuencia con la que estos preprints se descargan, se citan, se publican y se discuten en línea. Un elemento que falta por examinar es el lenguaje contenido en el repositorio de preprints de bioRxiv. Por ello se Intento comparar y contrastar las características lingüísticas de los preprints de bioRxiv con el texto biomédico publicado en su conjunto, ya que es una excelente oportunidad para examinar cómo la revisión por pares cambia estos documentos.

Los rasgos más frecuentes que cambiaron parecen estar asociados a la composición tipográfica y a las menciones de secciones de información de apoyo o archivos adicionales. Además de la comparación de textos, se crearon inserciones de documentos derivadas de un modelo word2vec entrenado previamente. Se descubrió que estas inserciones son capaces de analizar diferentes enfoques y conceptos científicos, vincular pares de artículos revisados por pares sin anotar e identificar revistas que publican artículos lingüísticamente similares a un preprint determinado. También se utilizaro estas inserciones para examinar los factores asociados con el tiempo transcurrido entre la publicación de un primer preprint y la aparición de una publicación revisada por pares. Descubrimos que los preprints con más versiones publicadas y más cambios textuales tardaban más en publicarse.

Por último, se construyó una aplicación web que permite a los usuarios identificar qué revistas y artículos son más similares lingüísticamente a un preprint de bioRxiv o medRxiv, así como observar dónde se posicionaría el preprint dentro del panorama de artículos publicados.