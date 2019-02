arXiv’s Feedback on the Guidance on the Implementation of Plan S. arXiv.org blog: news from arXiv.org February 4, 2019

Aplaudimos los esfuerzos de cOAlition S para lograr un sistema de publicación científica más accesible, eficiente, justo y transparente. Apreciamos esta oportunidad para proporcionar retroalimentación sobre la Guía para la Implementación del Plan S. Apoyamos incondicionalmente una visión de un sistema de publicación académica que proporcione el uso y la reutilización inmediata, gratuita y en gran medida sin restricciones de las publicaciones académicas. Nos gustaría comentar algunos de los requisitos de cumplimiento que se aplican a los repositorios institucionales y temáticos como arXiv. En primer lugar, compartiremos información general sobre las operaciones de arXiv para destacar la importancia de tener en cuenta las capacidades actuales y los modelos de negocio de los servicios existentes para los requisitos de implementación del Plan S.

Sobre arXiv

Hace veintisiete años, Paul Ginsparg comenzó un proyecto para permitir a sus colegas físicos compartir de manera eficiente manuscritos científicos inéditos sin necesidad de fotocopiarlos ni enviarlos en papel. Hoy en día, arXiv cuenta con 1,5 millones de documentos con 600 enviados cada día y 7 descargas de documentos cada segundo que hacen usuarios de todo el mundo. No hay cargos asociados con el acceso o depósito de contenido en arXiv. El depósito ha crecido significativamente y ha transformado la infraestructura de comunicación académica de múltiples campos de la física, y desempeña un papel cada vez más destacado en Matemáticas, Informática, Biología Cuantitativa y Estadística. El año pasado, amplió su alcance para incluir la Ingeniería eléctrica y Economía de sistemas.

Desde el punto de vista de los usuarios, arXiv sigue siendo un servicio exitoso y destacado, que satisface las necesidades de muchos científicos de todo el mundo. Tiene un alcance internacional, con presentaciones y lectores de todo el mundo, y colaboraciones con sociedades profesionales estadounidenses y extranjeras y otras organizaciones internacionales. Es un componente esencial de la comunicación científica, necesario para difundir rápida y ampliamente sus hallazgos, establecer la prioridad de sus descubrimientos y buscar retroalimentación para ayudar a mejorar su trabajo. arXiv es un repositorio de materiales académicos, que incluye preprints, manuscritos y postprints. Mantenemos un registro permanente de cada presentación y versión publicada, con el fin de proporcionar acceso perpetuo al registro académico. Se proporciona un registro DOI y otro de la revista para que los autores puedan indicar cuándo se publican formalmente sus artículos. Además, arXiv colabora con algunos editores y proveedores de servicios (como Inspire) para actualizar automáticamente los metadatos de arXiv con el DOI y las referencias de revistas de las versiones publicadas. Actualmente, aproximadamente el 60% de los artículos de arXiv incluyen DOIs o números de referencia de las revistas.

La Universidad de Cornell tiene la responsabilidad administrativa y financiera general del funcionamiento y desarrollo de arXiv, con la orientación de su consejo consultivo de miembros Member Advisory Board MAB y su consejo consultivo científico Scientific Advisory Board (SAB). Desde 2010, la financiación y el gobierno de arXiv se ha basado en un programa de membresía que involucra a bibliotecas y laboratorios de investigación de todo el mundo que representan a los usuarios institucionales más destacados del repositorio. arXiv opera sobre la base de un presupuesto muy reducido, ya que el modelo actual de sostenibilidad apoya la operación de línea de base con un enfoque en el mantenimiento y la operación diaria, en otras palabras, lo que llamamos “mantener las luces encendidas“. En 2016, el equipo de arXiv se embarcó en la iniciativa arXiv (arXiv-NG) de próxima generación y ha seguido una estrategia de renovación gradual y modular del sistema arXiv existente. arXiv tendrá que identificar recursos adicionales para implementar algunos de los cambios necesarios para que el servicio cumpla con los requisitos del Plan S, teniendo en cuenta tanto el desarrollo único como los costes de mantenimiento continuo.

Guía de ArXiv para la Implementación del Plan S

A continuación, encontrará nuestros comentarios y preguntas que se aplican a las especificaciones proporcionadas en la Sección 10 del documento de implementación, 10 Deposition of Scholarly Content in Open Access Repositories. Estos son nuestros comentarios preliminares basados en nuestra interpretación de los requisitos a medida que intentamos entender el papel de arXiv como repositorio temático para garantizar el cumplimiento, especialmente en relación con la funcionalidad de publicación (versión de registro) de las revistas. Además, nuestro objetivo es explorar los requisitos de cumplimiento de las revistas superpuestas que se construyen sobre la plataforma arXiv.

10.2 Requisitos para los repositorios de acceso abierto compatibles con el Plan S:

10.2.1 Sistema de registro automático de manuscritos

Nuestra interpretación de este requisito es que los repositorios compatibles deben proporcionar mecanismos de incorporación de las publicaciones que se ajusten con los requisitos del Plan S. Recomendamos dejar claro que el hecho de proporcionar una API o un protocolo basado en FTP para el depósito de editores u otras entidades autorizadas satisface este requisito.

10.2.2. Texto completo almacenado en XML en el estándar JATS (o equivalente)

La minería de texto y datos es una importante cuestión, y los diferentes grupos de usuarios tienen diferentes expectativas sobre los formatos de entrega. Recomendamos que se elimine la referencia a JATS/XML, ya que da la impresión engañosa de que este formato de entrega específico es significativo para el cumplimiento.

Nuestra interpretación de este requisito es que el objetivo final es hacer que el contenido esté fácilmente disponible para la minería de texto y datos por cualquier medio posible. Recomendamos que se aclare la frase “o equivalente” enumerando específicamente los requisitos más importantes: Que el contenido en texto plano adecuado para TDM esté disponible gratuitamente, por ejemplo, a través de una API. Que los metadatos y el contenido se entreguen en un formato adecuado para el consumo computacional/programático (por ejemplo, como JSON, XML u otro formato de serialización).

Como se articula en la respuesta de la Confederation of Open Access Repositories recomendamos que en lugar de requerir apoyo para que TDM forme parte de un sistema de repositorio que cumpla con las normas, TDM puede ser facilitado a través de servicios externos que agreguen y conviertan los recursos en un formato de texto. Ya existen numerosos servicios de este tipo que se especializan en casos de uso de TDM, como Semantic Scholar y Open MinTeD, y que están en condiciones de abordar los requisitos de TDM de la manera más eficaz.

“Metadatos de calidad garantizada….incluyendo información sobre el DOI de la publicación original, sobre la versión depositada (AAM/VoR), sobre el estado de acceso abierto y la licencia de la versión depositada. Los metadatos deben cumplir los mismos criterios de calidad que las revistas y plataformas de acceso abierto (véase más arriba). En particular, los metadatos deben incluir información completa y fiable sobre la financiación proporcionada por los financiadores de cOAlition S.”

Recomendamos que esta frase se aclare para enfatizar el papel del autor y/o editor en asegurar la calidad de los metadatos de las publicaciones que cumplen con el Plan S, específicamente que los repositorios que cumplen con el Plan S son responsables de aceptar, almacenar y poner a disposición esos metadatos cuando sean proporcionados por el autor y/o editor.

…en formato estándar interoperable….

Recomendamos que se aclare esta frase para enfatizar la amplia gama de esquemas formales adoptados por los repositorios científicos de todo el mundo. Nuestra interpretación de este requisito es que los metadatos estén disponibles en un formato de serialización común como JSON o XML, que los metadatos se ajusten a un esquema formal y que el esquema se ponga a disposición del público.

Con respecto a la codificación de metadatos para la legibilidad de las máquinas, el Plan S debería considerar la posibilidad de recomendar el protocolo de señalización como convención aceptable para la entrega de metadatos normalizados junto con el contenido de la publicación.

API abierta para permitir que otros (incluyendo máquinas) accedan al contenido

Recomendamos que se aclare esta declaración para enfatizar que una API compatible debe ser de libre acceso, lo que permite la mejor práctica de requerir información de autenticación de los clientes que realizan solicitudes de API.

Proceso de garantía de calidad para integrar el texto completo con los servicios básicos de resúmenes e indexación (por ejemplo, PubMed).

Recomendamos que se aclare este punto enfatizando el papel de los servicios de información disciplinaria además de las plataformas de indexación de propósito general como PubMed. Recomendamos que los repositorios sean necesarios para apoyar los servicios de resúmenes e indexación relevantes para sus comunidades. Esto puede lograrse entregando metadatos estandarizados (calidad garantizada por el autor y/o editor) y contenido en texto plano de las publicaciones que cumplen con el Plan S de manera oportuna, ya sea proporcionando APIs de libre acceso o impulsando el contenido a esos servicios.

Presentado por:

Dr. Erick Peirson, arquitecto principal de arXiv, Cornell Computing and Information Science

Dr. Oya Y. Rieger, Director de Programas de arXiv, Cornell Computing and Information Science

Profesor Steinn Sigurdsson, Director Científico de arXiv, Universidad Estatal de Pensilvania, Departamento de Astronomía y Astrofia