Archivo de la categoría: Acceso abierto

Teoría y práctica de la citación de datos de investigación

 

 

simons-fig3

Silvello, G. “Theory and practice of data citation.” Journal of the Association for Information Science and Technology vol. 69, n. 1 (2018). pp. 6-20. http://dx.doi.org/10.1002/asi.23917

 

Las citas son la piedra angular de la propagación del conocimiento y el medio principal para evaluar la calidad de la investigación, así como para dirigir las inversiones en ciencia. La ciencia se está haciendo cada vez más “intensiva en datos”, donde se recogen y analizan grandes volúmenes de datos para descubrir patrones complejos mediante simulaciones y experimentos, y la mayoría de las obras científicas de referencia están siendo reemplazadas por conjuntos de datos curados en línea. Sin embargo, dado un conjunto de datos, no existe una forma cuantitativa, consistente y establecida de saber cómo se ha utilizado a lo largo del tiempo, quién contribuyó a su curación, qué resultados se han obtenido o qué valor tiene.

El desarrollo de una teoría y práctica de la citación de datos es fundamental para considerar los datos como objetos de investigación de primera clase con la misma relevancia y centralidad de los productos científicos tradicionales. Muchos trabajos en los últimos años han discutido la citación de datos desde diferentes puntos de vista: ilustrando por qué se necesita la citación de datos, definiendo los principios y esbozando recomendaciones para los sistemas de citación de datos, y proporcionando métodos computacionales para abordar temas específicos de la citación de datos. El panorama actual es polifacético y falta todavía una visión global que reúna diversos aspectos de este tema.

Anuncios

Cita y reutilización de datos de investigación : análisis del contenido de las publicaciones a texto completo.

 

dmkc2nrwsaardhw-large-1024x750

Zhao, M., E. Yan, et al. “Data set mentions and citations: A content analysis of full-text publications.” Journal of the Association for Information Science and Technology vol. 69, n. 1 (2018). pp. 32-46. http://dx.doi.org/10.1002/asi.23919

 

Este estudio proporciona evidencias de menciones y citas de conjuntos de datos en múltiples disciplinas basadas en un análisis del contenido de 600 publicaciones en PLoS One. Se encuentra que las menciones y citas de los conjuntos de datos variaron enormemente entre disciplinas en términos de cómo se recolectaron, referenciaron y curaron los conjuntos de datos. Aunque la mayoría de los artículos proporcionaron libre acceso a los datos, en un número limitado de artículos se utilizaron formas normalizadas de atribución de datos, como los DOI y las citas de datos. Además, la reutilización de los datos tuvo lugar en menos del 30% de las publicaciones que utilizaron los datos, lo que sugiere que los investigadores todavía se inclinan a crear y utilizar sus propios conjuntos de datos, en lugar de reutilizar los datos previamente curados. Este documento proporciona una comprensión exhaustiva de cómo se utilizan los conjuntos de datos en la ciencia y ayuda a las instituciones y editores a elaborar políticas de datos útiles.

Incentivos para la creación de Servicios de Gestión Datos de Investigación (RDM) en Bibliotecas Universitarias

 

1515089418982

Bryant, Rebecca ; Lavoie, Brian  ; Malpas, Constance. Incentives for Building University RDM Services. The Realities of Research Data Management Dublin, Part 3. Ohio: OCLC, 2018

Texto completo

 

En este tercer informe de la serie Incentives for Building University RDM Services, los autores exploran los incentivos que inspiraron la adquisición de la capacidad de Servicios de Gestión Datos de Investigación (RDM) por parte de las cuatro universidades de investigación descritas en los estudios de caso, y describen tanto los patrones generales como las circunstancias dependientes del contexto que dieron forma a estos incentivos.

Basándose en los estudios de caso, los autores organizaron estos incentivos en cuatro amplias categorías: cumplimiento, normas académicas en evolución, estrategia institucional y demanda de los investigadores.

  • La inversión de la universidad en infraestructura, servicios, o infraestructura de gestión de datos de investigación.
  • El personal está motivado por incentivos relevantes a nivel local. En otras palabras, el aumento de atención sobre RDM en las universidades de investigación que operan en diferentes circunstancias locales refleja una alineación de intereses institucionales y motivaciones externas.
  • La demanda de los investigadores y el cumplimiento de los mandatos de las políticas fueron factores importantes para diseñar y mantener un conjunto de servicios de RDM a lo largo del tiempo, pero no fueron los factores clave para establecer los servicios RDM en las instituciones de estudio de caso.
  • Si bien la constelación de incentivos relevantes difiere de un contexto a otro, la adquisición o el desarrollo de la capacidad está invariablemente motivada por un interés en proteger o mejorar la reputación y el éxito institucional.
  • Consecuentemente, la sostenibilidad a largo plazo de los servicios RDM universitarios depende de la alineación con las necesidades institucionales, tanto como las necesidades individuales de los investigadores.

 

 

Dimensions: un portal de servicios de investigación y un nuevo índice de citas alternativo a Scopus y Web of Knowledge

25848383408_4bd07f3d99_b_d

https://www.dimensions.ai/

Interface de búsqueda

Dimensons, es una nueva plataforma de descubrimiento de investigación de Digital Science, un nuevo producto que incluye una base de datos de citas, un conjunto de análisis de investigación y una moderna funcionalidad de acceso y descubrimiento de artículos, La mayoría de sus servicios y productos son gratuitos y otros de pago. Un producto innovador en varios aspectos que pretende ser una alternativa a Elsevier y Clarivate. La versión gratuita de Dimensions está diseñada para proporcionar a los investigadores una forma más eficiente y eficaz de descubrir la investigación más relevante. Incluye la búsqueda de artículos a texto completo, y métricas básicas para todas esas publicaciones, además del acceso a cualquier artículo de acceso abierto que aparezca en los resultados de búsqueda. Durante 2018 se añadirá la búsqueda a través de conjuntos de datos.

 

El panorama de la investigación ha evolucionado rápidamente en los últimos 10 años con nuevas tecnologías, más datos y ecosistemas de investigación cada vez más diversos. Sin embargo, a pesar de estos cambios, los canales para el descubrimiento y las formas como se mide y evalúa el impacto han permanecido estáticas. La ciencia en el entorno digital propicia un sistema de investigación más robusto que favorezca la democratización de los datos, y que la capacidad de comunicación de los resultados de la investigación se maximicen contando con la amplia participación de la comunidad como una parte esencial para convertir esta gran idea en una realidad escalable.

En los últimos años, se ha producido un cambio en la gestión de la investigación y su difusión en plataformas que brinda nuevas e importantes oportunidades para analizar el rendimiento. cada vez existe un interés mayor en medir no sólo el rendimiento de los títulos de las revistas, sino también cada vez más el de los artículos individuales, de los propios investigadores, departamentos y universidades.

Dimensions es producto de la colaboración entre seis empresas del portafolio de Digital Science (Altmetric, Digital Science Consultancy, Figshare, Readcube, Symplectic y ÜberResearch) y más de 100 investigadores y universidades con una misión concreta: hacer la investigación más accesible.

Dimensions recoge más de 860 millones de citas académicas disponibles gratuitamente, y ofrece acceso a más de 9 millones de artículos de Acceso Abierto. El producto además de ser un índice de citas incluye información sobre becas, publicaciones, ensayos clínicos, datos altmétricos y patentes en un solo lugar. Además ofrece indexación del texto completo del artículo con el objetivo de favorecer su descubrimiento. El texto completo está disponible para 50 millones de artículos, procedentes, ya sea de una fuente pública como PubMedCentral o arXiv, o de un acuerdo establecido con el editor. Es este sentido, Dimensions es por lo tanto una herramienta de descubrimiento mucho más potente que las otras bases de datos de citas de la competencia que no indexan el texto completo del artículo.

El modelo institucional, llamado Dimensions Plus, proporciona un uso más intensivo de las herramientas analíticas de investigación, y tiene un precio anual escalonado según el tipo de institución, desde aproximadamente 10.000 a 30.000$. También hay una versión que incluye herramientas diseñadas para atraer a un editor o financiador de investigación. Para los primeros adoptantes institucionales, el precio base incluirá el uso de una potente API que permite construir o integrar servicios adicionales con la base de datos. La API de Dimensions  proporciona acceso a los datos subyacentes de forma fácil y flexible, utilizando un lenguaje específico de dominio diseñado para usuarios no técnicos. La API se puede utilizar no sólo para la recuperación de datos, sino también para agregar datos o devolver diferentes facetas en una sola llamada a la API, lo que permite integraciones directas e implementaciones de máquina a máquina. También las universidades pueden habilitar el acceso a texto completo a través de la plataforma a  los materiales que tienen contratados bajo licencia, previo pago de entre 3.000 a 7.000 dólares adicionales.

Para habilitar las funciones avanzadas Dimensons anima a los investigadores a registrarse en el servicio gratuito utilizando sus cuentas universitarias.

 

 

Más allá del repositorio: Integración de los sistemas de preservación local con los servicios de distribución nacional

starting-small-practical-first-steps-in-digital-preservation-15-728

 

Weinraub, E., L. Alagna, et al. (2017). [e-Book]  Beyond the Repository: Integrating Local Preservation Systems with National Distribution Services. Whasington Institute of Museum and Library Services, 2017

Texto completo

 

El informe analiza como las prácticas de preservación digital local y los sistemas de depósito interactúan con los servicios de preservación digital distribuida (DDP). El equipo de investigación llevó a cabo una encuesta seguida de entrevistas en profundidad con encuestados seleccionados. La encuesta y las entrevistas revelaron una gran diversidad en la forma en que se practica la preservación digital y los desafíos comunes en la intersección de los repositorios locales y los servicios de DDP. La encuesta recibió 170 respuestas completas de diversas organizaciones. El 75 % de los encuestados se identificaron a sí mismos como instituciones académicas, pero también respondieron a la encuesta representantes de archivos, organizaciones gubernamentales, museos, organizaciones sin fines de lucro y bibliotecas públicas. Los encuestados se dividieron casi uniformemente entre los que se identificaron como administradores o jefes de departamento/unidad y los que se identificaron como personal. La gran mayoría de los encuestados -el 90%- informaron que su institución había colectado más de un terabyte de contenido digital único, y el 63% informó haber colectado cincuenta terabytes o menos. Los encuestados informaron que utilizaron una variedad de sistemas digitales de preservación y almacenamiento para administrar su contenido; una clara mayoría de los encuestados no utilizó ningún sistema.

Los datos de la encuesta revelan que la mayoría de los encuestados (84%) están almacenando copias de su contenido único en múltiples ubicaciones. Sin embargo, el número de copias almacenadas varió entre los encuestados: mantener dos o tres copias fueron las respuestas más comunes, pero diez informaron de que conservaban siete o más copias. En cuanto al lugar donde se almacenan estas copias, los encuestados indicaron con frecuencia que sus organizaciones persiguen más de una estrategia de almacenamiento. El sesenta y seis por ciento guarda copias en múltiples ubicaciones in situ, pero los servicios cloud y DDP son también mecanismos comunes de almacenamiento. De los encuestados que utilizan un servicio DDP, casi la mitad son miembros de la Digital Preservation Network, aunque varios de ellos utilizan DPN junto con otros servicios.

Cuando se les preguntó sobre la curación, casi la mitad de los encuestados indicaron que enviaron un subconjunto de sus datos a un repositorio distribuido (o fuera del sitio, o a la nube). Cuando se pidió a estos encuestados que clasificaran la importancia de los criterios utilizados para seleccionar el subconjunto de materiales enviados fuera del sitio, la mayoría eligió el mandato como el más importante, seguido de cerca por el valor intrínseco y el tipo de contenido. El sesenta por ciento indicó que tienen políticas establecidas para guiar la selección de materiales locales, pero sólo el 47% tiene políticas similares para los materiales que se envían a los sistemas distribuidos. Las entrevistas reflejaron esta tendencia, y muchos de los entrevistados comentaron que tienen criterios para seleccionar los materiales que enviaron a in almacenamiento externo o a los sistemas DDP, pero no necesariamente están articulados en políticas.

Los encuestados y entrevistados frecuentemente mencionaron la falta de interoperabilidad entre las herramientas y los sistemas como un reto. Muchos señalaron que la sobreespecialización de los sistemas contribuía a los problemas de interoperabilidad. Otros describieron sus sistemas como unidades separadas con poca integración entre ellas, requiriendo procesos manuales y soluciones. Una forma en que esto parece manifestarse comúnmente es la dificultad que tienen muchos encuestados y entrevistados para rastrear su contenido entre sistemas.

Esta investigación también reveló una serie de desafíos organizacionales. Un tema común tanto en las respuestas a la encuesta como en las entrevistas fue la falta de fondos o personal para un programa robusto de preservación digital. Estos factores fueron citados como las principales razones por las que los encuestados no mantuvieron copias múltiples de contenido en múltiples ubicaciones, y como razones significativas por las que sus organizaciones no tenían políticas de preservación digital. La rotación del personal fue un reto mencionado por muchos de los entrevistados. Varios mencionaron las dificultades para retener al personal técnico, y otros señalaron que era difícil convencer a los administradores de que sustituyeran a los funcionarios que se habían ido. Además de los retos mencionados anteriormente en la integración de herramientas y sistemas, la financiación y el personal surgieron como barreras significativas para la creación de programas sólidos de preservación digital.

El equipo deinvestigación y la junta asesora se han unido en torno a tres recomendaciones tras reflexionar sobre los resultados de la encuesta y la entrevista.

  • La primera recomendación es la creación de un conjunto de herramientas de toma de decisiones para elegir los materiales que se enviarán a los sistemas DDP, lo que ayudaría a los usuarios a tomar decisiones de curación y agilizaría los flujos de trabajo de preservación digital.
  • La segunda recomendación consiste en determinar un perfil BagIt compartido para los sistemas DDP, lo que mejoraría la interoperabilidad entre sistemas.
  • La tercera recomendación es un tablero de instrumentos o una herramienta similar que podría utilizarse para rastrear el contenido entre sistemas.

Deseando que estas recomendaciones se tengan en cuenta para cualquier trabajo de seguimiento de este proyecto con el objetivo de mejorar los flujos de trabajo y la interoperabilidad del DDP.

Estadísticas de arXiv

New submissions by year by subject area

Depósitos por años y disciplinas en ArxiV

arXiv

 1991-2017 submission rate statistics

 

arXiv es un repositorio de los campos de física, matemáticas, informática, biología cuantitativa, finanzas cuantitativas, estadística, economía, ingeniería eléctrica y de sistemas. Los documentos depositados en arXiv deben cumplir con los estándares académicos de la Universidad de Cornell. arXiv es propiedad y está operado por Cornell University, una institución educativa privada sin fines de lucro. arXiv está financiado por la Biblioteca Universitaria de Cornell, la Fundación Simons y otras instituciones miembros.

A principios de la década de los 90 se producen una serie de iniciativas aisladas por parte de investigadores y gestores de la información que tienen como objetivo común promover el libre acceso a la información y que se concretarán a lo largo de la década en lo que hoy conocemos como movimiento para el Acceso Abierto. Entre estos pioneros esta un físico de la Universidad de Los Álamos que en 1991 crea ArXiv, el que se considera el primer archivo abierto. La importancia de Ginsparg no está en la creación de un repositorio, sino en la concreción de un nuevo modelo de comunicación científica.

ArXiv es un repositorio que proporcionar acceso a casi millón y medio de publicaciones en los campos de la Física, Matemáticas, Informática, Biología Cuantitativa, Finanzas Cuantitativas, Estadística, Ingeniería Eléctrica y Ciencias de Sistemas y Economía. (1,346,542 de documentos archivados)

Las estadísticas de arXiv se basan en datos desde 1991 a 2017, actualizados al 31 de diciembre de 2017. En octubre de 2016, la tasa de autoarchivo era de más de 10.000 documentos por mes. La tasa de depósitos por disciplina en 2017 fue compuesta de aproximadamente un total del 47% de documentos de física, 26% de matemáticas y 22% de Informática. (2017 fue el primer año en que el porcentaje entrante de física cayó por debajo del 50% del total entrante).

Las tasas actuales de autoarchivo en 2017 fueron:

 

 

Una aproximación al Repositorio Institucional Universitario; el caso de Gredos, el Repositorio Institucional de la Universidad de Salamanca

 

datavenndiagram

Fernández García, M. J. [e-Book]  Una aproximación al Repositorio Institucional Universitario; el caso de Gredos, el Repositorio Institucional de la Universidad de Salamanca. Salamanca, Universidad de Salamanca, 2016.

Texto completo

 

El desarrollo de las tecnologías de información y el surgimiento del “Movimiento Open Access” han permitido diferentes modalidades de disponer la información científica, académica y cultural de las universidades en acceso abierto. Con esto, las instituciones; a través del desarrollo de Repositorios Institucionales (vía verde), han conseguido incrementar su visibilidad y mejorar el impacto de las investigaciones que en ellas se realizan, así como dar prestigio a los investigadores. La Universidad de Salamanca, con el Repositorio Gredos, se ha unido a las universidades que promueven la el acceso abierto a su información científica, académica y administrativa. En este contexto, no se deben descuidar los aspectos de actualización y mantenimiento del Repositorio, ya que puede perjudicar seriamente al prestigio de la institución.. En el presente trabajo, se presentan los Repositorios en general para más adelante centrarse en el Repositorio de la Universidad de Salamanca, GREDOS, con el fin de introducir las actividades allí realizadas durante el período de prácticas del Máster en Sistemas de Información Digital. En las conclusiones, se ha considerado oportuno hacer una breve alusión a las licencias de propiedad intelectual de los documentos que aloja el Repositorio, ya que lo que se ha hecho en las prácticas está relacionado directamente con esa cuestión.