Archivo de la categoría: Acceso abierto

Más allá del repositorio: Integración de los sistemas de preservación local con los servicios de distribución nacional

starting-small-practical-first-steps-in-digital-preservation-15-728

 

Weinraub, E., L. Alagna, et al. (2017). [e-Book]  Beyond the Repository: Integrating Local Preservation Systems with National Distribution Services. Whasington Institute of Museum and Library Services, 2017

Texto completo

 

El informe analiza como las prácticas de preservación digital local y los sistemas de depósito interactúan con los servicios de preservación digital distribuida (DDP). El equipo de investigación llevó a cabo una encuesta seguida de entrevistas en profundidad con encuestados seleccionados. La encuesta y las entrevistas revelaron una gran diversidad en la forma en que se practica la preservación digital y los desafíos comunes en la intersección de los repositorios locales y los servicios de DDP. La encuesta recibió 170 respuestas completas de diversas organizaciones. El 75 % de los encuestados se identificaron a sí mismos como instituciones académicas, pero también respondieron a la encuesta representantes de archivos, organizaciones gubernamentales, museos, organizaciones sin fines de lucro y bibliotecas públicas. Los encuestados se dividieron casi uniformemente entre los que se identificaron como administradores o jefes de departamento/unidad y los que se identificaron como personal. La gran mayoría de los encuestados -el 90%- informaron que su institución había colectado más de un terabyte de contenido digital único, y el 63% informó haber colectado cincuenta terabytes o menos. Los encuestados informaron que utilizaron una variedad de sistemas digitales de preservación y almacenamiento para administrar su contenido; una clara mayoría de los encuestados no utilizó ningún sistema.

Los datos de la encuesta revelan que la mayoría de los encuestados (84%) están almacenando copias de su contenido único en múltiples ubicaciones. Sin embargo, el número de copias almacenadas varió entre los encuestados: mantener dos o tres copias fueron las respuestas más comunes, pero diez informaron de que conservaban siete o más copias. En cuanto al lugar donde se almacenan estas copias, los encuestados indicaron con frecuencia que sus organizaciones persiguen más de una estrategia de almacenamiento. El sesenta y seis por ciento guarda copias en múltiples ubicaciones in situ, pero los servicios cloud y DDP son también mecanismos comunes de almacenamiento. De los encuestados que utilizan un servicio DDP, casi la mitad son miembros de la Digital Preservation Network, aunque varios de ellos utilizan DPN junto con otros servicios.

Cuando se les preguntó sobre la curación, casi la mitad de los encuestados indicaron que enviaron un subconjunto de sus datos a un repositorio distribuido (o fuera del sitio, o a la nube). Cuando se pidió a estos encuestados que clasificaran la importancia de los criterios utilizados para seleccionar el subconjunto de materiales enviados fuera del sitio, la mayoría eligió el mandato como el más importante, seguido de cerca por el valor intrínseco y el tipo de contenido. El sesenta por ciento indicó que tienen políticas establecidas para guiar la selección de materiales locales, pero sólo el 47% tiene políticas similares para los materiales que se envían a los sistemas distribuidos. Las entrevistas reflejaron esta tendencia, y muchos de los entrevistados comentaron que tienen criterios para seleccionar los materiales que enviaron a in almacenamiento externo o a los sistemas DDP, pero no necesariamente están articulados en políticas.

Los encuestados y entrevistados frecuentemente mencionaron la falta de interoperabilidad entre las herramientas y los sistemas como un reto. Muchos señalaron que la sobreespecialización de los sistemas contribuía a los problemas de interoperabilidad. Otros describieron sus sistemas como unidades separadas con poca integración entre ellas, requiriendo procesos manuales y soluciones. Una forma en que esto parece manifestarse comúnmente es la dificultad que tienen muchos encuestados y entrevistados para rastrear su contenido entre sistemas.

Esta investigación también reveló una serie de desafíos organizacionales. Un tema común tanto en las respuestas a la encuesta como en las entrevistas fue la falta de fondos o personal para un programa robusto de preservación digital. Estos factores fueron citados como las principales razones por las que los encuestados no mantuvieron copias múltiples de contenido en múltiples ubicaciones, y como razones significativas por las que sus organizaciones no tenían políticas de preservación digital. La rotación del personal fue un reto mencionado por muchos de los entrevistados. Varios mencionaron las dificultades para retener al personal técnico, y otros señalaron que era difícil convencer a los administradores de que sustituyeran a los funcionarios que se habían ido. Además de los retos mencionados anteriormente en la integración de herramientas y sistemas, la financiación y el personal surgieron como barreras significativas para la creación de programas sólidos de preservación digital.

El equipo deinvestigación y la junta asesora se han unido en torno a tres recomendaciones tras reflexionar sobre los resultados de la encuesta y la entrevista.

  • La primera recomendación es la creación de un conjunto de herramientas de toma de decisiones para elegir los materiales que se enviarán a los sistemas DDP, lo que ayudaría a los usuarios a tomar decisiones de curación y agilizaría los flujos de trabajo de preservación digital.
  • La segunda recomendación consiste en determinar un perfil BagIt compartido para los sistemas DDP, lo que mejoraría la interoperabilidad entre sistemas.
  • La tercera recomendación es un tablero de instrumentos o una herramienta similar que podría utilizarse para rastrear el contenido entre sistemas.

Deseando que estas recomendaciones se tengan en cuenta para cualquier trabajo de seguimiento de este proyecto con el objetivo de mejorar los flujos de trabajo y la interoperabilidad del DDP.

Estadísticas de arXiv

New submissions by year by subject area

Depósitos por años y disciplinas en ArxiV

arXiv

 1991-2017 submission rate statistics

 

arXiv es un repositorio de los campos de física, matemáticas, informática, biología cuantitativa, finanzas cuantitativas, estadística, economía, ingeniería eléctrica y de sistemas. Los documentos depositados en arXiv deben cumplir con los estándares académicos de la Universidad de Cornell. arXiv es propiedad y está operado por Cornell University, una institución educativa privada sin fines de lucro. arXiv está financiado por la Biblioteca Universitaria de Cornell, la Fundación Simons y otras instituciones miembros.

A principios de la década de los 90 se producen una serie de iniciativas aisladas por parte de investigadores y gestores de la información que tienen como objetivo común promover el libre acceso a la información y que se concretarán a lo largo de la década en lo que hoy conocemos como movimiento para el Acceso Abierto. Entre estos pioneros esta un físico de la Universidad de Los Álamos que en 1991 crea ArXiv, el que se considera el primer archivo abierto. La importancia de Ginsparg no está en la creación de un repositorio, sino en la concreción de un nuevo modelo de comunicación científica.

ArXiv es un repositorio que proporcionar acceso a casi millón y medio de publicaciones en los campos de la Física, Matemáticas, Informática, Biología Cuantitativa, Finanzas Cuantitativas, Estadística, Ingeniería Eléctrica y Ciencias de Sistemas y Economía. (1,346,542 de documentos archivados)

Las estadísticas de arXiv se basan en datos desde 1991 a 2017, actualizados al 31 de diciembre de 2017. En octubre de 2016, la tasa de autoarchivo era de más de 10.000 documentos por mes. La tasa de depósitos por disciplina en 2017 fue compuesta de aproximadamente un total del 47% de documentos de física, 26% de matemáticas y 22% de Informática. (2017 fue el primer año en que el porcentaje entrante de física cayó por debajo del 50% del total entrante).

Las tasas actuales de autoarchivo en 2017 fueron:

 

 

Una aproximación al Repositorio Institucional Universitario; el caso de Gredos, el Repositorio Institucional de la Universidad de Salamanca

 

datavenndiagram

Fernández García, M. J. [e-Book]  Una aproximación al Repositorio Institucional Universitario; el caso de Gredos, el Repositorio Institucional de la Universidad de Salamanca. Salamanca, Universidad de Salamanca, 2016.

Texto completo

 

El desarrollo de las tecnologías de información y el surgimiento del “Movimiento Open Access” han permitido diferentes modalidades de disponer la información científica, académica y cultural de las universidades en acceso abierto. Con esto, las instituciones; a través del desarrollo de Repositorios Institucionales (vía verde), han conseguido incrementar su visibilidad y mejorar el impacto de las investigaciones que en ellas se realizan, así como dar prestigio a los investigadores. La Universidad de Salamanca, con el Repositorio Gredos, se ha unido a las universidades que promueven la el acceso abierto a su información científica, académica y administrativa. En este contexto, no se deben descuidar los aspectos de actualización y mantenimiento del Repositorio, ya que puede perjudicar seriamente al prestigio de la institución.. En el presente trabajo, se presentan los Repositorios en general para más adelante centrarse en el Repositorio de la Universidad de Salamanca, GREDOS, con el fin de introducir las actividades allí realizadas durante el período de prácticas del Máster en Sistemas de Información Digital. En las conclusiones, se ha considerado oportuno hacer una breve alusión a las licencias de propiedad intelectual de los documentos que aloja el Repositorio, ya que lo que se ha hecho en las prácticas está relacionado directamente con esa cuestión.

Qualitative Data Repository (QDR): repositorio de datos digitales de investigación cualitativa y multi-método de Ciencias Sociales

38663597875_c510b74d66_b_d

Qualitative Data Repository (QDR)

https://qdr.syr.edu/

Qualitative Data Repository (QDR) es un repositorio dedicado a almacenar y compartir datos digitales generados o recopilados a través de la investigación cualitativa y multi-método de Ciencias Sociales. QDR proporciona una herramientas de búsqueda para facilitar el descubrimiento de datos, y también sirve como un portal para de otro tipo de recursos con enlaces a archivos estadounidenses e internacionales. 

QDR es financiado por la National Science Foundation, y patrocinado por el Center for Qualitative and Multi-Method Inquiry, una unidad de la Maxwell School of Citizenship and Public Affairs de Syracuse University.

Los datos cualitativos son utilizados por los científicos sociales para avanzar en en sus investigaciones con fines analíticos, interpretativos e inferenciales. Sin embargo, en los Estados Unidos, tradicionalmente estos datos han sido usados sólo una vez: los científicos sociales los recogen para un propósito de investigación particular, y luego los desechan. La falta de costumbre de compartir datos se debe en parte a la falta de infraestructura, como la ausencia de un lugar adecuado para almacenar y compartir datos cualitativos.

En primer lugar, el QDR amplía y facilita el acceso a los datos cualitativos de las ciencias sociales. Este acceso empodera a la investigación que de otro modo no se llevaría a cabo, y promueve la enseñanza y el aprendizaje para generar, compartir, analizar y reutilizar datos cualitativos. Además, el repositorio contribuye a hacer más transparente el proceso y los productos de la investigación cualitativa. Esta mayor apertura facilita la replicación, reproducción y evaluación del análisis cualitativo. Por último, al aumentar la visibilidad de los investigadores, el depósito impulsa el intercambio, promoviendo la formación de comunidades epistemológicas y sirviendo como plataforma para formar redes y asociaciones de investigación.

Con los objetivos de fomentar, facilitar y regularizar el archivo y el intercambio de datos derivados de la investigación cualitativa y multi-método en ciencias sociales son consistentes con los nuevos estándares de la American Political Science Association para el Acceso a Datos y Transparencia en la Investigación (DA-RT).

QDR busca proporcionar a los usuarios todos los beneficios que se derivan de los archivos de datos institucionalizados fiables. Por lograrlo, QDR sigue las recomendaciones  de Data Preservation Alliance for the Social Sciences (Data-PASS) del Center for Open Science (COS) para crear un «depósito de datos de investigación», estos sitios deben atender estos principios, que sean:

  • Utilizables: el contenido está en formatos digitales normalizados y bien establecidos.
  • Descubribles: se proporciona un catálogo disponible al público y de consulta gratuita.
  • Significativos: se ofrecen metadatos, documentación y otros materiales necesarios para facilitar la reutilización de los datos.
  • Citables: la citación formal de datos se ve facilitada por la asignación de identificadores persistentes a nivel internacional que se vinculen verificablemente con versiones específicas de los datos.
  • Seguros: se mantienen las políticas y los controles de procedimiento para proteger la confidencialidad y la privacidad personal, tal como lo exigen la ley y las normas éticas de la comunidad investigadora.
  • No discriminatorios: el acceso a los contenidos se ofrece en condiciones que no discriminen a personas, grupos o campos de actividad.
  • Durables: se garantiza la conservación a largo plazo y el acceso a los activos digitales.

 

Participar en estas prácticas aumenta la visibilidad de los datos, haciéndolos más fáciles de descubrir, acceder, usar y citar, ampliando así su impacto potencial. Es en gran medida debido a estos beneficios, por lo que muchas agencias de financiamiento requieren que los datos generados a través de la investigación que apoyan se  depositen en un archivo formal.

 

 

 

 

La dinámica social de los datos abiertos 

social-dynamics-of-open-data-cover

Francois van, S., G. V. Stefaan, et al. [e-Book]  The Social Dynamics of Open Data, African Minds, 2017

Texto completo

 

The Social Dynamics of Open Data es una colección de trabajos revisados por pares que se presentaron en el 2º Simposio de Investigación sobre Datos Abiertos = 2nd Open Data Research Symposium (ODRS) celebrado en Madrid, España, el 5 de octubre de 2016. La investigación es crítica para desarrollar un análisis más riguroso y detallado no sólo de por qué los datos abiertos son valiosos, sino también de cómo son valiosos y bajo qué condiciones específicas. El objetivo del Simposio de Investigación de Datos Abiertos y la subsiguiente recopilación de capítulos publicados aquí tiene como objetivo construir una base de evidencias más sólida. Esta base es esencial para entender cuáles han sido los impactos de los datos abiertos hasta la fecha, y cómo se pueden habilitar y amplificar los impactos positivos. Consecuentemente, común a la mayoría de los capítulos de esta colección está el intento de los autores de utilizar las teorías científicas existentes y aplicarlas a los datos abiertos para explicar mejor las dinámicas socialmente integradas que explican los éxitos y fracasos de los datos abiertos para contribuir a una sociedad más equitativa y justa.

Cómo sacar el máximo partido al software DSpace de repositorios de acceso abierto

aaeaaqaaaaaaaaloaaaajdzhntg3zwvjltg2ndytngnjni1injq5lwfjyzbhnzazywi1za

 Iryna Kuchma, How to make your OA repository work really well. EIFL, 2017

Texto completo

Uno de los objetivos del programa de acceso abierto del FIPL para 2016-2017 era mejorar los repositorios de acceso abierto en los países socios. Esto significa garantizar que funcionen bien junto con otros sistemas y plataformas, e incluir nuevas funcionalidades de repositorios que faciliten el uso de los repositorios y permitan compartir con mayor facilidad los resultados de la investigación.

Por ello En EIFL crearon una lista de control de consejos para mejorar los repositorios de acceso abierto creados con el software DSpace. Los consejos se han extraído de una serie de siete seminarios en línea organizados por el EIFL con expertos invitados del Instituto de Estudios sobre el Desarrollo (IDS, Reino Unido) y la Universidad de Stellenbosch (Sudáfrica), entre enero y mayo de 2016. Los expertos, Nason Bimbe (IDS) y Hilton Gibson (Universidad de Stellenbosch), compartieron sugerencias y buenas prácticas en la creación y ejecución de repositorios de acceso abierto que utilizan software libre y de código abierto DSpace, que es el software de repositorios más ampliamente utilizado en los países socios del EIFL.

Ciencia abierta: Guía de evolución sobre cómo Internet está cambiando la investigación, colaboración y comunicación científica

46133445804_19c3559381_o_d

Bartling S, Friesike S. Opening Science: The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing. Munich: Springer-Verlag GmbH 2014.

GRATIS

Amazon

Texto completo

PDF

ePub

El libro recoge todo lo relativo a que está ocurriendo y como se están desarrollado aquello que impulsa los cambios actuales en el mundo de la investigación y la ciencia. Se introducen los conceptos de Ciencia 2.0 y Open Science. Para ello ofrece una breve descripción a la historia de la ciencia y la difusión de conocimientos. Explica los orígenes de nuestra cultura científica que se desarrolló en torno a los métodos de publicación. Se aclaran los asuntos sobre las interdependencias de los conceptos actuales y se reafirma que la transición hacia la Ciencia Abierta es un cambio cultural complejo . Se discuten algunas razones de por qué el cambio es lento y los principales obstáculos que se encuentran. Para pasar a analizar los cambios recientes en los flujos de trabajo científico y cómo estos causan cambios en el sistema en su conjunto.Ciencia Abierta es un término general que abarca una multitud de supuestos sobre el futuro de la creación y difusión de conocimientos . Basado en una revisión de la literatura, proponie cinco escuelas de pensamiento sobre Ciencia Abierta: La escuela de infraestructura (que se ocupa de la arquitectura tecnológica ) , la escuela pública ( que se refiere a la accesibilidad de la creación de conocimiento ) , la “escuela de la medición” ( que se refiere a la medición del impacto alternativo) , la “escuela democrática” (que tiene que ver con el acceso al conocimiento ) y la “escuela pragmática” ( que se ocupa de la investigación en colaboración ) .

La promesa y el peligro de los Big Data

 

the_promise_peril_big_data_cover

Bollier, D. [e-Book]  The Promise and Peril of Big Data. New York, The Aspen Institute.

 

Texto completo

 

Cada vez son más los datos generados por las redes móviles, el cloud computing y otras nuevas tecnologías. Al mismo tiempo, las innovaciones continuas utilizan técnicas de correlación avanzadas para analizarlos,sin embargo, los resultados de todo este proceso pueden ser alentadores y alarmantes. The Promise and Peril of Big Data explora las formas en que estas tecnologías inferenciales pueden afectar positivamente a la medicina, las empresas y el gobierno, y también examina los peligros sociales que plantean. Escrito por David Bollier, el informe resume las ideas de la decimoctava Mesa Redonda Anual sobre Tecnología de la Información, que buscó comprender las implicaciones del surgimiento de «Big Data» y las nuevas técnicas de análisis inferencial.

Big Data Glossary: guía para la nueva generación de herramientas de datos

big_data_glossary

Warden, Pete. Big Data Glossary. O’Reilly Media, 2011

Texto completo

Este práctico glosario también incluye un capítulo de términos clave que ayudan a definir muchas de las herramientas utilizadas en la producción y análisis de grandes conjuntos de datos: bases de datos NoSQL, MapReduce, Almacenamiento, Servidores, Procesamiento, Procesamiento de lenguaje natural, Aprendizaje automático, Visualización, Adquisición, Serialización.

Esta guía describe 60 de las innovaciones más recientes, desde las bases de datos NoSQL y MapReduce, hasta las herramientas de aprendizaje y visualización. Las descripciones se basan en experiencias de primera mano con estas herramientas en un entorno de producción.