Archivo de la categoría: Acceso abierto

Desarrollo de flujos de trabajo para científicos de datos

development-workflows-1

Development Workflows for Data Scientists. O’Reilly Media, 2017

Texto completo

GitHub se asoció con O’Reilly Media para examinar cómo los equipos de análisis de datos de varias organizaciones están mejorando la forma en que definen, aplican y automatizan los flujos de trabajo basados en servicios de datos.

  • Definición de la estructura y las funciones del equipo
  • Preguntas interesantes
  • Examen de trabajos previos
  • Recolección, exploración y modelado de datos
  • Prueba, documentación e implementación de códigosde producción
  • Comunicación de los resultados

Este informe esclarecedor muestra cómo, a pesar de que el ritmo de cambio es rápido y el deseo por el conocimiento y la visión de los datos es cada vez mayor, las disciplinas duales de ingeniería de software y la ciencia de los datos están a la altura de la tarea.

 

I4OC: Iniciativa para promover la disponibilidad sin restricciones de datos de citas académicas.

i4oc

 

https://i4oc.org

La Iniciativa para Citas Abiertas I4OC es un proyecto colaborativo entre editores académicos, investigadores y otras partes interesadas para promover la disponibilidad sin restricciones de datos de citas académicas.

Las citas son los vínculos que unen nuestro conocimiento científico y cultural. Son datos primarios que proporcionan información tanto de la procedencia, como una explicación de cómo conocemos los hechos. Nos permiten atribuir y acreditar contribuciones científicas, y permiten evaluar la investigación y sus impactos. En suma, las citas son el vehículo más importante para el descubrimiento, difusión y evaluación de todo el conocimiento científico.

Dado que se estima que el número de publicaciones académicas se duplicará cada nueve años, las citas -y los sistemas computacionales que las siguen- permiten a los investigadores y al público mantenerse al tanto de los desarrollos significativos en cualquier campo, es esencial tener acceso sin restricciones a datos bibliográficos y de citas en forma legible por ordenador

El actual sistema de comunicación académica expone inadecuadamente las redes de conocimiento que ya existen en nuestra literatura. Los datos de citas no suelen estar libremente disponibles para acceder, pues a menudo están sujetos a licencias de propiedad y difíciles de analizar. Por ello el objetivo de I4OC es promover la disponibilidad de datos sobre citas estructuradas, separables y abiertas.

Estructurado significa que los datos que representan cada publicación y cada cita se expresan en formatos comunes, legibles por máquina, y que se pueda acceder a ellos mediante programación. Separable significa que se puede acceder a las instancias de citación y analizarlas sin necesidad de acceder a los productos bibliográficos de origen (como artículos de revistas y libros) en los que se crean las citas. Abierto significa que los datos están libremente accesibles y reutilizables.

Lograr estos objetivos conlleva el establecimiento de una red pública global de datos de citas académicas vinculadas para mejorar la detección de contenido publicado, tanto de acceso mediante suscripción como de acceso abierto. Esto beneficiará particularmente a las personas que no son miembros de instituciones académicas con suscripciones a bases de datos de citas comerciales. La capacidad de construir nuevos servicios sobre los datos de citas abiertas, en beneficio de editores, investigadores, agencias financiadoras, instituciones académicas y el público en general, así como mejorar los servicios existentes. La creación de un sitio público de citas para explorar las conexiones entre campos de conocimiento, y seguir la evolución de ideas y las diferentes disciplinas académicas.

Open Data: base de datos sobre información de la historia del clima de la tierra desde hace 2.000 años

 

PDFsdata201788-f1

 

“A global multiproxy database for temperature reconstructions of the Common Era.” vol. 4, n. (2017). pp. 170088. http://dx.doi.org/10.1038/sdata.2017.88

PDF

La base de datos contiene la historia del clima de la Tierra desde hace 2.000 años
Los científicos del clima podrán estudiar con mayor precisión los cambios de temperatura de la Tierra, gracias a una base de datos global compilada con la ayuda de una Universidad Victoria de Wellington y GNS Science. Siendo la única herramienta para probar y verificar de forma independiente los modelos climáticos más allá de los últimos cuarenta años. PAGES ha publicado la base de datos como un recurso abierto, lo que permite a cualquiera descargar y utilizar los datos.

 

Es la colección más completa de información sobre el cambio de temperatura global de todos los tiempos, los datos que proporciona han tardado más de 2 años en reunirse. La base de datos reúne cerca de 700 registros de 648 localidades, compilados por 98 expertos regionales de 22 países, incluyendo todas las regiones continentales y las principales cuencas oceánicas. El proyecto fue coordinado por la red de científicos paleoclimáticos internacionales de PAGES (Past Global Changes)

La base de datos recoge información sobre la temperatura del pasado basada en la evidencia de varias fuentes de información, incluyendo anillos de árboles, corales, glaciares y sedimentos marinos y lacustres. La base de datos permite evaluar críticamente y mejorar los modelos de sistemas de tierra utilizados para proporcionar proyecciones futuras. La importancia de esta base de datos es que proporciona información muy necesaria sobre tendencias y patrones regionales de temperatura.

la colección completa se archiva como archivos pdf en Data Citation 1: figshare (Data Citation 1: figshare https://doi.org/10.6084/m9.figshare.c.3285353

PAGES 2k Consortium, figshare https://doi.org/10.6084/m9.figshare.c.3285353 (2017).

 

 

 

Curación de datos de investigación: estrategias prácticas para un repositorio digital

 

Johnston, L. R. (ed). [e-Book] Curating research data: Practical Strategies for Your Digital Repository. Volume one: practical strategies for your digital repository. Chicago, ACRL, 2017.

Texto completo

 

Los datos digitales están omnipresentes y cambian rápidamente en la medida que progresa la investigación actual y en el futuro. La capacidad de información de los bibliotecarios puede ayudar a asegurar la resiliencia de los datos digitales y la información que representa, al tratar que significado que tiene la integridad y la procedencia de los datos digitales generados por los investigadores de hoy se capturan y serán transmitidos a los futuros investigadores.

Los datos se están convirtiendo en la moneda proverbial del reino digital: un producto de investigación que podría adquirir crédito de reputación en una cultura disciplinaria de intercambio de datos, o comprar transparencia cuando se enfrentan a mandatos de agencias de financiamiento o escrutinio de editores. A diferencia de la mayoría de los sistemas monetarios, sin embargo, los datos digitales pueden fluir en una abundancia continua. Por otra parte, la magnitud de de los datos digitales desafía el papel tradicional del bibliotecario, ya los profesionales de la ciencia de la información deben de aprovechar este flujo de la información que fluye del descubrimiento de la investigación y de la búsqueda académica para preservar estas evidencias para el uso futuro.

El Volumen Uno de Curating Research Data analiza una variedad de razones y motivaciones para explicar por qué los servicios de recuperación de datos son necesarios en el contexto de los esfuerzos que están desarrollando los repositorio de datos académicos y disciplinarios. El libro se compone de doce capítulos, divididos en tres partes, que proporcionan una visión en profundidad de la práctica compleja de la curación de datos. La Parte I establece el escenario para la recuperación de datos describiendo las políticas actuales, los modelos de intercambio de datos y los esfuerzos de colaboración actualmente en curso que afectan a los servicios potenciales. La Parte II estudia varias cuestiones clave, como la recuperación de costos y la estrategia de marketing, un tema de gran interés para los profesionales que están pensando en implementar servicios de datos. Por último, la Parte III describe el ciclo de vida completo de los datos mediante el examen de los problemas de reutilización ética y práctica que los profesionales de la conservación de datos deben tener en cuenta a medida que nos esforzamos por preparar los datos para el futuro.

 

Acceso abierto en las universidades europeas: encuesta institucional 2015/2016

2017-07-05_12-21-121

Open Access in European Universities: Results From the 2015/2016 EUA Institutional Survey, Brussels: European University Association (EUA), 2017

Texto completo

Resultados de la encuesta institucional 2015/2016 de la EUA, que realiza un seguimiento del progreso de las instituciones en la aplicación de políticas y prácticas en el ámbito del acceso abierto. La encuesta realizada en 2015/2016 se centró en el acceso abierto a las publicaciones de investigación y, por primera vez, en el acceso abierto a los datos de investigación. Reunió respuestas de 169 instituciones de 33 países europeos, mostrando un progreso relativamente más consolidado en el acceso abierto a las publicaciones de investigación y también una conciencia creciente sobre el acceso abierto a los datos de la investigación.

 

Hacia el pleno acceso abierto en 2020: objetivos y recomendaciones para los líderes universitarios y las conferencias de rectores nacionales

2017-07-05_12-15-431

 Towards Full Open Access in 2020: aims and recommendations for university leaders and National Rectors’ Conferences European University Association (EUA), 2017

Texto completo

La European University Association (EUA) es la organización representativa de universidades y conferencias de rectores nacionales en 47 países europeos. EUA juega un papel crucial en el Proceso de Bolonia e influye en las políticas de la UE en materia de educación superior, investigación e innovación. Gracias a su interacción con otras organizaciones europeas e internacionales, la UE asegura que se escuchará la voz independiente de las universidades europeas, dondequiera que se tomen decisiones que repercutan en sus actividades.

En Towards Full Open Access in 2020: aims and recommendations for university leaders and National Rectors’ Conferences, la EUA hace un llamamiento a un sistema más abierto de comunicación científica basado en la calidad del proceso de revisión por pares, Los derechos sobre los resultados de la investigación y las licencias abiertas para la reutilización de la información, así como una relación de costo-beneficio equitativa tanto para las instituciones públicas como para los editores. Se describen una serie de recomendaciones en diferentes ámbitos relacionados con el acceso abierto, como el acceso abierto a las publicaciones de investigación y la gestión de datos de investigación, el desarrollo institucional del acceso abierto, la movilización de investigadores, los sistemas de evaluación y las negociaciones de grandes acuerdos con los editores.

 

Elsevier contra Sci-Hub: una sentencia obliga a Alexandra Elbakyan a indemnizar con 15 millones de dólares al gigante de la edición científica

 

la-joven-que-desafia-a-las-editoriales-con-su-pirate-bay-de-articulos-cientificos

Alexandra Elbakyan neurocientífica de Kazajstán creadora de Sci-Hub

 

Elsevier, el mayor editor de la investigación académica del mundo, demandó en mayo de este año a Alexandra Elbakyan  neurocientífica de Kazajstán, creadora del portal Sci-Hub, por piratería informática y violación de derechos de autor. Los artículos abarcan todos los temas científicos, desde los experimentos de física hasta los últimos avances en biotecnología. Sci-Hub afirma tener 62 millones de trabajos de artículos de investigación científica, la mayoría de los cuales son copias no autorizadas. Según un informe publicado en la revista científica Science el año pasado, Elsevier es la editorial que más se ve afectada por las actividades de Sci-Hub, con datos aportados por la editorial, recientemente Sci-Hub proporcionó medio millón de descargas de artículos de Elsevier en una semana. Hace unos días un tribunal dictaminó la victoria del gigante editorial contra la investigadora kazaya a la que obliga a indemnizar con 15 millones de dólares por daños a Elsevier.

Durante los seis meses anteriores a marzo de 2017, Sci-Hub sirvió 28 millones de documentos. Más de 2,6 millones de las solicitudes de descarga procedían de Irán, 3,4 millones de la India y 4,4 millones de China, pero no sólo de estos países, ya que en un período de 6 meses se descargaron 74.000 artículos de direcciones IP de la ciudad de Nueva York, 19.000 solicitudes de descarga fueron emitidas desde la Universidad de Columbia, y 68.000 de East Lansing, Michigan, Estas cifras ayudan a explicar por qué Elsevier ha estado persiguiendo a Sci-Hub obstinadamente durante los dos últimos años. En diciembre de 2015, el mismo juez de Nueva York que acaba de adjudicar los 15 millones de indemnización a Elsevier emitió una orden judicial preliminar contra el operador del sitio. El acceso al dominio original – sci-hub.org – fue suspendido, pero a los pocos días el operador siguió usando un dominio diferente https://sci-hub.io/; ya que en la era de Internet los intentos de bloquear el sitio son inútiles, ya que los servidores de Sci-Hub están ubicados en Rusia, fuera del alcance de la ley estadounidense.

En el fondo de este conflicto se esconde un modelo en el que las editoriales editan revistas científicas que son suscritas por universidades, que además aportan la fuerza de trabajo, tanto en el proceso de creación como en el proceso de revisión, lo que aporta a estas empresas márgenes de beneficio de entre un 30% y un 40%, niveles casi desconocidos en otras industrias. Además, durante los últimos años la inflación de las suscripciones no ha dejado de incrementarse, lo que está limitando la capacidad investigadora de muchas universidades. Y fue esta incapacidad de acceder a los documentos científicos, tal como dijo ante el tribunal, la clave que llevó a Alexandra Elbakyan a crear Sci-Hub en 2011.

“Cuando era estudiante en la universidad de Kazajstán, no tenía acceso a ningún trabajo de investigación. Los documentos que necesitaba para mi proyecto de investigación tenían un coste de 32 dólares, ese precio es una locura cuando se necesitan leer decenas o cientos de estos documentos para hacer la investigación. Obtuve estos papeles pirateándolos. Más tarde descubrí que hay muchos y muchos investigadores, no sólo estudiantes, sino que también investigadores universitarios que no pueden pagar esos precios por acceder a los artículos, especialmente en países en desarrollo”