Archivo de la etiqueta: Gestión de datos de investigación

Dryad & Zenodo inician un proyecto de colaboración para promover de manera más eficiente los objetivos de la Ciencia Abierta

 

2020-03-10_13-47-57

 

Tanto Dryad como Zenodo han sido líderes en la publicación de datos, software y otros productos de investigación de código abierto durante la última década. Si bien nuestro enfoque y mecanismos de adopción pueden haber sido diferentes, hemos tenido valores y objetivos similares todo el tiempo: publicar y archivar productos de investigación no tradicionales de una manera abierta y accesible que promueva las mejores prácticas.

Dryad se ha centrado durante mucho tiempo en los datos de investigación, curando cada conjunto de datos publicados y trabajando en estrecha coordinación con los editores y las sociedades para apoyar las políticas de datos de las revistas. Zenodo, con sede en el CERN, se basa en una fuerte capacidad de infraestructura y se ha centrado en la publicación y citación de software.

Por lo que a principios de febrero, se reunieron ambos equipos para comprender los sistemas de reposición, las hojas de ruta y para trazar nuestro trabajo futuro. Dividiendo el trabajo en un par de segmentos y comenzaremos con un primer proyecto de colaboración, como se indica en Github, como “DJ D-Zed”: Mezclando Repositorios”. En otras palabras, integrando dos sistemas para facilitar a los investigadores que quieran seguir las mejores prácticas publicando su software, datos e información de apoyo. La primera dirección de enfoque es la publicación de Dryad a Zenodo.

Este proyecto implica reimaginar la interfaz de carga de Dryad para ampliar el alcance de la carga para dar cabida a los investigadores que depositan algo más que datos. Dentro de esta interfaz, a través de una serie de declaraciones y lecturas de la máquina, datos, software y archivos de apoyo (otros). Los datos deben ser curados y publicados en Dryad. El software requiere una serie de diferentes opciones de licencia, metadatos y otros atributos y los archivos de apoyo se benefician de un previsor, por lo que estos archivos se publican más apropiadamente en Zenodo.

Después de la curaduría, una vez que los elementos están listos para ser publicados, es esencial vincular el trabajo con sus DOI y citas a ambos. Como Dryad y Zenodo cada uno acuña sus DOIs para los trabajos publicados, por ello es esencial exponer la relación entre el software, los datos y otras citas para que los usuarios puedan encontrar todos los trabajos relacionados. El beneficio de tener citas separadas para el software y los datos permitirá prácticas de citación más específicas en revistas, en preprints, etc.

 

La importancia de crear una infraestructura de datos

 

oreilly-ebook-575x863-1_0

 

LaPlantte, Alicia. Building a Unified Data Infrastructure. Sebastopol, California: O’Really, 2020

Texto completo

 

Este informe demuestra la importancia de crear una infraestructura de datos holística. Explica cómo la virtualización de datos, la gestión de datos maestros y la gestión de metadatos en combinación ayudan a cumplir los objetivos organizacionales. Descubre los beneficios de combinar estas capacidades en una plataforma de datos unificada y aprende a:

  • Cómo las operaciones, el análisis y la gestión pueden utilizar los datos con gran ventaja
  • Un enfoque pragmático y holístico para construir una infraestructura de datos unificada
  • Las capacidades críticas necesarias para un enfoque holístico, incluida la capacidad de aprovechar la tecnología existente
  • Seis prácticas óptimas para combinar las capacidades de gestión de datos

Este informe es de lectura obligada para los directores de datos, arquitectos de empresas, líderes analíticos y ejecutivos de línea de negocios.

 

La ética de la privacidad en la era de los Big Data

 

cable_racks_at_grid_computing_center_fermilab_with_blue_lights-2-min-1744x1159-1

Data, privacy & the individual | IE CGC, 2020

Texto completo

 

Los datos son el principal combustible de nuestras economías digitales. Nuestras transacciones financieras, movimientos, comunicaciones, relaciones e interacciones con gobiernos y empresas, tanto en línea como fuera de ella, generan datos que son recopilados, comprados y vendidos por corredores de datos y empresas interesadas en establecer perfiles de personas.

 

A medida que la recopilación y el análisis de datos se hacen más sofisticados y precisos, y a medida que los conjuntos de datos crecen hasta convertirse en Big Data, las oportunidades que se presentan parecen infinitas. Sin embargo, los riesgos también son grandes, ya que la información que se maneja sobre los individuos es extremadamente sensible. Conseguir la privacidad correcta es uno de los mayores retos de esta nueva década del siglo XXI. Los últimos años han demostrado que todavía hay mucho trabajo por hacer en la privacidad para domar los aspectos más oscuros de la economía de los datos. A medida que siguen surgiendo escándalos relacionados con los datos, abundan las preguntas sobre cómo interpretar y hacer cumplir la reglamentación, cómo diseñar nuevas y mejores leyes, cómo complementar la reglamentación con una mejor ética y cómo encontrar soluciones técnicas a los problemas de los datos.

Este proyecto de investigación explora algunas de las cuestiones éticas clave planteadas por las tecnologías emergentes de hoy en día, y analiza nuevos métodos técnicos que los gobiernos y las empresas pueden utilizar para sacar provecho de la información respetando las reglamentaciones y manteniendo la confianza tanto de sus clientes como de los ciudadanos.

 

Estudio sobre blockchain: aspectos legales, de gobernanza e interoperabilidad

 

450_1000

 

Study on Blockchains – Legal, governance and interoperability aspects SMART 2018/0038. Luxembourg: Publications Office of the European Union, 2020

Texto completo

 

Blockchain y Distributed Ledger Technologies (DLT) como un conjunto de tecnología de confianza es una clave en el flujo libre de datos que sustenta cada sociedad impulsada por los datos. El estudio proporciona un análisis extenso sobre escenarios en la construcción de un marco legal de la UE para desarrollar e implementar blockchain y DLT.

El objetivo general del estudio es proporcionar pruebas y apoyo a los enfoques de política y las medidas concretas en el marco de la iniciativa europea de blockchain y contribuir a la elaboración de una estrategia de la UE a la luz de la la tecnología de blockchain. Por consiguiente, en el estudio se analiza y evalúa el marco jurídico de la UE en relación con la tecnología blockchain y se presentan opciones de política en los casos en que es necesario hacer ajustes o aclaraciones. En el estudio también se evalúa los efectos de la blockchain y estas opciones de política con miras a considerar la evolución futura de la política de la cadena en bloque.

 

Impacto económico del Open Data

 

captura-6

The Economic Impact of Open Data: Opportunities for value creation in Europe”. Capegnini, 2020

Texto completo

 

Los datos abiertos hacen referencia a la información recopilada, elaborada o encargada por organismos públicos que puede utilizarse, modificarse y compartirse libremente por cualquier persona. Entre sus ventajas están un aumento en la transparencia y responsabilidad gubernamental, así como beneficios financieros tangibles para los ciudadanos, negocios y la sociedad civil

 

El estudio destaca las oportunidades cuantificables que ofrecen la utilización y la reutilización de series de datos abiertos, como el incremento de la eficiencia, la reducción de costes y ayuda para la consecución de objetivos sociales y medioambientales. El informe se ha elaborado a petición de la Comisión Europea en el marco de la iniciativa del Portal Europeo de Datos bajo la dirección de Capgemini Invent

El estudio de Capgemini publicado en 2015 para el lanzamiento del Portal Europeo de Datos estimó un valor de 75.700 millones de euros en volumen de mercado para Open Data en 2020, con un aumento significativo de aproximadamente un 37% entre 2016 y 2020. En este contexto, la Unión Europea lanzó el Portal Europeo de Datos, que recopila información sobre los datos disponibles en cada país europeo. Hasta la fecha, engloba 35 países, 82 catálogos, enlaces a casi un millón de conjuntos de datos en toda Europa y ofrece una serie de recursos de aprendizaje y ejemplos de uso de datos abiertos.

Esta edición del estudio, publicado por primera vez en 2015, examina de qué forma los datos abiertos (open data) pueden crear valor económico de múltiples formas. En concreto, muestra que el open data puede ser beneficioso en diversos sectores, de formas distintas y para una variedad de usuarios como empresas, administraciones públicas y ciudadanos. El informe revela también que los datos abiertos permiten un acceso más sencillo y rápido a un volumen mayor de información, contribuyendo así a mejorar el proceso de toma de decisiones. Estas son las principales conclusiones del estudio:

Dimensión del mercado de datos abiertos: En un escenario conservador de crecimiento, el tamaño del mercado de datos abiertos en la UE27+ llegará a los 199.510 millones de euros en 2025. En un marco optimista, la cifra alcanzaría los 334.200 millones; una diferencia de 143.690 millones de euros.

Empleo en el ámbito del open data: También se espera que crezca el número de personas que trabaja con el movimiento de datos abiertos. Según las previsiones, en 2025, este sector puede llegar hasta los 1,97 millones empleados directos e indirectos en un escenario optimista, 884.000 más que ahora —el escenario conservador augura alcanzar 1,12 millones de empleos—. Si en 2025 el valor creado por cada empleado superase los 169.000 euros (tal y como ocurrió en 2019), el tamaño del mercado de datos abiertos podría ser incluso mayor del previsto.

Incremento de la eficiencia y reducción de los costes gracias a los datos abiertos: El valor creado por los datos abiertos no se limita exclusivamente a los beneficios económicos. Los datos abiertos no solo ayudan a las empresas y las administraciones públicas a generar más ingresos por la creación de nuevos servicios y a reducir costes gracias a una mayor eficiencia en el trabajo, sino que también pueden ayudar a salvar vidas, ahorrar tiempo, conservar el medio ambiente y mejorar la transferencia de conocimientos a través de servicios lingüísticos.

Oportunidades para alcanzar el pleno potencial de los datos abiertos: Si se examina la creación de valor del open data, puede observarse que las oportunidades no solo residen en el tamaño de la fuerza de trabajo, sino, también, en la forma en que se crea y puede crearse valor en el futuro. Para ello es necesario que haya un suministro adecuado de series de datos abiertos. En la actualidad, existe un gran volumen de datos aptos para su publicación como open data, pero que todavía no están abiertos, lo que supone perder una oportunidad potencial. Al mismo tiempo, muchas series de datos no son adecuadas para su libre disponibilidad en su forma original, porque son confidenciales o porque contienen datos personales, como es el caso de los historiales médicos, y que se deben someter a un proceso de agregación o anonimización antes de que puedan ser distribuidos.

Esther Huyer, consultora de Capgemini Invent e investigadora jefe y autora del informe, ha señalado: “El open data está ahí para enriquecer nuestros proyectos basados en datos, permitir la adopción de decisiones informadas y mejorar nuestros procesos, servicios y productos. El potencial económico se materializa cuando incrementamos nuestro nivel de conocimiento y competencia para descubrir y aprovechar oportunidades. Debemos explorar y mejorar los enfoques dados a la reutilización de datos, ajustándolos a principios éticos y de sostenibilidad, dándoles la utilidad requerida y combinando potencialmente datos abiertos con datos personales, compartidos o de fuentes participativas”.

Desarrollo de un marco de política de datos de investigación para todas las revistas y editores

 

data_management

 

Hrynaszkiewicz, I., Simons, N., Hussain, A., Grant, R. and Goudie, S., 2020. Developing a Research Data Policy Framework for All Journals and Publishers. Data Science Journal, 19(1), p.5. DOI: http://doi.org/10.5334/dsj-2020-005

 

Cada vez más revistas y editores, y agencias e instituciones de financiación, están introduciendo políticas de datos de investigación. Pero a medida que aumenta la prevalencia de las políticas, existe la posibilidad de confundir a los investigadores y al personal de apoyo con numerosos conflictivos de requisitos de políticas. En el artículo se definen y describen 14 características de las políticas de datos de investigación de revistas que se organizan en un conjunto de seis tipos de políticas estándar o niveles, que pueden ser adoptados por revistas y editores para promover el intercambio de datos de una manera que fomenten las buenas prácticas y sea apropiados para el público.

Las características de la política incluyen cobertura de temas tales como citas de datos, repositorios de datos, declaraciones de disponibilidad de datos, estándares y formatos de datos, y revisión por pares de datos de investigación. Estas características y tipos de políticas se han creado al revisar las políticas de varios editores académicos, que publican colectivamente más de 10.000 revistas, y a través de discusiones y construcción de consenso con múltiples partes interesadas en la política de datos de investigación a través del Data Policy Standardisation and Implementation Interest Group de Research Data Alliance. También se proporcionan pautas de implementación para las políticas estándar de datos de investigación para revistas y editores, junto con textos de políticas de plantilla que pueden ser implementados por las revistas en su información para autores y flujos de trabajo de publicación.

Se concluye con una llamada a la colaboración entre la comunidad académica editorial y de investigación en general para impulsar una mayor implementación y adopción de políticas consistentes de datos de investigación. y a través de discusiones y construcción de consenso con múltiples partes interesadas en la política de datos de investigación a través de Research Data Alliance. También se proporcionan pautas de implementación para las políticas estándar de datos de investigación para revistas y editores, junto con textos de políticas que pueden ser implementados por las revistas en su información para autores y flujos de trabajo de publicación.

El trabajo en la era de los datos

 

es_el-trabajo-en-la-era-de-los-datos

 

‘El trabajo en la era de los datos’. Madrid: BBVA OpenMind, 2020

Texto completo

PDF

ePub

mobi

 

El aumento exponencial de la capacidad de almacenamiento, transmisión y procesamiento de datos, junto con la reducción de su coste unitario que la revolución digital ha traído consigo, supone el comienzo de una nueva era, la «era de los datos».

 

Vivimos un periodo de transformación acelerada de la economía, la sociedad y los modos de vida. Y estas transformaciones están afectando de forma particularmente profunda al ámbito del trabajo.

Diecinueve grandes expertos de todo el mundo esbozan las reformas ambiciosas y radicales necesarias para encarar los desafíos de la era de los datos y aprovechar la tecnología como una fuerza poderosa que mejore de manera radical las condiciones de trabajo y el nivel de vida a escala global.

El libro busca hacer, en primer lugar, una revisión de los efectos de la revolución digital sobre el crecimiento, la distribución de la renta, la productividad y la inversión, con implicaciones relevantes sobre el mercado de trabajo a escala global.

Adicionalmente, se analizan los cambios fundamentales en la propia estructura del mercado de trabajo, tales como la polarización en el crecimiento del empleo; es decir, el crecimiento del empleo en los segmentos superiores e inferiores del mercado, en detrimento de los segmentos medios, que contribuye al aumento de la desigualdad; o la explosión reciente de formas de trabajo alternativas, que han sido bautizadas en su conjunto como gig economy.

Por último, el libro busca fomentar el análisis y el debate sobre las decisiones que debemos tomar, de manera individual o colectiva, para conseguir un mercado de trabajo en la era de los datos más justo, eficiente y productivo. Asimismo, plantea una reflexión final sobre los principales retos globales que debemos superar para asegurar que el enorme potencial de la tecnología se traduzca, efectivamente, en mejoras de las condiciones de trabajo y del bienestar para el conjunto de la población.
En definitiva, hemos de promover una transformación muy compleja y radical. Pero la alternativa es un mundo más desigual e inestable en el que, además, se perderían un tiempo y una energía preciosos para utilizar la tecnología como herramienta decisiva en la resolución del gran problema de todos: la amenaza creciente sobre la sostenibilidad del planeta.