Archivo de la etiqueta: Gestión de datos de investigación

Ciencia abierta e innovación: observación de la Tierra

Mathieu, Pierre-Philippe, y Christoph Aubrecht, editores. Earth Observation Open Science and Innovation. Springer Nature, 2018.

Texto completo

El mundo de la Observación de la Tierra (EO) está cambiando rápidamente como resultado de los avances exponenciales de los sensores y las tecnologías digitales. La velocidad del cambio no tiene precedentes históricos. En las últimas décadas se han producido avances extraordinarios en las TIC, incluyendo Internet, la computación en la nube y el almacenamiento, que han dado lugar a formas radicalmente nuevas formas de recoger, distribuir y analizar datos sobre nuestro planeta.

Esta revolución digital también va acompañada de una revolución de la detección que proporciona una cantidad de datos sin precedentes sobre el estado de nuestro planeta y sus cambios. Europa lidera esta revolución de la detección en el espacio a través de la iniciativa Copérnico y el correspondiente desarrollo de una familia de misiones Sentinel. Esto ha permitido Esto ha permitido la vigilancia global de nuestro planeta en todo el espectro electromagnético espectro electromagnético de forma operativa y sostenida.

Además, una nueva tendencia, denominada «Nuevo Espacio» en Estados Unidos o «Espacio 4.0» en Europa, está surgiendo rápidamente a través de la creciente mercantilización y comercialización del espacio. En particular, con la rápida caída de los costes de construcción, lanzamiento y procesamiento de pequeños satélites, el lanzamiento y el procesamiento de pequeños satélites, los nuevos actores de la OE, incluidas las nuevas empresas y los gigantes de las TIC, están entrando en el sector espacial en masa, formando nuevas constelaciones de pequeños satélites estandarizados que proporcionan una nueva clase de datos sobre nuestro planeta con mayor resolución espacial y una mayor frecuencia temporal.

Estos nuevos conjuntos de datos globales procedentes del espacio permiten obtener una imagen mucho más completa de nuestro planeta. Esta imagen es ahora aún más refinada gracias a los datos de miles de millones de sensores inteligentes y sensores interconectados, lo que se conoce como la Internet de las Cosas (IoT). Estos flujos de datos dinámicos sobre nuestro planeta ofrecen nuevas posibilidades a los científicos para avanzar en nuestra comprensión de cómo el océano, la atmósfera, la tierra y la criosfera operan e interactúan como parte de un sistema terrestre integrado. También representa nuevas oportunidades para que los empresarios conviertan los big data en nuevos tipos de servicios de información. Sin embargo, estas oportunidades vienen acompañadas de nuevos retos para los científicos empresas, proveedores de datos y de software que deben dar sentido a la enorme y diversa cantidad de datos aprovechando las nuevas tecnologías, como la analítica de big data.

El estado de los datos abiertos 2021 – Actitudes mundiales hacia los datos abiertos

The State of Open Data 2021 – Global Attitudes Towards Open Data” Published Today, 2021

Texto completo

El informe anual de Figshare, Digital Science y Springer Nature sobre el estado de los datos abiertos revela una creciente preocupación entre los investigadores por el mal uso de los datos, así como por la falta de reconocimiento de aquellos que comparten abiertamente sus datos.

El informe sobre el estado de los datos abiertos está en su sexto año, y más de 4.200 investigadores de todo el mundo respondieron, proporcionando una visión detallada y prolongada de las motivaciones, los desafíos, las percepciones y los comportamientos hacia los datos abiertos. Se basa en un sólido conjunto de pruebas que confirman que uno de los principales obstáculos para compartir datos es la falta de crédito y reconocimiento.

Resultados clave:

El 55% de los encuestados cree que necesita apoyo en lo que respecta a los derechos de autor y las licencias para poner los datos de investigación a disposición del público, y el 73% apoya firmemente o en cierta medida la idea de un mandato nacional para poner los datos de investigación a disposición del público. Al mismo tiempo, el 65% de los encuestados nunca ha recibido crédito o reconocimiento por compartir datos.

Las principales motivaciones para compartir los datos están vinculadas a las medidas tradicionales de impacto y crédito, con el 19% de los encuestados motivados por la citación de sus trabajos de investigación, el 14% por la coautoría en los trabajos, el 11% por el aumento del impacto y la visibilidad de la investigación, y el 11% por el beneficio público.

A pesar de la preocupación por el mal uso de los datos y las licencias, el 66% de los encuestados había oído hablar de los principios de datos FAIR (encontrables, accesibles, interoperables y reutilizables), que se establecieron hace cinco años, y el 28% respondió que está familiarizado con ellos, el número más alto desde que se hizo esta pregunta por primera vez en 2018. Más de la mitad de los encuestados (54%) pensó que sus datos cumplían mucho o algo con los principios de datos FAIR, también el número más alto desde que se hizo esta pregunta por primera vez en 2018. Estos resultados indican que la preocupación por compartir datos podría disminuir a largo plazo si los datos son tan accesibles y reutilizables como sea posible.

Perspectivas de las políticas y prácticas abiertas de los financiadores de investigación europeos

Fosci, Mattia, Richens, Emma, & Johnson, Rob. Insights into European research funder Open policies and practices. SPARC Europe, 2019

Texto completo

Este informe resume los resultados de una encuesta realizada a los financiadores de la investigación europea sobre las políticas de Acceso Abierto (OA) y Datos de Investigación (DI), encargada por SPARC Europe, en consulta con representantes de las siguientes organizaciones: ALLEA, el Centro de la Fundación Europea y Science Europe y un grupo asesor más amplio.

Lanzada en la primavera de 2019, la encuesta, dirigida a unos 400 financiadores, obtuvo algo más de 60 respuestas de 29 países. La cohorte incluye importantes agencias de financiación nacionales (casi el 50%), financiadores paneuropeos, academias nacionales y regionales, fundaciones y organizaciones filantrópicas y organizaciones benéficas de investigación.

Los artículos que tiene depositados los datos en un repositorio público tienen de media un 25% más de citas

Colavizza G, Hrynaszkiewicz I, Staden I, Whitaker K, McGillivray B (2020) The citation advantage of linking publications to research data. PLoS ONE 15(4): e0230416. https://doi.org/10.1371/journal.pone.0230416

Los esfuerzos por hacer que los resultados de la investigación sean abiertos y reproducibles se reflejan cada vez más en las políticas de las revistas que animan u obligan a los autores a proporcionar declaraciones de disponibilidad de datos. Como consecuencia de ello, se ha producido un fuerte aumento de las declaraciones de disponibilidad de datos en la literatura reciente. Sin embargo, todavía no está claro qué proporción de estas declaraciones contienen realmente enlaces bien formados a los datos, por ejemplo, a través de una URL o un identificador permanente, y si hay un valor añadido en el suministro de tales enlaces.

Para comprobar esta hipótesis se consideraron 531, 889 artículos de revistas publicadas por PLOS y BMC, y se desarrollo un sistema automático para etiquetar las declaraciones de disponibilidad de datos según cuatro categorías basadas en su contenido y el tipo de disponibilidad de datos que muestran, y finalmente se analizó la ventaja de citación de las diferentes categorías de declaraciones mediante regresión.

Se encontró que, siguiendo las políticas obligatorias de los editores, las declaraciones de disponibilidad de datos se vuelven muy comunes. En 2018, el 93,7% de 21.793 artículos de PLOS y el 88,2% de 31.956 artículos de BMC tenían declaraciones de disponibilidad de datos. Las declaraciones de disponibilidad de datos que contienen un enlace a los datos en un repositorio -en lugar de estar disponibles bajo petición o incluidas como archivos de información de apoyo- son una fracción del total. En 2017 y 2018, el 20,8% de las publicaciones de PLOS y el 12,2% de las publicaciones de BMC proporcionaron DAS que contenían un enlace a los datos en un repositorio. También se encontró una asociación entre los artículos que incluyen declaraciones que enlazan a los datos en un repositorio y hasta un 25,36% (± 1,07%) de impacto de citación más alto en promedio, utilizando un modelo de predicción de citas.

Se discuten las posibles implicaciones de estos resultados para los autores (investigadores) y los editores de revistas que hacen el esfuerzo de compartir sus datos en repositorios.

La importancia de depositar los datos de investigación para maximizar el impacto

What a difference a data repository makes: Six ways depositing data maximizes the impact of your science. Plos Blog, October 18, 2021 Lindsay Morton Open Access Open Data

Texto original

Los datos son la clave para la verificación, la replicación, la reutilización y la mejor comprensión de las conclusiones de la investigación. Cuando los datos están en un repositorio su impacto y su relevancia se magnifican. He aquí seis formas en las que poner los datos en un repositorio público puede ayudar a que la investigación tenga mayor visibilidad.

1Los datos que están en un repositorio público nunca se pierden

¿Alguna vez has perdido la pista de un conjunto de datos de tu investigación? Tal vez hayas actualizado tu ordenador o te hayas trasladado a una nueva institución. Tal vez hayas borrado un archivo por error, o simplemente no recuerdes el nombre del archivo que estás buscando. Sea cual sea la causa, la pérdida de datos puede resultar embarazosa y requerir mucho tiempo de búsqueda. No puedes proporcionar la información solicitada por las revistas durante el proceso de revisión o a los lectores después de la publicación. Es imposible realizar futuros metaanálisis o revisiones sistemáticas. Y es posible que tengas que rehacer los experimentos para poder avanzar en tu línea de investigación. Con los datos depositados de forma segura en un repositorio con un DOI único para su seguimiento, normas de archivo para evitar su pérdida, y materiales de metadatos, saber que tus datos se utilizan correctamente, cumplir con las solicitudes de las revistas o revisar trabajos anteriores es fácil.

2Los repositorios públicos de datos apoyan la comprensión, el reanálisis y la reutilización

La publicación transparente de los datos brutos en un repositorio público favorece una investigación científica fiable y reproducible. El conocimiento de los datos y el análisis permite a los lectores comprender mejor los artículos de investigación publicados. Ofrecer la oportunidad de que otros interpreten los resultados demuestra integridad y abre nuevas vías de debate y colaboración. Un formato de los datos legibles por máquina permite incorporar el trabajo a futuras revisiones sistemáticas o metaanálisis, ampliando su utilidad.

3 – Los repositorios públicos de datos facilitan el descubrimiento

Incluso los mejores datos no se pueden utilizar si no se pueden encontrar. Los metadatos detallados, la indexación de las bases de datos y los enlaces bidireccionales hacia y desde artículos relacionados ayudan a que los datos de los repositorios públicos sean fácilmente buscables, de modo que lleguen a los lectores que más los necesitan, maximizando el impacto y la influencia del estudio en su conjunto.

4Los repositorios públicos de datos reflejan el verdadero valor de los datos

Los datos no deben tratarse como un producto secundario de un artículo de investigación. Los datos son investigación. Y los investigadores merecen el crédito académico por recopilar, capturar y conservar los datos que generan con tu trabajo. Los repositorios públicos ayudan a ilustrar la verdadera importancia y la relevancia duradera de los conjuntos de datos asignándoles su propio y único DOI, distinto del de los artículos de investigación relacionados, para que los conjuntos de datos puedan acumular citas por derecho propio.

5Los datos públicos demuestran el rigor

No hay mejor manera de ilustrar el rigor de los resultados que explicar exactamente cómo los has obtenido. Compartir los datos le permite demostrar tu credibilidad e inspira confianza en los lectores al contextualizar los resultados y facilitar la reproducibilidad.

6 – La investigación con datos en repositorios de datos públicos atrae más citas

Un estudio realizado en 2020 sobre más de 500.000 artículos de investigación publicados descubrió que los artículos que enlazan con datos en un repositorio público tienen una tasa de citación un 25% más alta de media que los artículos en los que los datos están disponibles a petición o como información de apoyo. Las razones exactas de esta asociación siguen sin estar claras. ¿Son los investigadores que depositan datos cuidadosamente curados en un repositorio también más dados a producir una investigación rigurosa y digna de ser citada? ¿Los investigadores que tienen tiempo y recursos para dedicar a la conservación y el depósito de datos están más consolidados en sus carreras y, por tanto, son más citados? ¿Son los lectores más propensos a citar la investigación cuando confían en que pueden verificar las conclusiones con datos? ¿Quizás una combinación?

ACRL y PLA lanzan Benchmark, una herramienta de análisis de datos para bibliotecas

ACRL and PLA Launch Benchmark, a Library Data Analysis Tool
by Matt Enis Library Journal, Nov 09, 2021

Ver completo

The Association of College & Research Libraries (ACRL) and Public Library Association (PLA) han lanzado Benchmark: Library Metrics and Trends, un nuevo recurso digital de análisis y visualización de datos diseñado para «ayudar a las bibliotecas a planificar, tomar decisiones informadas y contar la historia de su impacto», según un anuncio conjunto, la herramienta se basa en una recopilación centralizada de datos procedentes de diversas fuentes. En el caso de las bibliotecas públicas, incluye encuestas de la APA, datos del censo de Estados Unidos y datos y encuestas del Instituto de Servicios de Museos y Bibliotecas (IMLS). Las bibliotecas universitarias también tienen acceso a los datos de la encuesta de tendencias y estadísticas de las bibliotecas universitarias de la ACRL.

Benchmark sustituye a Public Library Data Service (PLDS), que se interrumpió en 2019 tras las peticiones del ámbito bibliotecario «para obtener mejores datos de comparación entre bibliotecas, interfaces fáciles de usar para el análisis de datos y la presentación de informes, menos redundancia en la recopilación de datos y una mejor formación de datos relacionados con los indicadores de la comunidad», según el anuncio. En respuesta a estas necesidades, Evaluation, and Assessment Committee de PLA invirtió en el desarrollo de Benchmark, que comenzó hace más de dos años.

Todas las bibliotecas públicas tendrán acceso gratuito a páginas de resumen con métricas y visualizaciones seleccionadas para la biblioteca, su principal grupo de pares y todas las bibliotecas del país. Otras características, como un sólido conjunto de paneles de datos interactivos con visualizaciones y filtros. Un generador de informes personalizados que incluye métricas históricas [desde 2002 para las bibliotecas públicas y desde 1998 para las académicas]. Y la posibilidad de crear grupos de pares personalizados para la evaluación comparativa.

El estado de la transformación digital en 2021: aprendizajes e ideas clave de 10 años de transformación digital

The 2021 State of Digital Transformation: Key Learnings and Insights From 10 Years of Digital Transformation. Altimeter, Prophet, 2021

Texto completo

En el informe de este año sobre el estado de la transformación digital, nuestro objetivo es identificar las diferencias clave entre las empresas que han tenido éxito en la transformación digital y las que siguen teniendo problemas. Hemos encuestado a 587 ejecutivos de EE.UU., Europa y China, de diversos sectores, para poner de relieve no solo sus capacidades digitales actuales, sino las inversiones y decisiones clave que les han llevado hasta donde están. Al separar las respuestas de las empresas de alto rendimiento y las de rendimiento medio, identificamos se identificaron las características clave de las empresas que cumplieron con éxito sus objetivos de transformación.

Este informe sirve como punto de referencia para lo que es la madurez digital en 2021 y traza un camino para las empresas que buscan prosperar en la próxima ola de iniciativas de transformación digital.

Las principales conclusiones son las siguientes:

  • El crecimiento y la innovación fueron los principales objetivos de transformación para las empresas de mayor rendimiento, mientras que las empresas de rendimiento medio citaron la modernización y la eficiencia como sus principales objetivos.
  • La mayoría de las empresas utilizaron un enfoque de transformación holístico o coordinado simultáneamente para transformar la organización, en lugar de transformar los departamentos de forma aislada o secuencial.
  • La COVID-19 redujo los presupuestos y recursos para la transformación, pero no frenó los programas de transformación. De hecho, en el caso de las empresas de alto rendimiento, aceleró los esfuerzos de transformación.
  • Las empresas con transformaciones exitosas eran mucho más propensas a priorizar las iniciativas de gestión de datos, innovación, experiencia del cliente y experiencia del empleado, en comparación con las empresas promedio.
  • Las transformaciones lideradas por un CEO tienen más éxito que las lideradas por otros cargos
  • Las empresas digitalmente maduras buscan invertir en el aprovechamiento de los datos, la optimización de las experiencias de los clientes y los empleados, y la creación de asociaciones y redes externas para prepararse para la siguiente fase de transformación.

Métricas para repositorios de datos y bases de conocimiento

Metrics for Data Repositories and Knowledgebases: Working Group Report” NIH, 2021

Texto completo

Este informe presenta los resultados de una exploración del panorama actual de las métricas de los repositorios de datos biomédicos de datos biomédicos realizado por el Grupo de Trabajo NIH Lifecycle and Metrics Working Group and the NIH Metrics for Repositories (MetRe) Working Group. Los grupos de trabajo (WG) reunieron información de la comunidad de repositorios de datos biomédicos mediante un proceso de dos partes. En la primera fase, el grupo de trabajo MetRe identificó varios repositorios financiados por NIH y desarrolló una lista de métricas que se recogen con mayor frecuencia. Esta lista de Esta lista de métricas se utilizó para desarrollar un instrumento de encuesta que el grupo de trabajo sobre el ciclo de vida y las métricas utilizó para recoger las aportaciones de la comunidad de repositorios biomédicos en general en la fase 2. Este informe describe los resultados de estas dos actividades, proporcionando información sobre el estado actual de los datos y datos y métricas de los repositorios en la comunidad de la investigación biomédica y complementa los esfuerzos en curso en la en la comunidad de métricas más amplia.Este informe incluye las aportaciones de los representantes de 13 repositorios de los NIH de la fase 1 y de 92 gestores de repositorios de la fase 2. en la fase 2. Las métricas que estos encuestados declararon utilizar se dividen en varias categorías generales categorías amplias, incluyendo (de la más a la menos común) Características del comportamiento del usuario, Contribución/impacto Contribución/Impacto Científico, y Operaciones del Repositorio, y los encuestados de los dos grupos reportaron patrones similares en las métricas que recogen. La mayoría de los encuestados en la fase 2 (77%) también indicaron compartir los datos de sus métricas, un hallazgo alentador dado que dichas métricas pueden ser útiles a los NIH para comprender mejor cómo se utilizan los conjuntos de datos y los repositorios. Muchos de los encuestados de ambos grupos informaron de que utilizaban Google Analytics para recopilar métricas, principalmente en las áreas de de comportamiento de los usuarios, dada su facilidad de uso y su capacidad para realizar un seguimiento preciso de dichas métricas. Sin embargo, muchos de los encuestados también indicaron que les gustaría recopilar métricas adicionales, pero que actualmente no lo hacen o no pueden hacerlo debido a la falta de herramientas para ello.

Los resultados de este informe proporcionan una mejor comprensión de las métricas utilizadas actualmente en la comunidad de repositorios biomédicos, lo que puede informar sobre los futuros esfuerzos de los NIH para ayudar a desarrollar este espacio y para comprender los patrones de uso entre los conjuntos de datos y los repositorios. Los NIH también deberían estar al tanto de de los desarrollos en la comunidad más amplia de métricas de repositorios para asegurar la alineación.

Guía sobre la alfabetización de datos para principiantes

A Beginner’s Guide to Data & Analytics, London: Harvard Business School, 2021

Texto completo

Con este libro electrónico, obtendrás una introducción a la alfabetización de datos que puede ponerle en el camino de ser un profesional orientado a los datos. Entrar en el espacio de los datos como un principiante puede parecer desalentador, pero con el conocimiento básico, puedes comprender la alfabetización de datos y aprovechar el poder de los datos para el éxito de tu organización.

Inteligencia artificial, robótica y ciencia de los datos

Sara Degli Esposti; Carles Sierra. Artificial intelligence, robotics & data science.  Madrid : Consejo Superior de Investigaciones Científicas, 2021

Texto completo

El libro blanco del CSIC sobre Inteligencia Artificial, Robótica y Ciencia de Datos esboza una hoja de ruta preliminar para abordar los actuales retos de I+D asociados a las máquinas automatizadas y autónomas. En ocho capítulos se presentan más de 50 retos de investigación investigados en toda España por más de 150 expertos del CSIC. El capítulo uno introduce conceptos clave y aborda la cuestión de la integración del conocimiento (representación), el razonamiento y el aprendizaje en el diseño de entidades artificiales. El capítulo dos analiza los retos asociados al desarrollo de teorías -y tecnologías de apoyo- para modelar el comportamiento de los agentes autónomos. En concreto, presta atención a la interacción entre los elementos a nivel micro (las interacciones individuales de los agentes autónomos) con el mundo macro (las propiedades que buscamos en las sociedades grandes y complejas). Mientras que el capítulo tres analiza la variedad de aplicaciones de la ciencia de datos que se utilizan actualmente en todos los campos de la ciencia, prestando especial atención a las técnicas de aprendizaje automático (ML), el capítulo cuatro presenta el desarrollo actual en diversas áreas de la robótica. El capítulo cinco explora los retos asociados a los modelos cognitivos computacionales. El capítulo seis presta atención a los retos éticos, legales, económicos y sociales que acompañan al desarrollo de los sistemas inteligentes. El capítulo siete aborda el problema de la sostenibilidad medioambiental del despliegue de sistemas inteligentes a gran escala. Por último, el capítulo ocho aborda la complejidad de garantizar la seguridad, la resistencia y la protección de la privacidad de los sistemas inteligentes frente a las ciberamenazas.