Archivo de la etiqueta: Gestión de datos de investigación

Estado de los datos abiertos

“The State of the Union of Open Data” (3rd Ed.). The Data Foundation, 2019

Texto completo

The State of the Union of Open Data, que se basa en 33 entrevistas en profundidad con altos cargos de la administración pública y el sector privado. El informe de este año ha encuestado a los líderes del mundo de los datos abiertos sobre el panorama actual en tres categorías: normalización de datos, publicación e intercambio, y uso. El objetivo es informar al público sobre la historia y las tendencias actuales de los datos abiertos y destacar las perspectivas de los líderes de los datos abierto, y todo indica que los datos abiertos están avanzando. Sus beneficios son exponenciales: el uso de los datos abiertos puede aplicarse a muchos sectores diferentes de la sociedad y la administración, como la sanidad, la vivienda, la educación y la defensa nacional.

El aumento de la estandarización, el intercambio y, lo que es más importante, el uso de los datos abiertos ha dado lugar a una mayor eficiencia de los programas gubernamentales, una mayor transparencia y mejores resultados. Lo que ayudará a acelerar las mejoras en los programas y servicios gubernamentales y permitirá a los líderes de las agencias tomar mejores decisiones en aspectos tan decisivos cómo asignar los escasos recursos del gobierno.

Resultados clave:

  • Casi el 84% de los encuestados informaron de avances en la normalización de datos en su agencia u organización en el último año, en comparación con el 81,8% del año pasado.
  • Casi el 85 por ciento de los encuestados informaron de una mejora en la publicación o el intercambio de datos en su agencia u organización en el último año, frente al 76,2 por ciento del informe del año pasado.
  • Casi todos los encuestados, el 96,9%, afirman que el uso de datos para la toma de decisiones informadas y el conocimiento ha mejorado en su agencia u organización durante el último año.
  • El 93,6 por ciento de los encuestados indica que cree que la normalización, el intercambio y el uso de datos abiertos mejorarán en el futuro inmediato, en comparación con el 79,2 por ciento de los encuestados de 2017.
  • Los encuestados identifican la gestión interna como el principal beneficio de los datos abiertos, seguido de la transparencia y la automatización de los informes.

Ciencia abierta: permitir el descubrimiento en la era digital

Open Science – Enabling Discovery in the Digital Age. OECD, 2021

Texto completo

La innovación impulsada por los datos y la ciencia de uso intensivo de datos son muy prometedoras para abordar los grandes retos de la sociedad. Las iniciativas de ciencia abierta, que facilitan el acceso abierto a las publicaciones, los datos, los algoritmos, el software y los flujos de trabajo, desempeñan un papel esencial en la aceleración de la investigación científica necesaria y del propio proceso de innovación.

Esta informe de Going Digital Toolkit ofrece una visión general del movimiento de la ciencia abierta, destaca los logros de la ciencia abierta, incluidos los obtenidos en el contexto de la pandemia de COVID-19, identifica los desafíos para lograr todos los beneficios que la ciencia abierta puede ofrecer, y arroja luz sobre la evolución de las políticas de ciencia abierta en una serie de economías. El informe también aboga por un camino a seguir que implica los siete pilares de la Recomendación revisada del Consejo sobre el acceso a los datos de investigación procedentes de la financiación pública:

(1) Gobernanza de los datos para la confianza;

(2) Normas y prácticas técnicas;

(3) Incentivos y recompensas;

(4) Responsabilidad, propiedad y tutela;

(5) Infraestructuras sostenibles;

(6) Capital humano; y

(7) Cooperación internacional para el acceso a los datos de investigación.

Cómo triunfar en los hackatones de ciencia de datos

Amit Raja Naik – How To Ace Data Science Hackathons
OIM, 08/08/2021

Texto completo

Un hackathon, es un termino de la informática que describe un evento social de codificación que reúne a programadores informáticos y otras personas interesadas para mejorar o construir un nuevo programa de software. La palabra hackathon es una contracción de las palabras hacker, que significa programador inteligente, y maratón, un evento marcado por la resistencia, que también se utiliza para la reunión competitiva de cualquiera de otros expertos en un campo para resolver problemas de investigación que de otro modo podrían llevar meses o años. En este caso interesados y expertos en ciencia de los datos.

Los hackathones son una forma estupenda de perfeccionar las habilidades en la ciencia de los datos, aunque pueden ser difíciles de resolver, especialmente para los principiantes. Plataformas como  KaggleMachineHack están ayudando a las empresas a contratar a los mejores talentos de la ciencia de datos utilizando el modelo de los hackathones. El mes pasado,  MATHCO.thon concluyó su reto de «predicción del precio de los coches».

En esta experiencia participaron 2.383 profesionales de la ciencia de datos, de los cuales 50 pasaron el corte. Los tres primeros de la clasificación se llevaron premios en metálico. El profesor del IIT Madras, Chandrasekharan Rajendra, dijo que los candidatos deben actualizar continuamente sus conocimientos y diferenciarse participando activamente en hackathones internacionales.

A menudo, cuando hablamos de proyectos de ciencia de datos, nadie parece ser capaz de dar una explicación sólida de cómo se desarrolla todo el proceso. Desde la recopilación de los datos, hasta el análisis y la presentación de los resultados. El marco OSEMN cubre cada paso del ciclo de vida del proyecto de ciencia de datos, desde la obtención, la depuración, la exploración, el modelado y la interpretación de los datos.

Directrices para las revistas científicas que deseen establecer una «política de datos» relacionada con sus publicaciones

Guidelines for journals that wish to establish a “data policy” related to their publications. March 2021 (French original version), June 2021 (English version). Paris: Ministère de l’Enseignement supérieur, de la Recherche et de l’InnovationOuvrir la Science, 2021

Texto completo

El documento está destinado a los consejos de redacción de las revistas que deseen establecer una política de datos para sus publicaciones. La política define lo que la revista espera de sus autores en cuanto a la gestión y el intercambio de los datos asociados a sus publicaciones. Las recomendaciones abarcan siete apartados que deben tenerse en cuenta en la política.

Los datos de investigación incluyen todos los «documentos en formato digital, distintos de las publicaciones científicas, que se recogen o producen en el curso de las actividades de investigación científica y se utilizan como prueba en el proceso de investigación, o que son comúnmente aceptados en la comunidad investigadora como necesarios para validar las conclusiones y los resultados de la investigación»

El documento está dirigido en particular a los editores de revistas de Humanidades y Ciencias Sociales, ya que han sido relativamente menos activos en este ámbito que sus homólogos de Ciencia, Tecnología y Medicina. Sin embargo, puede ser útil para todos los editores, independientemente del ámbito disciplinario de su revista.

Las políticas de datos difieren en función de la naturaleza de los incentivos y requisitos que ofrecen, en particular:

  • ¿Incentivan o exigen que se pongan a disposición todos o parte de los datos subyacentes a las publicaciones?
  • ¿Existen condiciones específicas sobre la disponibilidad de los datos: plazo, formato, licencias…?
  • ¿Se someten los datos a un proceso de revisión por pares al igual que las publicaciones?
  • Para establecer progresivamente su política de datos, las revistas pueden remitirse a las tipologías existentes (por ejemplo, RDA ofrece 6 tipos de políticas de datos, Springer define 4).

Contar historias con los datos de la biblioteca

Telling Stories with Library Data
See how The Met’s Watson Library uses data visualizations

The Met by Michael Cummings

La Biblioteca Watson del Met utiliza las visualizaciones de datos para analizar la actividad de la biblioteca utilizando el mejor software de inteligencia empresarial del mercado Microsoft Power BI. . En este post, se comparten algunas revelaciones que los datos pueden mostrar sobre las actividades de la biblioteca.

Recientemente, la biblioteca recopilado meticulosamente seis años de datos de «Sierra», la base de datos de la biblioteca. Particularmente las categorías en las que se incluyen las adquisiciones, la catalogación y la circulación de la colección. También se recopilaron cifras de fuentes en línea como Google Analytics y las Colecciones Digitales de la Biblioteca Watson. Incluso de cifras manuales como el número y el tipo de tratamientos de libros en el Centro Sherman Fairchild para la Conservación de Libros. La captura de pantalla siguiente muestra el programa de diseño de informes.

El software que que se utilizó para diseñar los informes es Microsoft Power BI. Gartner, una empresa de investigación y asesoramiento, comparó Microsoft Power BI con software similar en el mercado y calificó a Microsoft como el mejor en «integridad de la visión» y la «capacidad de ejecución» del desarrollo.

Hemos estado utilizando Power BI para perfilar la actividad de cada departamento en la biblioteca desde hace seis años. En total, se recopilaron más de cuatro mil puntos de información. Las visualizaciones de los datos con Power BI ilustran el crecimiento de las colecciones impresas y digitales. Aunque el acceso a la mayor parte de los datos y gráficos estadísticos de Power BI está restringido al personal de la biblioteca y del Museo, nos complace compartir resúmenes de informes mensuales seleccionados que abarcan cuatro años fiscales recientes en la página Library Dashboard del sitio web del Met.

Maestros del intercambio de datos: cómo las organizaciones inteligentes utilizan los ecosistemas de datos para obtener una ventaja competitiva

Data-sharing masters: How smart organizations use data ecosystems to gain an unbeatable competitive edge. Capgemini Research Institute, 2021

Texto completo

Una nueva investigación del Instituto de Investigación de Capgemini revela que, a nivel mundial, las organizaciones que comparten, intercambian y colaboran con datos, como parte de un ecosistema de datos[1], pueden obtener beneficios financieros de hasta 940 millones de dólares (o lo que es lo mismo, el 9% de los ingresos anuales para una organización media con una facturación anual de 10 mil millones de dólares)[2]. En los próximos cinco años, estos beneficios se materializarán a través de ahorros de costes, nuevas fuentes de ingresos y mejoras en la productividad. Según el informe “Los maestros del intercambio de datos: cómo las organizaciones inteligentes utilizan los ecosistemas de datos para obtener una ventaja competitiva imbatible”, se calcula que las organizaciones que participan en ecosistemas de datos más complejos y colaborativos obtienen 10 puntos porcentuales adicionales de ventaja financiera. Sin embargo, el 61% de las organizaciones participa principalmente en ecosistemas de datos que implican un simple intercambio de datos y bajos niveles de colaboración, y sólo el 39% de las organizaciones está convirtiendo los conocimientos basados en datos en una ventaja competitiva sostenida.

Fortalecimiento de los sistemas de información sobre la gestión de la educación para aumentar la resistencia a las crisis

Strengthening education management information systems for increased resilience to crises: a synthesis of case studies. Paris: Unesco, 2021

Texto completo

La UNESCO se compromete a apoyar a los sistemas educativos para que sean más resiliencia y capacidad de respuesta ante conflictos, disturbios sociales y peligros naturales, y a garantizar que la educación se mantenga durante situaciones de emergencia, conflicto y post-conflicto. Uno de los principales retos a los que se enfrenta la educación en los países afectados por crisis es la falta de datos precisos, fiables y oportunos, necesarios para impulsar para impulsar procesos eficaces de preparación, respuesta y recuperación en situaciones de emergencia.

En 2019, la UNESCO y sus socios llevaron a cabo seis estudios de casos de países en Chad, Etiopía, Palestina, Sudán del Sur; la República Árabe Siria República Árabe Siria y Uganda para examinar los EMIS y los desafíos recurrentes relacionados con informar las estrategias de Educación en Emergencias (EiE) y los planes de educación sensibles a la crisis para mitigar la interrupción de la educación y garantizar el acceso a una educación de calidad y segura a todos los niños y jóvenes.

Esta publicación es un análisis técnico y una síntesis de las principales conclusiones y recomendaciones clave de los seis estudios para para informar sobre el camino a seguir de la iniciativa y contribuir a la creación de sistemas educativos resistentes.

La enseñanza de la ciencia de los datos

Roundtable on Data Science Postsecondary Education: A Compilation of Meeting Highlights. National Academies of Sciences, Engineering, and Medicine, 2020

Texto completo

Establecida en diciembre de 2016, la Mesa Redonda de la National Academies of Sciences, Engineering, and Medicine sobre la educación postsecundaria en ciencias de los datos se encargó de identificar los desafíos y destacar las mejores prácticas en la educación postsecundaria en ciencias de los datos. Con una periodicidad trimestral durante tres años, representantes del mundo académico, la industria y el gobierno se reunieron con otros expertos de todo el país para debatir diversos temas en el marco de esta tarea. Las reuniones se centraron en cuatro temas centrales: los fundamentos de la ciencia de los datos; la ciencia de los datos en el plan de estudios postsecundario; la ciencia de los datos en la sociedad; y la ética y la ciencia de los datos. Esta publicación destaca las presentaciones y los debates de cada reunión.

Cómo pueden las bibliotecas de investigación apoyar a su comunidad universitaria en el acceso a los datos bibliométricos

Library Impact Practice Brief: Supporting Bibliometric Data Needs at Academic Institutions. Washington, DC: Association of Research Libraries, October 28, 2020. https://doi.org/10.29242/brief.waterloo2020

Texto completo

Este resumen de prácticas presenta la investigación realizada por el personal de la Biblioteca de la Universidad de Waterloo como parte de la participación de la biblioteca en la iniciativa Research Library Impact Framework initiative de ACRL. La investigación abordó la pregunta: «¿Cómo pueden las bibliotecas de investigación apoyar a su comunidad universitaria en el acceso a los datos bibliométricos necesarios para fines institucionales?» El informe explora: los antecedentes del servicio, los socios, los proveedores de servicios y los usuarios, cómo se utilizan los datos bibliométricos, las fuentes de datos, las principales lecciones aprendidas y los recursos recomendados

Usos aceptables e inaceptables de los datos de búsqueda de las bibliotecas universitarias: una descripción interpretativa de las perspectivas de los estudiantes universitarios

Gariepy, Laura W. “Acceptable and Unacceptable Uses of Academic Library Search Data: An Interpretive Description of Undergraduate Student Perspectives” Evidence Based Library and Information Practice (EBLIP), 16(2); 2021
DOI: 10.18438/eblip29923

Objetivo – Este artículo presenta los resultados de las actitudes de los estudiantes universitarios con respecto a la privacidad de los datos de búsqueda en las bibliotecas universitarias. Aunque la literatura bibliotecaria incluye muchos artículos sobre las percepciones de los bibliotecarios en esta materia, este trabajo añade una rica evidencia cualitativa a la limitada investigación disponible sobre las preferencias de los estudiantes en cuanto a cómo las bibliotecas deben manejar la información sobre lo que buscan, toman prestado y descargan. Este trabajo abarca los usos aceptables e inaceptables de los datos de búsqueda de los estudiantes, basándose en las perspectivas de los estudiantes universitarios estadounidenses. Se trata de un área de estudio importante debido a la naturaleza cada vez más orientada a los datos de la evaluación, la responsabilidad y la mejora en la educación superior, que se basa en los datos de los estudiantes a nivel individual para el análisis del aprendizaje. Estas prácticas a veces entran en conflicto con el antiguo compromiso de las bibliotecas con la privacidad de los usuarios, que históricamente ha limitado la cantidad de datos recopilados sobre el uso de materiales por parte de los estudiantes. Sin embargo, el uso de los datos de búsqueda de los estudiantes por parte de las bibliotecas está aumentando.

Métodos – Este estudio cualitativo se abordó a través de la descripción interpretativa, un marco cualitativo riguroso para responder a preguntas prácticas de investigación en un entorno o disciplina aplicada. Se utilizó el método comparativo constante de recogida y análisis de datos para realizar entrevistas semiestructuradas a 27 estudiantes universitarios de una gran institución pública de investigación estadounidense. Las entrevistas incluían preguntas y viñetas, es decir, situaciones breves diseñadas para obtener respuestas. Mediante la codificación inductiva, se organizaron los datos en temas y subtemas interpretativos para describir las actitudes de los estudiantes.

Resultados – Los participantes consideraron que los datos de búsqueda en las bibliotecas universitarias eran menos reveladores desde el punto de vista personal que los datos de búsqueda en Internet. En consecuencia, los estudiantes se sentían generalmente cómodos con la recopilación de datos de búsqueda por parte de las bibliotecas, siempre y cuando se utilizaran en su beneficio. Se sentían cómodos con el uso de los datos para mejorar las colecciones y los servicios de la biblioteca, pero se mostraban más ambivalentes sobre el uso de los datos de búsqueda para obtener resultados de búsqueda personalizados y para la evaluación basada en el análisis del aprendizaje. Los estudiantes tenían sentimientos encontrados sobre el uso de los datos de búsqueda en investigaciones relacionadas con la actividad criminal o la seguridad nacional. La mayoría de los estudiantes expresaron su deseo de desidentificación y control de los datos por parte del usuario. Los estudiantes que no se sentían cómodos con la recopilación o el uso de sus datos de búsqueda solían mantener sus convicciones con más fuerza que los que consideraban que la práctica era aceptable, y sus preocupaciones solían estar relacionadas con el hecho de que los datos pudieran utilizarse de forma que perjudicaran a los miembros de grupos vulnerables.

Conclusión – Los resultados de este estudio sugieren que los bibliotecarios deberían seguir explorando las perspectivas de los estudiantes sobre la recopilación de datos de búsqueda en las bibliotecas universitarias para considerar cómo y si podrían ajustar sus prácticas de recopilación de datos para ser respetuosos con las preferencias de los estudiantes en cuanto a la privacidad, sin dejar de cumplir los objetivos de evaluación y mejora. Este estudio también introduce el marco cualitativo de la descripción interpretativa en la literatura bibliotecaria y de ciencias de la información, promoviendo el uso de este enfoque cualitativo aplicado, que se adapta bien a las preguntas prácticas que se plantean a menudo en los estudios de investigación bibliotecaria.