Archivo de la etiqueta: Gestión de datos de investigación

El contexto de descubrimiento de datos de investigación

Liu, Ying-Hsang, Mingfang Wu, Megan Power, y Adrian Burton. «Elicitation of Data Discovery Contexts: An Interview Study». Report. Australian Research Data Commons, 10 de octubre de 2022. Australia. https://apo.org.au/node/321054.

PDF

Este proyecto está diseñado para obtener contextos de descubrimiento de datos de investigadores en todo el sistema de investigación de Australia. Como la principal agencia de coordinación de datos de investigación de Australia, Australian Research Data Commons (ARDC) ha identificado la necesidad de una mayor comprensión de los contextos en torno a los cuales los usuarios de datos abordan su descubrimiento de datos. En concreto, el estudio ha sido diseñado para responder a las siguientes preguntas de investigación:

  • ¿Cómo abordan los investigadores el descubrimiento de datos?
  • ¿Cómo buscan los investigadores los datos?
  • ¿Qué atributos de datos son importantes para la búsqueda de datos de los investigadores?
  • ¿Qué criterios aplican los investigadores para evaluar la relevancia y la usabilidad de los conjuntos de datos?
  • ¿Cuáles son los contextos de reutilización de datos por parte de los investigadores?

Este estudio adoptó un enfoque de método mixto para responder a las preguntas de investigación propuestas mediante el uso de métodos de encuestas y entrevistas en profundidad. Se diseñó una encuesta previa a la entrevista para capturar la información de antecedentes de los participantes, que incluye; sus áreas/temas de investigación, etapa de carrera, funciones laborales y sus fuentes de datos en proyectos recientes. Los investigadores diseñaron el protocolo de entrevista a lo largo de cada paso del ciclo de vida de los datos y adoptaron un protocolo de técnica de incidente crítico (CIT) para realizar entrevistas en profundidad semiestructuradas para obtener los contextos del descubrimiento de datos.

¿Cómo y por qué los investigadores hacen referencia a los datos?

Lafia, Sara, Andrea Thomer, Elizabeth Moss, David Bleckley, y Libby Hemphill. «How and Why Do Researchers Reference Data? A Study of Rhetorical Features and Functions of Data References in Academic Articles» Data Science Journal 22, n.o 1 (28 de abril de 2023): 10. https://doi.org/10.5334/dsj-2023-010.

PDF

Aunque los datos de investigación son cada vez más importantes en los análisis científicos modernos, no se han considerado históricamente como productos de investigación primarios. La publicación, la preservación a largo plazo y la difusión de datos de investigación, junto con metadatos descriptivos, hacen posible que otros descubran, usen y citen observaciones recopiladas por otros investigadores para otros fines.

La reutilización de datos es una práctica común en las ciencias sociales. Si bien los datos publicados juegan un papel esencial en la producción de la investigación en ciencias sociales, no se citan de manera constante, lo que dificulta evaluar su impacto académico completo y dar crédito a los productores de datos originales.

Este estudio explora las características y funciones retóricas de las referencias de datos en artículos académicos, con el objetivo de comprender cómo y por qué los investigadores hacen referencia a datos en su trabajo. Los autores analizan un corpus de 108 artículos académicos en varias disciplinas, examinando los tipos de referencias de datos, el contexto en el que se utilizan y sus propósitos comunicativos.

El estudio encuentra que los investigadores usan referencias de datos de varias maneras, incluso para proporcionar evidencia, respaldar afirmaciones y situar su investigación en un contexto más amplio. Los autores también identifican diferentes tipos de referencias de datos, como fuentes de datos primarias, fuentes de datos secundarias e informes gubernamentales, cada uno con sus propias funciones retóricas.

Los autores argumentan que las referencias de datos son un aspecto importante del discurso académico, ya que sirven como un medio para establecer credibilidad, demostrar conocimiento del campo y contribuir a la conversación en curso en una disciplina determinada. Concluyen que una mejor comprensión de las funciones retóricas de las referencias de datos puede ayudar a los investigadores a hacer un uso más efectivo de los datos en sus propios escritos y también puede informar el desarrollo de políticas y prácticas de gestión de datos.

Construir culturas de datos justas en la universidad: desafíos para el profesorado

Raffaghelli, J. E. (2023). Construir culturas de datos justas en la universidad: Desafíos para el profesorado. Universitat de Barcelona. IDP/ICE & Ediciones Octaedro.

Texto completo

Los capítulos de este libro exploran perspectivas de lo que significa crear culturas de datos justas en la educación superior, destacando la gama de herramientas y estrategias que se requieren según cada perspectiva. Los capítulos abarcan las dimensiones teóricas y prácticas de este reto, así como los diferentes niveles que intervienen en la creación de la cultura, desde los recursos y las infraestructuras hasta las habilidades y conocimientos del profesorado.

Aunque se centra en un sector concreto (educación superior), también plantea la cuestión más amplia del papel del profesorado y la educación superior en la preparación de las personas para vivir en una sociedad donde la digitalización ha quedado atravesada por la datificación. La investigación crítica de los datos que se presenta en este libro va a contracorriente del pensamiento popular en el ámbito de la educación, que, en general, se ha dejado seducir por el poder de los big data (o macrodatos). En este breve prólogo desglosaré las diferentes dimensiones del desafío, considerando el contexto de la educación superior, cómo podríamos desarrollar una cultura de datos justa y los desafíos y oportunidades que surgen para los educadores en este contexto. Comenzaré por considerar los datos y la datificación como fenómenos sociotécnicos.

Un nuevo preprint explora la reutilización de datos y las citas

New preprint explores tracing data reuse and citations. (2023, abril 20). Scholarly Communications Lab | ScholCommLab. https://www.scholcommlab.ca/2023/04/20/new-preprint-explores-tracing-data-reuse-and-citations/

En nuestra era digital, no cabe duda de que los científicos comparten y reutilizan datos abiertos. Sin embargo, sigue sin estar claro hasta qué punto están extendidas las prácticas de reutilización y citación de datos en las disciplinas académicas, y por qué los científicos citan -o no- datos en sus trabajos de investigación.

Las citas de datos, o citas en listas de referencias a datos, se consideran cada vez más un medio importante para rastrear la reutilización de datos e incentivar su puesta en común. Aunque las diferencias disciplinarias en las prácticas de citación de datos han sido bien documentadas mediante enfoques cienciométricos, aún no sabemos hasta qué punto son representativas dentro de las disciplinas. Tampoco conocemos aún las motivaciones de los investigadores para citar -o no citar- datos en sus trabajos académicos. Se presentan aquí los resultados de la mayor encuesta conocida (n=2.492) para investigar explícitamente las prácticas de citación de datos, preferencias y motivaciones, utilizando una muestra representativa de autores académicos por disciplina, tal y como está representada en la Web of Science (WoS). Presentamos los resultados sobre las prácticas y motivaciones actuales de los investigadores para reutilizar y citar datos y también examinamos sus preferencias sobre cómo les gustaría que se citaran sus propios datos. Concluimos analizando los patrones disciplinarios en dos grandes grupos, centrándonos en los patrones de las ciencias sociales y las humanidades, y consideramos las implicaciones de nuestros resultados para el seguimiento y la recompensa de la puesta en común y la reutilización de datos.

¿Qué motiva a los investigadores que citan datos a hacerlo? En toda la muestra, la mayoría de las razones podrían interpretarse como motivaciones que reflejan la práctica «ideal» de la investigación (por ejemplo, mostrar una deuda intelectual), ayudar a otros a encontrar datos o apoyar la validez de las afirmaciones de su investigación. Pocos encuestados indicaron que los factores externos, es decir, que las revistas o los editores les aconsejaran hacerlo, fueran un factor motivador en su decisión de citar datos.

Sin embargo, se encuentran algunas diferencias disciplinarias significativas en esta cuestión. Por ejemplo, los investigadores de ciencias sociales y humanidades (SHH) indicaron que citaban datos para reconocer la deuda intelectual con más frecuencia de lo esperado. Una posible explicación de este hecho podría estar vinculada a los fines comunes para los que nuestros encuestados de las SSH reutilizan los datos (por ejemplo, servir de base para un nuevo estudio o integrar fuentes para construir un argumento).

Bibliotecas digitales: La era del Big Data y la ciencia de datos

Ceci, Michelangelo, Stefano Ferilli, y Antonella Poggi, eds. Digital Libraries: The Era of Big Data and Data Science 16th Italian Research Conference on Digital Libraries, IRCDL 2020. Springer Nature, 2020.

Texto completo

PDF

ePub

Este libro constituye las actas exhaustivas de la 16ª Conferencia Italiana de Investigación sobre Bibliotecas Digitales, IRCDL 2020, celebrada en Bari, Italia, en enero de 2020. Las 12 ponencias completas y 6 breves presentadas fueron cuidadosamente seleccionadas entre 26 propuestas. Los artículos están organizados en secciones temáticas sobre recuperación de información, datos de licitación y ciencia de datos en DL; patrimonio cultural; ciencia abierta.

Cómo aprovechar al máximo la información de la UE: información y datos de la UE: servicios para bibliotecarios y proveedores de información

Publications Office of the European Union, How to get the most out of EU information : EU information and data in all official EU languages, Publications Office of the European Union, 2022

Texto completo

Publications Office of the European Union, How to get the most out of EU information : services for librarians and information providers, Publications Office, 2019

Texto completo

La Oficina de Publicaciones de la Unión Europea presta a las instituciones de la UE servicios de publicación y gestión de datos abiertos. La Oficina de Publicaciones es su punto de acceso central a la legislación y la jurisprudencia de la UE, los anuncios de licitación, las publicaciones, las aplicaciones, los datos abiertos, los resultados de la investigación, la información de contacto oficial y mucho más. La misión es apoyar la elaboración de políticas de la UE y garantizar que la información y los datos de la UE estén disponibles y sean accesibles y reutilizables para los ciudadanos, las empresas y las administraciones públicas de toda la UE y fuera de ella. Como centro de excelencia para la gestión de datos, información y conocimiento, dando a conocer al público lo que hace la UE y proporcionándole los medios para liberar el poder de los datos, pretendemos contribuir a la transparencia y la democracia, a nuestras economías y sociedades y a la difusión del conocimiento y la transformación digital de Europa.

Además, ha desarrollado una serie de servicios de apoyo dirigidos específicamente a los especialistas en información. Entre ellos figuran servicios para compartir metadatos, vocabularios controlados reutilizables y mucho más.

Con este folleto se pretende ayudar a aprovechar al máximo la riqueza de publicaciones, datos e información que ofrece la Oficina de Publicaciones, en relación con la legislación de la UE, las oportunidades de negocio, las políticas de la UE, los resultados de la investigación y mucho más. Siga leyendo y descubra lo que le ofrecemos.

Hacia una infraestructura nacional de datos del siglo XXI

Toward a 21st Century National Data Infrastructure: Enhancing Survey Programs by Using Multiple Data Sources. National Academies of Sciences, Engineering, and Medicine, 2023

Texto completo

Gran parte de la información estadística que producen actualmente los organismos federales de estadística -información sobre el bienestar económico, social y físico esencial para el funcionamiento de la sociedad moderna- procede de encuestas por muestreo. En los últimos años han proliferado los datos procedentes de otras fuentes, como los recogidos por los organismos públicos durante la administración de programas, los datos de satélites y sensores, los datos del sector privado, como los registros sanitarios electrónicos y los datos de transacciones con tarjetas de crédito, y las ingentes cantidades de datos disponibles en Internet. ¿Cómo pueden utilizarse estas fuentes de datos para mejorar la información recogida actualmente en las encuestas y ofrecer nuevas fronteras para la producción de información y estadísticas en beneficio de la sociedad estadounidense?

Visualización de Datos y Medios de Comunicación: Scoping Review

Lopezosa, Carlos, Mario Pérez-Montoro, y Javier Guallar. «Visualización de Datos y Medios de Comunicación: Scoping Review». Report, 20 de enero de 2023.

Texto completo

La visualización de datos en periodismo tiene una aplicación intensiva como herramienta para narrar historias, sin embargo, las investigaciones y aportaciones teóricas sobre este campo no acompañan ni en volumen ni en importancia. Ante estas circunstancias nace este informe, que analiza la producción científica sobre medios de comunicación, visualización de datos y, más concretamente sobre la visualización de la información, infografías, narrativas visuales y visual Storytelling. Con ello, se pretende en primer lugar, conocer el estado del arte sobre esta disciplina, en segundo lugar, identificar nuevas tendencias, desafíos, tecnologías y protocolos y, en tercer lugar, determinar sus posibilidades y limitaciones en el campo de la comunicación y el periodismo. Los resultados señalan que los principales estudios desarrollados en los últimos años sobre esta disciplina se han centrado principalmente en la infografía, el periodismo de datos, el periodismo estructurado, la alfabetización mediática sobre la interpretación del lector sobre los datos visuales, las propuestas de visualización en cibermedios y la analítica visual. Respecto a las tecnologías y herramientas de visualización de datos se han realizado estudios muy interesantes sobre Big data y medios de comunicación, y más específicamente sobre software y sobre creación de herramientas de análisis visual. Adicionalmente, se han estudiado las prácticas de visualización de datos en las redacciones periodísticas, en este sentido, destacan los estudios sobre rutinas productivas, propuestas de visualización de datos en cibermedios, diseño de visualizaciones y sobre técnicas de interacción.

Documento de opinión sobre la alfabetización en datos EOSC FAIR / Recomendaciones para una EOSC FAIR – Libro Blanco

Recommendations for a FAIR EOSC – White Paper FAIRsFAIR Synchronisation Force 2021

https://zenodo.org/record/5793105#.ZArb9XbMKUk

European Commission, Directorate-General for Research and Innovation, Opinion paper on EOSC FAIR data literacy, Publications Office of the European Union, 2022, https://data.europa.eu/doi/10.2777/716842

La alfabetización en materia de datos, basada en un conjunto de aptitudes y competencias específicas, es un factor clave para hacer realidad el cambio cultural necesario para la implantación de la ciencia abierta y la EOSC. Para garantizar que se salvaguardan los principios de la investigación -máxima calidad, integridad, transparencia, verificabilidad y confianza- y que los objetos de investigación se comparten respetando las normas legales y éticas más estrictas, es necesario alinear y coordinar adecuadamente las políticas y prácticas en el ámbito del desarrollo de la alfabetización de datos. Crear un volumen crítico de datos y servicios de datos FAIR, compartirlos y garantizar un (re)uso competente de los datos requiere una serie de conocimientos, habilidades y competencias específicos. Éstas pueden enseñarse en contextos formales, informales y no formales, y fomentarse mediante incentivos adecuados. Las prácticas de ciencia abierta requieren formación y desarrollo continuo a nivel del investigador y de la organización, y deben ser debidamente reconocidas en los procesos de evaluación. Para lograr avances, es esencial desarrollar un paradigma de educación y formación holístico, coherente y visible, que se base en los principios de subsidiariedad y complementariedad de los tres niveles (europeo, nacional e institucional).

Repensar el impacto de los datos abiertos: un primer paso hacia una evaluación europea del impacto de los datos abiertos

                                             

Publications Office of the European Union, Ooijen, C., Osimo, D., Regeczi, D., et al., Rethinking the impact of open data : a first step towards a European impact assessment for open data, Publications Office of the European Union, 2023, https://data.europa.eu/doi/10.2830/911822

Este informe es el primero de una serie de cuatro cuyo objetivo es establecer una metodología estándar para la evaluación del impacto de los datos abiertos que pueda utilizarse en toda Europa. Este ejercicio es clave porque no existe una definición coherente del impacto de los datos abiertos.

La falta de una base conceptual sólida ha hecho más difícil para los portales de datos demostrar su valor a través de pruebas empíricas. También pone en entredicho la capacidad de la UE para comprender y comparar los resultados de los distintos Estados miembros. La mayoría de los artículos académicos que buscan explorar el impacto de los datos hacen referencia a los marcos de datos abiertos existentes, siendo los de madurez de datos abiertos (ODM) y barómetro de datos abiertos (ODB) los más frecuentemente representados.

Estos dos marcos distinguen entre distintos tipos de impacto, y ambos mencionan en particular el impacto social, político y económico. El ODM también incluye en su marco el impacto medioambiental. A veces, estos marcos divergen de las propias recomendaciones de la Comisión Europea sobre la mejor manera de medir el impacto, como se explica en secciones específicas de las directrices para legislar mejor y la caja de herramientas para legislar mejor. Ayudan a responder a una pregunta fundamental para los responsables políticos: ¿son mayores los beneficios que se obtienen que los costes de recopilar y distribuir datos (abiertos)? En futuros informes de esta serie se estudiará cómo adaptar mejor los marcos existentes, como el MDD, a estas directrices de importancia crítica.

Del Estudio Economic Impact of Open Data: Opportunities for value creation in Europe (2020)

Por último, el informe también examina ejemplos y reflexiones sobre la reutilización de datos abiertos en las organizaciones. A continuación se resumen las principales conclusiones

  • La especificación e implementación de conjuntos de datos de alto valor como parte de la nueva Directiva de Datos Abiertos es una oportunidad prometedora para abordar las demandas de calidad y cantidad de los datos abiertos.
  • Abordar las demandas de calidad y cantidad es importante, pero no suficiente para alcanzar todo el potencial de los datos abiertos.
  • Los reutilizadores de datos abiertos tienen que ser conscientes y capaces de comprender y aprovechar su potencial.
  • La creación de valor de los datos abiertos forma parte del reto más amplio de la transformación de competencias y procesos: un proceso largo cuyo cambio e impacto no siempre son fáciles de observar y medir.
  • Las iniciativas sectoriales y la colaboración entre los sectores público y privado fomentan la creación de valor.
  • La combinación de datos abiertos con datos personales, compartidos o procedentes de crowdsourcing es vital para hacer realidad un mayor crecimiento del mercado de datos abiertos.
  • Para los distintos retos, debemos explorar y mejorar múltiples enfoques de reutilización de datos que sean éticos, sostenibles y adecuados a su finalidad.