Archivo de la etiqueta: Datos abiertos

Cuando los datos de investigación se comparten libremente

Pileberg, Silje, y University of Oslo. «When Research Data Is Shared Freely». Accedido 24 de enero de 2023. https://phys.org/news/2022-12-freely.html.

En los últimos años, los investigadores han publicado cada vez más sus investigaciones en revistas de acceso abierto. Algunos van un paso más allá y comparten sus datos.

Cuando los investigadores del TIK Lars Wenaas y Magnus Gulbrandsen planeaban publicar un nuevo estudio en otoño de 2022, tenían claro que debía publicarse en una revista de acceso abierto. Sin embargo, ambos fueron más allá. Habían analizado unos 180 documentos. De ellos habían recuperado una gran serie de resúmenes e información que proporcionaban el material en el que basaron su investigación. Decidieron publicarlo al mismo tiempo que el estudio.

El Consejo de Investigación ha seguido la tendencia mundial del acceso abierto y ha dado un pequeño impulso a los investigadores noruegos: publicar en abierto, de una forma u otra, es un requisito previo para la financiación de proyectos, a menos que los investigadores tengan buenas razones para no hacerlo.

En 2017, el Consejo de Investigación también decidió que los investigadores que recibieran su apoyo debían considerar la posibilidad de elaborar un plan de gestión de datos. Este debe, entre otras cosas, mostrar si los datos se compartirán y, en caso afirmativo, cómo.

Permite la verificabilidad

En Noruega, la proporción de investigaciones que se publican en abierto ha aumentado considerablemente en los últimos diez años. Mientras que en 2013 menos del 40% de los artículos de investigación noruegos se publicaban en abierto, en 2021 esa proporción había aumentado hasta cerca del 75%, según el barómetro de OA del proveedor de servicios Sikt.

Compartir datos no es tan habitual.

«Para nosotros, se trata de buenas prácticas científicas. De transparencia. Cuando compartimos los datos abiertamente, los lectores del artículo pueden comprobar si los datos respaldan lo que escribimos. Verificar los resultados de la investigación puede ser muy difícil sin acceso al conjunto de datos», dice Wenaas.

Muchos estudios han señalado las dificultades de verificar las conclusiones de los estudios, lo que se ha dado en llamar la crisis de la replicación.

Los dos investigadores señalan experimentos como el Experimento Marshmallow, en el que un grupo de investigación estadounidense estudió el autocontrol de los niños. Muy pocos niños consiguieron esperar quince minutos por un malvavisco, a pesar de que obtendrían el doble si pudieran. Según el estudio, la capacidad de autocontrol de los niños se mantuvo bastante estable hasta la adolescencia.

Desde entonces, nuevos estudios han cuestionado las conclusiones del Experimento del Malvavisco.

«Las conclusiones son sencillas e intuitivas, aunque no han sido fáciles de replicar, en parte porque el conjunto de datos no ha estado disponible. Esto ocurre con muchas investigaciones», afirma Gulbrandsen.

No todos los datos deben compartirse

Otra ventaja de la transparencia en relación con el material de datos es que éstos pueden, en principio, utilizarse en otros contextos, señala Wenaas.

«No todo es susceptible de reutilización, pero la opción existe», afirma.

Sin embargo, ambos subrayan que hay circunstancias en las que publicar un conjunto de datos no es tan fácil, como los datos de entrevistas que has prometido anonimizar.

«¿Y si primero quieres hacer más uso tú mismo de los datos antes de compartirlos?».

«No es infrecuente querer hacer un uso completo de los conjuntos de datos antes de publicarlos. Sin embargo, puedes optar por compartir partes de los datos, las partes que apoyan lo que estás publicando en primer lugar. Esa es la opción mínima», dice Wenaas.

Cuestión de cultura

Wenaas y Gulbrandsen también creen que compartir datos es una cuestión de cultura. Para muchos es nuevo, para otros puede ser una práctica habitual desde hace mucho tiempo.

Según el servicio de puesta en común de datos de la UiT, la Universidad Ártica de Noruega, que han utilizado personalmente, se han compartido muchos más conjuntos de datos en las ciencias naturales y la salud que en las ciencias sociales. En la medida en que el servicio es representativo, es menos habitual compartir datos dentro de las ciencias sociales y las humanidades.

Asimismo, señalan que compartir datos también requiere tiempo y esfuerzo.

«Es un tipo de trabajo adicional por el que no se obtienen méritos. Para nosotros ha sido un trabajo manejable porque el conjunto de datos es pequeño. Si tienes un conjunto de datos más grande, se convierte en un reto real y costoso», dice Wenaas.

¿Un futuro abierto?

Los dos están convencidos de que las directrices del Consejo de Investigación han sido un factor decisivo en la tendencia de los últimos años a publicar cada vez más en revistas de acceso abierto.

Wenaas y Gulbrandsen creen que el intercambio de datos continuará.

«Creo que compartir datos acabará convirtiéndose en la norma. Forma parte del concepto más amplio de ciencia abierta. Quienes financian la investigación lo exigen cada vez más, al igual que las partes interesadas del sector público. La UE se está centrando mucho en ello. Las revistas también han empezado a exigirlo, así que ahora se nos anima desde varios frentes», afirma Wenaas.

El Consejo de Investigación basa sus directrices en los principios internacionales FAIR, según los cuales los datos deben ser Localizables, Accesibles, Interoperables y Reutilizables.

La gestión de datos de investigación en el horizonte de las bibliotecas universitarias y de investigación.

Ver PDF

Ver Video

La sociedad TIC necesita, hace uso y proporciona de una enorme cantidad de datos; procesarlos, entenderlos y transformarlos en decisiones de valor es el reto del análisis de los llamados «big data», un término utilizado para referirse a la explosión de una ingente cantidad y diversidad de datos digitales de alta frecuencia, que se están convirtiendo en un elemento esencial para la competencia, y que según la mayoría de los expertos en el tema serán clave para el crecimiento de la productividad, la innovación y la posibilidad de generar el suficiente excedente para la sostenibilidad de la sociedad. La gestión de los datos de investigación se plantea como uno de los grandes retos que han de asumir durante los próximos años las bibliotecas científicas y de investigación. Ya la mitad de las universidades estadounidenses tienen un plan de trabajo sobre esta cuestión, todos los informes de tendencias están de acuerdo en que la Gestión de Datos de Investigación (RDM) será una de las cuestiones prioritarias y de futuro que deberán asumir las bibliotecas de investigación. En este artículo se hace un análisis del estado de la cuestión sobre la gestión de datos de investigación, normativa, repositorios de datos, prácticas y políticas que están desarrollando las bibliotecas en torno al tema

Informe sobre el estado de los datos abiertos 2022: los investigadores necesitan más apoyo para cumplir con los mandatos de datos abiertos

The State of Open Data Report 2022: Researchers Need More Support to Assist With Open Data Mandates” Digital Science, Figshare and Springer Nature, 2022

Texto completo

Basado en una encuesta mundial, el informe llega a su séptimo año y proporciona información sobre las actitudes y experiencias de los investigadores con respecto a los datos abiertos. Con más de 5.400 encuestados, la encuesta de 2022 es la más grande desde que comenzó la pandemia de COVID-19.

Según los autores de un nuevo informe, los investigadores de todo el mundo necesitarán más ayuda para cumplir con un número cada vez mayor de mandatos de datos abiertos.

El informe de este año también incluye artículos invitados de expertos en datos abiertos de los Institutos Nacionales de Salud (NIH), la Oficina de Política Científica y Tecnológica de la Casa Blanca (OSTP), la Academia China de Ciencias (CAS), editoriales y universidades.

Las principales conclusiones del informe de este año indican que:

  • Existe una tendencia creciente de los investigadores a estar a favor de que los datos se pongan a disposición del público como práctica común (4 de cada 5 investigadores estaban de acuerdo con esto), apoyada en cierto modo por el hecho de que ahora más del 70% de los encuestados están obligados a seguir una política de intercambio de datos.
  • Sin embargo, los investigadores siguen pidiendo como necesidad clave para ayudarles a compartir sus datos una mayor formación o información sobre las políticas de acceso, intercambio y reutilización (55%), así como estrategias de almacenamiento y gestión de datos a largo plazo (52%).
  • El crédito y el reconocimiento fueron una vez más un tema clave para los investigadores a la hora de compartir sus datos. El 66% de los que habían compartido datos con anterioridad habían recibido algún tipo de reconocimiento por sus esfuerzos, sobre todo a través de una cita completa en otro artículo (41%), seguida de la coautoría en un artículo que había utilizado los datos.
  • Los investigadores son más proclives a compartir los datos de sus investigaciones cuando pueden tener un impacto en las citas (67%) y en la visibilidad de su investigación (61%), en lugar de estar motivados por el beneficio público o el mandato de la revista o el editor (ambos 56%).

Conclusiones por tema:

Apoyo a los datos abiertos

  • Cuatro de cada cinco encuestados están a favor de que los datos de investigación estén disponibles en abierto como práctica habitual.
  • El 74% de los encuestados afirma compartir sus datos durante la publicación.
    Aproximadamente una quinta parte de los encuestados informó de que no tenía ninguna preocupación por compartir los datos en abierto – esta proporción ha crecido constantemente desde 2018.
  • El 88% de los investigadores encuestados apoyan que los artículos de investigación sean de acceso abierto (OA) como una práctica académica común.

Motivaciones y beneficios

  • Cuando se trata de que los investigadores compartan sus datos, las citas de los artículos de investigación (67%) y el aumento del impacto y la visibilidad de los artículos (61%) superan el beneficio público o el mandato de la revista/editorial (ambos 56%) como motivación.
  • El 66% de los encuestados que habían compartido datos con anterioridad habían recibido algún tipo de reconocimiento por sus esfuerzos, sobre todo a través de una cita completa en otro artículo (41%), seguida de la coautoría de un artículo que había utilizado los datos.
  • Un tercio de los encuestados indicó que había participado en una colaboración de investigación como resultado de los datos que habían compartido anteriormente.

Mandatos de datos abiertos

  • El 70% de los encuestados se vio obligado a seguir una política de intercambio de datos en su investigación más reciente.
  • Más de dos tercios de los encuestados apoyan «en cierta medida» un mandato nacional para poner los datos de investigación a disposición del público. Esta cifra ha disminuido desde 2019.
  • Un poco más de la mitad (52%) de los encuestados en la encuesta de 2022 consideró que compartir los datos debería ser un requisito para la concesión de subvenciones de investigación. De nuevo, este número ha ido disminuyendo desde 2019.

Inconvenientes

  • Solo el 19% de los encuestados cree que los investigadores reciben suficiente crédito por compartir sus datos, mientras que el 75% dice que reciben muy poco crédito.
  • Poco menos de una cuarta parte de los encuestados indicó que había recibido previamente apoyo con la planificación, la gestión o el intercambio de sus datos de investigación
  • La mayor preocupación entre los encuestados es el mal uso de sus datos (35%).
  • Las principales necesidades de los investigadores que, en su opinión, mejorarían con más formación o información son una mejor comprensión y definición de las políticas de acceso, intercambio y reutilización (55%), así como estrategias de almacenamiento y gestión de datos a largo plazo (52%), aspectos que afectan a ambos extremos del ciclo de investigación.

Datos demográficos clave de los encuestados

  • Los investigadores de China representan ahora el 11% de todos los encuestados, igual que los de Estados Unidos. China y Estados Unidos son los dos países con mayor número de respuestas a la encuesta, seguidos de India, Japón, Alemania, Italia, Reino Unido, Canadá, Brasil, Francia y España.
  • El 31% de los encuestados eran investigadores noveles (ECR), mientras que otro 31% se clasificó como investigador senior.
  • La mayoría de los encuestados (42%) procedían de la medicina y las ciencias de la vida, el 38% de las matemáticas, la física y las ciencias aplicadas y el 17% de las humanidades y las ciencias sociales (un aumento del 3%).
  • Los encuestados se clasificaron en términos generales como: Defensores de la ciencia abierta (32%), Defensores de la publicación abierta (26%), Cautelosamente pro ciencia abierta (25%), Agnósticos de la ciencia abierta (11%) y No creyentes de la ciencia abierta (6%).

Nuevas perspectivas en los estudios críticos de datos: Las ambivalencias del poder de los datos

New Perspectives in Critical Data Studies: The Ambivalences of Data Power, editado por Andreas Hepp, Juliane Jarke, y Leif Kramp, Palgrave, 2022.

Texto completo

PDF

ePuB

El poder de los datos es un fenómeno altamente ambivalente y son precisamente estas ambivalencias las que abren importantes perspectivas para el floreciente campo de los estudios críticos de datos:

En primer lugar, las ambivalencias entre las infraestructuras globales y las invisibilidades locales. Estas desafían la gran narrativa de la naturaleza efímera de una infraestructura global de datos y, en cambio, hacen visibles las condiciones locales de trabajo y de vida, y los recursos y arreglos necesarios para operar y dirigirlas.

En segundo lugar, las ambivalencias entre el Estado y la justicia de datos. Se considera la justicia de los datos en relación con la vigilancia estatal y el capitalismo de los datos y se reflejan las ambivalencias entre un «estado empresarial» y un «estado de bienestar».

En tercer lugar, las ambivalencias de las prácticas cotidianas y la acción colectiva, en las que los grupos de la sociedad civil, las comunidades y los movimientos intentan posicionar los intereses de las personas frente a los «grandes actores» de la industria tecnológica.

Con esta introducción, queremos argumentar que ver el poder de los datos y sus irreductibles ambivalencias de manera puntual proporcionará una orientación a los capítulos de este libro. Para ello, en primer lugar, ofrecemos un breve esbozo del desarrollo de los estudios críticos de datos. En parte, también queremos situar las conferencias sobre el poder de los datos, la más reciente de las cuales es la base de este volumen.

¿Cómo citar datos de investigación? recomendaciones y buenas prácticas sobre cómo citar los datos

PJessop, P., Data citation : a guide to best practice, Publications Office of the European Union, 2022, 

Texto completo

Cada día, millones de personas utilizan los datos. Buscan, publican, reutilizan y analizan. Pero muy a menudo, una de las principales dificultades para los usuarios es encontrar los datos adecuados. ¿Y cómo ayudarles? Es sencillo: Citar los datos. La publicación «Data citation : a guide to best practice» es una guía práctica que incluye recomendaciones y buenas prácticas sobre cómo citar los datos. Está dividida en 3 partes: parte 1 – cuestiones de citación de datos, recomendaciones generales; parte 2 – recomendaciones sobre formatos específicos y otros elementos para la citación de datos y parte 3 – otra información (por ejemplo, diferencias específicas entre las recomendaciones). Al final, el lector encontrará anexos con listas de comprobación, diagramas y ejemplos.

Barómetro Global de Datos (2022)

Barómetro Global de Datos (2022). Primera Edición Informe – Barómetro Global de
Datos. ILDA. DOI: https://doi.org/10.5281/zenodo.6488349

Español

Inglés

Los datos son una fuente de poder. Una fuente que se puede explotar para obtener beneficios individuales y limitar la libertad, o bien puede ser utilizada por el bien público como un recurso para afrontar los desafíos sociales, facilitar la colaboración, impulsar la innovación y mejorar la rendición de cuentas

A lo largo de la última década, los datos han llegado a la cima de las agendas políticas nacionales y globales. Esto sucede en la medida que los países buscan desarrollar sus economías, utilizar los datos para abordar los desafíos sociales y responder a las preocupaciones de los ciudadanos sobre los usos y abusos de los datos. Sin embargo, el progreso hacia una gobernanza eficaz de los datos y hacia la realización del valor público de los mismos sigue siendo muy desigual entre países, regiones y sectores. Por ejemplo, si bien las leyes de protección de datos están hora extendidas por todo el mundo, muchas carecen de mecanismos de rectificación que permitan a las personas y comunidades ejercer eficazmente sus derechos sobre sus datos. Asimismo, pocas abordan de forma exhaustiva los problemas emergentes en torno a los datos de ubicación o la toma de decisiones algorítmica. En áreas críticas como la acción climática, las brechas significativas de datos pueden frustrar la acción local para proteger los ecosistemas y responder a la vulnerabilidad climática. Y cuando miramos más allá de la simple disponibilidad de los conjuntos de datos para examinar si satisfacen las necesidades del usuario, se han encontrado casos de datos recopilados y compartidos pero que carecen de ciertas características o garantías de calidad que permitan potenciar adecuadamente la acción cívica, mejorar los servicios públicos y el desarrollo económico.

El Barómetro Global de Datos presenta unos resultados clave para los cuatro pilares evaluados:

  1. 10,63 % de los conjuntos de datos evaluados cumplen con los criterios de datos abiertos, es decir, gratuitos, en formatos legibles por máquina y con licencia abierta.
  2. Los proyectos periodísticos están usando datos abiertos para identificar redes de propietarios
  3. Existe una capacidad reducida en la gestión de los datos ante la falta de alfabetización de datos, particularmente en el ámbito subnacional. En efecto, 23 de los 109 países demuestran formación planificada en datos a servidores públicos y 22% del total cuentan con institucionalización de la administración en datos en gobiernos locales.
  4. 98 de los países tienen leyes de protección de datos personales, pero sin fuerza de ley en 13 de ellos, mientras que en 12 aplican a sectores en específico. 30 países tienen políticas vinculantes de datos abiertos con mención en la publicación y disponibilidad, pero su implementación varía dependiendo del sector.

OpenCitations, una infraestructura electrónica abierta para fomentar la máxima reutilización de los datos de las citas

Di Giambattista, Chiara, et al. OpenCitations, an open e-infrastructure to foster maximum reuse of citation data. arXiv, 15 de junio de 2022. arXiv.org, https://doi.org/10.48550/arXiv.2206.07476.

OpenCitations es una organización independiente sin ánimo de lucro dedicada a la publicación de datos bibliográficos y de citación abiertos mediante el uso de tecnologías de la web semántica (Linked Data). OpenCitations colabora con proyectos que forman parte del ecosistema de la Ciencia Abierta y cumple con los principios fundacionales de la UNESCO para la Ciencia Abierta, las recomendaciones de I4OC y los principios de datos FAIR, según los cuales los datos deben ser Encontrables, Accesibles, Interoperables y Reutilizables. Dado que sus datos satisfacen todas las directrices de reutilización proporcionadas por FAIR en términos de riqueza, procedencia, licencias de uso y estándares comunitarios relevantes para el dominio, OpenCitations proporciona un ejemplo de una exitosa e-infraestructura abierta en la que la reutilización de datos es parte integral de su misión.

Tipos de errores que se encuentran en los datos de Google Scholar

Sauvayre, Romy. «Types of Errors Hiding in Google Scholar Data». Journal of Medical Internet Research, vol. 24, n.o 5, mayo de 2022, p. e28354. http://www.jmir.org, https://doi.org/10.2196/28354.

Google Scholar (GS) es una herramienta gratuita que puede ser utilizada por los investigadores para analizar las citas; encontrar la bibliografía adecuada; o evaluar la calidad de un autor o de un aspirante a la titularidad, la promoción, un puesto en la facultad, la financiación o las becas de investigación. GS se ha convertido en una importante base de datos bibliográfica y de citas. Para evaluar la literatura, se pueden utilizar bases de datos como PubMed, PsycINFO, Scopus y Web of Science en lugar de GS porque son más fiables. El objetivo de este estudio era examinar la exactitud de los datos de citación recogidos a partir de GS y proporcionar una descripción exhaustiva de los errores y los recuentos erróneos identificados. Para ello, se recuperaron 281 documentos que citaban 2 trabajos específicos mediante el software Publish or Perish (PoP) y se examinaron.

Este trabajo estudió el problema de los falsos positivos inherente al análisis de datos de neuroimagen. Los resultados revelaron una tasa de error sin precedentes, ya que 279 de 281 (99,3%) referencias examinadas contenían al menos un error. Los documentos no académicos tendían a contener más errores que las publicaciones académicas (U=5117,0; P<.001).

Este artículo de opinión, basado en un estudio de caso que examina la exactitud de los datos de GS, muestra que los datos de GS no sólo no son exactos, sino que además exponen potencialmente a los investigadores, que utilizarían estos datos sin verificarlos, a sesgos sustanciales en sus análisis y resultados. Hay que seguir trabajando para evaluar las consecuencias del uso de los datos de GS extraídos por PoP.

Cuidado con los datos: proteger la privacidad y la seguridad de los alumnos

Minding the data: protecting learners’ privacy and security. Unesco, 2022

Texto completo

La pandemia de COVID-19 aceleró enormemente el uso de las tecnologías digitales en la educación. Pero más allá de la respuesta de emergencia, existe una tendencia internacional a explorar cómo la inteligencia artificial y la analítica basada en datos pueden apoyar el aprendizaje, las evaluaciones del aprendizaje y los procesos de planificación de políticas basados en pruebas.

El uso de datos en la educación es un arma de doble filo. Por un lado, ofrecen un enorme potencial para crear valor mejorando las políticas y los programas, impulsando una gobernanza transparente y una mejor gestión de los sistemas educativos, la capacitación de los profesores, las experiencias de aprendizaje personalizadas, la evaluación y la certificación. Por otro lado, la acumulación de datos puede conducir a una concentración de poder económico y político, lo que aumenta la posibilidad de que los datos se utilicen de forma indebida en detrimento de los alumnos.

Esta publicación sostiene que es necesario encontrar un equilibrio entre el uso de la tecnología para avanzar en la transformación educativa y la salvaguarda de la privacidad y los derechos individuales. Se necesitan normas y protocolos adecuados para proteger a los estudiantes y a los profesores, no sólo en las políticas nacionales, sino también a nivel internacional, donde también se requiere la cooperación y los esfuerzos de colaboración para apoyar el aprendizaje de políticas, el intercambio de conocimientos y el entendimiento mutuo.

La UNESCO lanza a través de esta publicación un llamamiento a la comunidad educativa no sólo para que preste cuidadosa atención a la privacidad de los datos en la educación, sino para que tome la iniciativa en estos desarrollos.

Buenas prácticas en la enseñanza de la competencia FAIR en la gestión de datos de investigación

Good Practices in FAIR Competence Education. European Commission, 2021

Texto completo


Este informe presenta una colección de siete estudios de caso que describen cómo se están abordando las competencias FAIR a través de programas de educación y formación. Las buenas prácticas ofrecen ejemplos de integración exitosa de la  Gestión de datos de investigación (RDM) y de las competencias relacionadas con los datos FAIR en los planes de estudio y la formación de las universidades para proporcionar una perspectiva actualizada sobre cómo estas competencias están siendo implementadas por las instituciones de educación superior.

El objetivo del informe es proporcionar a las universidades puntos de inspiración y ejemplos prácticos de cómo otras instituciones y organizaciones del sector de la educación superior han abordado la necesidad de enseñar más habilidades relacionadas con RDM y los datos FAIR en los niveles de grado, máster y doctorado. Para ello, se analizan los impulsores externos e internos, los pasos para la implementación, la capacidad invertida y el impacto alcanzado por las buenas prácticas.

El informe se ha elaborado en el marco del proyecto Fostering FAIR Data Practices in Europe (FAIRsFAIR), cuyo objetivo es desarrollar y suministrar soluciones prácticas para apoyar la aplicación y el uso de los principios de datos FAIR a lo largo del ciclo de vida de los datos de investigación. En particular, contribuye a los esfuerzos del paquete de trabajo 7 (WP7) del proyecto, dirigido por la EUA y centrado en «FAIR Data Science Curricula and Professionalisation».