Archivo de la etiqueta: Gestión de datos de investigación

¿Utilizan los investigadores datos de investigación abiertos?

Quarati, A. , Raffaghelli, J. E. “Do Researchers Use Open Research Data? Exploring the Relationships Between Usage Trends and Metadata Quality Across Scientific Disciplines From the Figshare Case“. Journal of Information Science
Article First Published Online October 4, 2020

Texto completo

Los datos de investigación abiertos (ORD) se han considerado un motor de transparencia científica. Sin embargo, también se ha señalado la fricción de datos, como fenómeno de subutilización de datos por varias causas. Un factor que a menudo se cuestiona por el bajo uso de ORD es la calidad de la ORD y los metadatos asociados. 

Este trabajo tiene como objetivo ilustrar el uso de ORD, publicado por el repositorio científico de Figshare, en relación con su disciplina científica, su tipo y en comparación con la calidad de sus metadatos. Considerando todos los recursos de Figshare y realizando una evaluación de la calidad programática de sus metadatos, nuestro análisis destacó dos aspectos. 

En primer lugar, independientemente del dominio científico considerado, la mayoría de las ORD están infrautilizadas, pero con casos excepcionales que concentran la atención de la mayoría de los investigadores. Segundo, No hubo evidencia de que el uso de ORD esté asociado con buenas prácticas de publicación de metadatos. Estos dos hallazgos abrieron una reflexión sobre las posibles causas de tal fricción de datos.

Implementación de prácticas de datos efectivas: recomendaciones de las partes interesadas para el apoyo a la investigación colaborativa

Implementing Effective Data Practices: Stakeholder Recommendations For Collaborative Research Support.Association of Research Libraries (ARL), 2020

Texto completo

En este informe, los expertos de las comunidades bibliotecaria, científica y de investigación brindan recomendaciones clave para prácticas de datos efectivas para respaldar un ecosistema de investigación más abierto. Las recomendaciones se basan en la información y los conocimientos compartidos durante una conferencia por invitación en diciembre de 2019 convocada por la Association of Research Libraries (ARL), California Digital Library (CDL), Association of American Universities (AAU), y la Association of Public and Land-grant Universities (APLU). La conferencia fue patrocinada por la US National Science Foundation (NSF). El informe se centra en recomendaciones para instituciones de investigación y también proporciona orientación para editores, fabricantes de herramientas y asociaciones profesionales.

Libro Blanco Data. Actualización 2020

Libro Blanco Data. Actualización 2020. Madrid: IAB Spain, 2020

Texto completo

IAB Spain, la asociación de la publicidad, el marketing y la comunicación digital en España, ha lanzado la actualización del Libro Blanco de Data.

La comunicación, marketing y publicidad digital se ha ido apoyando cada vez más en la última década en los datos para poder llegar así de una forma más precisa y eficiente a las audiencias deseadas y conseguir los objetivos de las campañas, y esto ha ocurrido tanto en el ámbito de captación de nuevos clientes con estrategias de prospecting, como en la gestión de los ya clientes con estrategias de fidelización, haciendo que las barreras entre ambas estrategias se difuminen para así complementarse y se ponga foco en la gestión de la comunicación de la persona independientemente del momento de la relación con la marca.

Modelos para involucrar a los bibliotecarios de enlace en los servicios de datos de investigación

Sapp Nelson, M. and Goben, A., 2020. Models for Engaging Liaisons in Research Data Services . Journal of Librarianship and Scholarly Communication, 8(1), p.None. DOI: http://doi.org/10.7710/2162-3309.2382

Los servicios de datos de investigación en bibliotecas universitarias a menudo se perciben como competencia de los bibliotecarios de enlace. Ha surgido una variedad de modelos mediante los cuales estos servicios pueden desarrollarse o implementarse. Estos incluyen modelos jerárquicos y aquellos basados ​​más en el interés individual. Sin embargo, con cualquier modelo es de vital importancia la identificación de apoyo y oportunidades para la participación de la administración y gestión de la biblioteca con el fin de crecer y evaluar la implementación de servicios de datos de investigación.

Medición del valor económico de los datos y de los flujos de datos

Measuring the economic value of data and cross-border data flows. A business perspective. Paris: OCDE, 2020

Texto completo

Más sobre Gestión de datos de investigación

La cantidad y variedad de datos que las empresas reúnen, agregan y analizan ha aumentado drásticamente en los últimos años. En este documento se investiga cómo se puede conceptualizar y medir el valor económico de los datos desde una perspectiva empresarial. El informe examina la monetización de los datos como una estrategia para desarrollar nuevos modelos empresariales o mejorar los tradicionales, y propone una nueva taxonomía para los datos que se centra en la medición de su valor empresarial. En el documento también se examina la forma en que las diferentes características y tipos de datos afectan al valor económico, antes de examinar el papel de los flujos de datos transfronterizos como factor clave de nuestra economía mundial. Como parte de este debate, se presenta el concepto de “cadena de valor de los datos mundiales”, basado en la idea de que la digitalización permite el desprendimiento físico de la recopilación, el análisis, el almacenamiento y la monetización de los datos. El documento concluye con un resumen y un debate sobre las vías más prometedoras para medir el valor económico de los datos.

Recomendación de citación: enfoques y conjuntos de datos

figure2

Michael Färber ; Adam Jatowt. “Citation Recommendation: Approaches and Datasets”. International Journal on Digital Libraries DOI: 10.1007/s00799-020-00288-2

Texto completo

La recomendación de citas describe la tarea de como citar un texto determinado. Debido a la sobrecarga de trabajos científicos publicados en los últimos años, por una parte, y a la necesidad de citar las publicaciones más apropiadas al redactar textos científicos, por otra, la recomendación de citas ha surgido como un importante tema de investigación. En los últimos años se han presentado varios enfoques y conjuntos de datos de evaluación. Sin embargo, hasta donde sabemos, no se ha realizado ningún estudio de la literatura explícitamente sobre la recomendación de citas.

En este artículo, proporciona una introducción completa a la investigación de la recomendación de citación automática. A continuación, presentamos una visión general de los enfoques y conjuntos de datos para la recomendación de citas e identificamos las diferencias y los puntos comunes utilizando varias dimensiones. Por último, pero no por ello menos importante, arrojamos luz sobre los métodos de evaluación y esbozamos los retos generales de la evaluación y cómo afrontarlos. Nos limitamos a la recomendación de citas para publicaciones científicas, ya que este tipo de documento es el que más se ha estudiado en esta área. Sin embargo, muchas de las observaciones y discusiones incluidas en este estudio también son aplicables a otros tipos de texto, como artículos de noticias y artículos enciclopédicos.

¿Qué pueden hacer las humanidades por la ciencia de datos? Libro blanco

McGillivray, Barbara et al. (2020). The challenges and prospects of the intersection of humanities and data science: A White Paper from The Alan Turing Institute, 2020

Texto completo

El nuevo libro blanco hace recomendaciones clave para la investigación en la intersección de las dos disciplinas y explora el gran potencial de nuevas investigaciones innovadoras en la intersección entre las disciplinas de ciencia de datos y humanidades y ofrece recomendaciones clave para financiadores, instituciones académicas e investigadores.

Las herramientas digitales y la ciencia de datos presentan muchas oportunidades que podrían transformar la investigación en humanidades. Al mismo tiempo, las humanidades, disciplinas académicas que estudian aspectos de la sociedad y la cultura humanas, también tienen el potencial de transformar la investigación en ciencia de datos. Este debería ser un intercambio bidireccional de enfoques y conocimientos. El nuevo documento define el panorama actual de la investigación en humanidades digitales del Reino Unido y reflexiona sobre lo que implica la investigación basada en datos dentro de las humanidades. También destaca una serie de recomendaciones sobre cómo estas dos comunidades pueden trabajar juntas de manera más fácil y mejor para aprovechar todo el potencial del trabajo interdisciplinario.  

El documento describe recomendaciones en siete áreas en dos temas para apoyar y promover la investigación interdisciplinaria en ciencia de datos y humanidades, que incluyen:

Proceso de investigación

  1. Marcos metodológicos y culturas epistémicas : Desarrollar marcos / terminología metodológicos comunes y fomentar un uso más amplio de protocolos de investigación compartidos en estas áreas. 
  2. Mejores prácticas en el uso y evaluación de herramientas computacionales : Utilizar prácticas que aseguren la transparencia y apertura en la investigación y programas de capacitación para ayudar a elegir las herramientas computacionales más adecuadas en la investigación en humanidades. 
  3. Investigación reproducible y abierta : promueva la investigación transparente y reproducible en las humanidades, incluidos datos, código, flujos de trabajo, entornos computacionales, métodos y documentación. 

Facilitadores y estructuras de apoyo  

  1. Infraestructura técnica : Desarrollar infraestructura para democratizar el acceso a los recursos digitales y garantizar su mantenimiento y mejora continua. 
  2. Política de financiación y evaluación de la investigación : cree planes entre consejos que financien proyectos colaborativos de ciencia de datos. Cuando sea apropiado, el uso de protocolos de investigación en proyectos de ciencia de datos relacionados con datos de humanidades debe incluir perspectivas de humanidades. 
  3. Capacitación, educación y experiencia : Mejora a los investigadores de humanidades en métodos cuantitativos y computacionales e incorpora estos métodos en títulos de pregrado y posgrado. 
  4. Carrera, desarrollo y equipos : fomente múltiples trayectorias profesionales y ejemplos de trabajo para que los estudiantes y los investigadores de carrera temprana puedan ver qué opciones de carrera podrían estar abiertas para ellos. 

 

Gestión eficaz de los datos

Effective Data Governance: A Survey Of Federal Chief Data Officers. Data Foundation, 2020

Texto completo

Cuando el Congreso estadounidense aprobó la ley bipartidista de fundamentos para la formulación de políticas basadas en la evidencia (Ley de la evidencia), estableció claras expectativas para que los organismos federales fortalecieran la gobernanza de datos. Se exige a los organismos que hagan un inventario de los datos, promuevan la apertura y la publicación de la información y garanticen el liderazgo para mejorar la gestión de los datos en general. También se formalizó la función de Chief Data Officer (CDO) en los organismos y se normalizaron las responsabilidades de los OCD.

La Fundación para los Datos, en asociación con el sector público de Grant Thornton y Qlik, realizó una encuesta entre los CDO del gobierno federal para evaluar los progresos realizados en la aplicación de sus nuevas funciones y responsabilidades. Hay señales de progreso, ya que las agencias federales aplican la Ley de Pruebas y la orientación complementaria del Poder Ejecutivo. Los principales resultados de la encuesta incluyen:

Resumen ejecutivo

  • La mayoría de los CDO tienen años de experiencia en el gobierno federal y su agencia específica, aunque su papel como CDO haya sido breve. Entre los CDO que respondieron, el 97% trabajó para el gobierno federal durante cinco años o más; el 61% ha estado con la misma organización durante al menos cinco años.
  • Los CDOs informan sobre los progresos en los principales resultados. Casi el 75% de los CDO informaron de los esfuerzos exitosos de gobernanza de datos y los progresos en la elaboración de inventarios de datos, requisitos básicos enumerados en la Ley de pruebas.
  • Siguen existiendo desafíos y barreras para la aplicación efectiva de las CDO. Incluso cuando las CDO avanzan en el cumplimiento de las obligaciones básicas, observan desafíos para cumplir con las responsabilidades individuales y las expectativas de la comunidad. Tres de cada cinco CDO citan los requisitos financieros y las limitaciones presupuestarias como obstáculos importantes para promover un gobierno basado en datos; la mitad ha experimentado dificultades para definir el papel del CDO en el gobierno.
  • Los CDO están de acuerdo en las prioridades actuales. A pesar de los desafíos, muchos CDO expresan su acuerdo sobre las prioridades del gobierno basado en datos durante el próximo año. Casi las tres cuartas partes están dando prioridad a la finalización del inventario de datos de su organismo, dos tercios tienen la intención de centrarse en mejorar los datos, así como aplicar una amplia estrategia de datos, y la mitad se centra en la evaluación de la madurez de los datos de los organismos

Decisiones sobre el ciclo de vida para los datos biomédicos

 

ecwbxaruyaarr-z

 

National Academies of Sciences, Engineering, and Medicine. 2020. Life Cycle Decisions for Biomedical Data: The Challenge of Forecasting Costs. Washington, DC: The National Academies Press. https://doi.org/10.17226/25639.

Texto completo

 

La investigación biomédica da como resultado la recopilación y el almacenamiento de conjuntos de datos cada vez más grandes y complejos. Preservar esos datos para que sean detectables, accesibles e interpretables acelera el descubrimiento científico y mejora los resultados de salud, pero requiere que los investigadores, curadores de datos y archiveros de datos consideren la disposición a largo plazo de los datos y los costos de preservar, archivar y promover acceso a ellos.

Elsevier OA CC-BY Corpus: 40.000 artículos abiertos y sus metadatos

 

how-parse-trees-work

Elsevier OA CC-BY Corpus

Noticia y corpus

 

Este es el primer corpus abierto de artículos de investigación científica que tiene una muestra representativa de todas las disciplinas científicas. Este corpus no solo incluye el texto completo del artículo, sino también los metadatos de los documentos, junto con la información bibliográfica de cada referencia.

Este conjunto de datos se publicó para respaldar el desarrollo de modelos de  aprendizaje automático (ML) y procesamiento del lenguaje natural (NLP)  dirigidos a artículos científicos de todos los dominios de investigación. Si bien la versión se basa en otros conjuntos de datos diseñados para dominios y tareas específicos, permitirá derivar conjuntos de datos similares o desarrollar modelos que se puedan aplicar y probar en todos los dominios.