Archivo de la etiqueta: Gestión de datos de investigación

Open Data el portal de datos abiertos de investigación del CERN

codp_visualise

La Organización Europea para la Investigación Nuclear, comúnmente conocida por la sigla CERN, es el mayor laboratorio de investigación en física de partículas del mundo. El CERN dispone de un repositorio de datos abiertos “Open Data” que facilita la consulta de los datos de las investigaciones realizadas en este importante laboratorio europeo de investigación de físca de partículas.

http://opendata.cern.ch

El portal CERN Open DataOpen Data es el punto de acceso a una creciente gama de datos producidos de la investigación realizada en el CERN. En este portal se pone a disposición del publico investigador la producción preservada de diversas actividades de investigación, incluido el software y la documentación complementaria necesarioa para comprender y analizar los datos que se comparten.

El portal se adhiere a los estándares mundiales establecidos en la preservación de los datos y la Ciencia Abierta: los productos son compartidos bajo licencias abiertas; y se les otorga un identificador de objeto digital (DOI) que permite la vinculación permanente a los registros para convertirlos en objetos citables.

Los datos producidos por los experimentos del LHC, generalmente se clasifican en cuatro niveles diferentes (Grupo de Estudio DPHEP, 2009) . El portal Open Data se enfoca en la liberación de datos de nivel 2 y 3. Los datos de nivel 1 comprenden datos que están directamente relacionados con publicaciones que proporcionan documentación para los resultados publicados. Los datos de nivel 2 incluyen formatos de datos simplificados para el análisis en ejercicios de difusión y enseñanza. Los datos de nivel 3 incluyen datos reconstruidos y simulaciones, así como el software de nivel de análisis para permitir un análisis científico completo. El nivel 4 cubre los datos básicos de nivel bruto (si aún no están cubiertos como datos de nivel 3) y su software asociado que permite el acceso al potencial completo de los datos experimentales.

Una guía para mejorar la integridad y gestión de datos de investigación

cat

Roper, J. [e-Book] A Guide to Improving Data Integrity and Adoption: a Case Study in Verifying Usage Data. London, O’Really, 2016.

Texto completo

ePub

Mobi

PDF

Para la mayoría de entidades de investigación y empresas, los datos de calidad son fundamentales para medir el éxito y planificar los objetivos. Pero lograr la exactitud de los datos y la integridad puede ser una tarea desalentadora dada la naturaleza desordenada de los datos en bruto. ¿De qué manera se puede confiar en que los datos de origen son exactos? ¿Qué datos deben ser excluidos? ¿Qué pasos se deben tomar para asegurar que todos los datos se transforman correctamente?

Este informe presenta un estudio de caso de un proyecto de gestión de datos intensivos (Big Data) Spiceworks, la vibrante red, la comunidad línea y el mercado para profesionales de TICs. La autora Jessica Roper, desarrolladora senior en la división de análisis de datos de Spiceworks, demuestra formas de pensar en la verificación, procesamiento, análisis y automatización de datos. Además de ser una guía de herramientas para:

  • Determinar si los datos que recopila y utiliza son fiables y precisos.
  • Comprender lo que implica investigar los datos para verificar su fiabilidad.
  • Aprender estrategias y casos de prueba para verificar fuentes de datos sin procesar y trabajar con transformaciones de datos.
  • Familiarizarse con los datos de cada capa y crear pruebas entre cada transformación para garantizar la coherencia.
  • Entender qué casos , qué tendencias y valores esperamos obtener.
  • Monitorización de datos para identificar anomalías y problemas del sistema.
  • Automatizar las pruebas de proceso y aceptación para supervisar y garantizar la fiabilidad de los datos.
  • Trabajar con otros equipos y grupos para mejorar y validar la exactitud de los datos.
  • Aumentar la adopción mediante el uso de datos para medir el éxito.

MLA Commons, la red de intercambio y colaboración para personas que trabajan en lenguas y literaturas modernas

cropped-cropped-commons-logo-square-large

https://mla.hcommons.org/

MLA Commons, la red de intercambio y colaboración para personas que trabajan en lenguas y literaturas modernas. En MLA Commons  puedes encontrar las últimas investigaciones en acceso abierto, materiales de enseñanza, conexiones interdisciplinarias.

Depositar su trabajo en el repositorio CORE (Commons Open Repository Exchange) asegura que el documento sea preservado, atribuido unívocamente al investigador, y que esté amplia y rápidamente disponible para otros. CORE proporciona a los miembros de MLA Commons una instalación permanente de almacenamiento en acceso abierto para la producción académica, facilitando la máxima detección y alentando la retroalimentación por parte de otros colegas.

Las obras depositadas en CORE reciben automáticamente un identificador permanente llamado DOI. Los DOIs proporcionan metadatos persistentes para trabajos académicos y creativos, incluyendo literatura gris como publicaciones de blogs, programas de estudio, conjuntos de datos, presentaciones y archivos de video y audio. MLA CORE ofrece la ventaja añadida de compartir un trabajo con una audiencia inmediata de investigadores especialistas en tu disciplina.

Lo primero es crear una cuenta en el sitio y generar un perfil. Aquí dispones de una guía que te facilitará hacerlo.

En MLA CORE se pueden depositar artículos, tesis; obras en curso; conferencias; planes de estudios, resúmenes; conjuntos de datos; presentaciones; traducciones; reseñas de libros; mapas, cartas y más. CORE acepta los siguientes tipos de archivo. Los archivos PDF se prefieren por razones de compatibilidad entre plataformas y seguridad. El tamaño máximo de archivo para un único elemento es de 100 MB

Tipos de archivos

Audio: .mp3, .ogg, .wav
Datos: .csv, .ods, .sxc, .tsv, .xls, .xlsx
Imagen: .gif, .jpeg, .jpg, .png, .psd, .tiff
Material mixto o software: .gz, .rar, .tar, .zip
Texto: .doc, .docx, .htm, .html, .odp, .odt, .pdf, .pps, .ppt, .pptx, .rdf, .rtf, .sxi, .sxw, .txt, .wpd, .xml
Video: .f4v, .flv, .mov, .mp4

Gestión de la identidad y reputación digital del investigador: de las métricas alternativas a la gestión de datos de investigación

reputaciononline

“Gestión de la identidad y reputación digital del investigador: de las métricas alternativas a la gestión de datos de investigación” por Julio Alonso Arévalo

Descargar en:

Reputacion e identidad digital del investigador de Julio Alonso Arévalo

 

LUGAR

Universitat Jaume I (Castellón de la Plana) 11,30 h del lunes, 9 de enero de 2017 en el Salón de Actos del edificio del centro de postgrado.

RESUMEN

En el nuevo ecosistema informativo se están produciendo cambios profundos. Los medios sociales están modificando la forma de interactuar, presentar las ideas e información y juzgar la calidad de los contenidos y contribuciones. En los últimos años han surgido cientos de plataformas que permiten compartir libremente todo tipo de información y conectarnos a través de redes. Estas nuevas herramientas generan estadísticas de actividad e interacciones entre sus usuarios, tales como menciones, retweets, conversaciones, comentarios. Como afirma Eric Qualman “Los medios sociales no son una moda, son un cambio fundamental en la forma en que nos comunicamos.” A la par de estos cambios, la mayor parte de los investigadores han trasladado sus actividades de investigación a la web y con el éxito de los medios sociales esta situación se ha hecho más evidente, ya que estas herramientas tienen más potencialidad para desarrollar un rango mayor de influencia académica que los entornos tradicionales de publicación. Las posibilidades que ofrecen las tecnologías participativas facilitan que los autores puedan compartir información, favorecer el descubrimiento científico y la visibilidad de la investigación a través de bases de datos, plataformas y servicios de apoyo a los procesos de una investigación. Todo esto se ha visto favorecido por los avances que están impulsando una ciencia más interconectada y abierta con avances asombrosos en los sistemas de identificación de obras y de autores. Este proceso está teniendo su incidencia en la necesidad de que los investigadores conozcan, utilicen y gestionen los mecanismos de valoración, acreditación y potenciación de la visibilidad científica de sus publicaciones, lo que a su vez incide en el desarrollo de la carrera personal del investigador, pero también de manera colectiva en la calidad de las propias universidades, cuya medición se basa fundamentalmente en los ranking elaborados a partir de los datos de investigación de sus académicos.  Todo ello está poniendo de relieve la importancia más que nunca la necesidad por parte de quienes investigan de conocer los mecanismos de edición, comunicación, medición y promoción.

Cómo hacer para que los datos generados por los ciudadanos sean de utilidad

2016-12-27_12-13-18

Danny Lämmerhirt, Shazade Jameson, and Eko Prasetyo.. Making Citizen-Generated Data Work. 2017

Texto completo

Vivimos en un mundo de datos. Los gobiernos utilizan datos para medir el impacto y la eficiencia de las políticas basadas en la evidencia. Las empresas extraen grandes cantidades de datos para conocer los patrones de comportamiento de sus clientes.

Los individuos están organizando su vida social a través de medios que permiten capturar, recopilar y comunicar más información sobre sus comportamientos y creencias, que nunca antes fue posible disponer en cualquier otra época. Las Naciones Unidas pidieron una “revolución de datos” para aprovechar las nuevas tecnologías y aprovechar este vasto tesoro de datos existentes y emergentes para ayudar a los Objetivos de Desarrollo Sostenible (SDG), que buscan medir el camino de la humanidad hacia la sostenibilidad con un conjunto más amplio de datos con el objetivo “no dejar a nadie detrás”.

Este informe analiza cómo los ciudadanos y la sociedad civil generan datos para impulsan el desarrollo sostenible; y cómo los datos creados por los ciudadanos pueden influir en la toma de decisiones y en la gestión de las instituciones públicas, para que estas cumplan mejor con su misión, con el objetivo de ser más eficientes y efectivas a la hora de invertir adecuadamente los recursos de todos.

Construcción y mantenimiento de infraestructuras de datos

thumb1

Bicarregui, J. (2016). [e-Book] Building and sustaining data infrastructures. London, Welcome Trust. Texto completo: https://ndownloader.figshare.com/files/6860004

Revisión encargada por Wellcome Trust centrada en la construcción y mantenimiento de infraestructuras de datos.

¿Qué piensan los investigadores sobre la ciencia abierta?

oscience

Veerle Van den Eynden, Gareth Knight, Anca VladBarry Radler, Carol Tenopir, David Leon, Frank ManistaJimmy Whitworth, Louise Corti. Survey of Wellcome researchers and their attitudes to open research, Digital Science, 2016

Texto completo

Resultados de una encuesta de Wellcome Trust para descubrir qué piensan los investigadores acerca de la ciencia abierta, cómo la practican y qué barreras encuentran. En el intercambio de datos, las razones por las que los investigadores ponen a disposición sus datos, los beneficios que pueden experimentar, las barreras que perciben y los posibles incentivos para disponer de más datos dependen  fuertemente de la etapa profesional, la disciplina de investigación y la posición dentro del organismos de investigación.

En la investigación se encuestaron a 583 investigadores de todas las categorías de Welcome Trust. Los resultados se contrastaron con los resultados de una encuesta paralela a investigadores financiados por el Consejo de Investigación Económica y Social (ESRC), como un grupo de investigadores en ciencias sociales que realizan investigaciones en el contexto de un organismo financiador con una política obligatoria de intercambio de datos. Más específicamente el estudio reunieron evidencias sobre:

  • Opiniones de los investigadores sobre diversos aspectos de la investigación abierta
  • Prácticas actuales en la publicación de acceso abierto
  • Opiniones sobre la evolución futura de la publicación
  • Prácticas y experiencias actuales en el intercambio de datos y la reutilización
  • Las barreras para compartir y las motivaciones para hacer disponibles los datos
  • Prácticas y experiencias actuales en el uso compartido de código y su reutilización
  • Barreras y motivaciones para compartir código

Este trabajo fue encargado por el Wellcome Trust y dirigido por la Escuela de Londres de Higiene y Medicina Tropical y el Servicio de Datos del Reino Unido. Los investigadores financiados por Wellcome Trust ya están practicando la investigación abierta de muchas maneras, tal como se ilustra a lo largo de este informe, ya sea publicando sus escritos en revistas de acceso abierto o poniendo sus datos de investigación y código a disposición de la comunidad académica para su reutilización. Diferentes barreras entran en juego para que los datos estén en abierto. Algunos aspectos de la investigación abierta se aplican a todos los investigadores en general, mientras que otras características están muy determinadas por la disciplina de investigación, la etapa de carrera, la institución ala que pertenece el investigador y el tipo de métodos de investigación utilizados, así como en función de los datos generados. Las prácticas de investigación abierta están aumentando, y los participantes informan sobre muchos desarrollos recientes que están llevando a cabo en sus prácticas de investigación abierta, generalmente con experiencias positivas, como la revisión abierta por pares, la publicación de preprints de documentos y el intercambio de código.

Publicación

En lo que se refiere a la publicación de artículos revisados por pares, los principales factores que son decisivos y que importan a los investigadores a la hora de publicar un artículo son la reputación de las revistas, el público al que va dirigido, la revisión por pares de alta calidad y el factor de impacto de la revista. En comparación, el hecho de publicar documentos en acceso abierto es menos importante para ellos. Sin embargo, muchos investigadores financiados por Wellcome Trust publican sus artículos en acceso abierto, gracias a la financiación proporcionada por el Wellcome Trust, con más del 70% de todos los artículos publicados en acceso abierto y una cifra de un tercio de los investigadores que publican todos sus artículos en acceso abierto.

La proporción de publicaciones de acceso abierto es independiente de la etapa de carrera. Sin embargo, los investigadores de carrera temprana son menos dados a usar la financiación de Wellcome Trust para cubrir los cargos de procesamiento de artículos; Lo mismo se aplica a los investigadores de ciencias sociales, mientras que los investigadores biomédicos y clínicos son más inclinados a hacerlo.

Al seleccionar la literatura a utilizar en la investigación, dan poca importancia a los documentos que están en acceso abierto o  a los datos suplementarios disponibles que respaldan los hallazgos. En cambio, la calidad del contenido, la reputación de la revista, el prestigio del autor y la suscripción institucional son los principales factores al elegir los documentos que se consultan en la investigación.

Wellcome Trsut recientemente lanzó Wellcome Open Research, una nueva plataforma que facilita la publicación de una gama de productos; las principales características que piden a esta plataforma es que la revisión por pares sea abierta y transparente, que todos los productos disponibles estén en libre acceso, y que el costo de la publicación sea cubierto completamente por Wellcome Trust. Además, los investigadores dicen que quisieran que en los sistemas de publicación futuros los comentarios de los revisores fueran visibles, que tuvieran un foro para comentarios para la discusión de los documentos, y también permitir la visualización de los datos en los documentos y la publicación rápida de los documentos como preprints, que posteriormente podrían ser enviados a revistas reconocidas. La prioridad de las características deseadas está determinada por la etapa de carrera y la disciplina de investigación.

Datos

La mitad de los investigadores pone a disposición datos de investigación para que puedan ser utilizados por otros investigadores, ya sea como conjuntos de datos completos o como subconjuntos, y cada investigador ha puesto a disposición un promedio de cuatro conjuntos de datos en los últimos cinco años. Los datos son en su mayoría publicados a través de repositorios institucionales y comunitarios de acceso abierto.

Las principales razones para poner a disposición los datos de investigación son los requisitos impuestos por los organismos financiadores y revistas, también porque se considera una buena práctica de investigación, además por facilitar la colaboración  y permitir la validación y replicación de la investigación. Los principales beneficios que los investigadores han experimentado al compartir sus datos son el que les han surgido nuevas colaboraciones y mayores tasas de citas. Sin embargo, la mayoría de los investigadores no han experimentado ningún beneficio directo de poner sus datos a disposición de todos. Tampoco han experimentado muchos efectos negativos al compartir sus datos.

Las principales barreras que se perciben para compartir datos son el temor de que los datos sean mal utilizados o malinterpretados, el temor de que compartir datos pueda poner en peligro futuras oportunidades de publicación, y el tiempo y esfuerzo que se requiere para preparar y depositar los datos. El hecho de que muy pocas personas hayan tenido realmente malas experiencias de compartir datos, muestra que estos temores son en gran medida infundados. Lo positivo es el hecho de que los beneficios superan a las barreras para la mayoría de los investigadores.

Los investigadores indican que estarían más motivados para hacer que más datos estuvieran disponibles en el futuro si recibieran fondos adicionales para cubrir el costo de la preparación de los datos, si poner sus datos disponibles mejorara su reputación académica, si supieran cómo otros investigadores usan sus datos; además de si se tuviera en cuenta el intercambio de datos en futuras decisiones de financiación y promoción de la carrera.

Las razones para compartir datos, beneficios experimentados, barreras y motivaciones están determinadas por la etapa y la disciplina de la carrera de un investigador. Los investigadores reutilizan los datos existentes, principalmente para proporcionar información de antecedentes y contexto a su investigación, para la validación de la investigación, para ayudar a desarrollar sus metodologías y para nuevos análisis. Los niveles de reutilización de datos dependen de la etapa de carrera, la disciplina y los métodos de investigación utilizados. Sin embargo, una cuarta parte de los investigadores nunca han reutilizado los datos existentes. Los datos para la reutilización se obtienen principalmente de colegas, repositorios o directamente del creador. Importante es que los datos sean de una fuente acreditada, de alta calidad y bien documentados. Los datos disponibles de forma abierta e inmediata son menos importantes para los investigadores.