Archivo de la etiqueta: Gestión de datos de investigación

La ciencia de los datos abiertos se está comiendo el mundo

 

33358449395_5a80be33d9_o_d

Chambers, M., C. Doig, et al. (2016). [e-Book] Breaking Data Science Open How Open Data Science Is Eating the World. Sebastopol, CA, O’Reilly Media, 2016.

Texto completo

La ciencia de los datos está captando la atención del todos como la tendencia tecnológica más importante en estos momentos. Ya no es sólo una palabra de moda para referirse al software analítico avanzado; la ciencia de los datos está a punto de cambiar todos los aspectos clave de cualquier organización: los clientes potenciales, los planes de expansión, la ingeniería y proceso de fabricación, cómo se interactúa con los proveedores y y otras cuestiones.

La ventaja principal de este tsunami llamada Open Data Science, es una combinación de tendencias innovadoras en los negocios y la tecnología, que promete un futuro más inteligente basado en la combinación de software de código abierto y colaboración entre organizaciones. Open Data Science es un movimiento que hace que las herramientas de código abierto y la ciencia de datos (datos, análisis y computación) trabajen juntas como si fueran un ecosistema.

En esta edición  de Breaking Data Science Open, aprenderá:

  • Cómo la ciencia de los datos entró en los negocios
  • Qué equipos utiliza la ciencia de datos
  • Por qué la ciencia de los datos cambiará la toma de decisiones
  • Qué aplicaciones se utilizan actualmente en la ciencia de los datos abiertas
  • Cómo iniciar el proceso de gestión de datos

Reutilización de datos de investigación: análisis de confianza y fiabilidad de los datos

trust-data

Yoon, A. “Data reusers’ trust development.” Journal of the Association for Information Science and Technology vol., n. (2016). pp.: http://doi.wiley.com/10.1002/asi.23730

La reutilización de datos se refiere al uso secundario de datos, no para su propósito original sino para estudiar nuevos problemas. Aunque la reutilización de datos aun no es de uso común en todas disciplina, los beneficios de la reutilización de datos compartidos han sido ratificados por diferentes organizaciones y grupos de investigadores, siendo una preocupación importante en muchas disciplinas. El reto que se plantea en torno a la cuestión es la fiabilidad de los datos y los perrjuicios derivados del uso de datos de baja caldiad

La valoración de los datos es uno de los grandes retos de cara a su reutiilizacón, esta cuestión se ha puesto de relieve sobre todo en los últimos años, que han aumentado las iniciativas de puesta en marcha de repositorios de datos de investigación; en los que se plantea la cuestión relativa a la confiabilidad de los datos, sobre todo debido a la falta de estándares para asegurar la calidad de los datos y los posibles daños derivados del uso de datos de baja calidad.

Esta investigación explora muchas facetas en torno a la fiabilidad que tienen los reutilizadores de datos cuando usan datos generados por otros investigadores, centrándose en el proceso de juicio de confianza y que factores críticos son los que determinan la confianza en los datos. El autor adoptó un enfoque cualitativo interpretativo mediante el uso de entrevistas semiestructuradas en profundidad como método de investigación principal.

Los resultados del estudio sugieren diferentes etapas de desarrollo en la generación de la confianza asociada a el proceso de reutilización de datos. La confianza de los reutilizadores en un sitios de alojamiento de daros de investigación se genera fundamentalmente a partir de las propias experiencias de los investigadores que utilizan estos datos, pero hay que tener en cuenta que esta fiabilidad es fluctuante, ya que puede ser formada, perdida, rechazada y recuperada durante sus experiencias de reutilización de datos. Estas etapas reflejan la naturaleza dinámica de la confianza.

Open Data el portal de datos abiertos de investigación del CERN

codp_visualise

La Organización Europea para la Investigación Nuclear, comúnmente conocida por la sigla CERN, es el mayor laboratorio de investigación en física de partículas del mundo. El CERN dispone de un repositorio de datos abiertos “Open Data” que facilita la consulta de los datos de las investigaciones realizadas en este importante laboratorio europeo de investigación de físca de partículas.

http://opendata.cern.ch

El portal CERN Open DataOpen Data es el punto de acceso a una creciente gama de datos producidos de la investigación realizada en el CERN. En este portal se pone a disposición del publico investigador la producción preservada de diversas actividades de investigación, incluido el software y la documentación complementaria necesarioa para comprender y analizar los datos que se comparten.

El portal se adhiere a los estándares mundiales establecidos en la preservación de los datos y la Ciencia Abierta: los productos son compartidos bajo licencias abiertas; y se les otorga un identificador de objeto digital (DOI) que permite la vinculación permanente a los registros para convertirlos en objetos citables.

Los datos producidos por los experimentos del LHC, generalmente se clasifican en cuatro niveles diferentes (Grupo de Estudio DPHEP, 2009) . El portal Open Data se enfoca en la liberación de datos de nivel 2 y 3. Los datos de nivel 1 comprenden datos que están directamente relacionados con publicaciones que proporcionan documentación para los resultados publicados. Los datos de nivel 2 incluyen formatos de datos simplificados para el análisis en ejercicios de difusión y enseñanza. Los datos de nivel 3 incluyen datos reconstruidos y simulaciones, así como el software de nivel de análisis para permitir un análisis científico completo. El nivel 4 cubre los datos básicos de nivel bruto (si aún no están cubiertos como datos de nivel 3) y su software asociado que permite el acceso al potencial completo de los datos experimentales.

Una guía para mejorar la integridad y gestión de datos de investigación

cat

Roper, J. [e-Book] A Guide to Improving Data Integrity and Adoption: a Case Study in Verifying Usage Data. London, O’Really, 2016.

Texto completo

ePub

Mobi

PDF

Para la mayoría de entidades de investigación y empresas, los datos de calidad son fundamentales para medir el éxito y planificar los objetivos. Pero lograr la exactitud de los datos y la integridad puede ser una tarea desalentadora dada la naturaleza desordenada de los datos en bruto. ¿De qué manera se puede confiar en que los datos de origen son exactos? ¿Qué datos deben ser excluidos? ¿Qué pasos se deben tomar para asegurar que todos los datos se transforman correctamente?

Este informe presenta un estudio de caso de un proyecto de gestión de datos intensivos (Big Data) Spiceworks, la vibrante red, la comunidad línea y el mercado para profesionales de TICs. La autora Jessica Roper, desarrolladora senior en la división de análisis de datos de Spiceworks, demuestra formas de pensar en la verificación, procesamiento, análisis y automatización de datos. Además de ser una guía de herramientas para:

  • Determinar si los datos que recopila y utiliza son fiables y precisos.
  • Comprender lo que implica investigar los datos para verificar su fiabilidad.
  • Aprender estrategias y casos de prueba para verificar fuentes de datos sin procesar y trabajar con transformaciones de datos.
  • Familiarizarse con los datos de cada capa y crear pruebas entre cada transformación para garantizar la coherencia.
  • Entender qué casos , qué tendencias y valores esperamos obtener.
  • Monitorización de datos para identificar anomalías y problemas del sistema.
  • Automatizar las pruebas de proceso y aceptación para supervisar y garantizar la fiabilidad de los datos.
  • Trabajar con otros equipos y grupos para mejorar y validar la exactitud de los datos.
  • Aumentar la adopción mediante el uso de datos para medir el éxito.

MLA Commons, la red de intercambio y colaboración para personas que trabajan en lenguas y literaturas modernas

cropped-cropped-commons-logo-square-large

https://mla.hcommons.org/

MLA Commons, la red de intercambio y colaboración para personas que trabajan en lenguas y literaturas modernas. En MLA Commons  puedes encontrar las últimas investigaciones en acceso abierto, materiales de enseñanza, conexiones interdisciplinarias.

Depositar su trabajo en el repositorio CORE (Commons Open Repository Exchange) asegura que el documento sea preservado, atribuido unívocamente al investigador, y que esté amplia y rápidamente disponible para otros. CORE proporciona a los miembros de MLA Commons una instalación permanente de almacenamiento en acceso abierto para la producción académica, facilitando la máxima detección y alentando la retroalimentación por parte de otros colegas.

Las obras depositadas en CORE reciben automáticamente un identificador permanente llamado DOI. Los DOIs proporcionan metadatos persistentes para trabajos académicos y creativos, incluyendo literatura gris como publicaciones de blogs, programas de estudio, conjuntos de datos, presentaciones y archivos de video y audio. MLA CORE ofrece la ventaja añadida de compartir un trabajo con una audiencia inmediata de investigadores especialistas en tu disciplina.

Lo primero es crear una cuenta en el sitio y generar un perfil. Aquí dispones de una guía que te facilitará hacerlo.

En MLA CORE se pueden depositar artículos, tesis; obras en curso; conferencias; planes de estudios, resúmenes; conjuntos de datos; presentaciones; traducciones; reseñas de libros; mapas, cartas y más. CORE acepta los siguientes tipos de archivo. Los archivos PDF se prefieren por razones de compatibilidad entre plataformas y seguridad. El tamaño máximo de archivo para un único elemento es de 100 MB

Tipos de archivos

Audio: .mp3, .ogg, .wav
Datos: .csv, .ods, .sxc, .tsv, .xls, .xlsx
Imagen: .gif, .jpeg, .jpg, .png, .psd, .tiff
Material mixto o software: .gz, .rar, .tar, .zip
Texto: .doc, .docx, .htm, .html, .odp, .odt, .pdf, .pps, .ppt, .pptx, .rdf, .rtf, .sxi, .sxw, .txt, .wpd, .xml
Video: .f4v, .flv, .mov, .mp4

Gestión de la identidad y reputación digital del investigador: de las métricas alternativas a la gestión de datos de investigación

reputaciononline

“Gestión de la identidad y reputación digital del investigador: de las métricas alternativas a la gestión de datos de investigación” por Julio Alonso Arévalo

Descargar en:

Reputacion e identidad digital del investigador de Julio Alonso Arévalo

 

LUGAR

Universitat Jaume I (Castellón de la Plana) 11,30 h del lunes, 9 de enero de 2017 en el Salón de Actos del edificio del centro de postgrado.

RESUMEN

En el nuevo ecosistema informativo se están produciendo cambios profundos. Los medios sociales están modificando la forma de interactuar, presentar las ideas e información y juzgar la calidad de los contenidos y contribuciones. En los últimos años han surgido cientos de plataformas que permiten compartir libremente todo tipo de información y conectarnos a través de redes. Estas nuevas herramientas generan estadísticas de actividad e interacciones entre sus usuarios, tales como menciones, retweets, conversaciones, comentarios. Como afirma Eric Qualman “Los medios sociales no son una moda, son un cambio fundamental en la forma en que nos comunicamos.” A la par de estos cambios, la mayor parte de los investigadores han trasladado sus actividades de investigación a la web y con el éxito de los medios sociales esta situación se ha hecho más evidente, ya que estas herramientas tienen más potencialidad para desarrollar un rango mayor de influencia académica que los entornos tradicionales de publicación. Las posibilidades que ofrecen las tecnologías participativas facilitan que los autores puedan compartir información, favorecer el descubrimiento científico y la visibilidad de la investigación a través de bases de datos, plataformas y servicios de apoyo a los procesos de una investigación. Todo esto se ha visto favorecido por los avances que están impulsando una ciencia más interconectada y abierta con avances asombrosos en los sistemas de identificación de obras y de autores. Este proceso está teniendo su incidencia en la necesidad de que los investigadores conozcan, utilicen y gestionen los mecanismos de valoración, acreditación y potenciación de la visibilidad científica de sus publicaciones, lo que a su vez incide en el desarrollo de la carrera personal del investigador, pero también de manera colectiva en la calidad de las propias universidades, cuya medición se basa fundamentalmente en los ranking elaborados a partir de los datos de investigación de sus académicos.  Todo ello está poniendo de relieve la importancia más que nunca la necesidad por parte de quienes investigan de conocer los mecanismos de edición, comunicación, medición y promoción.

Cómo hacer para que los datos generados por los ciudadanos sean de utilidad

2016-12-27_12-13-18

Danny Lämmerhirt, Shazade Jameson, and Eko Prasetyo.. Making Citizen-Generated Data Work. 2017

Texto completo

Vivimos en un mundo de datos. Los gobiernos utilizan datos para medir el impacto y la eficiencia de las políticas basadas en la evidencia. Las empresas extraen grandes cantidades de datos para conocer los patrones de comportamiento de sus clientes.

Los individuos están organizando su vida social a través de medios que permiten capturar, recopilar y comunicar más información sobre sus comportamientos y creencias, que nunca antes fue posible disponer en cualquier otra época. Las Naciones Unidas pidieron una “revolución de datos” para aprovechar las nuevas tecnologías y aprovechar este vasto tesoro de datos existentes y emergentes para ayudar a los Objetivos de Desarrollo Sostenible (SDG), que buscan medir el camino de la humanidad hacia la sostenibilidad con un conjunto más amplio de datos con el objetivo “no dejar a nadie detrás”.

Este informe analiza cómo los ciudadanos y la sociedad civil generan datos para impulsan el desarrollo sostenible; y cómo los datos creados por los ciudadanos pueden influir en la toma de decisiones y en la gestión de las instituciones públicas, para que estas cumplan mejor con su misión, con el objetivo de ser más eficientes y efectivas a la hora de invertir adecuadamente los recursos de todos.