Archivo de la etiqueta: Gestión de datos de investigación

Informe sobre el desarrollo de colecciones para repositorios de datos de investigación

 

portage_logo_bilingual

Vejvoda, Berenica; Ambi, Alison; Barsky, Eugene; Lindstrom, Kevin; MacDonald, Heather; Matthews, Kathleen; Moosberger, Michael; O’Hara, Lisa; Powelson, Susan; Silk, Kimberly; Sivak, Allison; Thompson, Kristi. Portage Data Discovery Expert Group – Collections Development Working Group : Phase One Report. Otawa: The Portage Data Discovery Expert Group, Jul 31, 2017

Texto completo

El informe  publicado por el Grupo de Trabajo de Desarrollo de Colecciones de los Expertos en Descubrimiento de Datos de Portage (Canadá)  describe un piloto para facilitar el descubrimiento de sus colecciones de datos  a través de la herramienta de búsqueda RFID (Research Data Repository) en el que participa un consorcio de diez repositorios de datos de investigación canadienses.

El informe analiza las distintas tipologías de repositorios de datos de investigación, describe los criterios de selección a partir de los cuales se seleccionó un conjunto de diez repositorios de datos de investigación canadienses para un proyecto piloto y proporciona las lecciones aprendidas y recomendaciones resultantes de esta revisión.

¿Qué se necesita para implementar una transformación digital basada en la gestión de datos?

2067383

Demarest, G. and J. Scott. [e-Book]  Architect’s Guide to Implementing: a Digital Transformation. Newton, Massachusetts, O’Really, 2017

Texto completo

 

En su nuevo libro, George Demarest presenta la historia de cómo las organizaciones progresan a través de cuatro fases de transformación digital:

Fase 1: Experimentación – Comprensión de las capacidades del gran ecosistema de datos.

Fase 2: Implementación – Desarrollo de los primeros casos de uso de producción para procesos de negocio digitales.

Fase 3: Expansión – Expansión a procesos de uso múltiple en toda la empresa.

Fase 4: Optimización – integración y convergencia de datos, aplicaciones y procesos.

Los casos de uso y los ejemplos de este libro se basan en cientos de contratos con clientes de MapR. Este libro recoge casos de uso y estudios de casos de clientes, así como consejos prácticos sobre cómo se puede transformar su organización en un negocio basado en datos.

Aprender a amar la ciencia de los datos

51wt4dpacjl-_sx345_bo1204203200_

Barlow, M. (2017). [e-Book] Learning to Love Data Science, O’Reilly Media, 2017

Texto completo

Hasta hace poco mucha gente pensaba que los «big data» eran una moda pasajera, y que la «ciencia de los datos» era un término misterioso. Hoy en día los  datos masivos son tomados en serio, y la ciencia de los datos se considera como atractiva. Esta antología de informes del  periodista Mike Barlow, ayudará a apreciar cómo la ciencia de los datos está cambiando nuestro mundo. Barlow describe de manera fácilmente entendible el espacio de datos emergentes y explica las nuevas técnicas y herramientas sobre el uso de datos para el bien social.

A través de esta antología, aprenderemos cómo:

  • Los analistas obtienen resultados de sus consultas de datos casi en tiempo  real.
  • Los fabricantes están difuminando las líneas entre el hardware y el software.
  • Las empresas tratan de equilibrar su deseo de rápida innovación con la necesidad de reforzar la seguridad de los datos.
  • La analítica avanzada y los sensores de bajo costo están transformando el mantenimiento de equipos de un centro de coste a un centro de beneficio.
  • Las nuevas herramientas de análisis permiten a las empresas ir más allá del análisis de datos  directamente a la toma de decisiones.

¿Dónde puedo depositar un documento si no dispongo de un repositorio institucional o temático de mi área de conocimiento?

35384396604_a2cf0c9615_b_d

Si no se dispone de un repositorio institucional o de áreas temáticas reconocido, los investigadores pueden considerar el uso de repositorios generalistas como Dryad , FigShare y Zenodo.

Es conveniente recordar que el repositorio no es una alternativa a las revistas; simplemente es una herramienta que contribuye a favorecer la visibilidad de la entidad y de sus investigadores; ya que este contenido –sus metadatos– son recogidos por recolectores generales y especializados que contribuirán decisivamente a su difusión. El repositorio supone una ventaja competitiva para la propia organización que proporciona un valor añadido, que es el acceso libre a su producción científica, a la vez que incrementa la visibilidad y el impacto propio y de sus investigadores llegando a ser en palabras de Kircz “el metabolismo central del conocimiento”

Frecuentemente se plantea si es mejor depositar en un repositorio institucional o uno disciplinares mejor depositar en un repositorio institucional o uno disciplinar; decir al respecto que no es excluyente el que el documento se deposite en uno u otro, o en ambos a la vez; es perfectamente factible que el autor deposite el documento en su página personal, también en el archivo de su institución y en un repositorio temático.

Aquí recogemos algunos de los repositorios institucionales por disciplinas que serán de interés para aquellos investigadores que no dispongan de repositorio institucional o bien quieran estar presentes en ambos canales para así tener mayor visibilidad.

Si bien, cuándo deposito un documento en acceso abierto ¿cómo se si es legal o no hacerlo? Esta es la preocupación más común entre los investigadores que desean autoarchivar sus obras en acceso abierto. Para asegurarse existen dos bases de datos que nos informan de las políticas de las revistas. Dulcinea para los artículos de revistas españoles y SHERPA/ROMEO cuando hayamos publicado en revistas de ámbito internacional

REPOSITORIOS TEMÁTICOS

Agricultura

AgriXiv

https://osf.io/preprints/agrixiv

Artes y Humanidades

OSF Preprints

https://osf.io/preprints/discover?subject=Arts%20and%20Humanities

Biblioteconomia

E-LIS.

http://eprints.rclis.org

DList (Digital Library Information Science & Technology).

http://dlist.sir.arizona.edu

LIS scholary Archive

https://osf.io/preprints/lissa/discover

Biomedicina

BioMed Central.

http://www.biomedcentral.com

BITTS

https://osf.io/preprints/bitss/discover

PubMed Central.

http://www.pubmedcentral.gov

Highwire.

http://highwire.stanford.edu/

Scielo.

http://scielo.isciii.es/scielo.php/lng_es

NetPrints: Clinicl Medicine & Health Research.

http://clinmed.netprints.org/home.dtl

 

Ciencia y Tecnología

National Science Digital Library (NSDL).

http://nsdl.org/

Citebase.

http://citebase.eprints.org/cgi-bin/search

Economia

REPEC.

http://www.repec.org/

Derecho

LawArXiv: Legal Scholarship in the Open

https://osf.io/preprints/lawarxiv

 

Física

ArXiv.

http://es.arxiv.org/

FiArchon.

http://archon.cs.odu.edu/

Institute of Physics.

http://www.iop.org/EJ/

NASA Technical Report Server.

http://ntrs.nasa.gov/?method=advanced

CERN Document Server (CDS).

http://cdsweb.cern.ch/?ln=en

 

Informática

Ncstrl.

http://www.ncstrl.org/

Citeseer.

http://citeseer.ist.psu.edu/

Computer Research Repository (CoRR).

http://uk.arxiv.org/archive/cs/intro.html

Ingeniería

engrXiv

https://osf.io/preprints/engrxiv/discover

 

Psicologia

CogPrints.

http://cogprints.soton.ac.uk/

Mindrxiv

https://osf.io/preprints/mindrxiv/discover

Psyarxiv

https://osf.io/preprints/psyarxiv/discover

Lingüística 

Open Language Archives Community.

http://www.language-archives.org/

 

Matemáticas

Mathematics Preprint Server.

http://www.ams.org/global-preprints/special-server.html

ArXiv.

http://es.arxiv.org/

 

Química

ChemWeb.com.

http://chemweb.com/

 

Sociología

SocArxiv https://osf.io/preprints/#socarxiv

 

Tesis doctorales

Digital Library of MIT Theses.

http://theses.mit.edu/

Tesis Doctorales en Red de las Universidades de Cataluña.

http://www.tdr.cesca.es/index_tdx_cs.html

 

Varios

D-Space, MIT.

https://dspace.mit.edu/index.jsp

E-PrintsUCM, Universidad Complutense de Madrid.

http://www.ucm.es/eprints

European Patent Office.

http://www.european-patent-office.org/index.en.php

Digital Library of the Commons (DLC).

http://dlc.dlib.indiana.edu/view/subjects/

Ibiblio Archivo Digital (por CDU).

http://www.ibiblio.org/collection

The Infomine Scholarly Internet Resource Collection.

http://infomine.ucr.edu/

JISC Information Environment Service Registry (IESR).

http://iesr.ac.uk/

Oaister.

http://oaister.umdl.umich.edu/o/oaister/

 

Video

 

Open Video.

http://www.open-video.org/

 

Desarrollo de flujos de trabajo para científicos de datos

development-workflows-1

Development Workflows for Data Scientists. O’Reilly Media, 2017

Texto completo

GitHub se asoció con O’Reilly Media para examinar cómo los equipos de análisis de datos de varias organizaciones están mejorando la forma en que definen, aplican y automatizan los flujos de trabajo basados en servicios de datos.

  • Definición de la estructura y las funciones del equipo
  • Preguntas interesantes
  • Examen de trabajos previos
  • Recolección, exploración y modelado de datos
  • Prueba, documentación e implementación de códigosde producción
  • Comunicación de los resultados

Este informe esclarecedor muestra cómo, a pesar de que el ritmo de cambio es rápido y el deseo por el conocimiento y la visión de los datos es cada vez mayor, las disciplinas duales de ingeniería de software y la ciencia de los datos están a la altura de la tarea.

 

Open Data: base de datos sobre información de la historia del clima de la tierra desde hace 2.000 años

 

PDFsdata201788-f1

 

«A global multiproxy database for temperature reconstructions of the Common Era.» vol. 4, n. (2017). pp. 170088. http://dx.doi.org/10.1038/sdata.2017.88

PDF

La base de datos contiene la historia del clima de la Tierra desde hace 2.000 años
Los científicos del clima podrán estudiar con mayor precisión los cambios de temperatura de la Tierra, gracias a una base de datos global compilada con la ayuda de una Universidad Victoria de Wellington y GNS Science. Siendo la única herramienta para probar y verificar de forma independiente los modelos climáticos más allá de los últimos cuarenta años. PAGES ha publicado la base de datos como un recurso abierto, lo que permite a cualquiera descargar y utilizar los datos.

 

Es la colección más completa de información sobre el cambio de temperatura global de todos los tiempos, los datos que proporciona han tardado más de 2 años en reunirse. La base de datos reúne cerca de 700 registros de 648 localidades, compilados por 98 expertos regionales de 22 países, incluyendo todas las regiones continentales y las principales cuencas oceánicas. El proyecto fue coordinado por la red de científicos paleoclimáticos internacionales de PAGES (Past Global Changes)

La base de datos recoge información sobre la temperatura del pasado basada en la evidencia de varias fuentes de información, incluyendo anillos de árboles, corales, glaciares y sedimentos marinos y lacustres. La base de datos permite evaluar críticamente y mejorar los modelos de sistemas de tierra utilizados para proporcionar proyecciones futuras. La importancia de esta base de datos es que proporciona información muy necesaria sobre tendencias y patrones regionales de temperatura.

la colección completa se archiva como archivos pdf en Data Citation 1: figshare (Data Citation 1: figshare https://doi.org/10.6084/m9.figshare.c.3285353

PAGES 2k Consortium, figshare https://doi.org/10.6084/m9.figshare.c.3285353 (2017).

 

 

 

Curación de datos de investigación: estrategias prácticas para un repositorio digital

curating20research_220vols20cover

Johnston, L. R. (ed). [e-Book] Curating research data: Practical Strategies for Your Digital Repository. Volume one: practical strategies for your digital repository. Chicago, ACRL, 2017.

Vol 1. Volume One: Practical
Strategies for Your Digital
Repository

Vol. 2. A Handbook
of Current Practice

Los datos digitales están omnipresentes y cambian rápidamente en la medida que progresa la investigación actual y en el futuro. La capacidad de información de los bibliotecarios puede ayudar a asegurar la resiliencia de los datos digitales y la información que representa, al tratar que significado que tiene la integridad y la procedencia de los datos digitales generados por los investigadores de hoy se capturan y serán transmitidos a los futuros investigadores.

Los datos se están convirtiendo en la moneda proverbial del reino digital: un producto de investigación que podría adquirir crédito de reputación en una cultura disciplinaria de intercambio de datos, o comprar transparencia cuando se enfrentan a mandatos de agencias de financiamiento o escrutinio de editores. A diferencia de la mayoría de los sistemas monetarios, sin embargo, los datos digitales pueden fluir en una abundancia continua. Por otra parte, la magnitud de de los datos digitales desafía el papel tradicional del bibliotecario, ya los profesionales de la ciencia de la información deben de aprovechar este flujo de la información que fluye del descubrimiento de la investigación y de la búsqueda académica para preservar estas evidencias para el uso futuro.

El Volumen Uno de Curating Research Data analiza una variedad de razones y motivaciones para explicar por qué los servicios de recuperación de datos son necesarios en el contexto de los esfuerzos que están desarrollando los repositorio de datos académicos y disciplinarios. El libro se compone de doce capítulos, divididos en tres partes, que proporcionan una visión en profundidad de la práctica compleja de la curación de datos. La Parte I establece el escenario para la recuperación de datos describiendo las políticas actuales, los modelos de intercambio de datos y los esfuerzos de colaboración actualmente en curso que afectan a los servicios potenciales. La Parte II estudia varias cuestiones clave, como la recuperación de costos y la estrategia de marketing, un tema de gran interés para los profesionales que están pensando en implementar servicios de datos. Por último, la Parte III describe el ciclo de vida completo de los datos mediante el examen de los problemas de reutilización ética y práctica que los profesionales de la conservación de datos deben tener en cuenta a medida que nos esforzamos por preparar los datos para el futuro.

Big Data: tecnologías disruptivas para un cambio en el juego

bigdataanalytics-sathi

 

Sathi, A. (2012). [e-Book]  Big Data Analytics: Disruptive Technologies for Changing the Game, IBM, 2012.

Texto completo

 

Este libro recopila varios casos y experiencias de uso de los Big Data, y a partir de ellas hace algunas consideraciones sobre la arquitectura y el surgimiento de nuevos espacios de observación (sociales, geoespaciales, etc.), además de cubrir algunos de los problemas más delicados relacionados con la privacidad de los datos. El espacio de observación de una organización disponible (datos que pueden obtener en sus manos dentro de la ley y la política) está creciendo más rápido que su capacidad de darle sentido. A medida que las organizaciones luchan por mantenerse al día, se ven obligadas a reconsiderar qué tipo de infraestructura será necesaria para aprovechar Big Data

Guía sobre cómo llegar a ser un científico de datos

ds_book

Big Data: The Numbers Game Deciphered : A Step-By-Step Guide, [e-Book]  simplilearn.com, 2017.

Texto completo

 

Como cada vez se producen más datos, existe la imperiante necesidad de obtener, organizar y analizar estos datos para hacerlos útiles. En términos simples, la ciencia de los datos consiste en la extracción de información útil a partir de los datos disponibles. Data Science se refiere a la recolección, reparación, análisis, visualización, gestión y preservación de la gran cantidad de datos que genera la sociedad del conocimiento. El libro es una guía informativa sobre como convertirse en un científico de los datos, una de las profesiones con mayor proyección de futuro, calificada por la revista  Harvard Business Review como «la profesión tecnológica más sexy del siglo XXI».

 

Una estadística reciente estima que cada día se crean alrededor de 2.5 quintilliones de bytes de datos, y que el 90% de los datos que existen actualmente en el mundo se han generado en los últimos dos años. Big Data es un término popular utilizado para definir los inmensos y complejos conjuntos de datos que están desafiando la capacidad y los métodos tradicionales de  análisis de procesamiento de datos.

Sin embargo, estos datos por si mismos no son útiles sin que previamente hayan sido analizados y procesados. La ciencia de los datos aporta los conocimientos y procesos necesarios para que estos datos puedan ser utilizados por instituciones y empresas para hacerlos reutilizables, y de esta manera ayudar en una mejor toma de decisiones. La principal razón que hay detrás del  uso de Big Data es recopilar datos de todas las fuentes, aprovechar los datos pertinentes y analizarlos para encontrar respuestas a las preguntas clave relacionadas con los negocios y la investigación.

El libro es una guía informativa sobre como llegar a ser un científico de datos. Una profesión que en opinión de Harvard Business Review es «el trabajo de tecnología más sexy del siglo XXI». La guía responde a las siguientes cuestiones ¿Qué hacen los científicos de datos? ¿Cuáles son los pre-requisitos para convertirse en un científico de datos? ¿Qué habilidades son imprescindibles? ¿Cuál es el programa de estudios de la ciencia de los datos? ¿Cómo trabajará en el futuro un científico de datos?

En resumen, la ciencia de los datos contribuye a una reducción de costos, reducción de tiempo, desarrollo y optimización de nuevos productos, y a una toma de decisiones más inteligente  y rápida.

 

 

 

 

Valoración e impacto de los datos de investigación: curación y recursos compartidos

 

synthesis1-211x300

Beagrie, N. and Houghton J.W. (2014) The Value and Impact of Data Sharing and Curation: A synthesis of three recent studies of UK research data centres, Jisc. PDF (24 pages)

Texto completo

La GDI es la base de la investigacion actual y del futuro, pero también de los mandatos de financiación, repositorios de acceso abierto, la reputación de los investigadores y los rankings institucionales. Sin embargo, la sostenibilidad financiera de una adecuada gestión de datos requiere de una importante inversión. Ya que los costos que implica la implementación y mantenimiento de repositorios de datos son mucho más cuantiosos que los necesarios para repositorios institucionals tradicionales. Aun así, la institución debe iniciar una política de datos, ya que los beneficios de un servicio de gestión de datos son mucho mayores en términos de investigación e impacto que los altos costos asociados a su implementación como demuestra esta investigación. Además de ser un servicio ineludible a medio plazo si se quiere seguir siendo competitivo

Este informe pretende resumir y reflexionar sobre los resultados de una serie de estudios realizados por Neil Beagrie de Charles Beagrie y John Houghton de la Universidad de Victoria, en torno al valor y el impacto de tres centros de datos de investigación: the Economic and Social Data Service (ESDS), the Archaeology Data Service (ADS), and the British Atmospheric Data Centre (BADC). Se proporciona un resumen de las principales conclusiones de la investigación y reflexionan sobre: los métodos que se pueden utilizar para recopilar datos; los métodos analíticos que se pueden utilizar para explorar de valor, impactos, costos y beneficios; y las lecciones aprendidas y recomendaciones derivadas de la serie de estudios en su conjunto.

Los estudios de los centros de datos combinan los enfoques cuantitativos y cualitativos con el fin de cuantificar el valor en términos económicos y otros impactos y beneficios no económicos. Los tres estudios muestran un patrón similar de resultados, con el intercambio de datos a través de los centros de datos que tienen un gran impacto medible en la eficiencia de la investigación y el retorno de la inversión sobre los propios datos y servicios. Estos hallazgos son importantes para los proveedores de fondos, tanto para el caso económico para la inversión en la infraestructura de datos de curación, como para el intercambio de datos y la propia  investigación, para asegurar la sostenibilidad de este tipo de centros de datos de investigación.

El análisis económico cuantitativo indica que:
· El valor para los usuarios excede la inversión hecha en el intercambio de datos y la preservación a través de los centros en los tres casos – con los beneficios de 2,2 a 2,7 veces los costes.
· Aumentos muy significativos en la eficiencia del trabajo por parte de los usuarios como consecuencia del uso de los centros y servicios de datos – con aumento de la eficiencia de entre 2 a 20 veces sobre los costos.
· Al facilitar el uso adicional, los centros de datos aumentan significativamente los rendimientos de la inversión en la creación / recogida de los datos alojados – con incrementos en los rendimientos de entre 2 a 12 veces sobre los costos.
El análisis cualitativo indica que:
· Por su parte, los usuarios académicos informan que los beneficios de la implementación de centros de datos son muy o extremadamente importantes para su investigación, pues en opinión de entre el 53% y el 61% de los encuestados la no disponibilidad de un servicio de datos hubiera tenido un impacto grave o muy grave sobre su trabajo.
· Para los depositantes, que tiene los datos conservados a largo plazo y garantizada su difusión a la comunidad académica, estos servicio son vistos como los aspectos más beneficiosos de depositar de datos en este tipo de centros. Además el depósito de datos incrementa las posibilidades de ser citados.

Un objetivo importante de este estudios fue el de contribuir al desarrollo de métodos de evaluación de impacto que pueden proporcionar estimaciones del valor y los beneficios de la infraestructura de datos de investigación y las inversiones. Esta síntesis se refleja las lecciones aprendidas y proporciona una serie de recomendaciones que podrían ayudar a desarrollar futuros estudios de este tipo. Las áreas clave para la investigación adicional incluyen: extender tales estudio a nuevos centros o a centros de menores niveles de agregación.