Archivo de la etiqueta: Gestión de datos de investigación

Papel de los bibliotecarios en la gestión de datos de investigación

librarianroles

La sociedad TIC propicia y requiere un diluvio universal de datos, procesarlos, entenderlos y transformarlos en decisiones de valor es el reto del análisis big data. Los llamados “Big Data” es un término utilizado para referirse a la explosión de una ingente cantidad y diversidad de datos digitales de alta frecuencia, se están  convirtiendo en un elemento esencial para la competencia, y en un futuro inmediato serán clave para el crecimiento de la productividad, la innovación y la posibilidad de generar el suficiente excedente para las sostenibilidad de la sociedad. Y la gestión de los datos de investigación (Big Data) se plantea como uno de los grandes retos que han de asumir durante los próximos años las bibliotecas científicas y de investigación.(Erway, R. and A. Rinehart, 2016)

Según estima idC hoy hay muchos más datos se incrementan un 50% al año, o sea que se duplican cada dos años. Áreas tan variadas como la ciencia y los deportes, la publicidad y la salud pública, se ha producido un salto hacia el descubrimiento y la toma de decisiones a partir de los datos. La Ciencia Datos se refiere a un área emergente de trabajo se ocupa de la recogida, preparación, análisis, visualización, administración y conservación de grandes colecciones de información. Aunque el nombre de Datos Científicos parece conectar más fuertemente con áreas tales como bases de datos y la informática, incluye muchos tipos diferentes de habilidades – incluyendo habilidades no-matemáticas -. Casi todos los analistas consideran “Big Data” como una de las tendencias de futuro que tendrán que tener en cuenta la mayoría de las empresas e instituciones. (Wanner, Amanda, 2015)

Durante siglos los bibliotecarios hemos sido expertos en la organización de las colecciones y saber cómo encontrar las cosas. La transición a los formatos digitales ha traído consigo un enorme volumen de datos que necesita ser curados como los relativos a descargas, citas, citas de patentes y la cobertura de los medios de comunicación. Todo ello ha ido acrecentando las competencias y habilidades de los bibliotecarios como uno de los segmentos profesionales más capacitados para la gestión de grandes cantidades de datos. ( Taylor Stang, 2016)

La Gestión de Datos de Investigación (RDM) es un proceso diseñado para gestionar y difundir conjuntos de datos de alta calidad, que cumplan con los requisitos académicos, legales y éticos. Que debe tener en cuenta ¿Quién posee los datos? ¿Qué requisitos son impuestos por otros? ¿Qué datos deben conservarse? Por cuánto tiempo deben conservarse estos datos? ¿Cómo deben ser preservado de datos digitales? ¿Existen consideraciones éticas? ¿Cómo se accede a los datos? ¿Cómo deben ofrecerse los datos? ¿Cómo se manejarán los costos? ¿Cuáles son las alternativas para la gestión de datos locales? a través de dos líneas 1. La preservación a largo plazo de los conjuntos de datos mediante sistemas de almacenamiento 2. Compartir y reutilización de los conjuntos de datos para la investigación y otros fines en la sociedad en general.

El análisis de las necesidades de datos de los investigadores a través de dominios institucionales puede requerir de la participación de la biblioteca para identificar y conectar a los investigadores en todas las unidades funcionales, tanto formales e informales para compartir, analizar, y reutilizar datos.Y los bibliotecarios pueden utilizar su experiencia para etiquetar y organizar este tipo de información, haciendo una contribución estratégica a su institución. De hecho los bibliotecarios llevamos algunos años desplegando conocimientos técnicos y expertos en promover y apoyar la gestión de repositorios y el intercambio de datos abiertos, por lo que la gestión de datos de investigación ha de formar parte de un desarrollo natural en nuestras tareas y funciones. Según MJ Tooey bibliotecaria de la University of Maryland  «Tenemos el conjunto de habilidades necesarias para organizar las cosas. Entendemos los vocabularios controlados. Entendemos las ontologías. Sabeos como organizar la información. Hemos realizado la evolución de la palabra impresa y el encabezamiento de materia a los datos como un proceso natural. Así que estamos preparados para ayudar a la gente a organizar, acceder y almacenar datos»

Las bibliotecas estadounidenses ya están respondiendo a esta nueva misión a través de una variedad de servicios, aproximadamente la mitad de todas las bibliotecas universitarias tienen algún tipo de programa de apoyo a la gestión de datos. Los bibliotecarios también están haciendo un trabajo interesante para ayudar a gestionar esta evolución basada en los principios de apertura e interoperabilidad. Esta práctica es necesaria para la transición desde la idea tradicional que se tiene de una “infraestructura de datos” centrada en torno a las revistas especializadas o repositorios institucionales en un sistema más robusto centrado en los datos de investigación. La creación de este nuevo ecosistema requerirá de la evolución en muchas áreas, incluyendo el desarrollo de nuevos estándares en torno a la validación de los datos de la investigación, los procedimientos para documentar la procedencia de los conjuntos de datos, y los nuevos modos de gestión y propiedad de los datos de la investigación. Así los bibliotecarios se están mostrando activos en todos estos espacios. Las bibliotecas tienen  identificadores de objetos digitales (DOI) que identifican los conjuntos de datos específicos utilizando servicios como DataCite y EZID. Organizaciones como JISC han desarrollado RDMRose un proyecto para producir materiales de aprendizaje para el desarrollo profesional continuo (DPC) en Gestión de Datos de Investigación (RDM) para los profesionales de la información. También será de gran ayuda el documento publicado por OCLC Role of Libraries in Data Curation sobre el papel de las bibliotecas el proyecto los “curación” de datos.

En conclusión, la adecuada gestión de datos es fundamental para los datos de investigación de alta calidad y, por tanto, la investigación de excelencia, es crucial para facilitar el intercambio de datos y asegurar la sostenibilidad y la accesibilidad de los datos a largo plazo y por lo tanto su reutilización para la ciencia futura. Siendo determinante la labor de la biblioteca en el apoyo a los investigadores de cara a gestionar y compartir datos a través de herramientas, la orientación sobre el tema a investigadores, la formación práctica; así como facilitar la citación y vinculación de los datos con publicaciones con el objetivo de proporcionar mayor visibilidad y accesibilidad de los datos y la investigación misma. Erway, R., L. Horton, et al. (2016)

Sin embargo, los desafíos son muchos; éstos incluyen el aprendizaje sobre los principios de gestión de datos de investigación (RDM), los problemas, la evaluación de las instituciones con mayores necesidades, selección y aplicación de un entorno de almacenamiento, colaboración con investigadores para transmitir la importancia del proyecto, la preparación de materiales de formación, la construcción de conocimientos técnicos entre personal de la biblioteca, y el establecimiento de directrices de metadatos. Por eso las escuelas que forman a los profesionales de las bibliotecas están introduciendo la curación de datos y la Gestión de Datos de Investigación (RDM) en sus planes de estudios para preparar la próxima generación de profesionales de la información y formando a bibliotecarios a través de cursos para la asunción de estos nuevos roles.

Bibliografía

Learning about research data in the lab at the Pitt iSchool By Liz Lyon, University of Pittsburgh | Oct 23, 2014

Librarians: the new research data management experts : How growth in research data is spurring a shift in the librarian’s role By Taylor Stang  Posted on 3 May 2016

Erway, R., L. Horton, et al. . [e-Book] Building Blocks: Laying the Foundation for a Research Data Management Program. Dublin, Ohio, OCLC, 2016.

Erway, R. and A. Rinehart (2016). [e-Book] If You Build It, Will They Fund? Making Research Data Management Sustainable OCLC, 2016.

Wanner, AmandaData literacy instruction in academic libraries: best practices for librarians. Archival and Information Studies Student Journal 2015 – Spring

 

DataSearch: el metabuscador de datos de investigación de Elsevier

29183583306_152b22c8cd_c_d

https://datasearch.elsevier.com/

Más información sobre Gestión de datos de Investigación en UA

Los datos que apoyan los resultados finales de una publicación son de una importancia crucial para la investigación del siglo XXI. El alcance y la eficacia de los flujos de trabajo que dan lugar a una investigación implica que esta información este disponible para su interpretación, reinterpretación o reutilización en set de datos debidamente organizados y estructurados.

Los datos de la investigación son la base sobre la que se construye el conocimiento científico, técnico y médico. A menudo estos conjuntos de datos no salen del laboratorio y quedan simplemente como archivos complementarios de la investigación publicada, sin ser accesibles a otros investigadores. Si nos ceñimos al ámbito estrictamente económico la tarea de compilación de datos es la que más tiempo  e inversión financiera ocupa en el trabajo de un investigador. Son numerosas las investigaciones que para el mismo desarrollo vuelven a compilar conjuntos de datos que otros investigadores habían compilado previamente y no hicieron públicos, con la consiguiente perdida de energía en términos de tiempo y dinero. Por lo cual la publicación de los datos de investigación es crucial para los autores, pues al hacerlos públicos están proporcionando un espectro completo de su trabajo, lo que a su vez redundará en unos más amplios beneficios para la comunidad de investigación, ya que así otros investigadores podrán tener la capacidad de  descubrir, replicar y reutilizar esos datos.

El nuevo motor de búsqueda DataSearch permite buscar conjuntos de datos de investigación a través de numerosos dominios y tipos (imagenes, documentos, datos brutos.. etc.)  a partir de una conjunto de repositorios de datos. Los motores de búsqueda generales son útiles, pero sin embargo cuando se trata de encontrar información específica adaptada a las necesidades del investigador moderno se requiere una aplicación más específica. De este modo teniendo en cuenta los mejores repositorios de datos de investigación Elsevier ha desarrollado DataSearch un buscador multidominio donde los investigadores del siglo XXI pueden encontrar fácilmente los conjuntos de datos que necesitan para su trabajo. De momento el buscador está aun en versión Beta, y se admiten sugerencias de mejora.

screencapture-datasearch-elsevier-com-1471271188574

Interfaz de DataSearch

Las fuentes de datos cubiertas por DataSearch son:

Análisis del entorno de las bibliotecas universitarias y de investigación ACRL 2015

environmentalscan

Environmental Scan 2015, ACRL Research Planning and Review Committee, [e-Book]  ACRL, 2015.

Texto completo

Cada dos años, el Comité de Planificación y Análisis de Investigación ACRL realiza un análisis del entorno de la educación superior, en la que se tiene en cuenta el potencial de impacto en las bibliotecas universitarias. La exploración del entorno 2015 ofrece una amplia revisión del actual panorama de la educación superior, con especial atención a la situación de las bibliotecas universitarias y de investigación. El documento se basa en informes anteriores de ACRL, incluyendo las principales tendencias en las bibliotecas universitarias.

En un momento de creciente desigualdad económica en los Estados Unidos,que en el contexto educativo se correlaciona con el nivel de ingresos y la asequibilidad de la educación superior, que se ha convertido en un tema frecuente en los medios de comunicación. A su vez los niveles de financiación de la investigación han disminuido, lo que lleva a un cada vez más competitivo. Al mismo tiempo, se vislumbra la necesidad de una gestión adecuada de los datos de uso intensivo en los dominios de la investigación, lo que implica que se deban introducir nuevos requisitos de infraestructura, servicios de gestión. Por ello el gobierno federal ha emitido mandatos de acceso abierto para la investigación científica financiada por organismos públicos. Las agencias federales han presentado y están revisando actualmente la liberación de los planes para cumplir con estas políticas.

Por otra parte la tecnología está avanzando hacia nuevos modelos en la educación superior. Los modelos de educación abierta ofrecen alternativas convenientes a los programas tradicionales basados en la presencialidad. los Cursos Abiertos Masivos en Línea (MOOCs) y los modelos de educación basada en competencias (CBE) representan esas alternativas a tener en cuenta. El aprendizaje en línea es una opción atractiva para los estudiantes adultos, un grupo demográfico que ha sido el centro de muchas de las grandes instituciones con fines de lucro; estos estudiantes pueden completar los programas de grado y otras credenciales a un ritmo autodeterminado y un costo más bajo. El entorno actual «ofrece nuevas formas de conectar cosas que antes se consideraban dispares y «no-conectables ‘: las personas, los recursos, las experiencias, contenidos diversos, y las comunidades, así como a expertos y novatos, sistemas de enseñanza formales e informales, además de poder contar con tutores y asesores.

Las bibliotecas están reevaluando sus prácticas de adquisición y las estrategias de desarrollo de colecciones desde un enfoque más integral, particularmente a la luz de las nuevas diversificación del expediente académico (por ejemplo, recursos educativos abiertos objetos de aprendizaje, recursos digitales de libre acceso, etc.). Para hacer frente a esta nueva diversificación, Dempsey, Malpas y Lavoie (2014) ofrecen una matriz útil basada en la administración, la escasez, y la singularidad de los recursos que pueden proporcionar una guía para administradores de colecciones.

Repositorios de datos de investigación y de ciencia abierta

oscience

 

 

Los datos abiertos son considerados como «la nueva materia prima del siglo 21», sin embargo en la actualidad los datos de investigación quedan encerrados en repositorios de datos, oficinas de los investigadores, o en los organismos que lo crearon. La mayoría de las instituciones académicas, organizaciones de investigación, las principales editoriales requieren que los datos se presenten adecuadamente para poder utilizarlos y que estén disponibles para sus estudios.

Los datos se definen como abiertos cuando se pueden utilizar libremente, modificar y compartir por cualquiera para cualquier propósito , incluyendo la creación de un bien común en el que cualquiera puede participar. Los datos abiertos son de utilidad a millones de personas en todo el mundo, investigadores, empresas y ciudadanos. Pero para que puedan ser de utilidad es necesario crear aplicaciones, poner en marcha nuevos productos y servicios que mejoren la transparencia y la apertura.

En los últimos años, varias organizaciones científicas nacionales e internacionales han emitido declaraciones y políticas que subrayan la necesidad de un inmediato archivo de los datos, y algunos organismos de financiación han comenzado a exigir que los datos procedentes de investigaciones que financian sean depositados en un archivo público. Estas declaraciones de las principales agencias de financiación de la investigación demuestran que la ética del intercambio de datos es esencial para maximizar el impacto y los beneficios de la investigación. La experiencia ha demostrado que la dispersión de los datos aumenta el coste de procesamiento y la preservación de los datos, y que la inversión disminuye cuando se dispone de depósitos bien conformados. (ICPSR, 2012).

El problema es cómo seleccionar el mejor repositorio para buscar los conjuntos de datos específicos que se necesitan. Los repositorios de datos varían mucho en cuanto a sus contenidos, objetivos, métodos y políticas de acceso. Dependiendo de la materia o disciplina de investigación, los datos generalmente pueden ser depositados en más de un centro de datos o repositorio. Cada depósito tiene sus propios requisitos o especificaciones respecto a los datos que ofrece, sobre la base de la investigación objeto o de dominio, metadatos, formato de archivo y / o estructura de datos, y los tipos y la naturaleza de las políticas de reutilización de datos y de acceso.

Herramientas para la recopilación de Ciencia Abierta y Datos de Investigación.

 

GENERALES

  • Dryad Digital Repository, a resource for making the data from scientific publications discoverable, reusable, and citable
  • Elsevier DataSearch. Search for research data across domains and types, from many domain-specific, cross-domain and institutional data repositories.
  • Mendeley Data Put your research data online today
  • protocols.io Discover & share science protocol knowledge
  • re3data.org the global registry of research data repositories
  • Repositive Data discovery platform for human genomic data
  • OBF Promote the practice and philosophy of Open Source software development
  • Figshare Manage your research in the cloud
  • LabScribbles Blog about real-time open access science
  • Zenodo Share all research outputs from across all fields of science
  • OSF Platform that simplifies scientific collaboration

.

.

POR DISCIPLINAS (tomados de Springer Nature)

.

Biología

 

DNA DataBank of Japan (DDBJ)
EMBL Nucleotide Sequence Database (ENA)
GenBank
dbSNP
European Variation Archive (EVA)
dbVar
Database of Genomic Variants Archive (DGVa)
EBI Metagenomics
NCBI Trace Archive
NCBI Sequence Read Archive (SRA)
Protein Circular Dichroism Data Bank (PCDDB) 
Crystallography Open Database (COD) 
Coherent X-ray Imaging Data Bank (CXIDB) 
Biological Magnetic Resonance Data Bank (BMRB)
Electron Microscopy Data Bank (EMDB) 
Worldwide Protein Data Bank (wwPDB) 
Structural Biology Data Grid
NeuroMorpho.org 
Functional Connectomes Project International Neuroimaging Data-Sharing Initiative (FCP/INDI) 
OpenfMRI 

 

Ciencias sociales

Harvard Dataverse
UK Data Service ReShare
openICPSR
Open Science Framework
Archaeology Data Service

Ciencias naturales

 

NOAA National Centers for Environmental Information (formerly the National Climatic Data Center; NCDC)
Oak Ridge National Laboratory Distributed Active Archive Center (ORNL DAAC)
Cold and Arid Regions Science Data Center (Lanzhou, China) (CARD)
World Data Center for Climate at DRKZ (WDCC)
NERC Data Centres
LTER Network Information System Data Portal
PANGAEA
Australian Antarctic Data Centre (AADC)
EarthChem
Marine Geosciences Data System
Australian Ocean Data Network
SEANOE
NASA Goddard Earth Sciences Data and Information Services Center
AEKOS – TERN Ecoinformatics

 

Ciencias de la salud

National Addiction & HIV Data Archive Program (NAHDAP)
National Database for Autism Research (NDAR)
Cancer Imaging Archive
ClinicalTrials.gov
Virtual Skeleton Database (SICAS medical image repository)
PhysioNet
National Database for Clinical Trials related to Mental Illness (NDCT)
Research Domain Criteria Database (RDoCdb)

 

Física

Reaction Database Standard Search Interface
SIMBAD Astronomical Database
UK Solar System Data Centre
NoMaD Repository

 

Química

caNanoLab*
ChEMBL*
PubChem

 

 

 

 

¿Qué se necesita para hacerse profesional de la ciencia de los datos?

 

cat

Overton, J. (2016). [e-Book] Going Pro in Data Science: What It Takes to Succeed as a Professional Data Scientist, O’Really, 2016

 Texto completo

PDF

ePUB

Mobi

Todas tendencias apuntan a que la gestión de grandes cantidades de datos de investigación para hacerlos re-utilizables va a ser una de las tareas de futuro del profesional de las bibliotecas universitarias y de investigación. El problema es que aún no está muy claro como hacerlo adecuadamente. Ya que en lugar de datos de alta calidad con la velocidad correcta, formatos, variedad y volumen, los científicos tienen que trabajar con información incompleta y a veces incorrecta.

En este informe de O’Reilly, Jerry Overton-Ingeniero y líder mundial sobre datos y TICs de CSC-nos introduce a las mejores prácticas en la gestión de datos de investigación, lo cual nos llevará a la toma de las mejores decisiones en un mundo desordenado y complicado. Lo que él llama simplemente «la ciencia de datos que funciona» es un proceso de ensayo y error de crear y probar hipótesis, la recopilación de pruebas y sacar conclusiones. Estas habilidades son mucho más útiles para la práctica de científicos de datos que el dominio de los detalles de un algoritmo de aprendizaje.

Adaptado y ampliado a partir de una serie de artículos publicados en Overton O’Reilly Radar y en el blog de CSC, cada capítulo es una lección de conocimiento para los gestores y científicos de datos y aspirantes a serlo, que desean desarrollar un trabajo profesional.

El informe aborda cuestiones como

– Uso de un método científico para obtener una ventaja competitiva. El conjunto de habilidades que se necesita para llegar a ser un científico de datos.

– ¿Por qué la práctica es una parte clave para pensar como un científico de datos. Las mejores prácticas para una escritura de código sólida en la ciencia de datos.

– ¿Cómo una ágil experimentación permite encontrar respuestas mucho más rápido. – Recomendaciones para sobrevivir (e incluso prosperar) como un científico de datos en su organización.

Analítica del aprendizaje en la enseñanza superior: revisión de prácticas en UK y a nivel internacional

learning-analytics-in-higher-education

Sclater, N., A. Peasgood, et al. (2016). [e-Book] Learning Analytics in Higher Education A review of UK and international practice, JISC, 2016.

Texto completo

Cada vez que un estudiante interactúa con su universidad – va a la biblioteca, ingresa a su entorno de aprendizaje virtual o hace una presentación de las evaluaciones en línea – deja tras de sí una huella digital. El  análisis del aprendizaje es el proceso de utilizar estos datos para mejorar el aprendizaje y la enseñanza. Aprender Analytics se refiere a la medición, recopilación, análisis y presentación de datos sobre el progreso de los estudiantes y de los contextos en los que tiene lugar el aprendizaje. Utilizando la mayor disponibilidad de grandes conjuntos de datos sobre la actividad de los estudiantes y sus huellas digitales en entornos de aprendizaje, el análisis del aprendizaje nos llevan más allá de los datos disponibles en la actualidad.

Este informe documenta los usos emergentes de la analítica de aprendizaje en los Estados Unidos, Australia y el Reino Unido. A través de una serie de once estudios de caso se presenta una visión general de los datos actualmente disponibles sobre el impacto que están teniendo en análisis de la enseñanza y el aprendizaje – y pone de relieve algunas de las oportunidades para el sector de la educación superior del Reino Unido. Dado el enfoque actual de la excelencia de la enseñanzaen el sector de la educación superior, el infortme será de interés para los responsables políticos y líderes institucionales por igual.

students-sharing-data-using-mobile-devices

¿Cuánta información? 2013: Informe sobre los consumidores estadounidenses

 

Bohn, R. and J. E. Short (2013). [e-Book]  How Much Information? 2013: Report on American Consumers. San Diego, American Consumers, 2013.

Descargar

Para 2015, se estima que los estadounidenses consuman tanto en los medios tradicionales y digitales más de 1,7 billones de horas, un promedio de aproximadamente 15 horas y media por persona al día. La cantidad consumida en los medios de comunicación  superará 8,75 zettabytes por año, o 74 gigabytes – el equivalente a 9 DVDs de datos por consumidor medio en un día normal. Un zetabyte es 10 elevado a los bytes de potencia 21a, un millón de millones de gigabytes. Estas estimaciones provienen de un análisis de más de 30 fuentes de datos de diferentes medios de comunicación, que van desde los medios tradicionales (TV, Radio, telefonía de voz) a nuevas fuentes digitales (tablets, dispositivos de juegos móviles, smartphones, vídeo móvil). Los medios que se consumen en el trabajo no está incluidos.

Definimos los medios consumidos como flujos de datos consumidos por los hogares y las personas, y se midió el tiempo de consumo y el rendimiento de bytes de los datos facilitados. Las fuentes de vídeo dominan el consumo de bytes, con 3,8 zettabytes procedentes de la televisión y 2,46 zettabytes de juegos de ordenador. Si las horas se utilizan como la medición, los medios consumidos son de mucha más amplia distribución, con cantidades sustanciales de radio, aplicaciones de Internet, como redes sociales, navegación y búsqueda, y otros, incluyendo las comunicaciones de mensajería y correo electrónico.Todos resultados son estimaciones, basadas en datos dados a conocer públicamente por los proveedores de datos, incluyendo Nielsen y ComScore, a través de las revelaciones proporcionadas por las compañías de medios y los analistas.

Las horas de consumo crecieron en un poco más allá del 5% desde el año 2008 hasta el 2013, debido a una combinación de aumento de horas de visualización per cápita, a partir de 11 horas por día a un promedio de más de 14 horas por día. En promedio de todos los medios de comunicación, los medios de comunicación consumidos en bytes está creciendo a un ritmo del 18% anual. Esto es menos de la capacidad de procesamiento de datos, impulsados por la Ley de Moore, el aumento de al menos el 30 por ciento al año, pero sigue siendo impresionante.

Los medios tradicionales continúan dominando nuestro consumo de los medios de comunicación todos los días, ya que solo la TV y la Radio ocupan el 60% de las horas. Las nuevas fuentes digitales, sin embargo, están teniendo efectos importantes en la mayoría de las formas de consumo de medios. Más de la mitad de todos los bytes de los medios de comunicación son ahora consumidos por ordenadores, que con los equipos móviles es el segmento de más rápido crecimiento. En 2008, los dispositivos móviles representaron aproximadamente el 3% de todos los bytes consumidos, para el año 2013 son casi un 10%, lo que representa una tasa de crecimiento interanual del 27 por ciento.

Mientras que en el consumo de medios de comunicación durante el pasado era abrumadoramente pasivo – nos sentábamos y veíamos la televisión o escuchamos la radio – el nuevo consumo de medios es cada vez más interactivo, con el retardo de tiempo, la multitarea y la interrupción de la audiencia se esta cambiando rápidamente en el comportamiento típico de consumo.

¿Cuánta información? Informe sobre los consumidores estadounidenses

Bohn, R. and J. E. Short. [e-Book] How Much Information? 2009 Report on American Consumers. San Diego, American Consumers, 2010.

Decargar

La evolución del consumo de información de EE.UU. en las últimas décadas. Durante los años 60 del pasado siglo la radio era un medio de comunicación importante, casi imprescindible, tal y como vemos en el gráfico inferior. Durante los años 80 se produce un desplazamiento de los medios escritos con la ampliación del ámbito de influencia de la televisión, sin embargo la radio gana aceptación.

La evolución del consumo de información de EE.UU. en las últimas décadas.

Comparando el volumen de palabras consumidas por los estadounidenses (fuera del lugar de trabajo), la participación de los medios impresos se redujo drásticamente desde los años 60 desde un 26 por ciento hasta apenas el 9 por ciento en 2008. Y desde la revolución de la entrada de los ordenadores personales en 1981, las computadoras como fuente de información se dispararon al 27 por ciento del total de palabras consumidas el año pasado por los hogares estadounidenses.

En los años iniciales del nuevo siglo hasta 2009 aumenta el uso del ordenador. Y disminuyen los medios tradicionales como el impreso, radio y televisión. Contrariamente a la percepción común, la lectura ha aumentado, debido al crecimiento de cosas para leer a través de los ordenadores como son los blogs y páginas web disponibles en internet.  La lectura que estaba en decadencia debido al crecimiento de la televisión, se triplicó desde 1980 hasta 2008, ya que es la forma abrumadoramente preferida recibir información en Internet.

Si bien, los medios tradicionales como la radio y televisión siguen dominando nuestro consumo diario, con un total de 60 por ciento de las horas. En total, más de las tres cuartas partes del tiempo de información hogares estadounidenses se consume en fuentes no informáticas. A pesar de esto, los ordenadores han tenido efectos importantes en algunos aspectos de consumo de información. En el pasado, el consumo de información fue abrumadoramente pasivo, gracias a los ordenadores, un tercio de las palabras y más de la mitad de los bytes se reciben ahora interactivamente.

Los hogares estadounidenses consumieron aproximadamente 3,6 zettabytes de información en el año 2008, de acuerdo con el informe “¿Cuánta información 2009 Informe sobre los consumidores estadounidenses,?” publicado por la Universidad de California, San Diego. Uno zetabyte es 1000000000 billón de bytes, y el total de bytes consumidos el año pasado fue el equivalente a la información contenida en un como el de siete metros de altura de novelas de bolsillo apiladas sobre todo Estados Unidos, incluyendo Alaska.

Este informe es una instantánea de lo que significa la revolución de la información para el estadounidense medio que en un día consume un promedio de 34 gigabytes y 100 000 palabras de información. En el nuevo informe se estima que entre 1980 y 2008, bytes consumidos aumentaron 350 por ciento, con una tasa de crecimiento anual promedio de 5.4 por ciento. Según el informe, el consumo promedio de información de los estadounidenses es de 34 gigabytes al día, el equivalente a una quinta parte del disco duro de un ordenador portátil. El nuevo informe estima que, un estadounidense está viendo la televisión  de promedio el 41 por ciento de tiempo dedicado a la información (incluyendo DVDs, programas de televisión grabados y visionado en tiempo real).

Sobre la base de bytes solos, sin embargo, los juegos de ordenador son la mayor fuente de consumo de información, con un total de 18.5 gigabytes por día para el consumidor estadounidense medio, o aproximadamente el 67 por ciento de todos los bytes consumidos. Aproximadamente el 80 por ciento de la población juega a algún juego de ordenador.

Los estadounidenses gastaron un 16 por ciento de sus horas dedicadas al consumo de información a través de Internet (en segundo lugar después de la televisión con el 41 por ciento). Con la proliferación de correo electrónico, la mensajería instantánea y las redes sociales. Una cosa positiva es que con los nuevos dispositivos de medios de comunicación son cada vez más dispositivos personales – los teléfonos móviles, Kindles y dispositivos portátiles de juegos – con pantallas pequeñas y relativamente baja resolución, limitan el número de bytes consumidos.

HPCC Sistemas (Thor): plataforma de código abierto para el análisis de Big Data

28341949862_98054197bb_o_d

https://hpccsystems.com/download 

El motor de curación de datos HPCC Sistemas (Thor) ayuda a gestionar, limpiar, enlazar, transformar y analizar grandes volúmenes de datos. Thor soporta estructuras de datos orientada de registro flexibles. A los datos procesados se puede acceder por un gran número de usuarios al mismo tiempo en tiempo real usando el motor Roxie. Las consultas a Roxie son típicamente complejas con capacidades de búsquedas booleanas.

Enterprise Control Language (ECL), es el lenguaje de programación se utiliza para programar tanto los trabajos de procesamiento de datos sobre Thor y como las consultas sobre Roxie

hpcc-flow

Los beneficios de la plataforma HPCC pueden ser definidos en dos palabras: velocidad y escalabilidad. Más información en http://hpccsystems.com/why-hpcc/benefits

Ver más características en http://hpccsystems.com/Why-HPCC/features

Lenguaje de programación ECL http://learn.lexisnexis.com/hpcc

Tutorial sobre Thor y Roxy en Tutorial PDF http://cdn.hpccsystems.com/releases/CE-Candidate-6.0.2/docs/HPCCDataTutorial-6.0.2-1.pdf

Tendencias en bibliotecas universitarias ACRL 2016

aaeaaqaaaaaaaadlaaaajdgxzji3ythlltixnzktndi1ni1izdezltflotvkmdninjllmw

2016 top trends in academic libraries
A review of the trends and issues affecting academic libraries in higher education
ACRL Research Planning and Review Committee. College & Research Libraries News  vol. 77 no. 6 274-281

Junio 2016

Texto completo

 

Una revisión de las tendencias y problemas que afectan a las bibliotecas universitarias elaborada por ACRL Research Planning and Review Committee.

Cada dos años, el Comité de Planificación y Análisis de Investigación de ACRL publica un documento sobre las tendencias principales en la educación superior y su relación con la las bibliotecas universitarias. En el informe de 2016 las principales tendencias de investigación analizan la gestión de datos de investigación (RDM), edición académica digital, las tendencias de evaluación de la colección, fusiones de proveedores de contenidos, las evidencias de aprendizaje, nuevas propuestas de alfabetización en el marco ACRL para la Alfabetización de la Información, altmetrics, puestos de personal emergentes, y recursos educativos abiertos.

Principales tendencias en 2016:

Gestión de datos de Investigación (RDM)

En los últimos años, varias organizaciones científicas nacionales e internacionales han emitido declaraciones y políticas que subrayan la necesidad de un inmediato archivo de los datos, y algunos organismos de financiación han comenzado a exigir que los datos procedentes de investigaciones que financian sean depositado en un archivo público. Ya muchas bibliotecas ofrecen actualmente servicios relacionados con la gestión de datos de investigación (RDM) ofreciendo información y servicios de consulta que se alinean con las funciones de enlace y de referencia existentes, de momento la mayoría aún no están ofreciendo servicios técnicos. Seis de las grandes bibliotecas universitarias y de investigación estadounidenses, han creado una red para desarrollar el proyecto “Data Curation Network,  con el objetivo de mejorar el apoyo al investigador  El proyecto tienen como base preparar los datos digitales de investigación para el acceso abierto y la reutilización o lo que se denomina Research Data Managemant (RDM). Lo que permitirá a las bibliotecas universitarias trabajar colectivamente y de manera más eficaz, con una variedad más amplia de tipos de datos. (Ver todo en UA sobre Research Data Management (RDM)

Políticas de datos y planes de gestión de datos

Ya más de la mitad de las bibliotecas universitarias estadounidenses están trabajando en un plan de datos de investigación. Se analiza las políticas de datos de investigación institucionales. El apoyo a los profesores y administradores en el diseño de estas políticas es una oportunidad importante para las bibliotecas. Así los bibliotecarios se están mostrando activos en todos estos espacios. Las bibliotecas utilizan identificadores de objetos digitales (Dois) que identifican los conjuntos de datos específicos utilizando servicios como DataCite y EZID. También están haciendo el trabajo de gestión de metadatos que facilita el descubrimiento y la reutilización a través de consultas individuales y el desarrollo de esquema.

Desarrollo profesional de los bibliotecarios que proporcionan RDM

Durante siglos los bibliotecarios hemos sido expertos en la organización de las colecciones y saber cómo encontrar las cosas. La transición a los formatos digitales ha traído consigo un enorme volumen de datos que necesita ser curados como los relativos a descargas, citas, citas de patentes y la cobertura de los medios de comunicación. Todo ello ha ido acrecentando las competencias y habilidades de los bibliotecarios como uno de los segmentos profesionales más capacitados para la gestión de grandes cantidades de datos. (Taylor Stang, 2016). La mayoría de las bibliotecas están reasignando al personal existente en tareas  relacionadas con la gestión de datos de investigación como «bibliotecarios de datos», creando una demanda cada vez mayor para el desarrollo de nuevas oportunidades profesionales. Por ello ya se están diseñando dos planes de estudio para la enseñanza de gestión de datos de investigación  La segunda es la creación de una división ACRL de Gestión de Datos de Investigación, que tendrá la forma de un taller de un día de duración diseñado para administradores de la biblioteca y otros especialistas. ste enfoque de colaboración conecta experiencias diversas que desarrollan las bibliotecas con los investigadores en el momento que se percibe una necesidad, creando oportunidades para construir redes dentro y fuera de la biblioteca, que facilitan que la biblioteca se integre en el proceso de investigación el el proceso de apoyo al acceso abierto a los datos de investigación. Esta formación debe ser continua para los bibliotecarios y los investigadores ya que los recursos técnicos y las mejores prácticas están en constante flujo; de este modo entre los desafíos que conlleva proporcionar cobertura de datos abiertos hace que surjan nuevos servicios y proveedores de fondos, se están empezando a establecer mandatos por parte de los organismos de financiación, y a surgir algunas normas para el almacenamiento y el acceso público a los resultados de la investigación, si bien todo ello está operando en un panorama cambiante.

Investigación digital

Para avanzar en los procesos educativos y de investigación las bibliotecas están desarrollando centros de investigación digital, a menudo en colaboración con otras unidades del campus. Estos centros amplian los métodos tradicionales de investigación mediante la aplicación de nuevas tecnologías, tales como el trabajo con datos de sistemas de información geográfica (SIG), gestión de activos digitales, preservación digital, formación, consultas y herramientas para la producción académica digital. Además de los desafíos asociados con la creación de espacios para las relaciones de colaboración en investigación académica digital: el papel de los bibliotecarios como proveedores colaboradores necesarios en servicios de investigación, la planificación de programas para diversos grupos, y la formación continua. Reconociendo que el valor de la biblioteca se centra fundamentalmente en la atención a las necesidades emergentes, el cumplimiento de su misión y en el compromiso con sus usuarios.

Tendencias en la evaluación de la colección

Ha habido un cambio notable a la incorporación e integración permanente, flexible y sostenible de colecciones. Existe una creciente la necesidad de establecer enfoques más globales y ágiles (tanto cualitativos como cuantitativos) para gestionar las limitaciones presupuestarias garantizando al mismo tiempo que las colecciones sean «sensibles», que atiendan adecuadamente las necesidades de la investigación institucional y los requisitos del plan de estudios. De este modo, las bibliotecas han establecido nuevos puestos de como el de analista de adquisiciones, empleando nuevas herramientas como la visualización, análisis predictivo, fuentes de datos,  la evaluación de los contenidos de acceso abierto y su integración en la biblioteca,  la incorporación de modelos de adquisición basados en la demanda (PDA), la re-evaluación de modelos de pago y el mejor aprovechamiento de la gestión de  las relaciones con los socios y actores externos.

Fusiones de proveedores de sistemas y contenidos para bibliotecas

Una mayor consolidación de las plataformas de contenidos que están adquiriendo un potencial impacto significativo en la fijación de precios, presupuestos, colección, y negociación institucional, dándose concentraciones de negocios tanto por la adquisición de proveedores de servicios tradicionales como Yankee y Coutts que fue comprado por EBSCO y ProQuest, como la adquisición de proveedores de sistemas de biblioteca como  Ex Libris por parte de plataformas de contenidos como ProQuest. Las grandes editoriales tienen la infraestructura y los recursos que facilitan el proceso de edición y difusión de las revistas científicas. Elsevier, Springer, Wiley-Blackwell, Taylor & Francis y Wise publican más de 50% de los artículos científicos de todos los campos. En general, las grandes editoriales controlan más de la mitad de los artículos científicos de mercado, tanto en las Ciencias Naturales y Medicina, como en Ciencias Sociales y Humanidades. Además, estas grandes editoriales comerciales tienen grandes niveles de ventas, con márgenes de beneficio de casi el 40%.

Evidencias del aprendizaje: El éxito del estudiante, la analítica de aprendizaje y acreditación

El éxito del estudiante sigue siendo un foco importante para las instituciones de educación superior, donde la tendencia hacia los criterios de financiación y acreditación basados en el desempeño incluye un énfasis en los resultados del aprendizaje, la retención y la matrícula. Existen los métodos para aumentar el éxito del estudiante se encuentran algunos como la formación de comunidades de aprendizaje, apoyo e incentivos para la terminación, la tutoría entre iguales, aulas inversas, Deeper Learning y módulos de aprendizaje adaptativo a los programas para los estudiantes de primer año.

Las bibliotecas como socios clave en la educación superior participan en las estrategias de éxito de los estudiantes y también llevan a cabo sus propios estudios, evaluaciones e iniciativas. Una iniciativa importante es la Evaluación de la ACRL Programa de acción (AIA) en el que se analiza el impacto de la biblioteca (instrucción, de referencia, colecciones, espacio y más) en el aprendizaje y éxito del alumno. Un nuevo informe publicado por la Asociación de Colegios y Bibliotecas de Investigación (ACRL), “Documented Library Contributions to Student Learning and Success: Building Evidence with Team-Based Assessment in Action Campus Projects.”, muestra con evidencias convincentes las contribuciones de las bibliotecas al aprendizaje y el éxito del estudiante.  El documento sintetiza más de 60 informes y proyecto individuales desarrrollados previamente (online). El informe identifica algunas evidencias contundentes de las contribuciones positivas de las bibliotecas universitarias al aprendizaje y el éxito del estudiante.

Tendencias en  Alfabetización en Información para la Educación Superior

Dentro del Framework for Information Literacy for Higher Education que reconoce la información como un ecosistema y anima a los bibliotecarios a perseguir una agenda más amplia basada en el nuevo concepto de AI como un «conjunto de capacidades integradas que abarcan el descubrimiento reflexivo de la información, la comprensión y valoración de cómo se produce la información, el uso de la información en la creación de nuevos conocimientos y la participación ética en las comunidades de aprendizaje.” En esta nueva definición hay un énfasis en la información como algo que se negocia socialmente, que es complejo, que no es simplemente algo que se encuentra y utiliza; si no que es algo creado por la gente – incluyendo a los propios estudiantes-. Por lo tanto tenemos que tener en cuenta esta cuestión cuando diseñamos nuestros servicios y colecciones. En este nuevo contexto los estudiantes tienen un mayor papel y la responsabilidad en la creación de nuevos conocimientos, una mejor comprensión del marco informacional y de la dinámica cambiante del mundo de la información, así como del uso de la información, los datos, y la investigación desde un punto de vista ético. En el nuevo entorno el profesorado tiene una mayor responsabilidad en el diseño de planes de estudio y en las tareas que fomentan el compromiso teniendo en mente las ideas centrales acerca de la información y la investigación dentro de sus disciplinas. A su vez, los bibliotecarios tienen una mayor responsabilidad en la identificación de las ideas fundamentales dentro de su propio campo de conocimiento que pueden ampliar el aprendizaje de los estudiantes, en la creación de un nuevo plan de estudios coherente para la alfabetización en información, y en colaborar más intensamente con la institución.

Altmetrics

Los medios sociales están cambiando la forma de interactuar, presentar las ideas e información y juzgar la calidad de los contenidos y contribuciones. En los últimos años han surgido cientos de plataformas que permiten compartir libremente todo tipo de información y conectarnos a través de redes. Estas nuevas herramientas generan estadísticas de actividad e interacciones entre sus usuarios

La penetración de altmetrics está aumentando rápidamente. Las citas son un resultado de una compleja serie de conductas de consumo de información que incluye evidencias como la lectura, marcadores sociales, descargas, anotaciones discusiones y recomendaciones, o menciones en plataformas de medios sociales como Twitter y Mendeley que proporcionan datos sobre el impacto social de la investigación. Estos datos pueden ser valiosos como complemento a los indicadores de impacto tradicional, pero primero hay que lograr una comprensión más profunda de los sistemas que producen estos datos. Estos incluyen la necesidad de definiciones específicas, estrategias para mejorar la calidad de los datos de los proveedores, la promoción del uso de identificadores persistentes, métodos transparentes para el cálculo de los tipos de salida específicos y casos de uso para diversos grupos de interés groupos.. Aunque muchas cuestiones técnicas y de aplicación siguen pendientes la utilización de altmetrics por parte de repositorios, editores, revistas y plataformas está creciendo.

Nuevos perfiles emergentes de puestos de trabajo

En la primavera de 2015, la Escuela de Información en la Universidad Estatal de San José analizó 400 publicaciones recientes de empleo para bibliotecarios. Las tendencias generales que surgieron: familiaridad con la tecnología y el apoyo técnico, se centran en la experiencia del usuario, soporte para servicios virtuales, humanidades digitales y gestión del conocimiento. El sector empresarial también está cada vez más interesado en profesionales con estos conjuntos de habilidades. La colaboración, el trabajo en equipo, y la comunicación se encuentran entre las habilidades más comunes en todas las descripciones de puestos de trabajo.

Recursos Educativos Abiertos (REA)

REA están experimentando un importante desarrollo en la educación superior en los Estados Unidos, se están publicando numerosos artículos en los principales medios de comunicación sobre el alto costo de los libros de texto de nivel universitario.En febrero de 2016, la University of Michigan Press  recibió 28,000 dólares de la Fundación Andrew W. Mellon para llevar a cabo un estudio sobre como se descubren y utilizan los libros electrónicos.  La investigación la dirige Eric Hellman y otros miembros de la Free Ebook Foundation, con el apoyo de la Universidad de Michigan, junto con Open Book Publishers. La importancia del proyecto es probar si es viable un modelo de libros electrónicos gratuitos en comparación con los modelo de pago actuales. La cadena de suministro convencional  sigue dominando el mercado del libro en el que un grupo de intermediarios se benefician de una parte considerable del precio de venta, Mientras que una “red abierta” dispone de una infraestructura de distribución de información más eficaz. De entrada esta es una hipótesis lógica, pero realmente se sabe muy poco sobre cómo se descubren los ebooks en libre acceso, además se desconocen muchos aspectos en torno a las mejores prácticas y las herramientas utilizadas para medir su impacto. Este es el desafío que tiene por delante el proyecto.

Las bibliotecas en la educación superior están colaborando a través del campus para promover y apoyar los REA. Esta creciente conciencia pública puede conducir una gama más amplia de las infraestructuras para hacer frente no sólo el desarrollo de los REA en los campus sino soluciones para hacer frente a almacenamiento y detectabilidad de los REA. En febrero de 2016 Amazon anunció el desarrollo de una plataforma REA dirigida al mercado K-12, y la educación superior.