Archivo de la etiqueta: Gestión de datos de investigación

¿Qué piensan los investigadores sobre la ciencia abierta?

oscience

Veerle Van den Eynden, Gareth Knight, Anca VladBarry Radler, Carol Tenopir, David Leon, Frank ManistaJimmy Whitworth, Louise Corti. Survey of Wellcome researchers and their attitudes to open research, Digital Science, 2016

Texto completo

Resultados de una encuesta de Wellcome Trust para descubrir qué piensan los investigadores acerca de la ciencia abierta, cómo la practican y qué barreras encuentran. En el intercambio de datos, las razones por las que los investigadores ponen a disposición sus datos, los beneficios que pueden experimentar, las barreras que perciben y los posibles incentivos para disponer de más datos dependen  fuertemente de la etapa profesional, la disciplina de investigación y la posición dentro del organismos de investigación.

En la investigación se encuestaron a 583 investigadores de todas las categorías de Welcome Trust. Los resultados se contrastaron con los resultados de una encuesta paralela a investigadores financiados por el Consejo de Investigación Económica y Social (ESRC), como un grupo de investigadores en ciencias sociales que realizan investigaciones en el contexto de un organismo financiador con una política obligatoria de intercambio de datos. Más específicamente el estudio reunieron evidencias sobre:

  • Opiniones de los investigadores sobre diversos aspectos de la investigación abierta
  • Prácticas actuales en la publicación de acceso abierto
  • Opiniones sobre la evolución futura de la publicación
  • Prácticas y experiencias actuales en el intercambio de datos y la reutilización
  • Las barreras para compartir y las motivaciones para hacer disponibles los datos
  • Prácticas y experiencias actuales en el uso compartido de código y su reutilización
  • Barreras y motivaciones para compartir código

Este trabajo fue encargado por el Wellcome Trust y dirigido por la Escuela de Londres de Higiene y Medicina Tropical y el Servicio de Datos del Reino Unido. Los investigadores financiados por Wellcome Trust ya están practicando la investigación abierta de muchas maneras, tal como se ilustra a lo largo de este informe, ya sea publicando sus escritos en revistas de acceso abierto o poniendo sus datos de investigación y código a disposición de la comunidad académica para su reutilización. Diferentes barreras entran en juego para que los datos estén en abierto. Algunos aspectos de la investigación abierta se aplican a todos los investigadores en general, mientras que otras características están muy determinadas por la disciplina de investigación, la etapa de carrera, la institución ala que pertenece el investigador y el tipo de métodos de investigación utilizados, así como en función de los datos generados. Las prácticas de investigación abierta están aumentando, y los participantes informan sobre muchos desarrollos recientes que están llevando a cabo en sus prácticas de investigación abierta, generalmente con experiencias positivas, como la revisión abierta por pares, la publicación de preprints de documentos y el intercambio de código.

Publicación

En lo que se refiere a la publicación de artículos revisados por pares, los principales factores que son decisivos y que importan a los investigadores a la hora de publicar un artículo son la reputación de las revistas, el público al que va dirigido, la revisión por pares de alta calidad y el factor de impacto de la revista. En comparación, el hecho de publicar documentos en acceso abierto es menos importante para ellos. Sin embargo, muchos investigadores financiados por Wellcome Trust publican sus artículos en acceso abierto, gracias a la financiación proporcionada por el Wellcome Trust, con más del 70% de todos los artículos publicados en acceso abierto y una cifra de un tercio de los investigadores que publican todos sus artículos en acceso abierto.

La proporción de publicaciones de acceso abierto es independiente de la etapa de carrera. Sin embargo, los investigadores de carrera temprana son menos dados a usar la financiación de Wellcome Trust para cubrir los cargos de procesamiento de artículos; Lo mismo se aplica a los investigadores de ciencias sociales, mientras que los investigadores biomédicos y clínicos son más inclinados a hacerlo.

Al seleccionar la literatura a utilizar en la investigación, dan poca importancia a los documentos que están en acceso abierto o  a los datos suplementarios disponibles que respaldan los hallazgos. En cambio, la calidad del contenido, la reputación de la revista, el prestigio del autor y la suscripción institucional son los principales factores al elegir los documentos que se consultan en la investigación.

Wellcome Trsut recientemente lanzó Wellcome Open Research, una nueva plataforma que facilita la publicación de una gama de productos; las principales características que piden a esta plataforma es que la revisión por pares sea abierta y transparente, que todos los productos disponibles estén en libre acceso, y que el costo de la publicación sea cubierto completamente por Wellcome Trust. Además, los investigadores dicen que quisieran que en los sistemas de publicación futuros los comentarios de los revisores fueran visibles, que tuvieran un foro para comentarios para la discusión de los documentos, y también permitir la visualización de los datos en los documentos y la publicación rápida de los documentos como preprints, que posteriormente podrían ser enviados a revistas reconocidas. La prioridad de las características deseadas está determinada por la etapa de carrera y la disciplina de investigación.

Datos

La mitad de los investigadores pone a disposición datos de investigación para que puedan ser utilizados por otros investigadores, ya sea como conjuntos de datos completos o como subconjuntos, y cada investigador ha puesto a disposición un promedio de cuatro conjuntos de datos en los últimos cinco años. Los datos son en su mayoría publicados a través de repositorios institucionales y comunitarios de acceso abierto.

Las principales razones para poner a disposición los datos de investigación son los requisitos impuestos por los organismos financiadores y revistas, también porque se considera una buena práctica de investigación, además por facilitar la colaboración  y permitir la validación y replicación de la investigación. Los principales beneficios que los investigadores han experimentado al compartir sus datos son el que les han surgido nuevas colaboraciones y mayores tasas de citas. Sin embargo, la mayoría de los investigadores no han experimentado ningún beneficio directo de poner sus datos a disposición de todos. Tampoco han experimentado muchos efectos negativos al compartir sus datos.

Las principales barreras que se perciben para compartir datos son el temor de que los datos sean mal utilizados o malinterpretados, el temor de que compartir datos pueda poner en peligro futuras oportunidades de publicación, y el tiempo y esfuerzo que se requiere para preparar y depositar los datos. El hecho de que muy pocas personas hayan tenido realmente malas experiencias de compartir datos, muestra que estos temores son en gran medida infundados. Lo positivo es el hecho de que los beneficios superan a las barreras para la mayoría de los investigadores.

Los investigadores indican que estarían más motivados para hacer que más datos estuvieran disponibles en el futuro si recibieran fondos adicionales para cubrir el costo de la preparación de los datos, si poner sus datos disponibles mejorara su reputación académica, si supieran cómo otros investigadores usan sus datos; además de si se tuviera en cuenta el intercambio de datos en futuras decisiones de financiación y promoción de la carrera.

Las razones para compartir datos, beneficios experimentados, barreras y motivaciones están determinadas por la etapa y la disciplina de la carrera de un investigador. Los investigadores reutilizan los datos existentes, principalmente para proporcionar información de antecedentes y contexto a su investigación, para la validación de la investigación, para ayudar a desarrollar sus metodologías y para nuevos análisis. Los niveles de reutilización de datos dependen de la etapa de carrera, la disciplina y los métodos de investigación utilizados. Sin embargo, una cuarta parte de los investigadores nunca han reutilizado los datos existentes. Los datos para la reutilización se obtienen principalmente de colegas, repositorios o directamente del creador. Importante es que los datos sean de una fuente acreditada, de alta calidad y bien documentados. Los datos disponibles de forma abierta e inmediata son menos importantes para los investigadores.

Gestión de datos de investigación con Fernanda Peset. Planeta Biblioteca 2016/12/21.

31428520590_4e68433a16_b_d

ESCUCHAR EL PROGRAMA

Ir a descargar

En esta ocasión ha estado en nuestro programa FERNANDA PESET profesora titular de la Universidad Politécnica de Valencia con quien hemos charlado sobre Gestion de Datos de Investigación, además es miembro de MAREDATA. Fernanda nos ha hablado de qué  son y qué implicaciones tienen los Big Data, los desafíos que se plantean en el contexto de la investigación científica, cómo se realiza la gestión que permite intervenir en el ciclo vital de los datos, qué políticas se están siguiendo al respecto y las implicaciones para el futuro de la profesión.

Los jóvenes investigadores no utilizan las bibliotecas

99086957_thumbnail_16x9

Early career researchers: the harbingers of change?: Final report from CIBER. August 2016,  [e-Book] Publishing Research Consortium, 2016

Texto completo

Este informe sobre los datos del primer año de un estudio cualitativo de tres años, analiza una amplia gama de temas a través de entrevistas personales a 116 jóvenes investigadores de siete países: Reino Unido, Estados Unidos, China, Francia, España, Polonia y Malasia. Según el informe las bibliotecas “se vuelven invisibles” a los investigadores más jóvenes. Muchos jóvenes investigadores dicen no haber acudido a su biblioteca universitaria en los últimos años. Igualmente no se considera una prioridad  la publicación en revistas de acceso abierto  en tanto que no se den incentivos a los investigadores para hacerlo.

Publishing Research Consortium es un grupo de asociaciones y editores que apoyan la investigación sobre temas globales que afectan la comunicación académica, con el fin de promover la discusión basada en la evidencia. Entre sus informes está la publicación Early career researchers: the harbingers of change? (Investigadores de carrera temprana: ¿Los precursores del cambio?)

Los investigadores que inician a edad temprana su carrera -menores de 35 años – son el futuro de la investigación, y sus actitudes y comportamiento son importantes. Además, son el futuro de la investigación y representan al grupo más grande de investigadores, sin embargo, no se han realizado investigaciones recientes sobre sus hábitos en comunicación científica y en que medida en que sus comportamientos pueden resultar transformadores.

Según el informe las bibliotecas “se vuelven invisibles” a los investigadores más jóvenes. Muchos de ellos no han utilizado la biblioteca en los últimos años.  La biblioteca se ve como un lugar para que trabajen los estudiantes de pregrado, y sus sistemas de descubrimiento son ignorados a favor de otras fuentes como Google. Respecto a estas opiniones Ann Rossiter, directora ejecutiva de Sconul, dijo que los investigadores no necesitaban entrar en la biblioteca para usar sus servicios.

La gran mayoría de jóvenes investigadores quieren seguir haciendo investigación, pero sus circunstancias son limitadas, inestables, incluso precarias, obligandoles esta situación a prácticas conservadoras orientadas hacia el impacto reputacional de la publicación buscando publicar en revistas altamente calificadas en los índices de citas. Así los jóvenes investigadores consideran la publicación en revistas de alto impacto como importante para avanzar en su carrera, pero muchos opinan que podrían adoptar otras estrategias de publicación en el futuro, siempre que su entorno lo posibilite. En general, se sienten cómodos con el sistema actual de revisión por pares y son escépticos acerca de la revisión abierta. También ponen de manifiesto que a menudo pueden obtener el estatus de “primer autor”, y que también suelen influir en la elección de dónde publicar dentro de su grupo de investigación.

La publicación en revistas de acceso abierto, a pesar de los mandatos, no figura como un criterio preeminente en la mayoría de las estrategias de publicación de los jóvenes investigadores. Así el acceso abierto no se apoya como una prioridad para las estrategias de publicación individuales y hay preocupaciones sobre la inequidad del acceso a los fondos para cubrir los Gastos por Procesamiento por Artículo (APC). Archivar o buscar en repositorios institucionales no es una prioridad para ellos; si bien los repositorios temáticos y las redes cooperativas tienen mucho más apoyo. La conciencia sobre las iniciativas de “ciencia abierta” sigue siendo baja, al menos hasta que los sistemas de crédito de la reputación y recompensa haga que sean considerado por los comités de acreditación a las actividades de divulgación e impacto, mientras tal actividad probablemente se mantendrá en un nivel bajo.

Sin embargo, no siguen invariablemente a sus mentores de más edad cuando se trata de actitudes hacia el futuro. Son conscientes de las tensiones y las transformaciones potenciales que se están produciendo a su alrededor, y muchos están esperando el momento oportuno en el que puedan participar o incluso llevar a cabo prácticas cambiantes.

Hay evidencias de un creciente uso de los medios de comunicación social, especialmente las redes de comunicación académica como ResearchGate, pero las utilizan más para la creación de perfiles que para comunicar los resultados o para la colaboración activa. Los teléfonos inteligentes se utilizan de manera poco distinta a como los utilizan en la vida normal, y generalmente no los utilizan para la lectura, excepto entre los jóvenes investigadores de China. El hecho de compartir la información lo consideran positivo para sus carreras y reputación, si bien esta la actividad se orienta más hacia el intercambio de resultados a través de redes de comunicación académica que a compartir datos de resultados intermedios, lo que sólo hace con su propio grupo de investigación. Hay escepticismo acerca de las nuevas métricas, y consideran que aún es pronto para pensar en ‘altmetrics’, a menos que sea adoptado por los sistemas de evaluación y acreditación académica.

HathiTrust Research Center (HTRC) Extracted Features (EF) Dataset: gestión de datos de investigación abiertos de la biblioteca digital de libros electrónicos

 

ht-logo2_0

HTRC Extracted Features Dataset

https://analytics.hathitrust.org/datasets

Este conjunto de datos proporciona a los investigadores acceso abierto a los datos extraídos de los volúmenes a texto completo de la Biblioteca HathiTrust Digital Library a una escala sin precedentes. Esta versión proporciona una manera novedosa y eficaz de extraer, generar y reutilizar los datos relevantes de un corpus de 13,5 millones de libros.

 

La palabra Hathi, pronunciado en indú “hah-tee”, significa en urdu elefante, motivo que representa su logotipo, el nombre se asigno por ser un animal famoso por su capacidad de memoria a largo plazo, sugiriendo la idea de preservación para el futuro, que es el objetivo del proyecto. HathiTrust es un proyecto de repositorio colaborativo a gran escala de contenidos digitales de las bibliotecas de investigación, incluyendo el contenido digitalizado a través de Google Books, así como contenidos digitalizados localmente por las bibliotecas, y ofrece una serie de servicios de localización y acceso, en particular búsqueda de texto completo a través de todo el repositorio.

HathiTrust anuncia hoy el lanzamiento de un conjunto de datos abierto significativamente expandido con HathiTrust Research Center (HTRC) Extracted Features (EF) Dataset, Version 1.0. Los datos corresponden a 13,7 millones de volúmenes de la biblioteca HathiTrust que están en dominio público.

Fundado en 2008 y alojada en la Universidad de Michigan, HathiTrust preserva y proporciona acceso a millones de libros y revistas digitalizados de las colecciones de más de 120 instituciones académicas y socios de investigación a través de su repositorio digital certificado de confianza. Incluye tanto materiales protegidos como de dominio público de los programas de digitalización masiva y de las iniciativas locales de digitalización de las instituciones asociadas al programa. El Centro de Investigación HathiTrust es un servicio de investigación avanzada de HathiTrust y un centro de investigación colaborativo lanzado conjuntamente por la Universidad de Indiana y la Universidad de Illinois.

El conjunto de datos abre la colección completa de HathiTrust para investigar las tendencias históricas y culturales, temas emergntes dentro del corpus y la evolución de las palabras y las estructuras de escritura en publicaciones que datan del siglo XVI al final del siglo XX. El conjunto de datos EF proporciona información cuantitativa sobre el recuento de palabras y líneas, partes del discurso y otros detalles dentro de cada página de cada volumen del HTDL. Además de estas investigaciones a gran escala, el EF Dataset también permite a los investigadores analizar de cerca el contenido de un determinado volumen o subconjunto de volúmenes.

Los datos proceden de los 13,7 millones de volúmenes encontrados en el HTDL, representando más de 5 mil millones de páginas de más de 2 billones de fichas. Una liberación preliminar del EF Dataset, extraído de un subconjunto mucho más pequeño que comprende solamente la colección del dominio público de HathiTrust, que permite la la utilización por parte de eruditos en economía, historia, lingüística, estudios literarios y sociología, entre otros campos.

november-18-2015-niso-webinar-text-mining-digging-deep-for-knowledge-8-638

El estado de los datos abiertos

page_1_width_2000

Shadbolt, N. [e-Book] The State of Open Data: A selection of analyses and articles about open data, curated by Figshare, Figshare, 2016.

Texto completo 

Encuesta

Infografía

En estos días Figshare dio a conocer los resultados de una encuesta mundial a 2.000 investigadores en un informe que evalúa el panorama mundial en torno a los datos abiertos y las prácticas de intercambio.

31478561495_8dac61eb27_b_d

Crédito otorgado a los datos abiertos

El informe ha sido patrocinado por Digital Science y la encuesta se llevó a cabo en colaboración con Springer Nature. Se pone de relieve el grado de sensibilización sobre los datos abiertos, los incentivos que rodean su uso y las perspectivas que los investigadores tienen sobre la apertura de sus propios datos de investigación.

Las principales conclusiones del informe incluyen:

  • Para la mayoría de los encuestados, los datos abiertos ya son una realidad, ya que aproximadamente tres cuartas partes de los encuestados dicen haber puesto sus datos de investigación abiertamente disponibles en alguna ocasión; un número similar es consciente de que los conjuntos de datos deben están abiertos para el acceso, la reutilización y redistribución.
  • Los investigadores en Ciencias Sociales demuestran el nivel más alto de la conciencia por disciplinas, desde el punto de vista geográfico, los investigadores en Asia demuestran menos predisposición hacia los datos abiertos.
  • Los investigadores valoran el crédito que reciben por depositar datos abiertos: Casi el 70% de los investigadores valoran una cita de datos tanto como una cita a un artículo. Y el 10% valora una cita de datos más que una cita del artículo. Según la encuesta, el 80% de los investigadores dice que habitualmente citan datos de investigación tanto o más que los propios artículos.
  • La conciencia de los datos abiertos trasciende la edad y la progresión profesional: Alentadormente, los Investigadores Principales (PIs) y los Profesores siempre respondieron de manera similar a los estudiantes de doctorado y post-doctorales en su conocimiento del uso de datos abiertos.
  • Los encuestados admiten la incertidumbre y lagunas en sus conocimientos y están deseosos de disponer de más información
  • De los investigadores que ya han abierto sus datos, el 60% de los encuestados no está seguro de las condiciones de concesión de licencias en virtud de las cuales ya han compartido sus datos y, por tanto, de la medida en que puede acceder o reutilizarse.
  • Los investigadores no están seguros de quién cubrirá los costos de la apertura de los datos.
  • Más de la mitad de los encuestados dijeron que necesitan disponer de más orientación sobre el cumplimiento de la política de sus financiadores.
  • Los investigadores no están seguros de cómo citar los conjuntos de datos: Menos de la mitad de los encuestados dicen que confían en cómo citar un conjunto de datos secundarios de investigación.
  • Hay indicios de que el futuro será más abierto: Los investigadores que nunca han puesto los datos abiertamente disponibles están considerando hacerlo – de los encuestados que no han puesto datos abiertos hasta la fecha, el 44% considerará hacerlo en el futuro, y otro 46% podría considerar hacerlo.
  • Existen diferencias regionales: los encuestados norteamericanos que aún no han abierto datos son los más propensos a hacerlo en el futuro; Los encuestados asiáticos tienen menos probabilidades de hacerlo.

31478561595_2a37049c9d_b_d

Predisposición a poner los datos en abierto

 

Mejores contenidos, mayor prestigio: adquisición de originales, evaluación y rankings

GUADALAJARA MËXICO

Mejores contenidos, mayor prestigio: adquisición de originales, evaluación y rankings

Julio Alonso Arévalo
Universidad de Salamanca (España)
alar@usal.es

VII Foro Internacional de Edición Universitaria y Académica. Feria Internacional del Libro de Guadalajara (FIL),
Martes 29 de noviembre de 11:45 a 13:00 horas.

PREZI

Texto completo

En el nuevo ecosistema informativo se están produciendo cambios profundos. Los medios sociales están modificando la forma de interactuar, presentar las ideas e información y juzgar la calidad de los contenidos y contribuciones. En los últimos años han surgido cientos de plataformas que permiten compartir libremente todo tipo de información y conectarnos a través de redes. Estas nuevas herramientas generan estadísticas de actividad e interacciones entre sus usuarios, tales como menciones, retweets, conversaciones, comentarios. .” A la par de estos cambios, la mayor parte de los investigadores han trasladado sus actividades de investigación a la web y con el éxito de los medios sociales esta situación se ha hecho más evidente, ya que estas herramientas tienen más potencialidad para desarrollar un rango mayor de influencia académica que los entornos tradicionales de publicación. Ello produce un reposicionamiento de todos los elementos que contribuyen a todo el proceso de investigación, por ello este entorno digital en expansión donde se producen nuevas interacciones científicas impulsa cambios en los criterios para medir el impacto de la investigación y erudición; de modo que es importante disponer de un método para el seguimiento del impacto de cualquier publicación en estos nuevos medios de comunicación.

problema

Gestión y reutilización de datos en bibliotecas

modesto5jp

Escuchar programa

Ir a descargar

Esta semana con Modesto Escobar, catedrático del Departamento de Sociología y Comunicación de la Facultad de Ciencias Sociales de la Universidad de Salamanca. Modesto ha desarrollado junto a otros investigadores el proyecto What’s in a library catalogue? (¿Qué hay en un catálogo de biblioteca?) analítica visual aplicada al conjunto de datos de la British National Bibliography (BNB) http://www.luismart.es/

Network Coincidence Analysis (NCA) es un marco de análisis visual que utiliza un conjunto robusto de métodos estadísticos, incluyendo el análisis de redes, para estudiar las coincidencias en los datos y poder visualizarlos.

Los retos de la gestión de los datos, información y documentos en la Transformación Digital

 

whitepaper-td

Palma Villalón, M. d. V. (2016). [e-Book] Libro blanco – Los retos de la gestión de los datos, información y documentos (records management) en la Transformación Digital. Madrid, Revista Transformación Digital |, 2016

Texto completo

Este libro blanco pretende resaltar la importancia de la gestión de los datos, información y documentos (records management) en las empresas e instituciones en la era de la transformación digital ya que en la literatura sobre el tema que se está publicando no se menciona ni se destaca. El desarrollo de las nuevas tecnologías y el auge de publicación de contenidos en las redes sociales facilita el procesamiento de millones de datos e información, el Big Data y el Big Content, que se almacenan mediante la nube en servidores esparcidos por todo el planeta, la consecuencia para las empresas es la dilución de los límites de sus sistemas de información corporativos. Los responsables de gestión de datos, información y evidencias (records) deben enfrentarse a este nuevo escenario que ofrece grandes oportunidades y desafíos en su recolección, organización, tratamiento y preservación. En la era de la transformación digital se han ampliado considerablemente estos tipos de records, sus estructuras, sus formatos, su tamaño y sus límites. Se difuminan las fronteras tradicionales entre datos, información y records.

DataFinder: el catálogo de datos de investigación de la Universidad de Oxford

 

datafinder-logo

RUMSEY, S. y JEFFERIES, N., 2013. DataFinder: A Research Data Catalogue for Oxford. Ariadne [en línea], no. 71. [Consulta: 7 noviembre 2016]. ISSN 1361-3200. Disponible en: http://www.ariadne.ac.uk/issue71/rumsey-jefferies.

En 2012, el Comité de Investigación de la Universidad de Oxford aprobó una política universitaria sobre la gestión de datos y registros de investigación. Gran parte de la infraestructura para apoyar esta política se está desarrollando bajo el Proyecto Damaro financiado por Jisc. Los nacientes servicios que sustentan la infraestructura de RDM (gestión de datos de investigación) de la Universidad se han dividido en cuatro temas:

  • Planificación de RDM;
  • Gestión de datos en vivo;
  • Descubrimiento y localización;
  • Acceso, reutilización y curación.

El catálogo de resultados de datos dará lugar a un conjunto de metadatos e interfaces que soportan el descubrimiento, la localización, la cita y los informes para los conjuntos de datos de investigación de Oxford. Este concepto de una herramienta que apoye una lista completa de resultados de datos de investigación de la Universidad, junto con la capacidad de encontrar, citar e informar sobre tales resultados, es lo que ha dado lugar a que la Universidad haya desarrollado DataFinder, que será el centro de herramientas y servicios de infraestructura de RDM para la institución. La visión general es que proporcionará el  punto de conexión entre los servicios, técnicos y no técnicos, y las políticas, a través de los cuatro temas enumerados arriba.

figure4-datafinder-prototype-interface-v2

Asi DataFinder proporcionará una lista de resultados de datos de investigación de Oxford, utilizando metadatos que apoyan el descubrimiento y la citación estándar. DataFinder pondrá las herramientas a disposición de los administradores para permitir a la Universidad informar tanto interna como externamente sobre sus resultados de datos de investigación. Para satisfacer estas necesidades de los usuarios, el catálogo ha sido diseñado de tal forma que cubra las necesidades de sus usuarios, cumpliendo con los estándares comunes. Durante el proceso de diseño e implementación, se tomaron varias decisiones sobre el diseño. Inevitablemente, se tuvieron que hacer adaptaciones  para desarrollar un servicio útil y utilizable por parte de investigadores, administradores y otros usuarios.

Recursos:

  1. Policy available at http://www.admin.ox.ac.uk/rdm/(link is external)
  2. Damaro Project http://damaro.oucs.ox.ac.uk/(link is external)
  3. Oxford DMPOnline
    http://www.jisc.ac.uk/whatwedo/programmes/di_researchmanagement/managingresearchdata/dmponline/oxforddmponline.aspx(link is external)
  4. DataStage http://www.dataflow.ox.ac.uk/index.php/about/about-datastage(link is external)
  5. ORDS (Online Research Database Service) http://ords.ox.ac.uk/(link is external)
  6. UK Data Archive (UKDA) http://data-archive.ac.uk/(link is external)
  7. Oxford DataBank [in development] https://databank.ora.ox.ac.uk/(link is external)
  8. FAST (Faceted Application of Subject Terminology) http://fast.oclc.org/searchfast/(link is external)
  9. RCUK Research Classifications http://www.rcuk.ac.uk/research/Efficiency/Pages/harmonisation.aspx(link is external)
  10. JACS Joint Academic Subject Coding
    http://www.hesa.ac.uk/index.php?option=com_content&task=view&id=158&Itemid=233(link is external)
  11. RIOXX http://rioxx.net/(link is external)
  12. CKAN http://ckan.org/(link is external)
  13. ColWiz http://www.colwiz.com/(link is external)
  14. Solr index and search http://lucene.apache.org/solr/(link is external)
  15. Piwik Web analytics http://piwik.org/(link is external)
  16. Fedora Commons http://fedora-commons.org/

What’s in a library catalogue? analítica visual aplicada al conjunto de datos de la British National Bibliography (BNB)

 

2eaf69_d17ec487ffac431daad4211cee0542cbmv2

http://www.luismart.es/

Network Coincidence Analysis (NCA) es un marco de análisis visual que utiliza un conjunto robusto de métodos estadísticos, incluyendo el análisis de redes, para estudiar las coincidencias en los datos y poder visualizarlos.

Puedes escuchar una entrevista de Radio USAL «Planeta Biblioteca» con el profesor Modesto Escobar, de la Universidad de Salamanca, uno de los desarrolladores de este interesante proyecto para hablarnos sobre el mismo

Este proyecto presenta un método de investigación y una herramienta, denominada Network Coincidence Analysis (NCA) (red de análisis de coincidencia) aplicada al conjunto de datos de la British National Bibliography (BNB) para proporcionar un método que permite profundizar en las relaciones inherentes a los datos, descubrir asociaciones y hacer comparaciones.

El principal resultado de este proyecto son visualizaciones que nos presentan exploraciones interactivas del corpus de la British National Bibliography (BNB) desde diferentes perspectivas y  descubrir nuevas tendencias.

Por ley la British Library mantiene una copia de todas las publicaciones del Reino Unido desde 1662. El conjunto de datos de la BNB es un registro de la actividad editorial del Reino Unido y la República de Irlanda desde la década de 1950.Los datos están disponibles en el sitio web de la Biblioteca Británica en formato RDF LOD y la instantánea del conjunto de datos BNB transformado en CSV para este proyecto está disponible en: http://dx.doi.org/10.7910/DVN/YGHGQB

tumblr_odliimhfec1tdazmho1_1280

 Infografía con un análisis descriptivo básico del conjunto de datos BNB.

NCA con sus métodos de investigación estadística y herramientas interactivas intenta inspirar y capacitar a los estudiosos de distintas disciplinas a utilizar grandes conjuntos de datos, colecciones, especialmente del mundo de las bibliotecas, y técnicas de visualización como parte de su investigación.

La herramienta permite:

  • Personalizar el tamaño, la forma y el aspecto de la red;
  • Filtrado, selección y aislamiento de los nodos y sus vecinos;
  • Exportar los gráficos a PDF y SVG y la descarga de la información sobre los nodos y enlaces.

Por ejemplo existen unos 50.000 libros que contienen temas sobre Europa. Esta red facilita el descubrimiento de la historia de la relación entre el Reino Unido y Europa, y muestra los datos sobre los vínculos históricos entre ellos, tales la importancia de la seguridad nacional durante la época de la guerra fría y el papel de EE.UU., los cambios geopolíticos en Europa del Este, así como los aspectos más actuales de la función de la Unión Europea en la política y el derecho.Ver visualización

También podemos visualizar por ejemplo la evolución de los temas BNB a través del tiempo. Ha habido un aumento en los libros publicados cada década desde los años sesenta. Sin embargo, los temas de las publicaciones han ido cambiando a través del tiempo. Esta red muestra cómo los intereses de las publicaciones han ido cambiando con un enfoque inicial en la ficción, poesía, cuentos y matemáticas en las últimas décadas, como han evolucionado hacia otras disciplinas científicas, como la Economía, la Ciencia y la Administración, así como un extraordinario crecimiento de las publicaciones relacionadas. (Ver visualización)

30577479156_deeedb3557_b_d