Archivo de la etiqueta: Datos vinvulados

OCLC inicia un proyecto piloto con datos vinculados en siete grandes bibliotecas de todo el mundo

 

 

OCLC ha empezado a trabajando con siete grandes bibliotecas de todo el mundo en un programa piloto diseñado para aprender más acerca de cómo los datos vinculados influirán en los flujos de trabajo de la biblioteca en el futuro. Entre las siete bibliotecas participantes seincluyen la Universidad de Cornell, la Universidad de Harvard, la Biblioteca del Congreso, la Biblioteca Nacional de Medicina de la Biblioteca Nacional de Polonia, la Universidad de Stanford y la Universidad de California.

 

OCLC es una organización de cooperación bibliotecaria mundial sin ánimo de lucro que proporciona servicios tecnológicos compartidos, impulsa la investigación y desarrollo de programas para que las bibliotecas pueden mejorar el aprendizaje , la investigación y la innovación.

Linked Data o datos enlazados es un método de publicación de los datos estructurados de forma que pueda ser fácilmente comprendidos por los ordenadores, lo que resulta vital para mejorar el descubrimiento de las colecciones de las bibliotecas a través de una amplia variedad de sitios populares y servicios Web, como pueden ser Google, Wikipedia y las redes sociales.

Las bibliotecas participantes en el proyecto piloto trabajaran con registros de autoridad, incluyendo 109 millones de descripciones breves de autores, directores, músicos que han sido extraídos de WorldCat, el recurso más importante del mundo de metadatos en bibliotecas. El objetivo del proyecto es reducir los datos redundantes mediante la vinculación de los conjuntos relacionados de identificadores y autoridades de personas. Mediante la presentación de una de una serie de identificadores, como VIAFISNI y LCNAF, el servicio piloto responderá con un identificador de persona WorldCat y asignaciones de identificadores adicionales para la misma persona.

VIAF es un proyecto conjunto de varias bibliotecas nacionales, implementado y alojado por OCLC. El objetivo del proyecto es disminuir el coste e incrementar la utilidad de los ficheros de autoridad de las bibliotecas mediante la comparación y la correspondencia entre los ficheros de autoridades de las bibliotecas nacionales, y poner esa información disponible en Internet.

ISNI es el número normalizado ISO para la identificación de los millones de contribuyentes a las obras de creación y de las entidades que actúan en su distribución, incluidos los investigadores, inventores, escritores, artistas, creadores visuales, artistas, productores, editores, agregadores y otros más. Es parte de una familia de identificadores de nivel internacional que incluye identificadores de obras, grabaciones, los productos y los titulares de derechos en todos los repertorios, por ejemplo, DOI, ISAN, ISBN, ISRC, ISSN, ISTC y ISWC.

LCNAF (Library of Congress Name Authority File) proporciona datos de autoridad de nombres de personas, organizaciones, eventos, lugares y títulos. Su objetivo es la identificación de estas entidades que través de la utilización de un vocabulario controlado pueda proporcionar acceso uniforme a los recursos bibliográficos.

Este proyecto inicial permitirá ganar una importante retroalimentación de los socios clave como son algunas de las las bibliotecas más importantes del mundo, para que de este modo se pueda determinar cómo se podrían desarrollar los servicios necesarios para satisfacer las necesidades de las bibliotecas. Y será un paso importante para comprender las necesidades de los flujos de trabajo a medida que las bibliotecas comiencen a trabajar con datos vinculados.

 

Buenas prácticas y recomendaciones estratégicas en un contexto de datos abiertos y relacionados

mini_magick20190303-23887-xfk21r

Térmens Graells, Miquel, Centelles Velilla, Miquel, Arroyo Fernández, Domingo, García-Morales, Elisa. Buenas prácticas y recomendaciones estratégicas sobre formatos de intercambio aplicables al Servicio de Registro de Bibliotecas y Entidades Relacionadas (SERBER) en un contexto de datos abiertos y enlazados. Madrid: España. Ministerio de Educación, Cultura y Deporte. Subdirección General de Coordinación Bibliotecaria, oct-2012

Descargar en castellano

En el marco del diseño e implementación de un modelo estratégico para el Servicio de Registro de Bibliotecas y Entidades Relacionadas con el Ministerio de Educación, Cultura y Deporte (MECD), según la norma ISO 2146:2010, la Subdirección General de Coordinación Bibliotecaria del MECD encargó a la empresa Infor@rea un estudio sobre la situación y buenas prácticas en relación a los formatos de intercambio de datos a publicar en dicho registro (desde ahora SERBER). En el primer apartado, se establecen las condiciones que el proyecto impone a la propuesta de formatos de publicación de datos, y las fuentes de información utilizadas para el estudio. En lo que respecta a las condiciones, es necesario abarcar, a largo plazo, los datos vinculados a los cinco tipos de objetos del modelo conceptual de ISO 2146:2010 además de la clase principal Objeto Registro , las subclases Partes (personas y organizaciones), Actividades, Colecciones, y Servicios y la limitación de los formatos de publicación de datos al marco de los datos abiertos (open data). También se especifican las tres cuestiones básicas que el estudio trata de responder: qué son los estándares abiertos; qué formatos específicos responden a la definición de estándares abiertos, y cuáles son los formatos abiertos idóneos para los propósitos del proyecto de SERBER. En el apartado 2, se define y delimita el concepto de estándar abierto a partir del marco normativo europeo y estatal de interoperabilidad y de reutilización de datos en el sector público. Estas fuentes permiten, además, detallar las circunstancias de aplicación de estándares no abiertos, y los criterios de selección entre diferentes estándares. En el apartado 3, y sobre la base de recomendaciones de especialistas nacionales e internacionales, se analiza qué formatos específicos responden a la definición de estándares abiertos, y cuáles son los formatos abiertos idóneos para los propósitos del proyecto de SERBER. Los tres formatos de referencia seleccionados para los propósitos del proyecto de SERBER son CSV, XML y RDF (con sus diferentes modalidades de serialización). Este último formato permite la incorporación de formatos de vinculación de datos, hecho que exige una profunda planificación previa que, entre otros aspectos, analice y seleccione los vocabularios idóneos para la descripción de los datos. En el apartado 4 se presenta el resultado de la búsqueda exhaustiva y del análisis de servicios de registro y directorios de bibliotecas y organizaciones relacionadas a nivel internacional que publican datos mediante formatos de intercambio. El resultado ha sido la identificación de una decena de casos de diferentes tipos, que se clasifican en tres grupos: servicios de registro de bibliotecas e instituciones similares (registries of libraries and related organizations) que aplican la norma ISO 2146:2010, y cuyo objeto principal de descripción en el modelo conceptual son las partes (personas y organizaciones); registros de servicios de colección (collection service registries) en pleno funcionamiento, que, como en el grupo anterior, aplican la norma ISO 2146:2010, pero se diferencian de ellos porque el objeto principal de descripción en el modelo conceptual son las colecciones; y, finalmente, directorios diseñados a partir de modelos diferentes a la norma ISO 2146:2010 y que, por lo tanto, no aplican su modelo conceptual. En los dos últimos apartados, se exponen las recomendaciones para la publicación de datos abiertos del proyecto de SERBER, expresadas en dos etapas sucesivas: una primera etapa (apartado 5) en la que los datos se publicarán en dos formatos estructurados, CSV y XML; y una segunda etapa (apartado 6), marcada por la transición estratégica hacia los datos enlazados en el contexto de la web semántica. En este segundo apartado, se presentan los pasos concretos a llevar a cabo, y los beneficios inmediatos que comportarían para el MECD.

Recomendaciones 2.0 Linked Open Data (LOD)

 

4528443760_4eb724a0db_n

Subirats, I.; Zeng, M. LODE-BD Recommendations 2.0 : How to select appropriate encoding strategies for producing Linked Open Data (LOD)-enabled bibliographic data. Rome: Food and Agriculture Organization of United Nations, 2012.

Descargar

LODE-BD Recomendaciones 2.0: Cómo seleccionar estrategias de codificación adecuados para la producción de Linked Open Data (LOD) habilitados para datos bibliográficos.

LODE-BD tiene como objetivo apoyar la selección de las estrategias de codificación apropiadas para producir proyectos Linked Open Data (LOD) habilitados para datos bibliográficas (directa o indirectamente). Las recomendaciones LODE-BD son aplicables para los datos estructurados que describen los recursos bibliográficos, tales como artículos, monografías, tesis, ponencias, materiales de presentación, informes de investigación, objetos de aprendizaje, etc – en forma impresa o electrónica. El núcleo LODE-BD contiene un conjunto de opciones de decisión recomendados para las propiedades comunes utilizados para describir una instancia de recurso bibliográfico. Cada rama de decisión se entrega con varios puntos de actuación y las propuestas de codificación que coincidan.

La gama completa de opciones presentadas por LODE-BD permitirá a los proveedores de datos para tomar sus decisiones de acuerdo con sus etapas de desarrollo, las estructuras de datos internas, y la realidad de sus prácticas.

Fundamentos de Linked Open Data

lod-book-cover

Bauer, Florian  and Martin  Kaltenböck. Linked Open Data: The Essentials A Quick Start Guide for Decision Makers. Vienna, Austria, Druck- u. Graphikservice GmbH, 2012

Descargar

Se describen los principios de vinculación de datos, se definen términos importantes como “Open Government”, y “Open Data” (Gobierno) y Linked Data, y se explican los mecanismos pertinentes para asegurar una base sólida antes profundizar más en otros aspectos. Cada capítulo explica un tema específico y propone recursos adicionales, tales como libros y sitios web, para obtener conocimientos más detallados sobre un tema particular.

Cuando hablamos de Gobierno Abierto, nos referimos a un movimiento que fue iniciado por “El Memorando sobre Transparencia y Gobierno Abierto” (La Directiva de Transparencia), firmado por el presidente de EE.UU. Barack Obama poco después de su toma de posesión en enero de 2009. La idea básica de un Gobierno Abierto es establecer una cooperación moderna entre los políticos, la administración pública, la industria y los ciudadanos, permitiendo una mayor transparencia para la democracia, la participación y la colaboración. En los países europeos, el Gobierno Abierto es a menudo visto como un compañero natural para el gobierno electrónico.

Un pasaje importante del memorando dice: “Mi administración está comprometida con la creación de un nivel sin precedentes de apertura en el gobierno. Vamos a trabajar juntos para asegurar la confianza pública y establecer un sistema de transparencia, participación pública y colaboración. La apertura fortalecerá nuestra democracia y promoverá la eficiencia y la eficacia en el gobierno»

La Alianza para el Gobierno Abierto fue lanzado el septiembre de 2011, cuando los ocho gobiernos fundadores (Brasil, Indonesia, México, Noruega, Filipinas, Sudáfrica, Reino Unido, Estados Unidos) aprobaron una declaración de Gobierno Abierto, anunció los planes de acción de sus países, y acogió con satisfacción el compromiso de los 38 gobiernos a unirse a la asociación. En septiembre de 2011, había 46 compromisos de los gobiernos nacionales para un gobierno abierto en todo el mundo.

Algunos de los facilitadores más importantes para el Gobierno Abierto son el libre acceso a la información y la posibilidad de utilizar libremente y volver a utilizar esta información (por ejemplo, datos, contenidos, etc.) Después de todo, sin información no es posible establecer una cultura de colaboración y participación entre las partes interesadas. Por lo tanto, Open Government Data (OGD) es a menudo visto como un aspecto crucial de Gobierno Abierto.

Marco bibliográfico para el modelo de datos vinculados

bibframe

Library of Congress [e-Book]  Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services Washington, DC, Library of Congress, 2012.

Descarga

La iniciativa tiene como objetivo, a largo plazo, la implementación de un nuevo entorno bibliográfico para las bibliotecas que forman el centro de “la red” y hace interconexión común. Impulsada en gran parte por el deseo de adoptar nuevas normas de catalogación, es esencial que la comunidad bibliotecaria revise sus modelos de datos bibliográficas como parte de esta iniciativa. Con ese objetivo, este documento presenta un modelo de alto nivel para la comunidad bibliotecaria para la evaluación y el debate, pero también es importante considerar este documento dentro de un contexto mucho más amplio, y que se va más allá de la propia comunidad bibliotecaria. Las bibliotecas tienen una larga y rica historia en la utilización de la tecnología para realizar economías de escala. La Biblioteca del Congreso encabezó el esfuerzo para desarrollar y aplicar el formato de lectura mecánica de Catalogación (comúnmente conocido como MARC) en los años 1960 para hacer precisamente eso – compartir información de forma electrónica. En lugar de miles de catalogadores que describen repetidamente los mismos recursos, el esfuerzo de un catalogador podría ser compartida con muchos. Con el tiempo, el formato se mantuvo prácticamente sin cambios, pero los métodos de intercambio y manipulación de datos continuaron evolucionando, así que la comunidad bibliotecaria se ha beneficiado de un período sustancial de modelo / formato de la estabilidad de los datos. Es una historia de éxito con pocos paralelos.

El nuevo Modelo Propuesto Se llama Simplemente BIBFRAME, abreviatura de Bibliographic Framework. El Nuevo Modelo es más que un mero sustituto del Modelo de Formato MARC de la comunidad bibliotecaria. Es la base para el futuro de la descripción bibliográfica que sucede sobre, dentro y como parte de la red y el mundo digital en el que vivimos.

En cierto sentido, 2011 ha sido el año de los datos vinculados de la biblioteca. No es que las bibliotecas de todo tipo están trabajando ya con datos vinculados a gran escala. No, pero hemos sido testigos de la publicación del informe final de la Biblioteca W3C Linked Data del Grupo Incubadora,  de la Biblioteca del Congreso que anuncio un nuevo marco bibliográfica para la era digital basado en Linked Data y RDF, además del lanzamiento de una serie de muchas publicaciones, reuniones y presentaciones sobre el tema.

Todos estos eventos se centran principalmente en la edición de metadatos bibliográficos como datos abiertos enlazados. los metadatos bibliográficos, como tal, describen las publicaciones, en el sentido más amplio, proporcionando información sobre el título, autores, temas, ediciones, fechas, direcciones URL, sino también los atributos físicos, como las dimensiones, número de páginas, formatos, etc Este tipo de información, en términos FRBR : Obra, Expresión y Manifestación de metadatos, se suelen compartir entre un gran número de bibliotecas, editores, libreros, etc “compartida” en este caso significa “multiplicado y redundantemente almacenada en diferentes sistemas locales. No tiene mucho sentido si todas las bibliotecas del mundo publican los mismos metadatos que otros.

Los datos de uso sobre las publicaciones, tanto impresas como digitales, pueden ser muy útiles para establecer la pertinencia y el impacto. De esta manera los solicitantes de información se puede apoyar en la búsqueda de la mejor manera posible  sobre las publicaciones de sus circunstancias específicas.

Open Linked Data : Guía para la liberación de datos abiertos

opendata

Open Linked Data : Guía para la liberación de datos abiertos [e-Book] . Madrid, Open Ximdex Evolution SL (OXE), 2013

Descargar

 

El presente documento desarrollado por Open Ximdex Evolution SL (OXE) proporciona una breve guía para la publicación de información en formato Open Linked Data (datos abiertos enlazados). Esta guía la usamos como punto de partida para analizar las posibilidades de una corporación para liberar información. Responderemos principalmente a las preguntas de cómo y en qué formatos liberar información de interés generada por una corporación ficticia (ACME Corp.1), minimizando los costes de recolección y publicación y garantizando la plena reutilización de la información. Es importante mencionar que con “datos” no sólo nos referimos a valores numéricos, sino que cualquier tipo de “documento” es susceptible de ser publicado como un “dato abierto”.

El objetivo de Open Linked Data es mejorar la información publicada para eliminar barreras en su consumo por los usuarios finales. Dependiendo del grado de compromiso (estrellas) será más sencillo automatizar tareas de utilización de la información publicada, eliminándose intermediarios que aportan poco valor a la información. La publicación en formato “datos abiertos” es un valor en alza entre las instituciones públicas para facilitar el acceso a información pública completa, fiable y de calidad.  Liberar datos (o documentos) abre un abanico de posibilidades al usuario final para usarlos, reutilizarlos, redistribuirlos o integrarlos en aplicaciones propias, o de terceros, al trabajar directamente con la fuente de la información (“datos en bruto”, “en crudo” o “raw”) en lugar de con “productos” (ej.: tablas, gráficos, etc.) derivados de la misma.

LODE-BD Recommendations 2.0: Cómo seleccionar las estrategias de codificación adecuadas para la producción de Linked Open Data (LOD)

[]

Subirats-Coll, I. and M. L. Zeng (2013). LODE-BD Recommendations 2.0 : Report on how to select appropriate encoding strategies for producing Linked Open Data(LOD) enabled bibliographical data.

Descargar

ODE-BD tiene como objetivo apoyar la selección de estrategias de codificación adecuadas para la producción significativa Linked Open Data (LOD) habilitados (directa o indirectamente). Las recomendaciones LODE-BD son aplicables para los datos estructurados que describen los recursos bibliográficos, tales como artículos, monografías, tesis, documentos de conferencias, material de presentación, informes de investigación, objetos de aprendizaje, etc – en formato impreso o electrónico.

El componente central de la LODE-BD contiene un conjunto de estructuras de decisión recomendadas para las propiedades comunes utilizados para describir una instancia de un recurso bibliográfico. Cada árbol de decisión se entrega con varios puntos de actuación y las propuestas de codificación determinadas. La gama completa de opciones presentado por LODE-BD permitirá a los proveedores de datos tomar sus decisiones de acuerdo con sus etapas de desarrollo, las estructuras de datos internas y la realidad de sus prácticas.