Archivo de la etiqueta: Datos abiertos

Datos abiertos: La transparencia y la información periodística al servicio de la sociedad en la era digital

 dataj-300x251

 

Fama, Andrea (2012). [e-Book]  Open Data – Data Journalism: trasparenza e informazione al servizio delle società nell’era digitale. Roma, Isdi.

Descargar

El periodismo como lo conocemos está pasando por una fase larga y saludable de crisis, tanto económica como de identidad. Saludable porque si bien implica despidos, cierre de periódicos, incluso históricos, disminuyendo la calidad del producto periodístico, por el otro da lugar (sobre todo gracias a las oportunidades tecnológicas) al desarrollo de un instinto natural de evolución hacia la  innovación. Tal vez se pueda hablar de una mutación genética del periodismo, una esquizofrenia que ha producido una amplia gama de periodismos posibles: alguno vicioso, porque tal vez el resultado de “cortar y pegar” ha dado lugar a un viaje de ida y vuelta a la Web donde se rebota la misma información redundante, y a muchos otros periodismos virtuosos, innovadores, participativos, hiperverticales, a veces incluso sostenibles, y siempre unidos a los  poderes que en cierta manera ha hecho perder un poco de independencia, la objetividad y la transparencia del periodismo.

La evolución, por tanto, que descubre y hereda el mejor periodismo tradicional tiene que ofrecer un intento de purificar los residuos acumulados durante décadas de compromisos y juegos de poder entre los editores, anunciantes, instituciones, etcétera.

Es en este contexto de higiene digital es en el que es posible que poco a poco toma forma el nuevo modelo periodístico, si no es totalmente nuevo, por supuesto, muy innovador en su enfoque multidisciplinario de la profesión: el periodismo de datos.

La importancia de los datos abiertos enlazados

512b458tuchl-_sx347_bo1204203200_

Isotani, S. and I. Bittencourt (2015). [e-Book] Dados abertos conectados. Sao Paulo, Novatec, 2015.

Texto completo

«Los datos son un  elemento vital en la toma de decisiones y la materia prima para la rendición de cuentas. es casi imposible diseñar políticas eficaces de monitoreo y evaluación sin datos de alta calidad que proporcionen la información correcta sobre las cosas correctas en el momento correcto «.

A World that Counts: Mobilising the data revolution for sustainable development, Naciones Unidas 2014

El mundo está lleno de datos. Los datos se generan cada vez que alguien utiliza su teléfono, cuando navegamos, cuando compramos algo por Internet o cuando vamos en nuestro automóvil conectados por GPS. Todos esos datos proporcionan una información valiosa cuando se analizan y procesan, ya que permiten la toma de decisiones basadas en patrones de comportamiento.

Esta gran cantidad de datos sobre las personas, gobiernos y empresas, está demostrado ser un instrumentos de un valor incalculable para la innovación. La posibilidad de innovación progresiva permite el sostenimiento económico a largo y medio plazo, ya que las personas capaces de utilizar estas tecnologías abiertas pueden producir nuevos negocios y nuevas soluciones a la sociedad. Además, la disponibilidad de los datos tiene un enorme potencial para proporcionar una mayor transparencia y una mayor participación de los ciudadanos en la solución de sus problemas.

Repositorios de datos de investigación y de ciencia abierta

oscience

 

 

Los datos abiertos son considerados como «la nueva materia prima del siglo 21», sin embargo en la actualidad los datos de investigación quedan encerrados en repositorios de datos, oficinas de los investigadores, o en los organismos que lo crearon. La mayoría de las instituciones académicas, organizaciones de investigación, las principales editoriales requieren que los datos se presenten adecuadamente para poder utilizarlos y que estén disponibles para sus estudios.

Los datos se definen como abiertos cuando se pueden utilizar libremente, modificar y compartir por cualquiera para cualquier propósito , incluyendo la creación de un bien común en el que cualquiera puede participar. Los datos abiertos son de utilidad a millones de personas en todo el mundo, investigadores, empresas y ciudadanos. Pero para que puedan ser de utilidad es necesario crear aplicaciones, poner en marcha nuevos productos y servicios que mejoren la transparencia y la apertura.

En los últimos años, varias organizaciones científicas nacionales e internacionales han emitido declaraciones y políticas que subrayan la necesidad de un inmediato archivo de los datos, y algunos organismos de financiación han comenzado a exigir que los datos procedentes de investigaciones que financian sean depositados en un archivo público. Estas declaraciones de las principales agencias de financiación de la investigación demuestran que la ética del intercambio de datos es esencial para maximizar el impacto y los beneficios de la investigación. La experiencia ha demostrado que la dispersión de los datos aumenta el coste de procesamiento y la preservación de los datos, y que la inversión disminuye cuando se dispone de depósitos bien conformados. (ICPSR, 2012).

El problema es cómo seleccionar el mejor repositorio para buscar los conjuntos de datos específicos que se necesitan. Los repositorios de datos varían mucho en cuanto a sus contenidos, objetivos, métodos y políticas de acceso. Dependiendo de la materia o disciplina de investigación, los datos generalmente pueden ser depositados en más de un centro de datos o repositorio. Cada depósito tiene sus propios requisitos o especificaciones respecto a los datos que ofrece, sobre la base de la investigación objeto o de dominio, metadatos, formato de archivo y / o estructura de datos, y los tipos y la naturaleza de las políticas de reutilización de datos y de acceso.

Herramientas para la recopilación de Ciencia Abierta y Datos de Investigación.

 

GENERALES

  • Dryad Digital Repository, a resource for making the data from scientific publications discoverable, reusable, and citable
  • Elsevier DataSearch. Search for research data across domains and types, from many domain-specific, cross-domain and institutional data repositories.
  • Mendeley Data Put your research data online today
  • protocols.io Discover & share science protocol knowledge
  • re3data.org the global registry of research data repositories
  • Repositive Data discovery platform for human genomic data
  • OBF Promote the practice and philosophy of Open Source software development
  • Figshare Manage your research in the cloud
  • LabScribbles Blog about real-time open access science
  • Zenodo Share all research outputs from across all fields of science
  • OSF Platform that simplifies scientific collaboration

.

.

POR DISCIPLINAS (tomados de Springer Nature)

.

Biología

 

DNA DataBank of Japan (DDBJ)
EMBL Nucleotide Sequence Database (ENA)
GenBank
dbSNP
European Variation Archive (EVA)
dbVar
Database of Genomic Variants Archive (DGVa)
EBI Metagenomics
NCBI Trace Archive
NCBI Sequence Read Archive (SRA)
Protein Circular Dichroism Data Bank (PCDDB) 
Crystallography Open Database (COD) 
Coherent X-ray Imaging Data Bank (CXIDB) 
Biological Magnetic Resonance Data Bank (BMRB)
Electron Microscopy Data Bank (EMDB) 
Worldwide Protein Data Bank (wwPDB) 
Structural Biology Data Grid
NeuroMorpho.org 
Functional Connectomes Project International Neuroimaging Data-Sharing Initiative (FCP/INDI) 
OpenfMRI 

 

Ciencias sociales

Harvard Dataverse
UK Data Service ReShare
openICPSR
Open Science Framework
Archaeology Data Service

Ciencias naturales

 

NOAA National Centers for Environmental Information (formerly the National Climatic Data Center; NCDC)
Oak Ridge National Laboratory Distributed Active Archive Center (ORNL DAAC)
Cold and Arid Regions Science Data Center (Lanzhou, China) (CARD)
World Data Center for Climate at DRKZ (WDCC)
NERC Data Centres
LTER Network Information System Data Portal
PANGAEA
Australian Antarctic Data Centre (AADC)
EarthChem
Marine Geosciences Data System
Australian Ocean Data Network
SEANOE
NASA Goddard Earth Sciences Data and Information Services Center
AEKOS – TERN Ecoinformatics

 

Ciencias de la salud

National Addiction & HIV Data Archive Program (NAHDAP)
National Database for Autism Research (NDAR)
Cancer Imaging Archive
ClinicalTrials.gov
Virtual Skeleton Database (SICAS medical image repository)
PhysioNet
National Database for Clinical Trials related to Mental Illness (NDCT)
Research Domain Criteria Database (RDoCdb)

 

Física

Reaction Database Standard Search Interface
SIMBAD Astronomical Database
UK Solar System Data Centre
NoMaD Repository

 

Química

caNanoLab*
ChEMBL*
PubChem

 

 

 

 

JISC Research Data Shared Service Project: servicio de datos compartidos de investigación

 

screen-shot-2016-06-14-at-12-10-33

Jisc Research Data Shared Service Project

RDSS Poster Open Repositories June 2016

El proyecto The Research Data Shared Service (RDSS) de JISC Joint Information Systems Committee del Reino Unido desarrollará un servicio beta con el objetivo de permitir a los investigadores dediferentes instituciones depositar fácilmente los datos para su publicación, descubrimiento, almacenamiento seguro, archivo a largo plazo y preservación. El servicio consistirá en apoyar a los investigadores para poder re-utilizar y compartir los datos, lo que les permitirá una mayor reproducibilidad de la investigación. El servicio facilitará que las instituciones cumplan con los requisitos sobre las políticas de gestión de datos de la investigación (RDM), con una mejor explotación de las eficiencias y mejores prácticas generadas a través del trabajo colectivo.

JISC ha creado un marco de contratación de depósito, conservación y presentación de informes proveedores, así como los desarrolladores que trabajarán en integraciones y mejoras de la experiencia del usuario. Trabajando en colaboración con 12 instituciones de educación superior y el consorcio de instituciones pequeñas y especializadas( CREST), para desarrollará un servicio en el que los datos de investigación pueden ser adquiridos, alojados y gestionados en nombre de las instituciones participantes.

Los objetivos que se plantea JISC con este servicio son :

  • Producir un nuevo sistema que puede ser ofrecido como un servicio gestionado, aliviando la carga del personal de las instituciones
  • Desarrollar en común una mejor interoperabilidad entre los sistemas de servicios institucionales y externos  existentes
  • Crear un sistema final, que también permitirá «escoger y mezclar» opciones para satisfacer todas las necesidades de la universidad.
  • Facilitar de gestión de datos de investigación (RDM) servicios y consultoría para apoyar los requisitos de RDM en instituciones.
  • » Creación de una experiencia de usuario intuitiva, que proporciona facilidad de uso para los investigadores y la interoperabilidad entre los sistemas de investigación institucionales y externos.

Reutilización de información pública y privada en España

 

mineria

Reutilización de información pública y privada en España:

Descargar

Avance de situación para agentes públicos y privados.

Una oportunidad para los negocios y el empleo.

Elaborado por: Alberto Abella. Socio de Rooter Analysis.

Datos abiertos (open data en inglés) es una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre a todo el mundo, sin restricciones de copyright, patentes u otros mecanismos de control. Tiene una ética similar a otros movimientos y comunidades abiertos como el código abierto (open source en inglés) y el acceso libre (open access en inglés). Para que un dato sea abierto, tiene que ser accesible y reutilizable, sin exigir permisos específicos, aunque los tipos de reutilización pueden estar controlados mediante una licencia

Los datos abiertos están centrados en material no-documental como información geográfica, el genoma, compuestos químicos, fórmulas matemáticas y científicas, datos médicos, biodiversidad… Son fuentes de datos que históricamente han estado en control de organizaciones, públicas o privadas; y cuyo acceso ha estado restringido mediante limitaciones, licencias, copyright, y patentes. Los partidarios de los datos abiertos argumentan que estas limitaciones van en contra del bien común y que estos datos tienen que ser puestos en disposición del público sin limitaciones de acceso, dado que es información que pertenece a la sociedad, como el genoma, o son datos que han sido creados por administraciones públicas (y por tanto, con los impuestos de todos), como la información geográfica o meteorológico.

Definiríamos Opendata como la puesta en común de datos para que otros usuarios, bien sean ciudadanos o profesionales los aprovechen para generar nuevos productos o servicios o simplemente para ser testigos de la ejecución de las entidades. Este documento analiza la situación de la liberación de datos públicos y privados. Se analiza únicamente su dimensión industrial sin considerar otras implicaciones sobre la transparencia, sociales, de transformación de la administración pública o de los mecanismos de colaboración en la investigación, cuyo impacto económico no puede ser despreciado.

El Opendata es el contexto económico en el que las Administraciones Públicas ponen a disposición de los ciudadanos los datos en su poder y permiten su combinación con datos privados para la creación de nuevos servicios o la mejora de los existentes. La información es ofrecida desde el ámbito público, generalmente de forma gratuita, si bien no existe todavía un consenso sobre la gratuidad o la necesidad de cobro, para garantizar modelos sostenibles.

En ese contexto el Opendata, podría crear 45.000 empleos en 10 años. Por tipos de información, la información geográfica es la más avanzada y ampliamente difundida tanto desde el punto de vista de cantidad como de estandarización técnica. España puede considerarse el segundo país más desarrollado en Opendata público (RISP) de la UE tras el Reino Unido, que junto con los Estados Unidos pueden considerarse líderes mundiales. España muestra una buena receptividad de las administraciones y una elevada descentralización de las iniciativas. Dentro del ámbito público, la administración del País Vasco puede considerarse la más destacada a nivel autonómico mientras que el Instituto Geográfico Nacional es la entidad pública más avanzada, aunque el lanzamiento de proyectos se está multiplicando en los últimos meses.

Más sobre Open Data

“Definición de Conocimiento Abierto v.1.0.” Open Knowledge Foundation Project vol., n. (2011). pp.: http://www.opendefinition.org/okd/espanol/

Marcos Martín, C. and S. L. Soriano Maldonado “Reutilización de la información del sector público y open data en el contexto español y europeo: Proyecto Aporta.” El Profesional de la Información vol. 20, n. 3 (2011). pp. 291-297. http://www.elprofesionaldelainformacion.com/contenidos/2011/mayo/07.pdf

Peset Mancebo, M. F., A. Ferrer Sapena, et al. “Open data y Linked open data: su impacto en el área de bibliotecas y documentación.”El Profesional de la Información vol. 20, n. 2 (2011). pp. 165-174. http://www.elprofesionaldelainformacion.com/contenidos/2011/marzo/06.pdf

Data Citation Index: la plataforma de datos de investigación deThompson Reuters

 

27775875241_f7f9a517d8_b_d

Data Citation Index

Parece evidente que la gestión de datos de investigación es una línea de desarrollo futuro que va a tener un peso importante en el futuro de la investigación y también de la profesión. De esta manera al igual que están haciendo las más importantes universidades del mundo, institutos de investigación y compañías privadas del peso de Thompson Reuters o Elsevier se están ocupando ya de esta cuestión. Elsevier dispone en versión beta del proyecto Mendeley Data un servicio gratuito y los conjuntos de datos están bajo licencias abiertas.

Hace ya un año Thompson Reuters anunció el lanzamiento de Data Citation Index que permite acceder a un conjunto de datos a través de temas y regiones, proporcionando una imagen completa de la producción de investigación para comprender los datos en su contexto y maximizar los esfuerzos de investigación.

El Índice de Citas de datos en la Web of Science ofrece un único punto de acceso a los datos de la investigación de calidad de los repositorios a través de disciplinas y de todo el mundo.

A través de contenidos y resumen de la información vinculada, estos datos se visualizan dentro del contexto más amplio de la investigación académica, permitiendo a los usuarios obtener una perspectiva que se pierde cuando los conjuntos de datos o repositorios son vistos en forma aislada. Estas conexiones permiten a los investigadores el acceso eficiente a una serie de datos a través de temas y regiones, proporcionando una imagen completa de los resultados de la investigación, para maximizar los esfuerzos de investigación y evaluar con precisión su importancia para acelerar la investigación, el descubrimiento y la innovación.

 

¿Qué es el Gobierno Abierto y los datos abiertos?

gobierno-abierto-logotipo_sofi-520x513

En el fascinante mundo de la cultura abierta después del software de código abierto, estándares abiertos, el acceso abierto y el contenido abierto; el fenómeno de los datos abiertos es la última frontera y quizás incluso en la actualidad uno de los recursos más estratégicos para gobiernos y organizaciones. A finales de la década del 2000 se abrió el debate sobre la importancia de la disponibilidad y la libre difusión de los datos “en bruto” con el fin de aumentar el potencial de la información y la comunicación del conocimiento compartido de la revolución digital. Pronto se percibió que la capacidad de recopilar, gestionar y reutilizar cantidades de datos cada vez más relacionados y más densos conducía a la necesidad de algunas reflexiones de carácter tanto legales como tecnológicas.

El concepto de Gobierno Abierto (Open Government) se ha popularizado recientemente, tanto por las propias iniciativas gubernamentales como –especialmente– por los movimientos ciudadanos y la reflexión y análisis intelectual y académico que reclaman su implantación. Pero su popularización también ha incrementado la diversidad de definiciones y la ambigüedad del propio término, que en ocasiones se solapa con otros conceptos como Gobierno Electrónico, gobierno eficiente, transparencia…, confundiendo los fines con los canales, los medios o las prácticas. La transparencia y rendición de cuentas (accountability) son elementos necesarios para el Gobierno Abierto, pero son solo una parte de lo que ese concepto puede implicar a nivel político y social. El papel capital de Internet y de la cultura digital para el avance de la toma de conciencia sobre la necesidad del Gobierno Abierto, donde  la primacía del derecho de acceso a la información, a la colaboración y la transparencia basadas en Internet requerían además de otros factores imprescindibles, como una regulación legal adecuada, una nueva conciencia de las instituciones y sus responsables y una intensa participación ciudadana.

open-government-c

Cuando hablamos de Gobierno Abierto, nos referimos a un movimiento que fue iniciado por “El Memorando sobre Transparencia y Gobierno Abierto” (La Directiva de Transparencia), firmado por el presidente de EE.UU. Barack Obama poco después de su toma de posesión en enero de 2009. La idea básica de un Gobierno Abierto es establecer una cooperación moderna entre los políticos, la administración pública, la industria y los ciudadanos, permitiendo una mayor transparencia para la democracia, la participación y la colaboración. En los países europeos, el Gobierno Abierto es a menudo visto como un compañero natural para el gobierno electrónico.

Algunos de los facilitadores más importantes para el Gobierno Abierto son el libre acceso a la información y la posibilidad de utilizar libremente y volver a utilizar esta información (por ejemplo, datos, contenidos, etc.) Después de todo, sin información no es posible establecer una cultura de colaboración y participación entre las partes interesadas. Por lo tanto, Open Government Data (OGD) es a menudo visto como un aspecto crucial de Gobierno Abierto.

El objetivo de Open Linked Data es mejorar la información publicada para eliminar barreras en su consumo por los usuarios finales. Dependiendo del grado de compromiso (estrellas) será más sencillo automatizar tareas de utilización de la información publicada, eliminándose intermediarios que aportan poco valor a la información. La publicación en formato “datos abiertos” es un valor en alza entre las instituciones públicas para facilitar el acceso a información pública completa, fiable y de calidad.  Liberar datos (o documentos) abre un abanico de posibilidades al usuario final para usarlos, reutilizarlos, redistribuirlos o integrarlos en aplicaciones propias, o de terceros, al trabajar directamente con la fuente de la información (“datos en bruto”, “en crudo” o “raw”) en lugar de con “productos” (ej.: tablas, gráficos, etc.) derivados de la misma.

La Alianza para el Gobierno Abierto fue lanzado el septiembre de 2011, cuando los ocho gobiernos fundadores (Brasil, Indonesia, México, Noruega, Filipinas, Sudáfrica, Reino Unido, Estados Unidos) aprobaron una declaración de Gobierno Abierto, anunciaron los planes de acción de sus países, y acogió con satisfacción el compromiso de los 38 gobiernos a unirse a la asociación. En septiembre de 2011, había 46 compromisos de los gobiernos nacionales para un gobierno abierto en todo el mundo.

 

Datos abiertos y gobierno abierto  Planeta Biblioteca 02/05/2013. OIR PODCAST

Open Linked Data : Guía para la liberación de datos abiertos [e-Book] . Madrid, Open Ximdex Evolution SL (OXE), 2013 Descargar

Ver: Bauer, Florian  and Martin  Kaltenböck. Linked Open Data: The Essentials A Quick Start Guide for Decision Makers. Vienna, Austria, Druck- u. Graphikservice GmbH, 2012. Descargar

Aliprandi, Simone Il fenomeno open data. Indicazioni e norme per un mondo di dati aperti.  [e-Book] Roma, LediPublishing, 2014 Texto completo

Linked Data y Linked Open Data

 

20160618_wbd002

La World Wide Web ha permitido la creación de un espacio de información global que comprende documentos vinculados. A medida que la Web se ve implicada en nuestra vida cotidiana, hay un deseo creciente de acceso directo a los datos en bruto o ligada a documentos de hipertexto. Linked Data proporciona un paradigma  en el que no sólo los documentos, sino también los datos puede ser un recurso de primera clase de la Web, lo que permite la extensión de la Web a un espacio global de datos basada en estándares abiertos – la Web de Datos. En este documento de síntesis  se ofrece una  introducción técnica detallada sobre los Linked Data. Sobre la base de un escenario práctico Linked Data, se establecen prácticas de orientación y mejoras sobre la arquitectura de publicación de Linked Data, la elección de URIs y vocabularios para identificar y describir los recursos, decidir qué datos proporcionarse en la descripción de un recurso en la Web, los métodos y marcos para la vinculación automática de conjuntos de datos, probar y depurar datos para el despliegue de datos vinculados.

ld2

Linked data at OCLC

En el marco del diseño e implementación de un modelo estratégico para el Servicio de Registro de Bibliotecas y Entidades Relacionadas con el Ministerio de Educación, Cultura y Deporte (MECD), según la norma ISO 2146:2010, la Subdirección General de Coordinación Bibliotecaria del MECD encargó a la empresa Infor@rea un estudio sobre la situación y buenas prácticas en relación a los formatos de intercambio de datos a publicar en dicho registro. En el primer apartado, se establecen las condiciones que el proyecto impone a la propuesta de formatos de publicación de datos, y las fuentes de información utilizadas para el estudio. En lo que respecta a las condiciones, es necesario abarcar, a largo plazo, los datos vinculados a los cinco tipos de objetos del modelo conceptual de ISO 2146:2010 además de la clase principal Objeto Registro, las subclases Partes (personas y organizaciones), Actividades, Colecciones, y Servicios y la limitación de los formatos de publicación de datos al marco de los datos abiertos (open data). También se especifican las tres cuestiones básicas que el estudio trata de responder: qué son los estándares abiertos; qué formatos específicos responden a la definición de estándares abiertos, y cuáles son los formatos abiertos idóneos para los propósitos del proyecto de SERBER. En el apartado 2, se define y delimita el concepto de estándar abierto a partir del marco normativo europeo y estatal de interoperabilidad y de reutilización de datos en el sector público. Estas fuentes permiten, además, detallar las circunstancias de aplicación de estándares no abiertos, y los criterios de selección entre diferentes estándares. En el apartado 3, y sobre la base de recomendaciones de especialistas nacionales e internacionales, se analiza qué formatos específicos responden a la definición de estándares abiertos, y cuáles son los formatos abiertos idóneos para los propósitos del proyecto de SERBER. Los tres formatos de referencia seleccionados para los propósitos del proyecto de SERBER son CSV, XML y RDF (con sus diferentes modalidades de serialización). Este último formato permite la incorporación de formatos de vinculación de datos, hecho que exige una profunda planificación previa que, entre otros aspectos, analice y seleccione los vocabularios idóneos para la descripción de los datos. En el apartado 4 se presenta el resultado de la búsqueda exhaustiva y del análisis de servicios de registro y directorios de bibliotecas y organizaciones relacionadas a nivel internacional que publican datos mediante formatos de intercambio. El resultado ha sido la identificación de una decena de casos de diferentes tipos, que se clasifican en tres grupos: servicios de registro de bibliotecas e instituciones similares (registries of libraries and related organizations) que aplican la norma ISO 2146:2010, y cuyo objeto principal de descripción en el modelo conceptual son las partes (personas y organizaciones); registros de servicios de colección (collection service registries) en pleno funcionamiento, que, como en el grupo anterior, aplican la norma ISO 2146:2010, pero se diferencian de ellos porque el objeto principal de descripción en el modelo conceptual son las colecciones; y, finalmente, directorios diseñados a partir de modelos diferentes a la norma ISO 2146:2010 y que, por lo tanto, no aplican su modelo conceptual. En los dos últimos apartados, se exponen las recomendaciones para la publicación de datos abiertos del proyecto de SERBER, expresadas en dos etapas sucesivas: una primera etapa (apartado 5) en la que los datos se publicarán en dos formatos estructurados, CSV y XML; y una segunda etapa (apartado 6), marcada por la transición estratégica hacia los datos enlazados en el contexto de la web semántica. En este segundo apartado, se presentan los pasos concretos a llevar a cabo, y los beneficios inmediatos que comportarían para el MECD.

img12

Tim Berners-Lee — Linked Data

En el contexto de las bibliotecas la iniciativa “Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services” tiene como objetivo, a largo plazo, la implementación de un nuevo entorno bibliográfico para las bibliotecas que forman el centro de “la red” y hace interconexión común. Impulsada en gran parte por el deseo de adoptar nuevas normas de catalogación, es esencial que la comunidad bibliotecaria revise sus modelos de datos bibliográficas como parte de esta iniciativa. Con ese objetivo, este documento presenta un modelo de alto nivel para la comunidad bibliotecaria para la evaluación y el debate, pero también es importante considerar este documento dentro de un contexto mucho más amplio, y que se va más allá de la propia comunidad bibliotecaria. Las bibliotecas tienen una larga y rica historia en la utilización de la tecnología para realizar economías de escala. La Biblioteca del Congreso encabezó el esfuerzo para desarrollar y aplicar el formato de lectura mecánica de Catalogación (comúnmente conocido como MARC) en los años 1960 para hacer precisamente eso – compartir información de forma electrónica. En lugar de miles de catalogadores que describen repetidamente los mismos recursos, el esfuerzo de un catalogador podría ser compartido con muchos. Con el tiempo, el formato se mantuvo prácticamente sin cambios, pero los métodos de intercambio y manipulación de datos continuaron evolucionando, así que la comunidad bibliotecaria se ha beneficiado de un período sustancial de modelo / formato de la estabilidad de los datos. Es una historia de éxito con pocos paralelos.

El nuevo Modelo Propuesto Se llama Simplemente BIBFRAME, abreviatura de Bibliographic Framework. El Nuevo Modelo es más que un mero sustituto del Modelo de Formato MARC de la comunidad bibliotecaria. Es la base para el futuro de la descripción bibliográfica que sucede sobre, dentro y como parte de la red y el mundo digital en el que vivimos.

En cierto sentido, en el año 2011 se empezó a trabajar con datos vinculados de la biblioteca. No es que las bibliotecas de todo tipo están trabajando ya con datos vinculados a gran escala. No, pero hemos sido testigos de la publicación del informe final de la Biblioteca W3C Linked Data del Grupo Incubadora,  de la Biblioteca del Congreso que anuncio un nuevo marco bibliográfico basado en Linked Data y RDF, además del lanzamiento de una serie de muchas publicaciones, reuniones y presentaciones sobre el tema.

Todos estos eventos se centran principalmente en la edición de metadatos bibliográficos como datos abiertos enlazados. los metadatos bibliográficos, como tal, describen las publicaciones, en el sentido más amplio, proporcionando información sobre el título, autores, temas, ediciones, fechas, direcciones URL, sino también los atributos físicos, como las dimensiones, número de páginas, formatos, etc. Este tipo de información, en términos FRBR: Obra, Expresión y Manifestación de metadatos, se suelen compartir entre un gran número de bibliotecas, editores, libreros, etc. “compartida” en este caso significa “multiplicado y redundantemente almacenada en diferentes sistemas locales. No tiene mucho sentido si todas las bibliotecas del mundo publican los mismos metadatos que otros.

Los datos de uso sobre las publicaciones, tanto impresas como digitales, pueden ser muy útiles para establecer la pertinencia y el impacto. De esta manera los solicitantes de información se pueden apoyar en la búsqueda de la mejor manera posible  sobre las publicaciones de sus circunstancias específicas.

Ver:

 

Datos Abiertos Vinculados. ¿Qué son? from Europeana on Vimeo.Vimeo.

Planeta Biblioteca 22/03/2013 Datos vinculados abiertos – Linked Open Data OIR PODCAST

Library of Congress [e-Book]  Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services Washington, DC, Library of Congress, 2012. DescargaDescarga

Térmens Graells, Miquel, Centelles Velilla, Miquel, Arroyo Fernández, Domingo, García-Morales, Elisa. Buenas prácticas y recomendaciones estratégicas sobre formatos de intercambio aplicables al Servicio de Registro de Bibliotecas y Entidades Relacionadas (SERBER) en un contexto de datos abiertos y enlazados. Madrid: España. Ministerio de Educación, Cultura y Deporte. Subdirección General de Coordinación Bibliotecaria, oct-2012 Descargar en castellanoDescargar en Inglés

Heath, Tom  and Christian  Bizer (2011). [e-Book]  Linked Data: Evolving theWeb into a Global Data Space. North Carolina Morgan & Claypool Publish. DescargarDescargar

Datos abiertos : fuentes de información sobre datos públicos

 

341-faq-del-lunes-fuentes-de-datos-abiertos-relacionados-con-el-trafico

¿Usted sabe exactamente cuánto de su dinero de los impuestos se gasta en luces de la calle o en la investigación del cáncer? ¿Cuál es el más corto, el más seguro y el más pintoresco recorrido en bicicleta desde su casa a su trabajo? ¿Cual es la calidad del aire de en su comunidad? ¿Cuando en su región se van a encontrar las mejores oportunidades de trabajo y el número más alto de árboles frutales por habitante? ¿Cuándo puede afectar a las decisiones sobre los temas que le interesan profundamente? Con las nuevas tecnologías es posible crear servicios que respondan  a estas preguntas casi automáticamente. Ya que gran parte de los datos que se necesitan para responder a las cuestiones planteadas arriba han sido generados por organismos públicos. Sin embargo, muchas de los datos requeridos no están disponibles en una forma adecuada y fácil de usar.

Datos abiertos (open data en inglés) es una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre a todo el mundo, sin restricciones de copyright, patentes u otros mecanismos de control. Tiene una ética similar a otros movimientos y comunidades abiertos como el Software libre, el código abierto y el acceso libre. En la actualidad uno de los recursos más estratégicos para gobiernos y organizaciones.

El concepto de Gobierno Abierto (Open Government) se ha popularizado recientemente, tanto por las propias iniciativas gubernamentales como –especialmente– por los movimientos ciudadanos y la reflexión y análisis intelectual y académico que reclaman su implantación. Pero su popularización también ha incrementado la diversidad de definiciones y la ambigüedad del propio término, que en ocasiones se solapa con otros conceptos como Gobierno Electrónico, gobierno eficiente, transparencia…, confundiendo los fines con los canales, los medios o las prácticas. La transparencia y rendición de cuentas (accountability) son elementos necesarios para el Gobierno Abierto, pero son solo una parte de lo que ese concepto puede implicar a nivel político y social. El papel capital de Internet y de la cultura digital para el avance de la toma de conciencia sobre la necesidad del Gobierno Abierto, donde  la primacía del derecho de acceso a la información, a la colaboración y la transparencia basadas en Internet requerían además de otros factores imprescindibles, como una regulación legal adecuada, una nueva conciencia de las instituciones y sus responsables y una intensa participación ciudadana.

A finales de la década del 2000 se abrió el debate sobre la importancia de la disponibilidad y la libre difusión de los datos “en bruto” con el fin de aumentar el potencial de la información y la comunicación del conocimiento compartido de la revolución digital. Pronto se percibió que la capacidad de recopilar, gestionar y reutilizar cantidades de datos cada vez más relacionados y más densos conducía a la necesidad de algunas reflexiones de carácter tanto legales como tecnológicas.

En 2009 los datos abiertos comenzaron a hacerse visibles en la corriente principal, a través de varios gobiernos (como los EE.UU., Reino Unido, Canadá y Nueva Zelanda) que anunciaron sus iniciativas hacia la apertura de su información pública.

En 2010 se publicaron los Principios Panton Principles for Open Data in Science. Estos principios redundaban en la idea de que “la ciencia se basa en la construcción, reutilización y apertura crítica de la publicación de los datos del conocimiento”  en los que se proporcionaba una lista breve de los fundamentos a tener en cuenta cuando se exponen datos abiertos. Destinado a una amplia audiencia de investigadores, editores y bibliotecarios, el libro Issues in Open Research Data explora las implicaciones de los principios a través de una serie de puntos de vista sobre los datos de investigación abiertos.

Otro recursos imprescindible en este sentido es el desarrollado por la Open Knowledge Foundation “Open Data Handbook Documentation”, publicado en 2012. El libro trata sobre cómo desbloquear el potencial de la información oficial y implementar nuevos servicios, para mejorar la vida de los ciudadanos y para mejorar el trabajo del gobierno y de la sociedad. El manual aborda los aspectos jurídicos, sociales y técnicos de los datos abiertos.

Cuando se habla de datos en este contexto, se refieren a números, letras, o píxeles expresados en cualquier forma. Los datos  pueden encontrarse en bruto o elaborados y dispuestas en una forma significativa. Sin embargo, algunos datos significativos son y pueden ser leídos e interpretados en su forma básica. Grupos significativos de datos son colecciones de conjuntos de datos y archivos de datos son los datos. A este respecto algunos gobiernos han establecido una serie de pautas. Así el Plan de Acción para el Departamento de Salud del Gobierno de Queensland ha determinado algunos requisitos imprescindibles para lograr alcanzar el compromiso con la revolución de datos abiertos. Estableciendo que estos datos serán publicados en un sitio web, disponible y tendrán como características:

 

• Estar disponible para cualquier uso

• Estar disponible de forma gratuita

• Disponible en formatos normalizados y fáciles de encontrar

• Estarán libres conforme a las normas y responsabilidades establecidas.

 

Aquí presentamos algunas de las más importantes fuentes de datos públicos y abiertos en España y en el mundo.

En España
Datos Públicos Esta wiki que recopilar fuentes de datos públicos disponibles en España. Es un proyecto iniciado por Pro Bono Publico para facilitar la participación en el desafío de datos abiertos.
En el mundo
Data.gov : La página web Data.gov tiene 210.912 conjuntos de datos que están abiertos y disponibles gratuitamente para su descarga y uso. Muchos de los conjuntos de datos son visibles a través de mapas interactivos.
ARDA – Association of Religion Data Archives: Este sitio web tiene también su propia sección de Mapas de GIS donde los usuarios pueden trazar conjuntos de datos religiosos sobre un barrio y / o mapas mundo.
Fuentes de datos públicos y abiertos en España y en el mundo. : sitio web La Oficina del Censo de EE.UU. tiene la versión más reciente del censo de EE.UU., que se puede descargar gratuitamente. También tienen una galería de visualizaciones de datos donde se pueden encontrar  infografías y mapas en los que se han utilizado los conjuntos de datos de la Oficina del Censo.
CIA World Factbook : The World Factbook, es elaborado por la Agencia Central de Inteligencia y proporciona información sobre la historia, la gente, gobierno, economía, geografía, comunicaciones, transporte, militar y cuestiones transnacionales de 267 entidades del mundo.
Eurostat : La misión de Eurostat es ser el principal proveedor de estadísticas de alta calidad a la Unión Europea y los países candidatos.
Observatorio Mundial de la Salud : Esta colección cuenta con más de 50 conjuntos de datos sobre temas prioritarios de salud como la mortalidad y la carga de las enfermedades, los Objetivos de Desarrollo del Milenio (nutrición infantil, salud infantil, la salud materna y reproductiva, la inmunización, el VIH / SIDA, la tuberculosis, el paludismo, las enfermedades olvidadas, agua y saneamiento), las enfermedades no transmisibles y factores de riesgo, enfermedades epidémicas, sistemas de salud, la salud ambiental, la violencia y las lesiones, la equidad, entre otros.
Harvard Dataverse Red : Esto es un repositorio para compartir, citando y la preservación de los datos de la investigación, abierta a todos los datos científicos de todas las disciplinas en todo el mundo. Incluye la mayor colección del mundo de los datos de la investigación en ciencias sociales.
HUD.gov : El Departamento de Vivienda y Desarrollo Urbano de EE.UU. ofrece algunos conjuntos de datos descargables sobre estos temas.
Fondo Monetario Internacional (FMI) de datos : El FMI (Fondo Monetario Internacional) publica una serie de datos de series de tiempo sobre los préstamos del FMI, de cambio y otros indicadores económicos y financieros.
NOAA: La Administración Nacional Oceánica y Atmosférica : National Climatic Data Center de la NOAA (CNDC) es el mayor proveedor mundial de datos meteorológicos y climáticos. -Base en tierra, mar, modelo, radar, globo de tiempo, satélite y paleoclimáticos son sólo algunos de los tipos de conjuntos de datos disponibles.
NYC Open Data : Esta colección cuenta con más de 800 conjuntos de datos que pertenecen a la ciudad de Nueva York, la mayoría de los cuales se puede ver como un mapa interactivo. Incluyen ubicaciones de graffiti, la ubicación de aseos en los parques públicos, lugares wifi, entradas de metro, y mucho más.
Centro Roper : Esta colección abierta tiene 19.000 conjuntos de datos que reflejan la opinión pública y las tendencias sociales, incluyendo las encuestas de Gallup que se remontan a 1936, Informes Roper y mucho más.
UNdata : La División de Estadística de las Naciones Unidas (UNSD) del Departamento de Asuntos Económicos y Sociales (DAES) puso en marcha un nuevo servicio de datos basado en Internet para la comunidad mundial de usuarios para proporcionar el libre acceso a las estadísticas mundiales.
Colección de datos del Banco Mundial : El Catálogo de datos proporciona acceso a más de 8.000 descargas indicadores a partir de conjuntos de datos del Banco Mundial, una búsqueda por país, los indicadores, o tema.

Estudio OpenAire sobre la utilización y protección de datos y recomendaciones de la investigación en acceso abierto

465242_cover

Ver: Guibault, L. and A. Wiebe [e-Book]  Safe to be open : Study on the protection of research data and recommendations for access and usage. Göttingen : OpenAire ; Universitätsverlag Göttingen, 2013

Descargar

 

El objetivo del estudio es examinar los requisitos legales para diferentes tipos de uso de los datos de investigación de una infraestructura de acceso abierto, como OpenAIREplus, que los vincula a las publicaciones.

El estudio se estructura en cuatro partes:

1. En la primera parte, se analizan los requisitos para la protección jurídica de los datos de investigación. En el proceso, el marco jurídico vigente en materia de propiedad intelectual potencialmente relevantes (PI) se analiza desde diferentes perspectivas: en primer lugar, desde la perspectiva general europea y, posteriormente, desde la de los Estados miembros de la UE seleccionados (Francia, Alemania, Italia, Países Bajos, Polonia y el Reino Unido). Cabe señalar que el marco jurídico europeo se ha armonizado parcialmente en el campo del derecho de autor y en gran medida también en el ámbito de la protección de bases de datos “sui generis” por las directivas de la UE. Por lo tanto, las regulaciones nacionales son muy similares en muchos aspectos.

Las diferencias nacionales son descritas después de la sección sobre la aplicación nacional en el Capítulo 2.5. A pesar de la armonización europea, el quizás sorprendente resultado del análisis es que existen algunas áreas de desarmonización entre los diferentes estados miembros. Un ejemplo muy significativo de desarmonización es la “excepción para la investigación científica”. Estas excepciones no son obligatorias ni vinculantes en la legislación nacional y parece que cada estado miembro tiene su propia interpretación de la Directiva de base. Tal como está redactada la directiva en la actualidad, la “excepción para la investigación científica” es para todos los propósitos casi inútil.

Otra área que causa dificultades es la cuestión de quién es el titular del derecho en una base de datos creada por un organismo público o en el curso de una investigación financiada con fondos públicos. De hecho, está lejos de ser clara. Algunos podrían decir que la institución de investigación o el organismo de financiación o ambos se convierten en los titulares del derecho. Pero según se establece en los regímenes jurídicos considerados en el estudio, la única jurisdicción con una regulación clara sobre este asunto es la de los Países Bajos, aunque por lo general se niega a la autoridad pública el derecho de ejercer el derecho exclusivo de propiedad sobre la base de datos.

Además, todavía no está claro si la vinculación, o por lo menos, la vinculación profunda, deben ser vistas como un acto pertinente de la comunicación pública. Hay sentencias contradictorias a nivel de los estados miembros. Sin embargo, al menos esta cuestión pronto se aclarará en el ámbito de una referencia real a la Corte Europea de Justicia (TJCE).

2. La segunda parte del estudio se dedica al alcance de la protección de los derechos de propiedad intelectual potencialmente relevantes. En primer lugar se hace un análisis de si los diferentes tipos de uso, como la vinculación, el acceso o la explotación de datos, infringen los diferentes tipos de derechos de propiedad intelectual.

3. La tercera parte es un examen de algunos problemas con las licencias más pertinentes. Dentro de esta parte del estudio, se analizan diferentes modelos de licencia con el fin de identificar que licencia se adapta mejor al objetivo del acceso abierto, especialmente en el contexto de la infraestructura de OpenAIREplus. El resultado es que la próxima versión de licencia CC 4.0 probablemente será la más adecuada para este tipo de infraestructura.

4. En la última parte, se dan algunas recomendaciones para mejorar la situación de los derechos en relación con los datos de la investigación. Concluyendo al respecto que el hecho de que la excepción de la investigación científica tal como está formulada en la actualidad es poco operativa, por lo que se sugiere que se formule una nueva y más amplia investigación sobre la excepción obligatoria a nivel europeo. Para lograr la interoperabilidad jurídica de diferentes bases de datos y las infraestructuras electrónicas, se recomienda que todos ellos deban conceder licencias sobre sus datos en virtud de la próxima licencia CC 4.0