Archivo de la etiqueta: Metadatos

USLM XML : Un nuevo formato XML que facilita la descarga y la reutilización de documentos

Resultado de imagen de "USLM XML" GPO

USLM XML

https://github.com/usgpo/bulk-data

Ver Noticia

La Oficina de Publicaciones del Gobierno de los Estados Unidos (GPO) anuncia la publicación en versión beta de un nuevo formato XML que facilita la descarga y la reutilización de documentos (United States Legislative Markup (USLM))

 

Los documentos disponibles en el formato Beta USLM XML incluyen proyectos de ley inscritos y leyes públicas a partir del 113º Congreso (2013) y los Estatutos generales a partir del 108º Congreso (2003). Pueden consultarse en govinfo, el sitio de la GPO en el que se ofrece información auténtica publicada del Gobierno. https://www.govinfo.gov/bulkdata.

Este nuevo formato maximiza el número de formas en que la información puede ser utilizada o reutilizada para aplicaciones móviles u otros proyectos digitales o de impresión. El público podrá ahora descargar grandes conjuntos de datos con un solo clic en lugar de descargar cada archivo individualmente, lo que ahorrará mucho tiempo a los desarrolladores y a otras personas que deseen reutilizar los datos.

 

 

 

Tendencias multidisciplinarias del uso de los metadatos

portadatendencias

Rodríguez García, Ariel Alejandro, González Castillo, Raúl Ariel. “Tendencias multidisciplinarias del uso de los metadatos” Ciudad de México: UNAM, 2018

Texto completo

PDF

ePub

Esta obra se forma a partir de las reflexiones recogidas del Seminario de Investigación sobre Metadatos y el esfuerzo colectivo de distintos investigadores y especialistas cuyo marco de discusión fue analizar los aspectos conceptuales, teóricos y metodológicos sobre el uso de los metadatos desde una perspectiva multidisciplinaria. Desde que los metadatos aparecieron en la Bibliotecología, se consideraron como referentes para la descripción de los recursos de información y los servicios que potencialmente se ofrecen a los usuarios. De ahí que su fin principal sea facilitar la identificación, localización, recuperación, manipulación y uso de los datos contenidos en los recursos de información. En este libro advertimos estos funcionamientos desde la perspectiva de la Bibliotecología, los Estudios de la Información, y otras materias afines.

Descubrimiento de monografías de Acceso Abierto en la cadena de suministro de bibliotecas: proyecto de informe y recomendaciones

43796081100_acdeff2110_n_d

OA monographs discovery in the library supply chain: draft report and recommendations
By Mafalda Marques October 25, 2018

Ver completo

Estudios clave, como el proyecto OAPEN-NL, han demostrado que el acceso abierto tiene un impacto positivo en el uso y descubrimiento de monografías. Sin embargo, un tema recurrente para los editores de monografías de acceso abierto es el de la descubribilidad, la difusión y los metadatos.

 

En 2017, el informe Jisc Changing publishing ecologies sugirió que se elaboraron mejores prácticas en materia de metadatos, ya que la calidad de los metadatos en las editoriales de universidades y en las iniciativas de publicación dirigidas por académicos se encontraba en diversos niveles de madurez. Esta opinión fue confirmada a nivel europeo por el informe Knowledge Unlatched al proyecto OPERAS sobre la visibilidad de los metadatos.

Con el fin de llevar adelante las recomendaciones del informe Jisc, en julio de 2018 se celebró un taller comunitario para tratar los problemas con las partes interesadas clave para la siguiente declaración del problema:

“Los editores de OA tienen dificultades para acceder a los canales que los departamentos de adquisición de bibliotecas utilizan para comprar contenido impreso y de libros electrónicos”.

El taller reunió a expertos de NUPs, ALPs, proveedores y distribuidores de libros, proveedores de metadatos, bibliotecas y otros expertos en la publicación de OA para discutir la declaración anterior. El objetivo central del taller era permitir que los expertos compartieran sus experiencias y conocimientos a fin de comprender mejor la cadena de suministro y comprender mejor el planteamiento del problema.

Se pidió a las partes interesadas de las UPN, los ALP, los proveedores de libros y las bibliotecas universitarias que ofrecieran una breve visión general y un esbozo del planteamiento del problema desde su perspectiva como parte de la cadena de suministro del flujo de trabajo de publicación/bibliotecas. Otros expertos en la mesa compartieron sus conocimientos para entender y desarrollar estos temas en relación con el planteamiento del problema y para considerar qué aprendizaje debe llevarse a cabo para abordar el planteamiento del problema.

A continuación se exponen los cuatro debates. Además, estas discusiones pusieron de relieve cuatro áreas clave, que el grupo acordó que necesitaban un mayor desarrollo. Éstas se han presentado como un conjunto de recomendaciones y sugerencias de mejores prácticas.

La Editoriales Universitarias dirigidas por bibliotecas pueden definirse como un “conjunto de actividades dirigidas por bibliotecas universitarias y de enseñanza superior para apoyar la creación, difusión y curaduría de obras académicas, creativas y/o educativas” (Library Publishing Coalition).

Se destacó que el planteamiento del problema no era sólo un problema de acceso abierto, sino un problema al que se enfrentan todas las pequeñas edtoriales. Se consideró que era necesario cierto grado de normalización para hacer frente a los canales de metadatos. También hubo problemas con los metadatos a nivel de capítulo en el sentido de que no siempre hay un medio para capturarlos.

Se sugirió que los proveedores no siempre ven los beneficios de la “gratuidad” y que las UPN tienen canales pagados y no pagados, por ejemplo, la mayoría de las imprentas que publican monografías ofrecen una versión gratuita de libre acceso, generalmente un PDF y una impresión a la carta para la venta. Las editoriales también necesitan demostrar el valor del acceso abierto y se consideró que este era un tema clave para que las partes interesadas de la cadena de suministro de bibliotecas lo entendieran.

Lo que se necesita son flujos de trabajo prácticos y soluciones duraderas que eviten la duplicación en la creación de metadatos. Esto sólo puede provenir del conocimiento compartido dentro de la cadena de suministro.

En cuanto a la detección de bibliotecas en la cadena de suministro, se observó que uno de los problemas más importantes era cómo trabajar con los sistemas de bibliotecas, ya que no hay ningún lugar donde añadir “gratis” a los registros MARC. Los encargados de la supervisión nacional desean saber cómo pueden trabajar con las bibliotecas para ayudar a que se puedan descubrir los contenidos. Esto condujo a un debate sobre los ISBN y se preguntó a las editoriales si atribuían ISBN separados a cada formato. Parece que esto lo hacen unos y no otros. Por lo tanto, se trata de un ámbito potencial para la normalización de los procesos. Sin embargo, las limitaciones con ONIX significan que los metadatos pueden no ser capturados para múltiples ISBNs.

 

Editores académicos

La edición académica puede describirse como “una iniciativa editorial creada y gestionada por académicos….. Las editoriales  académicas son, en la mayoría de los casos, entidades sin ánimo de lucro, independientes, creadas para proporcionar una vía de publicación alternativa a las editoriales comerciales o para apoyar la publicación de libros en acceso abierto.

Las publicaciones académicas o dirigidas por académicos han evolucionado a partir de la opinión de los académicos de que las opciones actuales para los autores no ofrecen lo que los académicos quieren. Por ejemplo, diferentes contenidos, diseño, datos, interacción, etc. El acceso abierto crea estas nuevas interacciones con los lectores y la investigación. Se preguntó a las bibliotecas qué hacen para que los investigadores conozcan el contenido de las investigaciones realizadas por los investigadores, qué quiere la comunidad bibliotecaria y qué puede hacer la editorial para ayudar a conseguirlo.Sobre todo es necesario un proceso para generar fácilmente metadatos, como MARC, ONIX, KBART y todos los demás formatos requeridos en las diferentes etapas de la cadena de suministro.

Se destacó que podría haber una posible solución dirigida por la iniciativa de la Base Nacional de Conocimientos Bibliográficos de Jisc y que los datos podrían convertirse al formato MARC 21, en el que las bibliotecas podrían descargar registros con algún tipo de identificador de acceso abierto. En este punto, se hizo una importante diferenciación entre descubrimiento y adquisición y que las dos áreas tenían diferentes conjuntos de sistemas y flujos de trabajo. La detección a través de sistemas de bibliotecas es un área más fácil de resolver a través de plataformas como DOAB y OAPEN. Sin embargo, los metadatos conservados en los sistemas de bibliotecas tienden a incluir elementos que han sido `comprados’, lo que refuerza la necesidad de resolver los problemas de metadatos en la cadena de suministro de las bibliotecas.

En cuanto a la incorporación de material de acceso abierto en los entornos de aprendizaje digital para la enseñanza, se consideró que el contenido de acceso abierto se presentaba normalmente de manera muy informal, mientras que el contenido de pago se organizaba a menudo formalmente debido a las compras y al flujo de metadatos a través de la cadena de suministro de las bibliotecas. Se percibió que el descubrimiento en estos sistemas a través de la cadena de suministro de las bibliotecas podría ayudar a asumir que el contenido de acceso abierto, en particular las monografías, no eran revisadas por pares y eran de más baja calidad que el contenido pagado.

Se observó que existían instrumentos para introducir contenidos de acceso abierto, como los recursos educativos abiertos, en los entornos de aprendizaje sin utilizar necesariamente la cadena de suministro de las bibliotecas. Por ejemplo, utilizando plataformas como Kortext y Talis Aspire.

Proveedores de libros

Llevando aún más lejos la diferencia entre el suministro y el descubrimiento, los proveedores de libros señalaron que para la cadena de suministro no se requerían registros MARC. Los metadatos deben ser suministrados en ONIX y que esto es aún mejor si es parte de un BDS/Nielsen Bookdata feed. Los proveedores pueden tomar los datos directamente de los editores, pero eso significaría que cada editor tendría que suministrar a todos los proveedores de libros, una tarea que sería demasiado grande para cualquier editor a pequeña escala. Se observó que cuantos más campos pudieran incluirse en los metadatos, mejor, como el contenido y los resúmenes.

ONIX ofrece acceso abierto. Sin embargo, una licencia adecuada, como una licencia Creative Commons, es más importante, ya que la definición de acceso abierto puede variar de un editor a otro. Por lo tanto, los datos que se envían a los proveedores son tan buenos como los que proporciona el editor.

 

Bibliotecas

Se observó que las bibliotecas están muy centradas en el estudiante en todo lo que hacen. Por lo tanto, esto es muy importante en la adquisición de contenidos, ya que las bibliotecas deben ofrecer a los estudiantes e investigadores la mayor cantidad posible de contenidos de acceso abierto. Sin embargo, esto no siempre encaja con la política de gestión y desarrollo de colecciones de la biblioteca. Aunque la política se centra a menudo en proporcionar valor, a menudo no contiene una sección sobre la adquisición de contenido de acceso abierto. Esto apoya los comentarios del ALP acerca de que el contenido abierto es menos formal que el contenido comprado.

Se sugirió que se necesitaban una serie de recomendaciones para las bibliotecas y que el SCONUL debía desempeñar un papel en este ámbito, además de centrar el acceso abierto en la adquisición de conocimientos básicos sobre la información.

 

Soluciones

El grupo estuvo de acuerdo en que los temas habían surgido en la discusión. Estas incluían dos áreas prácticas, la cadena de suministro de la biblioteca y los metadatos y dos áreas de aspiración, el cambio cultural en el proceso de adquisición y las nuevas formas de contenido. Éstos se desarrollan más adelante.

1, Cadena de suministro de la biblioteca

Existe un cruce entre los debates sobre la cadena de suministro de las bibliotecas y los metadatos. Sin embargo, se decidió que era importante poder trazar un mapa de la cadena de suministro de las bibliotecas para las monografías de acceso abierto, de modo que todas las partes llegaran a comprender por igual los procesos y el flujo de trabajo de cada una de ellas. Esto puede incluir alguna modificación de las prioridades para acomodar la oferta de monografías de acceso abierto. Para evitar más confusión, es importante que los editores de monografías de acceso abierto comprendan quiénes son los destinatarios de los diferentes tipos de metadatos. Por ejemplo, proveedores de bibliotecas, equipos de adquisición de bibliotecas, investigadores y otros usuarios finales.

Como parte del mapeo de la cadena de suministro de la biblioteca de monografías de acceso abierto, es importante entender cómo se cubrirán los diversos costos y quién los cubrirá.

Puede ser útil mapear el flujo de trabajo de descubrimiento además de la cadena de suministro de la biblioteca para entender cualquier punto en común. En este caso, el flujo de trabajo de descubrimiento se describe como el proceso de poner a disposición monografías de acceso abierto a través de otros medios, como el DOAB y los sistemas de descubrimiento de investigación.

2 Metadatos

El grupo convino en que es necesario acordar un requisito mínimo de metadatos, que podría utilizarse en todos los sistemas de metadatos de la cadena de suministro de las bibliotecas, como ONIX, MARC, KBART, etc. Esto permitiría a todas las partes entender lo que cada una de ellas quiere decir con el término metadatos y lo que está describiendo. El nivel mínimo de metadatos debe incluir ISBN, identificadores de nivel de capítulo y resúmenes. Existe la posibilidad de ampliar este modelo a escala internacional.

Se propusieron dos posibles soluciones para su posterior desarrollo. Esto podría ayudar a reducir el número de registros MARC múltiples en la cadena de suministro.

Una solución NBK

Se sugirió que se podría ofrecer un enfoque en dos etapas. En primer lugar, las bibliotecas y los consorcios con editoriales que tenían la capacidad de crear sus propios metadatos en un formato coherente podían cargar los datos directamente en NBK. Esto podría entonces ser transferido a la cadena de suministro de la biblioteca en cualquier formato que se requiera.

Para las editoriales más pequeñas que no disponen de los medios para crear sus propios metadatos, también se les podría ofrecer un formulario en red con los campos de metadatos necesarios. Esto también permitiría transferir los datos a la cadena de suministro, así como proporcionar a las editoriales sus propios registros MARC utilizando una licencia abierta.

Solución de BDS

Una solución alternativa sería utilizar un formulario en línea a través de BDS para crear registros, que luego podrían convertirse a ONIX, XML, etc. Este modelo sería gratuito para las editoriales, sino que incluiría una tasa de tramitación para los usuarios finales. Este es el modelo de negocio estándar de BDS y requeriría la existencia de modelos de licencia para los metadatos.

Cualquier norma mínima tendría que asegurar que hubiera una manera de permitir a los equipos de adquisición de bibliotecas ver que existe una versión de acceso abierto de la monografía, además de cualquier copia impresa a través del proveedor.

En cuanto al flujo de trabajo de descubrimiento, si una editoial ha sido preaprobada por DOAB, también existe la posibilidad, siempre y cuando se incluya la licencia correcta, de enviar los registros a DOAB para su inclusión en los sistemas de descubrimiento de bibliotecas.

Cambio cultural en el proceso de adquisiciones

En una nota más ambiciosa, se sugirió que, como parte de la transición hacia el acceso abierto a las monografías, las bibliotecas deben reorientar su pensamiento sobre la gestión de colecciones en las comunicaciones internas y a nivel nacional. Diferentes equipos dentro de la biblioteca se ocupan del acceso abierto de diferentes maneras. Por ejemplo, la detección se aborda más fácilmente mediante la entrega de metadatos a DOAB. Sin embargo, un problema importante para los equipos de adquisiciones es cómo reconocer el coste cero del acceso abierto mientras la versión impresa está disponible.

Una posible forma de avanzar es crear un documento de posición en el que se esboce el planteamiento del problema y se recomiende una forma de avanzar a nivel estratégico. Se pensó que esto podría ser propuesto por Jisc Collections como parte de su Grupo de Estrategia de Contenido. Se sugirió entonces que, si se consideraba apropiado, se podría seguir trabajando bajo los auspicios de SCONUL/RLUK.

Los temas clave fueron acordados como:

  • Aceptación por parte de los directores de las bibliotecas de la idea de financiar de forma centralizada las iniciativas de monografías, garantizando que formen parte del presupuesto central de libros y monografías.
  • Asegurar que la adquisición de contenido de acceso abierto se incluya en el plan o política de gestión y desarrollo de colecciones de la biblioteca.
  • Medición del impacto de las monografías de acceso abierto. Por ejemplo, en el software de lectura de listas, o a través de las estadísticas de OAPEN COUNTER si procede.
    Nuevas formas de contenido

Los debates sobre la cadena de suministro de las bibliotecas y los metadatos apropiados se centraron necesariamente en las formas más tradicionales de publicación de monografías, aunque se trate de una versión electrónica de la versión impresa de la publicación.

Ver completo

 

 

 

gesisDataSearch: índice de búsqueda de datos de investigación social y económica

2018-04-10_12-34-33

gesisDataSearch (beta)

http://datasearch.gesis.org/start

gesisDataSeach es la versión BETA de un servicio de descubrimiento basado en metadatos actualizados que se recolectan de colecciones de datos de investigación en ciencias sociales en todo el mundo.

gesisDataSearch es un índice de búsqueda de datos de investigación social y económica, que permite a los usuarios buscar referencias actualizadas de las existencias de datos en estas disciplinas. El índice puede utilizarse para el análisis comparativo de la publicación de conjuntos de datos en diferentes áreas de las ciencias sociales.

Es operado por el Instituto de Ciencias Sociales GESIS Leibniz y permite a los usuarios:

 

  • Encontrar colecciones de datos de ciencias sociales de forma rápida y sencilla, independientemente de su origen
  • Obtener una rápida visión general de los datos disponibles
  • Buscar y navegar a través de colecciones utilizando facetas estandarizadas.

 

Los resultados de la búsqueda se muestran en un formato fácil de usar y se enumeran por orden de relevancia y tiempo. El acceso a los objetos de datos se da a través de referencias proporcionadas en los metadatos. gesisDataSearch incluye metadatos Dublin Core de más de 30 proveedores de datos, entre ellos el ICPSR y los proveedores de servicios CESSDA GESIS, UKDA, SND, DDA, FSD, CSDA y LiDA. La mayoría de los metadatos se recolectan de agregadores de metadatos como da|ra, DataCite y DataVerse. gesisDataSearch es una agencia de servicios no sólo para los proveedores de datos para obtener una mayor visibilidad y los investigadores para encontrar datos y gestionar sus referencias de datos, sino también para otros proveedores de servicios para acceder a los datos mediante la exposición de sus metadatos estructurados a través de OAI-PMH. gesisDataSearch complementa los servicios de recuperación de GESIS al permitir a los usuarios encontrar datos que no están almacenados en el Archivo de Datos de GESIS.

El núcleo del índice es la base de datos de la agencia de registro da|ra para datos sociales y económicos, que contiene metadatos buscables de alta calidad de los editores de datos registrados. Los registros de metadatos de los datos de investigación se obtienen de proveedores de datos de todo el mundo y se incluyen en el índice.

El índice de descubrimiento de datos funciona como una plataforma dedicada y curada para encontrar datos de investigación en ciencias sociales, siendo actualmente la colección más completa y accesible de descripciones de datos de ciencias sociales disponibles.

 

Informe de la encuesta sobre prácticas de catalogación y metadatos de recursos visuales

mg_5857

 “Cataloging and Metadata Practices Survey Report” Visual Resources Association (VRA) Publishes, 2018

Texto completo

 

Encuesta de Catalogación y Metadatos (realizada entre el 22 de febrero y el 7 de abril de 2017), desarrollada por el grupo de trabajo de la encuesta de los Estándares de Datos de la Asociación de Recursos Visuales (VRA) y los Comités de Supervisión Básica de VRA. El grupo de trabajo preparó este informe que resume los hallazgos, las conclusiones y los próximos pasos.
Los principales objetivos de la encuesta fueron:

  • Comprender el alcance de la práctica de catalogación y metadatos de los profesionales de recursos visuales
  • Evaluar el uso y la satisfacción con el estándar de datos VRA Core.
  • Determinar cómo la VRA puede apoyar mejor las necesidades de los profesionales de catalogación y metadatos en el futuro.

 

Mejorando la visibilidad web de las bibliotecas: en las manos de los lectores

 

Siamese kitten sitting pointing at screen with one paw, other pa

Fons, T. [e-Book]  Improving Web Visibility: Into the Hands of Readers. Chicago, ALA, 2016.

Texto completo

 

La mejora de la visibilidad de las colecciones y los servicios bibliotecarios en la red es una de las estrategias para mejorar la viabilidad a largo plazo de las bibliotecas. La tradición de la biblioteconomía moderna ha sido centrarse en la eficiencia de los sistemas de flujo de trabajo de las bibliotecas y el procesamiento técnico y la precisión de los metadatos frente a las reglas escritas por bibliotecarios para la codificación de metadatos. Este número de Library Technology Reports (vol. 52, no. 5),”Improving Web Visibility: Into the Hands of Readers”, de Ted Fons, discute las acciones que deben tomar las bibliotecas con respecto a los sistemas de exposición de contenido, vocabularios, regímenes de metadatos de contenido y enfoques de diseño de sistemas que servirán a la conveniencia del buscador web y, por lo tanto, contribuirán a la viabilidad a largo plazo de las bibliotecas.

Revisión de las herramientas de recolección de metadatos

wam-tools

Samouelian, M. and J. Dooley (2018). [e-Book]  Review of Harvesting Tools. Ohio, OCLC Research Library Partnership Web Archiving Metadata Working Group, 2018

Texto completo

El Grupo de trabajo sobre metadatos de archivo web Web Archiving Metadata Working Group (WAM) de OCLC recomienda las mejores prácticas de metadatos descriptivos para el contenido web archivado. Cuando el grupo comenzó su trabajo a principios de 2016, se descubrió que los practicantes de metadatos tenían grandes esperanzas de que sería posible extraer metadatos descriptivos del contenido recolectado. Este informe ofrece nuestro análisis objetivo de 11 herramientas para dar respuesta a esta pregunta. Se revisaron las herramientas de recolección web seleccionadas para determinar sus funcionalidades de metadatos descriptivos. El informes intenta responder la siguiente cuestión ¿Las herramientas de recolección web pueden generar automáticamente metadatos descriptivos que apoyen el descubrimiento de recursos web archivados? La generación automática de metadatos descriptivos para los recursos web archivados podría dar lugar a mejoras significativas en la eficiencia de la entrada de datos y, por lo tanto, contribuir a permitir la producción de metadatos a escala. La intención era doble: 1) proporcionar a la comunidad de archivo web una descripción del propósito general y las capacidades relacionadas con los metadatos de cada herramienta relevante, y 2) informar al objetivo global de WAM de preparar recomendaciones de mejores prácticas para el archivo web de metadatos descriptivos basados en la comprensión de las necesidades del usuario.

 

Revisión bibliográfica sobre las necesidades del usuario relacionadas con los metadatos

 

wam-litreview

Venlet, J., K. S. Farrell, et al. (2018). [e-Book] Literature Review of User Needs. Ohio, OCLC Research Library Partnership Web Archiving Metadata Working Group.

Texto completo

 

Se estableción el Grupo de trabajo de metadatos sobre archivo web de la Asociación de bibliotecas de investigación de OCLC para recomendar las mejores prácticas de metadatos descriptivos para el contenido web archivado que satisfaga las necesidades de los usuarios finales, mejore la detección y mejore la coherencia de los metadatos. Con ese fin, el grupo llevó a cabo una revisión de la literatura para informar sobre el desarrollo de las mejores prácticas. Para ello se seleccionaron lecturas que incluían, como mínimo, una sección sustantiva relacionada con los metadatos, pero la mayoría abarcaba una franja más amplia de cuestiones. Esto les ayudó a aprender mucho más sobre quiénes son los usuarios de los archivos web, las estrategias que utilizan y los retos a los que se enfrentan. La literatura se divide en dos categorías claras: las necesidades de los usuarios finales y las necesidades de los profesionales de metadatos. Esta revisión caracteriza los tipos de usuarios finales, sus metodologías de investigación, las barreras de uso, las interfaces de descubrimiento y la necesidad de servicios de apoyo y extensión. La revisión de las literaturas de los profesionales aborda la necesidad de prácticas escalables, las normas y prácticas compartidas actualmente en uso, los resultados de una variedad de estudios de casos y otros enfoques de los metadatos.

 

 

Recomendaciones sobre metadatos descriptivos para el archivo web

 

wam-recommendations

Dooley, J. and K. Bowers (2018). [e-Book]  Descriptive Metadata for Web Archiving: Recommendations. Ohio, OCLC Research Library Partnership Web Archiving Metadata Working Group.

Texto completo

El objetivo general de Web Archiving Metadata (WAM) es desarrollar prácticas para crear metadatos consistentes que aborden las características únicas de los sitios web y colecciones. Más específicamente:

  • Desarrollar prácticas neutrales con respecto a la comunidad y a las normas para los metadatos descriptivos para el contenido web archivado, teniendo en cuenta las necesidades de los usuarios finales y los profesionales de los metadatos.
  • Definir un conjunto reducido de elementos de datos con notas de uso para guiar la preparación del contenido de los datos.
  • Asegúrar que los elementos de datos se pueden utilizar en concordancia con otros estándares que tienen muchos más conjuntos de elementos de datos granulares. Proporcionar un puente entre los enfoques bibliográficos y de archivo para la descripción.
  • Utilizar un enfoque escalable que no requiera una descripción detallada ni cambios extensos en los registros con el paso del tiempo.
  • Permitir que los profesionales tengan confianza en que están contribuyendo a la aplicación de prácticas coherentes en esta área emergente.

 

Las prácticas recomendadas de WAM pueden ser utilizadas por cualquier institución o persona con la necesidad de describir el contenido web.

 

 

El papel crítico de los metadatos en las comunicaciones en red: noticias falsas. identidad digital y viralización de información

39048648504_20da318cc4_o_d

Las ciencias de la información han estado tradicionalmente en el centro de la investigación centrada en los metadatos. Los documentos de inteligencia de la Agencia de Seguridad Nacional de los Estados Unidos (NSA) revelados por Edward Snowden en junio de 2013 popularizaron el término “metadatos” en la conciencia pública. Sorprendentemente, desde entonces se ha debatido poco sobre la naturaleza y la importancia de los metadatos en los sistemas de comunicación en red.  La confusión sobre el papel y significado de los metadatos dentro de los programas de inteligencia de la NSA o “noticias falsas” relacionadas con la elección presidencial de 2016 reflejan nuestra falta de comprensión sobre la importancia de los metadatos dentro de nuestros ecosistema de dispositivos en red.

Mayernik, M. S. and A. Acker “Tracing the traces: The critical role of metadata within networked communications.” Journal of the Association for Information Science and Technology vol. 69, n. 1 (2018). pp. 177-180. http://dx.doi.org/10.1002/asi.23927

Las bibliotecas han utilizado sistemas estructurados de catalogación a gran escala para proporcionar acceso a la información durante siglos. De manera similar, los estados nacionales han recopilado información sobre sus ciudadanos en masa, como datos del censo, certificados de defunción, registros fiscales, durante cientos de años. En todos estos contextos, los supuestos y valores sociotécnicos incorporados influyen en la forma en que se recopilan y aplican los metadatos. Una vez que estos metadatos son recolectados, pueden construirse nuevas aplicaciones para ampliar servicios o crear nuevos mercados, entre otras posibilidades.

Los metadatos que subyacen a la forma en que las infraestructuras transmiten la información están diseñados para un determinado conjunto de normas y criterios, pero no para otros.  Por ejemplo, los metadatos sobre los correos electrónicos pueden mostrar dónde, cuándo y a quién se envían los mensajes, pero no pueden mostrar por qué se enviaron. De este modo, los metadatos siempre muestran una perspectiva incompleta y parcial que satisface las necesidades funcionales de determinadas aplicaciones.

La recopilación de metadatos digitales repercute en las formas en que las personas experimentan la comunicación social y técnica. Sin tales metadatos, la comunicación en red no puede existir. Las filtraciones de la NSA, y los numerosos hacks recientes de las comunicaciones corporativas y gubernamentales, señalan a los metadatos como objetos de nueva investigación académica. Si queremos entablar debates significativos sobre nuestras trazas digitales, o tomar decisiones informadas sobre nuevas políticas y tecnologías, es esencial desarrollar marcos teóricos y empíricos que tengan en cuenta los metadatos digitales. Este documento de opinión presenta cinco características sociotecnológicas clave de los metadatos en las redes digitales que se beneficiarían de una mayor participación de las ciencias de la información.

Internet, las redes de telefonía móvil, el comercio en línea y cualquier otro dispositivo “inteligente” funcionan a través del intercambio de metadatos sobre nuestras comunicaciones y actividades digitales. Los metadatos describen un objeto físico o digital proporcionando un contexto, indicando la calidad o documentando otras características del objeto (Greenberg, 2005). Los metadatos tienen diferentes propósitos y pueden clasificarse de diferentes maneras. Gilliland, por ejemplo, distinguió cinco tipos de metadatos -administrativos, descriptivos, de preservación, técnicos y de uso- que tienen diferentes funciones en los sistemas de información digital (Gilliland, 2008). Los metadatos “descriptivos” pueden proporcionar a un usuario revisiones del producto de otros compradores, mientras que los metadatos “de uso” pueden incluir el historial de compras colectivas de un usuario y permitir que el sistema proporcione una lista de recomendaciones, anuncios o incluso noticias falsas. Sin embargo, estas funciones de los metadatos, que a menudo se dicen libres de valores y neutrales, pueden confundirse con el paso del tiempo, a veces de formas sorprendentes o inesperadas. De hecho, la nueva iniciativa de noticias falsas de Facebook para combatir las afirmaciones virales falsas en se basa en sopesar los metadatos de compromiso y las prácticas publicitarias con una comprobación de los hechos para limitar la información errónea y evitar la censura (Isaac, 2016).

La colección de rastros del comportamiento cotidiano de las personas en esferas públicas y privadas apunta a los metadatos como objetos de nuevas indagaciones académicas. La teorización de contextos de metadatos y la creación de evidencia empírica sobre su creación y circulación como fenómenos sociotecnológicos de infraestructuras y organizaciones será una de las características animadoras que los científicos de la información necesitarán abordar en un futuro próximo. Si queremos participar en discusiones significativas sobre nuestras trazas digitales, o tomar decisiones informadas sobre nuevas políticas y tecnologías, es esencial desarrollar marcos teóricos y empíricos para caracterizar el papel de los metadatos dentro de las infraestructuras de comunicación en red. Las metáforas como “escape de datos” que se utilizan para describir “el rastro digital que la gente deja” (Mayer-Schonberger & Cukier, 2013, p. 113) cuando usa computadoras o teléfonos celulares oscurecen la naturaleza de los metadatos dentro de estos sistemas. Por ejemplo, las compañías aseguradoras de automóviles han comenzado a ofrecer tarifas más bajas a los clientes que aceptan instalar un receptor de monitoreo GPS en sus automóviles que rastrea sus hábitos de conducción: aceleración y paro en particular (Lieber, 2014)

Los metadatos producidos por cualquier sistema técnico son el resultado de una selección activa por parte de los diseñadores del sistema de qué registrar y cuándo.  Por ejemplo, los dispositivos inalámbricos están diseñados para recopilar y transmitir metadatos sobre la hora y el lugar desde donde se envían los datos, así como las rutas que los datos toman a través de las redes (Acker, 2014). Estos metadatos de trazas muestran a los diseñadores y operadores de infraestructuras de comunicación cómo funcionan las redes y dónde se producen los problemas. Los operadores de redes celulares, por ejemplo, pueden determinar dónde se están cayendo las llamadas telefónicas, o dónde ha fallado una torre celular. En otro ejemplo, las franquicias de compras de Target a Amazon rastrean los metadatos sobre el comportamiento de compra y navegación de los consumidores a través del tiempo a través de programas de recompensas para determinar sus necesidades, hábitos y tendencias de compra. De este modo, los metadatos están diseñados para permitir usos y resultados específicos.

Las distinciones formales entre datos y metadatos son confusas y difíciles de definir (Gilliland, 2008). Los datos y los metadatos se designan a menudo en contradicción entre sí, dependiendo de sus diferentes funciones y medios de interpretación en contextos específicos de origen y uso.  Ciertas trazas digitales pueden servir como “metadatos” en un contexto porque proporcionan información sobre la actividad o el comportamiento de las personas, pero también pueden servir como “datos” si se analizan en otros contextos y se utilizan como evidencia para hacer una afirmación o argumentación (Borgman, 2015). Llamar a algo “metadatos” en lugar de “datos” es una clasificación contextual que raramente tiene una lógica evidente (Boellstorff, 2013). Por ejemplo, nuevos tipos de redes de sensores permiten a los investigadores producir datos científicos que antes eran difíciles o imposibles de recopilar. Estos datos técnicos son metadatos de fondo para el científico, pero son datos esenciales para el operador de red que supervisa y mantiene la red (Borgman, Wallis y Mayernik, 2012). Del mismo modo, las organizaciones gubernamentales y de ayuda humanitaria están organizando cada vez más metadatos de los medios sociales y las redes móviles como datos para permitir una orientación más eficaz de la ayuda de emergencia, la asignación de recursos de emergencia y el despliegue de las fuerzas policiales. A menudo se usan los metadatos para analizar el comportamiento y las intenciones de individuos específicos, y potencialmente identificar a esos individuos para acciones particulares. Esto es ilustrado vívidamente por la declaración del ex director de la CIA y la NSA, Michael Hayden, en mayo de 2014, cuando dijo “matamos gente a base de metadatos” (Cole, 2014).

Los metadatos recopilados por plataformas de medios sociales como Twitter y Facebook subyacen en una industria artesanal de análisis de patrones de uso de la tecnología, redes personales y tendencias de distribución de información (Schroeder, 2014). En muchos de estos estudios, los “grandes datos” son en realidad “grandes metadatos” que muestran cómo se utilizan, confían y estandarizan los servicios digitales.

Los metadatos ejecutables necesarios para la transmisión de datos y la comunicación impregnan nuestra cultura en red; de hecho, las infraestructuras no pueden funcionar sin ellos (Fidler & Acker, 2014). Sin embargo, la parcialidad de los metadatos y su capacidad de agregación presentan una tensión crucial en la sociedad. Por ejemplo, las personas nombradas en una publicación de agosto de 2015 de información de las cuentas robadas del sitio de citas para adultos Ashley Madison corrían el riesgo de ser identificadas como personas que habían llevado a cabo relaciones extramatrimoniales, apoyadas directamente por los metadatos liberados en sí mismos (Victor, 2015).

En conclusión, los metadatos son fundamentales para el diseño y la explotación de las infraestructuras técnicas, pero es fácil dar por sentado que nuestras vidas personales pueden aparecer en nuestras huellas digitales. Como ha dicho un erudito, los metadatos de trazas digitales pueden ser “notablemente reveladores” de nuestras vidas y actividades (Landau, 2016). Las filtraciones de la NSA han ilustrado, por ejemplo, cómo las facturas de telefonía móvil no son simplemente documentos privados banales. A medida que los metadatos de nuestra comunicación digital crecen en volumen y nuestro uso de herramientas digitales prolifera, se utilizarán y agregarán de maneras conocidas y desconocidas, intencionadas y oportunistas. Por ejemplo, el exitoso programa de Netflix “House of Cards” fue producido en base a la analítica de descriptores de metadatos generados por los usuarios (Carr, 2013).

Para poder participar en el mundo digital, las personas deben someterse a la creación de sus metadatos y utilizarlos para una variedad de propósitos (van Dijck, 2014). Pero, los metadatos, como los registros telefónicos y censales, siempre han estado conectados a cuerpos y vidas. Esto se amplifica cada vez más en el espacio digital. Estas cuestiones de metadatos están transformando las formas en que concebimos la gestión de los datos e incluso los derechos humanos.

Bibliografía