Archivo de la categoría: Archivos

New York Times está utilizando Google Cloud para encontrar historias no contadas en millones de fotos archivadas

 

morgue7.max-2200x2200-1

 

Sam Greenfield. Picture what the cloud can do: How the New York Times is using Google Cloud to find untold stories in millions of archived photos. Google Cloud Blog, 2019

Ver completo

Durante más de 100 años, The Times ha archivado aproximadamente de cinco a siete millones de sus fotos antiguas en cientos de archivadores tres pisos debajo del nivel de la calle cerca de sus oficinas de Times Square en un lugar llamado “morgue”. Muchas de las fotos han sido almacenadas en carpetas y no se habían visto en años. Aunque un catálogo de tarjetas proporciona una visión general del contenido del archivo, hay muchos detalles en las fotos que no se capturan en forma indexada.

El depósito contiene fotos de finales del siglo XIX, y muchos de sus contenidos tienen un gran valor histórico, algunos que no se almacenan en ningún otro lugar del mundo. En 2015, una tubería rota inundó la biblioteca de archivos, poniendo en riesgo toda la colección. Afortunadamente, solo se causaron daños menores, pero el evento planteó la pregunta: ¿cómo pueden almacenarse de manera segura algunos de los activos físicos más preciados de la compañía?

Google Cloud se ha asociado con The New York Times para ayudarlos a digitalizar su vasta colección de fotos. Está haciendo uso de numerosas herramientas dentro de Google Cloud Platform que les permiten almacenar de forma segura sus imágenes, proporcionarles una mejor interfaz para encontrar fotos y encontrar nuevos conocimientos incluso de los datos que aparecen en el reverso de las imágenes. No solo las imágenes de las fotos contienen información valiosa. En muchos casos, el reverso de las fotos incluye la hora y el lugar donde se tomó la foto.

Para preservar esta historia invaluable, y para darle a The Times la capacidad de mejorar sus informes con una historia visual y un contexto histórico aún más, The Times está digitalizando su archivo, utilizando Cloud Storage para almacenar escaneos de alta resolución de todas las imágenes del archivo.

Cloud Storage es un sistema duradero para almacenar objetos, y proporciona a los clientes como The Times una gestión automática del ciclo de vida, almacenamiento en regiones geográficamente distintas y una interfaz de administración y API fáciles de usar. Simplemente almacenar imágenes de alta resolución no es suficiente para crear un sistema que los editores de fotos puedan usar fácilmente. Un sistema de gestión de activos que funcione debe permitir que los usuarios puedan navegar y buscar fotos fácilmente. The Timesconstruyó una tubería de procesamiento que almacena y procesa las fotos y utilizará tecnología en la nube para procesar y reconocer texto, escritura a mano.

Así es como funciona. Una vez que una imagen se ingresa en el almacenamiento en la nube, The Times usa Cloud Pub / Sub para iniciar la canalización de procesamiento para realizar varias tareas. Las imágenes se redimensionan a través de servicios que se ejecutan en Google Kubernetes Engine (GKE) y los metadatos de la imagen se almacenan en una base de datos PostgreSQL que se ejecuta en Cloud SQL , la oferta de base de datos está totalmente administrada de Google.

En el caso de The Times, uno de los mayores desafíos en el escaneo de su archivo fotográfico ha sido agregar datos sobre el contenido de las imágenes. La API de Cloud Vision puede ayudar a llenar ese vacío. Si la parte posterior de las fotos contiene una gran cantidad de información útil, la API de Cloud Vision puede ayudarnos a procesarla, almacenarla y leerla. Este es solo el comienzo de lo que es posible para las empresas con archivos físicos. Pueden usar la API de Vision para identificar objetos, lugares e imágenes.

La API de lenguaje natural en la nube podría usarse para agregar información semántica adicional al texto reconocido. Por ejemplo, si pasamos el texto “The New York Time THE WAY IT WAY – Crowded Penn Station en 1942, una era en la que solo los valientes volaban – a Washington, Miami y varias estaciones de ruta” a través de Cloud Natural Language API, identifica correctamente “Penn Station”, “Washington” y “Miami” como ubicaciones, y clasifica la oración completa en la categoría “viajes” y la subcategoría “autobús y ferrocarril”. Es decir, utiliza un sistema de aprendizaje automático para obtener información adicional, de modo que es capaz a través de los datos obtenidos en la foto y de los contenidos en el sistema o web datos sobre la imagen que no estaban recogidos en la foto original a través de los datos masivos y la inteligencia artificial.

 

 

 

Preservación de sonido en cilindros de la época de Thomas Edison ahora disponibles en línea

 

img_9284-696x464-1

 

Tran, Sheila. Dusting Off The UCSB Cylinder Audio Archives. The Botton Line, 2020

Ver noticia

Escondido en la ladera de la montaña del tercer piso de la  Biblioteca Davidson de la UCSB se encuentra el Archivo de Audio de Cilindros, una colección cuidadosamente curada de más de 19.000 cilindros fonográficos históricos. Inventado por Thomas Edison a finales de 1800-mucho antes que los CD, las cintas de casete y los discos de vinilo- los cilindros de fonógrafo son el primer medio de grabación comercial. Estos objetos cilíndricos huecos son aproximadamente del tamaño de una lata de refresco y funcionan de manera similar a los discos de vinilo, con el audio grabado como ranuras que pueden ser tocadas por una aguja.

El archivo ofrece una mirada única a una época poco documentada de la cultura e historia de Estados Unidos, con una amplia variedad de géneros y tipos de grabaciones que se remontan a la década de 1890. Los sonidos, que están todos disponibles en línea, van desde géneros musicales como las melodías de violín y la música hawaiana hasta discursos y sermones históricos. Único en el archivo es su colección de grabaciones comerciales caseras hechas por gente común, que muestran las experiencias cotidianas de la vida durante el siglo XIX.

 

Destrucción de archivos durante la dictadura franquista

 

5d236d2f7d0db

 

La pormenorizada reconstrucción de la represión ha sido uno de los aspectos más notables de la reciente explosión historiográfica española. Esta tarea esencial se ha visto dificultada por la destrucción unilateral de material archivístico.

Si los franquistas no se sentían incómodos con sus acciones en el exterior y el interior, ¿por qué eliminaban las pruebas? Después de todo, los archivos que documentaban los crímenes, reales o imaginados, de la República fueron cuidadosamente reunidos y perviven al día de hoy.

En el año 1965 los franquistas empezaron a pensar lo impensable: que el Caudillo no era inmortal y que había que hacer preparativos para el futuro. En el año 1985 el gobierno español empezó a tomar algunas medidas, con retraso y vacilaciones, para proteger los recursos archivísticos de la nación.

Entre las pérdidas de aquellos decisivos veinte años figuran los archivos de la Falange, con los expedientes personales de cientos de miles de sus afiliados. Los archivos de las jefaturas de policía provinciales, de las cárceles y de la principal autoridad local del franquismo, los gobernadores civiles, también desaparecieron.

Convoyes enteros de camiones se llevaron los documentos «judiciales» de la represión. Además de la deliberada destrucción de archivos, se produjeron también pérdidas «involuntarias» cuando algunos ayuntamientos vendieron al peso sus archivos como papel para su reciclado. La consecuencia es que resulta imposible la reconstrucción completa a escala nacional del coste humano del golpe militar de 1936.

Paul Preston “Franco’

Gestionar los documentos de archivo para garantizar el acceso a la información

 

5c161021ac3d33492499a6ad4a8efb3f

Ramírez Aceves. Merizanda María del Carmen. Gestionar los documentos de archivo para garantizar el acceso a la información. México: UNAM,

Texto completo

 

En la última década, las políticas públicas orientadas a la rendición de cuentas, la transparencia y el acceso a la información han permitido revalorar las tareas archivísticas al interior de las instituciones. Se ha reiterado en diversas ocasiones que la rendición de cuentas es una medida de control o fiscalización que el gobierno establece a sus políticos y funcionarios públicos para obligarlos a informar al pueblo acerca de las decisiones que han tomado para llevar a cabo sus actividades, incluye además, la capacidad de sancionarlos en caso de negar u ocultar la información referida

 

Guía de archivos históricos de la banca en España

 

guia-de-archivos-hcos-de-banca-en-espac3b1a

 

Guía de archivos históricos de la banca en España. edición a cargo de María de Inclán Sánchez, Elena Serrano García y Ana Calleja Fernández. Madrid: Banco de España, 2019

Texto completo

 

El Banco de España ha publicado esta obra, coordinada por la División de Archivos y Gestión Documental, en la que presentan sus archivos históricos diez entidades y fundaciones bancarias que custodian en conjunto 180 archivos de entidades, la mayor parte ya desaparecidas. En la obra han participado los Archivos del Banco de España, del Banco de Santander, del BBVA, del Banco de Sabadell, de la CECA, de la Fundación Bancaria “la Caixa”, de la Fundación Bancaja, de la Fundación Caja Inmaculada (CAI), de la Fundación Especial Pinnae (Caixa Penedés) y del Centro de Documentación Fundación Fundos.

El libro, prologado por Pablo Hernández de Cos, gobernador del Banco de España, incluye un estudio sobre la evolución del sistema bancario español en el siglo XX, elaborado por el historiador Pedro Tedde de Lorca, y un mapa de bancos y cajas de ahorro, realizado por la profesora Carmen Angulo, donde aparecen todas las actuales entidades bancarias españolas desde su creación, incluyendo las absorciones y fusiones bancarias realizadas por ellas a lo largo de la historia.

La publicación tiene una importancia singular por concentrar en una sola obra las guías de los principales archivos bancarios españoles, lo que facilitará las búsquedas de información e impulsará las investigaciones en historia económica y bancaria basadas en el análisis de los documentos de archivo. Se espera que en un futuro se puedan incorporar a la Guía otros archivos bancarios no identificados en la actualidad.

El Día Mundial de la Preservación Digital

 

wdpd-spanish-portrait-nodate

Ver

Lista de bits’ de DPC de especies en peligro de extinción digital

 

El Día Mundial de la Preservación Digital se celebra el primer jueves de cada noviembre.

Con el tema ‘Materiales digitales en riesgo’, la comunidad de preservación digital se reunirá para celebrar su trabajo: las colecciones que han conservado, el acceso que han mantenido y la comprensión que han fomentado al preservar los materiales digitales.

wdpd_illustration

Las tecnologías digitales dominantes, cambiantes y ubicuas son una característica definitoria de nuestra era. Los materiales digitales son un producto básico para la industria, el comercio y el gobierno. Son fundamentales para la investigación, el derecho y la medicina. Las industrias creativas, el patrimonio cultural y los medios de comunicación dependen de un acceso confiable a los materiales digitales, mientras que las familias y los amigos extienden y mantienen sus relaciones a través de las interacciones digitales. ¿Qué mejores razones para celebrar las oportunidades creadas por la preservación digital?

‘Lista de bits’ de DPC de especies en peligro de extinción digita

 

Los archivos históricos en el siglo XXI: ¿Hacia una redefinición?.

 

1442517307959archivo314

Olmo, María Del. Los archivos históricos en el siglo XXI: ¿Hacia una redefinición?.  Métodos de información. Vol. 10, Núm. 18 (2019)

Texto completo

 

El presente artículo pretende realizar una mirada, quizás algo filosófica, sobre la realidad actual de los archivos históricos, afectados como el resto de la sociedad, por la revolución tecnológica y de la información. Una mirada que se extiende y proyecta hacia el futuro, tratando de imaginar lo que quizás estamos llamados a ser, sin dejar de contemplar aquellas zonas que van desapareciendo del contorno de nuestra identidad.