OCR4all : software de reconocimiento de texto de código abierto de documentos históricos

csm_16ocr4all_3115d24d3a

OCR4all

Los historiadores y los estudiosos de humanidades a menudo tienen que lidiar con objetos de investigación difíciles: trabajos impresos de siglos de antigüedad que son difíciles de descifrar y, a menudo, en un estado de conservación insatisfactorio. Muchos de estos documentos ahora han sido digitalizados, generalmente fotografiados o escaneados, y están disponibles en línea en todo el mundo. Para fines de investigación, esto ya es un paso adelante.

Sin embargo, aún hay un desafío que superar: llevar las fuentes antiguas digitalizadas a una forma de lectura moderna con un software de reconocimiento de texto que sea legible tanto para los no especialistas como para los ordenadores. Los científicos del Center for Philology and Digitality del Julius-Maximilians-Universität Würzburg (JMU) en Baviera, Alemania, han hecho una contribución significativa para un mayor desarrollo en este campo.

Con OCR4all, el equipo de investigación de JMU está poniendo a disposición de la comunidad científica una nueva herramienta. Convierte impresiones históricas digitalizadas con una tasa de error de menos del uno por ciento en textos legibles por ordenador. Y ofrece una interfaz gráfica de usuario que no requiere experiencia en TICs. Con las herramientas anteriores de este tipo, la facilidad de uso no siempre se daba, ya que la mayoría de los usuarios tenían que trabajar con comandos de programación.

Índice Mundial de Libertad de Prensa 2019

2019-04-18_10-32-27G

Reporters Without Borders Releases 2019 World Press Freedom Index

Mapa

Ranking

Ver

El Índice RSF, que evalúa el estado del periodismo en 180 países y territorios cada año, muestra que se ha desencadenado un intenso clima de miedo, que es perjudicial para un entorno de informes seguro. La hostilidad hacia los periodistas expresada por los líderes políticos en muchos países ha incitado actos de violencia cada vez más graves y frecuentes que han alimentado un nivel de temor y peligro sin precedentes para los periodistas.

Noruega ocupa el primer lugar en el Índice de 2019 por tercer año consecutivo, mientras que Finlandia ocupa el segundo lugar de los Países Bajos donde dos reporteros que cubren el crimen organizado han tenido que vivir bajo la protección permanente de la policía. Un aumento en el acoso cibernético hizo que Suecia (tercero) perdiera un lugar. En África, las clasificaciones de Etiopía (subió hasta el puesto 40 desde el 110) y Gambia (ascendió al puesto 30 desde el 92) han mejorado significativamente con respecto al Índice del año pasado.

Muchos regímenes autoritarios han caído en el Índice. Incluyendo a Venezuela (cinco puestos más  abajo en  el 148), donde los periodistas han sido víctimas de arresytos y violencia por parte de las fuerzas de seguridad, y Rusia (un puesto abajo en 149), donde el Kremlin ha utilizado arrestos, registros arbitrarios y leyes draconianas para aumentar la presión. en medios independientes e internet. En la parte inferior del Índice, tanto Vietnam (176º) como China (177º) han caído un lugar, Eritrea (hasta el 1 en el 178) es el tercero entre los últimos, a pesar de hacer las paces con su vecino Etiopía y Turkmenistán (dos puestos abajo, en el 180) Ahora es el último, reemplazando a Corea del Norte (en la posición 179).

Solo el 24% por de los 180 países y territorios están clasificados como “buenos” (de color blanco en el Mapa de Libertad de Prensa) o “bastante buenos” (amarillo), en comparación con el 26% del año pasado. Como resultado de un clima cada vez más hostil que va más allá de los comentarios de Donald Trump, los Estados Unidos (48) ha caído tres puestos en el Índice de este año y el clima de los medios ahora se clasifica como “problemático” (naranja). Nunca antes los periodistas estadounidenses han sido sometidos a tantas amenazas de muerte o han acudido tan a menudo a las empresas de seguridad privadas para solicitar protección. El odio a los medios de comunicación es ahora tal que un hombre entró en la Gaceta de la  Capital. Redacción en Annapolis, Maryland, en junio de 2018 y abrió fuego, matando a cuatro periodistas y otro miembro del personal del periódico. El pistolero había expresado repetidamente su odio por el papel en las redes sociales antes de actuar en última instancia.

Guía corporativa para desarrollar aplicaciones móviles seguras

app-dev-toolkit-1.2_es_1

Guía corporativa para desarrollar aplicaciones móviles seguras, Mobile Iron, 2018

Texto completo

La movilidad ya está aquí y está transformando a empresas de todos los sectores y en todas partes del mundo. Para las empresas que tradicionalmente confiaban en aplicaciones heredadas monolíticas, la transición a la tecnología móvil puede dar lugar a diferentes retos que surgen al navegar por territorio móvil inexplorado. Por ejemplo, ¿cómo se decide qué aplicaciones y funcionalidades implementar primero y cómo se consiguen los recursos adecuados y se ponen en marcha las mejores prácticas para respaldar sus objetivos de movilidad? Para ayudarle a tener éxito en su trayectoria móvil, esta guía detalla las mejores prácticas y recomendaciones esenciales de las cuatro etapas del ciclo de vida de las aplicaciones móviles: diseño, desarrollo, implementación y mantenimiento. Es ideal para las organizaciones que están preparadas para ir más allá de las aplicaciones básicas, como el correo y el calendario, en dispositivos móviles. Además, ofrece pautas operativas para implementar y mantener las aplicaciones móviles ya existentes.

Libro Blanco sobre el uso de Wikidata en la comunicación académica por parte de bibliotecas

2019-04-18_10-15-24

Open Knowledge: Association of Research Libraries (ARL) Releases White Paper on the Use of Wikidata in Scholarly Communication, Special Collections. ARL, 2019

Texto completo

En un nuevo Libro Blanco de la Asociación de Bibliotecas de Investigación estadounidenses (ARL), publicado por un grupo de trabajo de expertos usuarios de Wikidata, recomienda una variedad de formas para que los bibliotecarios utilicen la base de conocimiento abierto para avanzar en el descubrimiento global de sus colecciones, profesores e instituciones.

Los bibliotecarios utilizan los datos estructurados de Wikidata sobre personas, temas, conceptos y objetos para acreditar los sistemas de perfiles de profesores de código abierto, para mejorar los registros bibliográficos en catálogos en línea y para colaborar con las comunidades en metadatos significativos, culturalmente relevantes y descriptivos para colecciones y archivos especiales. El documento, distribuido para comentarios públicos en el otoño de 2018, contiene ejemplos de aplicaciones de Wikidata, capturas de pantalla y recomendaciones para la participación a nivel individual u organizativo.

Una escuela de Barcelona retira 200 libros infantiles sexistas de sus bibliotecas

0acc6c7eb2ba68842267012e4a9dc5ae

Varias escuelas de  Barcelona  están considerando retirar de sus bibliotecas algunos de libros infantiles que consideran sexistas y que mantienen estereotipos de género, después de que una escuela eliminara alrededor de 200 títulos, incluyendo Caperucita Roja y la historia de la leyenda de San Jorge de su biblioteca.

La biblioteca infantil de la escuela Tàber de alrededor de 600 libros infantiles fue revisada por la “ Associació Espai i Lleure” como parte de un proyecto que tiene como objetivo destacar el contenido sexista oculto. El grupo revisó los personajes de cada libro y los roles que desempeñan, encontrando que el 30% de los libros eran altamente sexistas, mantenían estereotipos y, en su opinión, no tenían ningún valor pedagógico.

El año pasado, las investigaciones de Observer y Nielsen encontraron que los personajes masculinos tenían el doble de probabilidades de haber tenido un papel principal en los libros ilustrados para niños , a menudo en roles estereotípicamente masculinos, y que los personajes principales tenían más del 50% de probabilidades de ser hombres.

 

El regalo de leer

Gratis en Amazon

 

Este libro celebra uno de los actos únicos en la condición humana: la lectura. Se inspira en el conocido poema de Miguel de Unamuno, que comienza con el verso «leer, leer, leer, vivir la vida» y que concluye con reflexiones que abarcan la trascendencia de nuestras acciones y la palabra escrita. Con este poema como premisa, hemos invitado a varios escritores reconocidos en el mundo hispanohablante a responder a la pregunta «¿Qué es leer para ti?».

Este libro se publica para conmemorar el Día Mundial del Libro de 2019, celebrado globalmente el 23 de abril y que coincide con Sant Jordi, cuya tradición está especialmente arraigada en Cataluña donde se festeja regalando libros y rosas entre amigos y enamorados.

Para acoger mejor esa tradición, las ilustradoras Las Rayadas han complementado el contenido con ilustraciones alusivas a rosas y libros. Su propuesta la encontrarás entrelazada con los textos de los autores.

40 aniversario de los servicios de prestamo interbibliotecario… ¿cuál es el futuro?

2019-03-28_-rsc

After 40 years of resource sharing … what’s next?

Cathy King Cathy King

OCLC 01 April 2019

Texto original

En estos dias se cumple el 40º aniversario de primer intercambio de recursos de OCLC. Así es, hace 40 años, el 1 de abril de 1979, se realizó el primer préstamo interbibliotecario a través de los sistemas de OCLC. Ese año, OCLC procesó 565,680 transacciones de préstamos entre bibliotecas. En el año 2018, se procesaron casi 7 millones.

Comparado con lo que tenemos ahora el trabajo de PI de hace 40 años suena como si fuera una aventura. Historias de direcorios telefónicos, notas post-it y retrasos de semanas y meses. Ahora, una aventura a menudo hace una buena historia en retrospectiva, pero no es algo que esperamos un lunes por la mañana.

¿Quién podría predecir, en 1979, los cambios masivos que llegarán a nuestras vidas? Estábamos a décadas de distancia de la web, por no hablar de teléfonos inteligentes, aplicaciones, Google, Amazon, Facebook, Twitter y todos nuestros otros servicios de información que ahora son cotidianos.

Pero, ¿todo ello es realmente diferente hoy? Estamos preparados, en todo el entorno de servicios de información, para avanzar aún más en áreas de automatización, inteligencia artificial y servicios en red.

El futuro de los servicios bibliotecarios, hoy.

Actualmente, ya estamos viendo a grandes rasgos estos cambios, y se tuvo la oportunidad de revisar algunos de ellos en la Conferencia de intercambio de recursos del mes pasado en Jacksonville, Florida. Más de 325 colegas se reunieron a para hablar sobre sus desafíos y éxitos. Fue una gran agenda, llena de información y sabiduría de muchos de los miembros de nuestras bibliotecas. Pronto tendremos un enlace para el contenido de la conferencia que puede revisar.

Uno de los temas principales que me llamó la atención en la conferencia fue que el futuro de los servicios de biblioteca ya está, esencialmente, aquí. Simplemente no siempre en nuestra profesión. Podemos ver una amplia gama de otros servicios comerciales con fines de lucro y ver herramientas y características para adoptar y adaptar a nuestro trabajo.

De alguna manera, esto es muy positivo para las bibliotecas. Nos permite obtener una vista previa de otras actividades relacionadas saber cómo adaptarlas para utilizarlas en la biblioteca. Dado que muchas de estas aplicaciones están basadas en datos e información, podemos ver una correlación directa con el trabajo que hacemos.

Pero eso también significa que nuestros usuarios esperan que cumplamos y superemos los tipos de servicios que esperan de las tiendas en línea, los servicios de entrega, los proveedores de contenido … incluso los juegos.

¿Cómo podemos igualar esas expectativas?

La biblioteca bajo demanda

Satisfacer las necesidades de los usuarios hoy y mañana requerirá que nos comprometamos a proporcionar “la biblioteca bajo demanda”.

Todos sabemos que la búsqueda de información es solo una de las muchas actividades realizadas en entornos amigables para el usuario. Para tener éxito, la biblioteca bajo demanda nos posicionará cuatro acciones para competir:

  1. Descubrimiento intuitivo que anticipa y entiende el contexto.
  2. Cumplimiento inteligente a través de sistemas que hacen el trabajo pesado para usuarios y bibliotecarios.
  3. Una cuenta personal, única para todas las actividades de la biblioteca.
  4. Acceso a un inventario universal de contenido masivo y de alto valor.

Esta es una estrategia de “el usuario primero”. Tomará nuevas formas de pensar sobre el trabajo que hacemos en la biblioteca. Requerirá eliminar ciertas funciones. Y tendremos que trabajar en los departamentos de bibliotecas, instituciones y procesos de proveedores.

Podemos hacelo. Pero tenemos que trabajar juntos. Esta no es una tarea que cualquier organización (o cualquier cooperativa) pueda asumir sola. Sin embargo, creo que OCLC está especialmente calificado para impulsar el concepto de la biblioteca bajo demanda, ya que posee:

  • La colección más grande y completa de metadatos de bibliotecas.
  • una red mundial de miles de bibliotecas que comparten datos, recursos y conocimientos técnicos
  • muchas asociaciones con proveedores de contenido, proveedores de servicios de biblioteca y servicios al consumidor
  • liderazgo en productos e investigación, incluido el trabajo sobre estándares y con organizaciones sobre normalización.

También es importante que OCLC sea una organización sin fines de lucro neutral y “independiente del servicio”. En términos de visibilidad y acceso al contenido, esa ofre un poderoso impulso que podemos usar en nombre de nuestros miembros.

Hay mucho trabajo por hacer que se basará en las grandes cosas que las bibliotecas ya están haciendo para brindar un servicio excepcional. Tres áreas principales de enfoque son importes en este momento:

  • Experiencia del usuario: abordar las deficiencias funcionales a través de la investigación, las pruebas de usabilidad, las mejores prácticas de la industria minorista y los comentarios de los miembros
  • Velocidad y previsibilidad: identificando materiales que se pueden entregar rápidamente, con el mayor acceso automático y con el menor número de intermediarios que sea posible
  • Interoperabilidad: integración de la flexibilidad en los productos para que puedan trabajar fácilmente con otros servicios, transfiriendo datos, solicitudes y materiales sin problemas

Para hacer todo esto, tendremos que asociarnos con otros proveedores y la comunidad de bibliotecas, como siempre lo hemos hecho. La mayor fortaleza es la diversidad de experiencias, la creatividad y el conocimiento que nuestros miembros nos brindan todos los días.

¿El logro? La biblioteca bajo demanda: servicios que mueven a los usuarios de forma natural desde su punto de necesidad hasta la llegada del recurso perfecto.