Informe de madurez de los datos abiertos 2022 (2023)

Publications Office of the European Union, Assen, M., Cecconi, G., Carsaniga, G., et al., Open data maturity report 2022, Publications Office of the European Union, 2023, https://data.europa.eu/doi/10.2830/70973

La evaluación de la madurez de los datos abiertos 2022 sirve de referencia para el desarrollo de los países europeos en el ámbito de los datos abiertos. En este octavo informe anual consecutivo de data.europa.eu (antes Portal Europeo de Datos) participan 35 países, entre ellos los 27 Estados miembros de la UE, 3 países de la Asociación Europea de Libre Comercio (AELC) (Islandia, Noruega y Suiza), 4 países candidatos (Albania, Montenegro, Serbia y Ucrania) y Bosnia y Herzegovina. Este informe pretende ayudar a los países participantes a comprender mejor su nivel de madurez, captar sus progresos a lo largo del tiempo, encontrar áreas de mejora y comparar su madurez con la de otros países. Además, el estudio ofrece una visión general de las mejores prácticas aplicadas en toda Europa que podrían transferirse a otros contextos nacionales y locales.

Declaración EOSC, el espacio europeo transversal de datos para la ciencia, la investigación y la innovación

European Commission, Directorate-General for Research and Innovation, EOSC, the transverse European data space for science, research and innovation : statement, Publications Office of the European Union, 2022, https://data.europa.eu/doi/10.2777/140927

El grupo de expertos del Comité Directivo de la EOSC (EOSC-SB) ha iniciado en 2022 una reflexión sobre los principales conceptos y prácticas disruptivos relacionados con la construcción y el futuro funcionamiento de la Nube Europea de Ciencia Abierta (EOSC). La ambición de EOSC es proporcionar a los investigadores, innovadores, empresas y ciudadanos europeos un espacio de datos federado y abierto, transfronterizo y multidisciplinar (o procomún de datos) donde puedan publicar, encontrar y reutilizar datos, herramientas y servicios con fines de investigación, innovación y educación. EOSC no es una única organización monolítica o proveedor de recursos. Por el contrario, se desarrolla como una federación (sistema de sistemas) con la participación de muchas organizaciones independientes y proveedores de recursos que aplican los principios FAIR y adoptan reglas y normas de calidad claras. Como tal, EOSC garantizará la independencia y autonomía de los proveedores de recursos participantes. La adopción de EOSC por parte de científicos, investigadores, innovadores y empresas europeos requiere prácticas transformadoras en varios ámbitos: desde las tecnologías de recopilación de datos FAIR-by-design hasta las capacidades de explotación de datos y servicios FAIR. Estas prácticas transformadoras de la EOSC también representan importantes activos transversales para los nueve nuevos espacios de datos sectoriales emergentes de la estrategia europea de datos. Contribuyen a la articulación de la EOSC con estos espacios de datos. En 2022, la Junta Directiva eligió y elaboró cuestiones específicas en función de la urgencia/prioridad percibida en el contexto de la EOSC. Estos temas se abordan individualmente en «Documentos de Opinión» elaborados por el Consejo de Dirección de la EOSC y comunicados al Gobierno Tripartito de la EOSC para convertirse en una referencia viva para la definición de las políticas de la EOSC a nivel europeo, nacional e institucional.

Políticas de acceso abierto en América Latina, el Caribe y la Unión Europea : avances hacia un diálogo político

European Commission, Directorate-General for Research and Innovation, Open access policies in Latin America, the Caribbean and the European Union : progress towards a political dialogue, Publications Office of the European Union, 2023, https://data.europa.eu/doi/10.2777/90667

América Latina y el Caribe y la Unión Europea son regiones estratégicas la una para la otra y socios naturales para colaborar en el desarrollo de prioridades políticas de investigación e innovación como la ciencia abierta. Este trabajo describe las políticas de acceso abierto a la producción científica que se han desarrollado en ALC y en la UE, analiza los retos comunes y las vías de convergencia para que ambas regiones establezcan un diálogo político, y propone recomendaciones concretas para una acción política conjunta en la que basar la colaboración intra-ALC y UE-ALC. Éstas se estructuran en 4 objetivos prioritarios desglosados en 7 acciones y 19 medidas concretas

ChatGPT lanza el boom de los libros electrónicos escritos con IA en Amazon

«ChatGPT launches boom in AI-written e-books on Amazon | Reuters». Accedido 7 de marzo de 2023. https://www.reuters.com/technology/chatgpt-launches-boom-ai-written-e-books-amazon-2023-02-21/.

Hasta hace poco, Brett Schickler nunca imaginó que podría ser un autor publicado, aunque había soñado con ello. Pero tras conocer el programa de inteligencia artificial ChatGPT, Schickler se dio cuenta de que se le había presentado una oportunidad.

«La idea de escribir un libro por fin parecía posible», dice Schickler, vendedor en Rochester (Nueva York). «Pensé: ‘Puedo hacerlo'».

Utilizando el software de IA, que puede generar bloques de texto a partir de simples indicaciones, Schickler creó un libro electrónico infantil ilustrado de 30 páginas en cuestión de horas, poniéndolo a la venta en enero a través de la unidad de autopublicación de Amazon.com Inc (AMZN.O).

En la edición, Sammy The Squirrel And His Journey Home, que también utiliza IA, aprende de sus amigos del bosque a ahorrar dinero cuando encuentra una moneda de oro. Construye una hucha con forma de bellota, invierte en un negocio de compraventa de bellotas y espera poder comprar algún día una piedra de moler bellotas.

Sammy se convierte en la ardilla más rica del bosque, la envidia de sus amigos y «el bosque empieza a prosperar», según el libro.

Brave Summarizer, una herramienta de IA para sintetizar resultados de Brave Search 

Brave Search

El Resumidor proporciona respuestas concisas y precisas en la parte superior de las páginas de resultados de Brave Search, en respuesta a la información introducida por el usuario, basándose únicamente en los resultados de las búsquedas en la Web. A diferencia de un modelo de IA puramente generativo, propenso a soltar afirmaciones sin fundamento, eliminando los grandes modelos lingüísticos (LLM) para procesar múltiples fuentes de información presentes en la Web. Esto produce una respuesta más concisa y precisa, expresada en un lenguaje coherente.

Además, la procedencia de las fuentes originales de datos se cita en todo momento mediante enlaces. De este modo se mantiene la legítima atribución de la información y se ayuda a los usuarios a evaluar la fiabilidad de las fuentes, dos elementos necesarios para mitigar los sesgos de autoridad de los grandes modelos lingüísticos.

Además del resumen en sí, nuestros modelos de IA también son capaces de sustituir los fragmentos (descripciones de resultados) ya dependientes de la consulta por una versión resumida de esos fragmentos, resaltando la respuesta cuando es posible. Esto puede verse como un resumen de una sola fuente (como un artículo de prensa), a diferencia del resumen principal, en el que se consideran y agregan múltiples fuentes para crear una respuesta más completa. El resumen de la parte superior de la página de resultados y estas descripciones especiales coinciden, por lo que los usuarios verán el resumen general y los fragmentos con las respuestas resaltadas.

Un coleccionista brasileño crea una gran biblioteca de manuscritos, la mayor colección privada de manuscritos del mundo.

AFP. «“Zany” for Proust: Brazilian Builds Massive Manuscript Library». Digital Journal, 6 de marzo de 2023. https://www.digitaljournal.com/world/zany-for-proust-brazilian-builds-massive-manuscript-library/article.

Pedro Correa do Lago, coleccionista brasileño, es el primero en admitir que la pasión de su vida es un poco loca.

«Debería llevar una camisa de fuerza», se ríe este historiador del arte de 64 años mientras visita su casa de Río de Janeiro, donde alberga la que, según él, es la mayor colección privada de manuscritos del mundo.

«Es un virus, una enfermedad… Mi mujer dice que los vendedores de manuscritos son mis ‘traficantes'», afirma mientras muestra a un visitante la casa del lujoso barrio de Gavea a la que se ha mudado recientemente, junto con la colección de más de 100.000 piezas que ha dedicado su vida a reunir.

En 2018, la Biblioteca Morgan de Nueva York dedicó una exposición a su colección, en la que expuso 140 de sus documentos, entre ellos un dibujo de Miguel Ángel, una carta de Gustave Flaubert a Victor Hugo, otra que Mozart escribió a su padre, manuscritos de Einstein, Newton y Darwin, y un pergamino del siglo XII.

¿Están preparadas las humanidades para compartir datos?

Are the Humanities Ready for Data Sharing?. Ithaka S+R:, 2023

Texto completo

Hoy, Ithaka S+R publica un informe que explora el estado actual del intercambio de datos en las humanidades y cómo podría ser un compromiso productivo con los datos. Nuestros hallazgos se basan en entrevistas semiestructuradas con personal clave de varios proyectos de humanidades con un fuerte componente de datos, una revisión de la literatura pertinente, y las ideas obtenidas a través de trabajos anteriores que exploran las prácticas de investigación con uso intensivo de datos y los desafíos de intercambio de datos en todos los campos.

¿Qué hemos aprendido?

  • Los humanistas tienen mucho que aprender de cómo otros campos han trabajado en las últimas décadas para impulsar el intercambio de datos.
  • El trabajo y las experiencias de los humanistas digitales proporcionan puntos de partida útiles para comprometerse con los datos en las humanidades.
  • Averiguar qué significan la reproducibilidad y la replicabilidad en los contextos de las humanidades, y cómo se relacionan con los valores profesionales sobre la integridad de la investigación en las humanidades debería ser una prioridad para los humanistas. Del mismo modo, existe una necesidad urgente de que los humanistas -que son expertos en reutilizar fuentes conocidas para generar nuevos conocimientos- desarrollen capacidades para comprender cómo formular nuevas preguntas a partir de datos estructurados existentes.
  • Los repositorios de dominio que han fomentado las comunidades de intercambio de datos en los campos STEM no existen en las humanidades, lo que hace que los conjuntos de datos existentes en humanidades sean vulnerables a la desaparición a medida que los sitios web de los proyectos se vuelven obsoletos y agravan los desafíos de descubrimiento.
  • Las humanidades cuentan con una infraestructura única y bien desarrollada para compartir públicamente la creación de conocimiento, como lo demuestran las numerosas iniciativas públicas de humanidades que constituyen una parte muy visible y vibrante de la erudición en humanidades.

La transformación de las instituciones de investigación y enseñanza superior en los próximos 75 años

Thomas, Jeena, y Steve Olson, eds. Transforming Research and Higher Education Institutions in the Next 75 Years: Proceedings of the 2022 Endless Frontier Symposium. Washington, D.C.: National Academies Press, 2023.

Texto completo

El 22 de septiembre de 2022, National Academy of Sciences celebró un simposio titulado Endless Frontier 2022: Research and Higher Education Institutions for the Next 75 Years. El evento fue la continuación de un simposio de la NAS convocado en febrero de 2020 para celebrar el 75 aniversario del histórico informe Science, the Endless Frontier.

Hacia una infraestructura nacional de datos del siglo XXI: movilizar la información por el bien común

Groves, Robert M., Thomas Mesenbourg, y Michael Siri, eds. Toward a 21st Century National Data Infrastructure: Mobilizing Information for the Common Good. Washington, D.C.: National Academies Press, 2022.

Texto completo

Históricamente, la infraestructura nacional de datos de Estados Unidos se ha basado en las operaciones del sistema estadístico federal y en los activos de datos que posee. A lo largo del siglo XX, los organismos estadísticos federales agregaron las respuestas de encuestas de hogares y empresas para producir información sobre la nación y diversas subpoblaciones. Las estadísticas creadas a partir de dichas encuestas proporcionan la mayor parte de lo que la gente sabe sobre el bienestar de la sociedad, incluyendo la salud, la educación, el empleo, la seguridad, la vivienda y la seguridad alimentaria. Las encuestas también contribuyen a crear una infraestructura para la investigación empírica en ciencias sociales y económicas. La investigación que utiliza los datos de las respuestas a las encuestas, con una estricta protección de la privacidad, ha dado lugar a importantes descubrimientos sobre las causas y consecuencias de importantes retos sociales y también ha informado a los responsables políticos. Como ocurre con otras infraestructuras, es fácil dar por sentadas estas estadísticas esenciales. Sólo cuando se ven amenazadas se reconoce la necesidad de protegerlas.

¿Cuáles de los metadatos relevantes para bibliometría son iguales y cuáles diferentes al pasar de Microsoft Academic Graph a OpenAlex?

Scheidsteger, Thomas, y Robin Haunschild. «Which of the metadata with relevance for bibliometrics are the same and which are different when switching from Microsoft Academic Graph to OpenAlex?» Profesional de La Información 32, n.o 2 (4 de marzo de 2023). https://doi.org/10.3145/epi.2023.mar.09.

PDF Español

PDF Inglés

Con el anuncio de la retirada de Microsoft Academic Graph (MAG), la organización sin ánimo de lucro OurResearch anunció que proporcionaría un recurso similar bajo el nombre de OpenAlex. Así pues, se compararon los metadatos relevantes para los análisis bibliométricos de la última instantánea de MAG con una de las primeras de OpenAlex. Prácticamente todas las obras de MAG se transfirieron a OpenAlex conservando sus datos bibliográficos año de publicación, volumen, primera y última página, DOI, así como el número de referencias que son ingredientes importantes del análisis de citas. Más del 90% de los documentos MAG tienen tipos de documento equivalentes en OpenAlex. De los restantes, especialmente las reclasificaciones a los tipos documentales journal-article y book-chapter de OpenAlex parecen ser correctas y ascienden a más del 7%, por lo que las especificaciones de los tipos documentales han mejorado significativamente de MAG a OpenAlex. Como otro elemento de metadatos de relevancia bibliométrica, examinamos la clasificación temática de los documentos en MAG y en OpenAlex. Encontramos un número significativamente mayor de documentos con una asignación de clasificación temática en OpenAlex que en MAG. En el primer y segundo nivel, la estructura de clasificación es casi idéntica. Presentamos datos sobre las reclasificaciones de materias en ambos niveles en forma de tabla y gráfico. La evaluación de las consecuencias de las abundantes reclasificaciones de materias en las evaluaciones bibliométricas normalizadas por campos no entra dentro del ámbito del presente artículo. Aparte de esta cuestión abierta, OpenAlex parece ser en general al menos tan adecuado para los análisis bibliométricos como MAG para los años de publicación anteriores a 2021 o quizás incluso mejor debido a la cobertura más amplia de las asignaciones de tipos de documentos.