Archivo de la etiqueta: Repositorios

Análisis estratégico 2025 del ecosistema de la comunicación científica y el rol de los repositorios

Shearer, Kathleen. COAR Strategic Analysis of the
Scholarly Communications Environment
. COAR, 27 de noviembre de 2025.

Texto completo

El informe presenta una visión panorámica del entorno sociopolítico que rodea actualmente a la comunicación científica y analiza las fuerzas que influirán en el ecosistema de repositorios en los próximos años.

Elaborado por COAR mediante encuestas, revisión bibliográfica y consultas a expertos, el documento busca orientar la estrategia de la organización para 2026–2028. El análisis identifica cinco fuerzas clave: la soberanía digital, los recortes en financiación de la investigación, el creciente descontento con el sistema editorial, el ascenso de la inteligencia artificial y la pérdida de confianza pública en la ciencia.

En primer lugar, el texto subraya que los cambios geopolíticos y las tensiones internacionales están modificando las colaboraciones científicas globales. La noción de “soberanía digital” impulsa a algunos países a reforzar infraestructuras de investigación propias, lo que podría repercutir en los sistemas de evaluación y en la dependencia de revistas internacionales. En paralelo, varios países experimentan fuertes recortes en la financiación científica, generando presiones sobre bibliotecas e infraestructuras de acceso abierto. Esta situación representa tanto un riesgo para la sostenibilidad del open science como una oportunidad para reorientar recursos hacia alternativas comunitarias y menos costosas.

El informe también aborda el creciente malestar ante un sistema editorial dominado por un puñado de grandes empresas, basado en métricas de prestigio y en modelos económicos poco sostenibles. A pesar de años de reformas, el acceso abierto sigue condicionado por acuerdos transformativos y revistas híbridas de elevado coste. La producción científica se ha disparado, tensionando los procesos de revisión y comprometiendo la calidad percibida. Como respuesta, muchas políticas nacionales empiezan a priorizar el depósito en repositorios, mientras surgen nuevos modelos como el Publish, Review, Curate (PRC) y se fortalecen iniciativas de evaluación responsable.

La irrupción de la inteligencia artificial constituye otro eje crítico. Los modelos generativos cambian los modos de búsqueda, resumen y gestión de la literatura científica, creando nuevas expectativas entre los usuarios. Al mismo tiempo, plantean desafíos éticos relacionados con la trazabilidad, la fiabilidad y el sesgo, especialmente cuando actúan como intermediarios opacos entre la literatura y el lector. El documento alerta también sobre el aumento de bots que extraen masivamente contenido de repositorios para entrenar modelos, provocando bloqueos y afectando incluso a servicios legítimos.

Finalmente, el informe señala la erosión de la confianza pública en la ciencia, alimentada por la complejidad de los mensajes científicos, la politización, la difusión de desinformación y los escándalos de fraude o malas prácticas. En este contexto, los repositorios, como infraestructuras abiertas y no comerciales, pueden contribuir a reconstruir credibilidad mediante prácticas de autenticidad, transparencia, preservación y trazabilidad reforzada.

A partir de este diagnóstico, COAR identifica cuatro líneas prioritarias de acción para los repositorios: navegar los cambios tecnológicos y garantizar un equilibrio entre acceso humano y automatizado; construir un entorno de información confiable mediante prácticas de validación y marcadores de confianza; mejorar la coherencia digital global a través de estándares e interoperabilidad; y aumentar la visibilidad del valor estratégico de los repositorios, especialmente en un contexto donde las herramientas de IA pueden ocultar el origen de los contenidos que consumen y reutilizan. El informe concluye afirmando que los repositorios seguirán siendo infraestructuras esenciales para la ciencia abierta, siempre que el sector actúe de manera coordinada para afrontar los riesgos y aprovechar las oportunidades de un ecosistema cada vez más complejo y volátil.

La avalancha de bots de inteligencia artificial desafía la sostenibilidad de los repositorios académicos

Washington, Jamie. “AI bots swarm UDSpace for information.” Library, Museums and Press, University of Delaware, 29 de septiembre de 2025. https://library.udel.edu/news/2025/09/29/ai-bots-swarm-udspace/

La Universidad de Delaware ha detectado un fenómeno inesperado en su repositorio institucional, UDSpace: una avalancha de bots de inteligencia artificial que acceden masivamente a su contenido.

Estos bots, diseñados para recopilar información y entrenar modelos de lenguaje, realizan miles de consultas automatizadas que han llegado a ralentizar el sistema y, en algunos casos, a dejarlo temporalmente inaccesible.

El atractivo de UDSpace radica en la gran cantidad de materiales académicos de alta calidad que alberga —tesis, artículos científicos, informes y otros documentos de investigación—, lo que lo convierte en una fuente muy valiosa para las empresas que desarrollan inteligencia artificial. Sin embargo, el patrón de comportamiento de los bots ha resultado extremadamente agresivo: generan peticiones a una velocidad imposible para los usuarios humanos y saturan el servidor, desbordando las capacidades de respuesta del repositorio.

Ante esta situación, el equipo técnico de la biblioteca probó inicialmente medidas básicas como bloquear direcciones IP o responder a los bots fingiendo que los documentos no existían. Pero estas estrategias solo sirvieron para que los ataques se intensificaran. En mayo de 2025, se optó por una solución más avanzada: un sistema que identifica las solicitudes automatizadas y las bloquea en la capa de entrada, antes de que lleguen al servidor. De esta forma, los usuarios legítimos pueden seguir accediendo sin problema mientras los bots reciben un mensaje de acceso prohibido.

Aunque esta estrategia ha logrado reducir la presión sobre UDSpace, el problema refleja una tendencia global. Cada vez más repositorios académicos y bibliotecas digitales se enfrentan a un dilema entre mantener el acceso abierto al conocimiento y proteger sus sistemas de un uso automatizado que amenaza con colapsar sus infraestructuras. El caso de la Universidad de Delaware muestra hasta qué punto el auge de la inteligencia artificial está obligando a las instituciones académicas a repensar la gestión y defensa de sus recursos digitales.

Repositorios de Datos Abiertos: guía para la selección y depósito

F1000Research. «Open Data Repositories.» Think F1000Research, febrero de 2021. PDF. https://think.f1000research.com/wp-content/uploads/2021/02/F1000Research-Open-Data-Repositories.pdf.

Los repositorios de datos abiertos constituyen un componente esencial del ecosistema de investigación científica contemporánea. El depósito de datos en repositorios públicamente accesibles y reconocidos que asignan identificadores globalmente persistentes garantiza que los conjuntos de datos permanezcan disponibles tanto para humanos como para máquinas en un formato utilizable en el futuro.

1. Repositorios de Acceso Controlado

En casos donde el intercambio abierto de datos no es factible debido a consideraciones éticas o de confidencialidad, los repositorios de acceso controlado proporcionan una solución viable. Estos permiten el acceso a datos sensibles a través de usuarios autenticados, dependiendo de los permisos otorgados por los participantes del estudio y las aprobaciones del comité ético.

2. Repositorios Específicos por Disciplina

Los repositorios específicos por disciplina ofrecen conocimiento especializado del dominio y experiencia en curación para tipos particulares de datos. Dado que los datos de investigación varían considerablemente entre disciplinas, estos repositorios proporcionan ventajas significativas al hacer que los datos sean más visibles para otros miembros de la comunidad de investigación específica.

3. Repositorios Institucionales

Muchas instituciones ofrecen apoyo a sus empleados para la gestión y depósito de datos. Los repositorios institucionales que aceptan conjuntos de datos proporcionan administración y custodia, ayudando a asegurar que los conjuntos de datos se preserven y sean accesibles a largo plazo.

4. Repositorios Generales de Datos

Los repositorios generales de datos aceptan conjuntos de datos independientemente de la disciplina o institución. Estos repositorios admiten una amplia variedad de tipos de archivos y son particularmente útiles cuando no existe un repositorio específico por disciplina.

Tipos de Repositorios de Datos

1. Repositorios de Acceso Controlado

En casos donde el intercambio abierto de datos no es factible debido a consideraciones éticas o de confidencialidad, los repositorios de acceso controlado proporcionan una solución viable. Estos permiten el acceso a datos sensibles a través de usuarios autenticados, dependiendo de los permisos otorgados por los participantes del estudio y las aprobaciones del comité ético.

2. Repositorios Específicos por Disciplina

Los repositorios específicos por disciplina ofrecen conocimiento especializado del dominio y experiencia en curación para tipos particulares de datos. Dado que los datos de investigación varían considerablemente entre disciplinas, estos repositorios proporcionan ventajas significativas al hacer que los datos sean más visibles para otros miembros de la comunidad de investigación específica.

3. Repositorios Institucionales

Muchas instituciones ofrecen apoyo a sus empleados para la gestión y depósito de datos. Los repositorios institucionales que aceptan conjuntos de datos proporcionan administración y custodia, ayudando a asegurar que los conjuntos de datos se preserven y sean accesibles a largo plazo.

4. Repositorios Generales de Datos

Los repositorios generales de datos aceptan conjuntos de datos independientemente de la disciplina o institución. Estos repositorios admiten una amplia variedad de tipos de archivos y son particularmente útiles cuando no existe un repositorio específico por disciplina.

Características Importantes de los Repositorios

Versionado

Algunos repositorios permiten cambios en los conjuntos de datos depositados a través del versionado. La selección de un repositorio que incluya esta característica proporciona flexibilidad para agregar nuevos datos, reestructurar y realizar mejoras al conjunto de datos. Cada versión del conjunto de datos es identificable de manera única y se mantiene, lo que permite a otros encontrar, acceder, reutilizar y citar cualquier versión específica que requieran.

Metadatos

Para facilitar la descubribilidad, los datos deben describirse utilizando metadatos apropiados. El contenido y formato de los metadatos a menudo está guiado por una disciplina específica y/o repositorio a través del uso de un estándar de metadatos. Independientemente del repositorio elegido, al depositar datos es importante completar tantos campos como sea posible, ya que esta información generalmente contribuye a los registros de metadatos.

Software y Código

El software y el código constituyen productos de investigación importantes. Además de utilizar un sistema de control de versiones como GitHub, se debe depositar el código fuente en un repositorio de datos donde se le asigne un identificador único. El uso de tal repositorio garantiza que el código esté abierta y permanentemente disponible.

Consideraciones Especiales

Plataformas de Reproducibilidad

Cuando se tienen tanto datos como código, se debe considerar el uso de una plataforma de reproducibilidad como Code Ocean. Depositar datos y código en tal plataforma significa que otros pueden ejecutar fácilmente los análisis, promoviendo así la reproducibilidad computacional.

Advertencias Importantes

El alojamiento de datos únicamente en un sitio web de laboratorio o como parte del material suplementario de una publicación dificulta la capacidad de encontrar y reutilizar los datos. Además, el lugar donde se depositan los datos dependerá de los factores legales y éticos aplicables, quién financió el trabajo y dónde se espera publicar.

Proceso de Selección de Repositorio

El documento proporciona un flujo de trabajo para la selección de repositorios basado en las siguientes preguntas clave:

  1. ¿Contienen los datos información personal o sensible que no puede ser completamente anonimizada?
  2. ¿Existe un repositorio específico por disciplina para el conjunto de datos?
  3. ¿El repositorio institucional acepta datos?

Este proceso de decisión guía hacia el tipo de repositorio más apropiado para cada situación específica.

Recursos Adicionales

El documento hace referencia a herramientas útiles para la identificación de repositorios apropiados, incluyendo Re3Data, FAIRsharing, FAIR Repository Finder, y recursos para hacer el código citable, así como cajas de herramientas para datos y código.

COAR lanza el Directorio Internacional de Repositorios (IRD)

International Repository Directory, IRD

https://ird.coar-repositories.org/browser?lang=en

La Confederación de Repositorios de Acceso Abierto (COAR) ha lanzado el Directorio Internacional de Repositorios (International Repository Directory, IRD), una herramienta global que proporciona información actualizada y fiable sobre los repositorios académicos de acceso abierto de todo el mundo. El objetivo del IRD es ofrecer una fuente autorizada que permita conocer de forma estandarizada las características de cada repositorio, tales como su plataforma tecnológica, alcance temático, ubicación geográfica, institución afiliada y funcionalidades disponibles.

El directorio cuenta actualmente con más de 7.500 registros, de los cuales aproximadamente 700 han sido verificados. La información se obtiene y actualiza mediante un modelo de curaduría distribuida, en el que organizaciones nacionales o regionales —denominadas “Responsables”— se encargan de supervisar y mantener la calidad de los datos de los repositorios de sus respectivos países o regiones. Estas organizaciones pueden designar curadores que actualicen la información manualmente o de manera automatizada.

La plataforma tecnológica del IRD ha sido desarrollada por Antleaf y funciona como una infraestructura centralizada, pero gestionada colaborativamente. Todo el software es de código abierto con licencia MIT, y los datos están disponibles bajo la licencia CC0, lo que permite su reutilización sin restricciones. Esta iniciativa refuerza el compromiso de COAR con el desarrollo de una red global de repositorios más interconectada, transparente y sostenible.

Importancia de los podcast en la potencialización y ampliación del impacto académico de los investigadores

Allison Symulevich, Matt Torrence, Jason Boczar, y Jessica Szempruch, «Podcasting as Open Access: A Review and Discussion of Potential Impact on Scholarly Communication and Promotion» Journal of Librarianship and Scholarly Communication 13, no. 1 (2025): eP18241, https://doi.org/10.31274/jlsc.18241

Los podcasts académicos constituyen una forma informal mediante la cual el profesorado puede compartir su experiencia investigadora con una audiencia más amplia e internacional. En el artículo, los autores sostienen que los podcasts representan un tipo de comunicación académica informal y destacan el papel que pueden desempeñar las bibliotecas en el éxito de su difusión y accesibilidad.

En los últimos años, los podcasts académicos han emergido como una valiosa herramienta de comunicación científica informal, permitiendo a docentes, investigadores y especialistas compartir su conocimiento y experiencia más allá de los canales tradicionales de divulgación, como los artículos académicos o las conferencias. Este tipo de contenido, al ser accesible y narrativo, facilita la conexión con audiencias más amplias y diversas, incluyendo estudiantes, colegas de otras disciplinas, profesionales del sector y el público general.

Uno de los aportes más significativos del podcasting en el entorno académico es su naturaleza abierta. Cuando estos materiales se publican en repositorios institucionales de acceso abierto, como se ha hecho en la Universidad del Sur de Florida, se garantiza su disponibilidad permanente y gratuita, lo que contribuye directamente a mejorar la visibilidad, el alcance internacional y la trazabilidad del trabajo académico. Este enfoque no solo amplía la audiencia potencial del contenido, sino que también complementa la evaluación del impacto de la producción científica a través de nuevas métricas de uso, como descargas, escuchas, alcance geográfico y nivel de interacción en plataformas digitales.

A nivel institucional, las bibliotecas universitarias pueden desempeñar un papel clave al apoyar la creación, el alojamiento, la preservación y la difusión de podcasts académicos, ayudando a los investigadores a optimizar el impacto de su producción intelectual. Asimismo, estos formatos pueden integrarse como evidencias de transferencia de conocimiento en procesos de evaluación y promoción académica, dado que reflejan habilidades de comunicación científica, compromiso con la sociedad y capacidad de innovación.

El estudio también plantea la necesidad de avanzar hacia una estandarización de los sistemas de medición del impacto de los podcasts académicos, así como la generación de guías que permitan a otras instituciones replicar buenas prácticas en este campo emergente de la ciencia abierta.

Algunos repositorios de acceso abierto han empezado a bloquear a los robots de inteligencia artificial

«Open Repositories Are Being Profoundly Impacted by AI Bots and Other Crawlers: Results of a COAR SurveyCOAR (blog), April 30, 2025. https://coar-repositories.org/news-updates/open-repositories-are-being-profoundly-impacted-by-ai-bots-and-other-crawlers-results-of-a-coar-survey/

Cada vez hay más bots de inteligencia artificial rastreando repositorios. Estos bots son lo suficientemente agresivos como para provocar interrupciones y cortes de servicio en los repositorios. Como consecuencia, algunos repositorios han empezado a bloquear el acceso de las máquinas a sus colecciones, lo que también está bloqueando inadvertidamente otros servicios de red deseados, como los agregadores académicos, los servicios de indexación y los directorios.

El impacto de los bots de inteligencia artificial (IA) y otros rastreadores en los repositorios de acceso abierto ha crecido considerablemente, lo que está afectando la estabilidad de los servicios y provocando interrupciones en las plataformas. En respuesta a esta situación, algunos repositorios han comenzado a bloquear el acceso de estas máquinas, lo que, de forma no intencionada, también bloquea otros servicios útiles como agregadores académicos, servicios de indexación y directorios.

Esta problemática no es exclusiva de los repositorios académicos. Según un informe de Axios, casi el 20% de los 1000 sitios web más visitados del mundo están bloqueando crawlers de IA debido a la falta de directrices legales claras sobre el uso de material con derechos de autor por parte de la IA. Por ejemplo, el bot GPTBot de OpenAI ha sido bloqueado por varios sitios, lo que refleja una creciente preocupación por el acceso automatizado a contenidos en línea.

Además, desarrolladores de software de código abierto han implementado medidas ingeniosas para combatir los bots de IA que no respetan las directrices de robots.txt. Herramientas como Anubis y Nepenthes han sido creadas para frustrar a los crawlers mediante pruebas de trabajo y contenido falso, respectivamente. Estas acciones subrayan la necesidad de proteger la infraestructura digital frente a accesos no deseados.

En respuesta a estos desafíos, COAR planea lanzar un grupo de trabajo para desarrollar acciones recomendadas que permitan a los repositorios mantener su acceso abierto mientras se protegen contra procesos disruptivos de máquinas.

Para comprender mejor el impacto de los bots y rastreadores en los repositorios, COAR (Confederation of Open Access Repositories) realizó una encuesta en abril de 2025, recibiendo 66 respuestas de miembros de diversas regiones del mundo. Los resultados muestran que más del 90% de los encuestados experimentan la presencia de bots de IA, generalmente más de una vez a la semana, lo que causa frecuentes interrupciones en los servicios. Para mitigar estos efectos, los repositorios emplean diversas estrategias, como la limitación de tasa, reglas de firewall, reglas de robots.txt y listas blancas compartidas.

COAR planea realizar un informe más detallado sobre los resultados de la encuesta en su sitio web y, posteriormente, formará un grupo de trabajo para desarrollar recomendaciones que permitan a los repositorios mantener su acceso abierto, protegiéndolos al mismo tiempo contra procesos disruptivos de máquinas.

arXiv lanza un proyecto piloto para incorporar resúmenes en audio generados por inteligencia artificial en su plataforma

Boboris, Kat. 2025. “arXiv Pilots Audio Summaries in Partnership with ScienceCast.” arXiv Blog, April 8, 2025. https://blog.arxiv.org/2025/04/08/arxiv-pilots-audio-summaries-in-partnership-with-sciencecast/

arXiv ha lanzado un proyecto piloto en colaboración con ScienceCast para incorporar resúmenes en audio de 60 segundos generados por inteligencia artificial en su plataforma Esta iniciativa busca ampliar el acceso al contenido científico más allá del formato PDF, continuando la línea iniciada en 2024 con la introducción de versiones en HTML de los artículos.

arXiv, uno de los repositorios científicos de acceso abierto más importantes del mundo, ha iniciado un proyecto piloto en colaboración con la plataforma ScienceCast para ofrecer resúmenes en audio de 60 segundos generados por inteligencia artificial. Esta iniciativa se enmarca en los esfuerzos de arXiv por hacer la ciencia más accesible a un público más amplio, diversificando los formatos disponibles más allá del tradicional PDF. Ya en 2024, arXiv había comenzado a ofrecer versiones en HTML de los artículos recientes, lo cual mejoraba la legibilidad y accesibilidad en dispositivos móviles y navegadores.

En esta nueva fase, los resúmenes en audio están disponibles, por el momento, solo para artículos nuevos de la categoría astro-ph.HE (astrofísica de alta energía) publicados a partir del 1 de diciembre de 2024. Estos audios se generan automáticamente a partir de los archivos TeX durante el proceso de envío del artículo, lo que permite una rápida publicación del contenido sintetizado. Para acceder a ellos, los lectores pueden dirigirse al menú lateral derecho de la página de resumen del artículo en arxiv.org, donde encontrarán una nueva sección llamada “Additional Features” (Funciones adicionales). Allí, el enlace “Audio Summaries” conduce a una página de destino donde se puede escuchar el resumen directamente en la plataforma de ScienceCast.

ScienceCast, que desde 2022 forma parte de arXivLabs —una incubadora de innovación abierta que conecta arXiv con herramientas externas— ya había implementado con éxito un programa similar con el repositorio bioRxiv en el campo de las ciencias biológicas. Su plataforma emplea inteligencia artificial para generar contenido audiovisual breve que resume los principales aportes de un artículo científico, lo que facilita el acceso al conocimiento tanto para investigadores como para estudiantes, divulgadores y entusiastas de la ciencia.

Ramin Zabih, director académico de arXiv y profesor de informática en Cornell Tech, destacó que esta colaboración representa un paso más en el cumplimiento de la misión de arXiv: garantizar que la ciencia esté abierta y disponible para todos. Con más de 2.6 millones de artículos en su repositorio, arXiv representa una fuente esencial para investigadores de múltiples disciplinas. En este contexto, los resúmenes en audio constituyen una herramienta útil para mantenerse al día con los avances, incluso en campos fuera del área de especialización de cada lector.

Por su parte, Erin Sharoni, directora ejecutiva de ScienceCast, subrayó que el objetivo de su empresa es eliminar barreras en los flujos de trabajo de investigación, promoviendo el acceso abierto y la participación activa de cualquier persona interesada en el conocimiento científico, desde expertos hasta el público general.

Aunque el proyecto se encuentra en una fase inicial y limitada a una categoría temática, se prevé su ampliación a otras áreas del conocimiento, así como la incorporación de más funcionalidades de audio y visualización. Desde arXiv y ScienceCast se anima a los usuarios a compartir sus comentarios, sugerencias o inquietudes, tanto a través del blog oficial como directamente en www.sciencecast.org.

Los autores que ya tengan un resumen en audio generado para su artículo también pueden contactar a ScienceCast para ofrecer retroalimentación o plantear preocupaciones específicas a través del correo electrónico: vacheh.joakim@sciencecast.ai.

Este proyecto representa un nuevo paso hacia una ciencia más inclusiva, comprensible y accesible, adaptada a las nuevas formas de consumo de contenido en la era digital.

Las publicaciones en acceso abierto generan pocas visitas desde los resultados de búsqueda de Google a los repositorios institucionales

Orduña-Malea, E., Font-Julián, C.I. & Serrano-Cobos, J. Open access publications drive few visits from Google Search results to institutional repositoriesScientometrics (2024). https://doi.org/10.1007/s11192-024-05175-0

El estudio resalta la importancia de Google Search en la generación de visitas a los repositorios institucionales (IR). La falta de visibilidad en los resultados de los motores de búsqueda puede afectar negativamente la posibilidad de que las publicaciones depositadas en estos repositorios sean encontradas, leídas, descargadas y citadas. Para mejorar esta situación, las instituciones deben evaluar la visibilidad de sus repositorios y determinar las acciones necesarias para optimizarla. No obstante, medir la visibilidad en términos de optimización de motores de búsqueda (SEO) requiere un método preciso y técnicamente viable.

Este trabajo es el primer intento de diseñar un método de este tipo, aplicado específicamente a la medición de la visibilidad de los IR de las universidades nacionales de España en Google Search, utilizando métricas SEO derivadas de la herramienta Ubersuggest. Se analizó un extenso conjunto de datos durante tres meses, que incluyó 217,589 registros bibliográficos y 316,899 palabras clave orgánicas.

Los resultados revelan que muchos registros en estos repositorios no aparecen en los primeros puestos de los resultados de búsqueda de Google. Los registros más visibles suelen ser trabajos académicos (tesis y disertaciones) en español, particularmente en Humanidades y Ciencias Sociales. Sin embargo, la mayoría de las visitas provienen de un número reducido de registros. Estos hallazgos cuestionan el papel de los IR en atraer lectores a través de Google Search, destacando que su enfoque principal sigue siendo la preservación más que la difusión en línea.

El estudio sugiere que mejoras potenciales podrían lograrse mediante esquemas de metadatos mejorados y prácticas de descripción normalizadas, así como la adopción de otras estrategias que fortalezcan la visibilidad en línea de los IR. Este trabajo resulta relevante para defensores del acceso abierto, agencias de investigación, bibliotecarios, desarrolladores de repositorios y administradores de sitios web, ya que contribuye a una mejor comprensión del impacto web de los resultados de investigación depositados en los IR.

Freesound: datos del repositorio de sonidos: 40.940 nuevos sonidos durante 2023

Freesound

https://freesound.org/

Freesound, se presentan estadísticas sobre la actividad del año 2023. Se subieron 40,940 nuevos sonidos, equivalente a 1134 horas de audio. Aunque hubo menos sonidos cargados en comparación con 2022, se subieron 70 horas más de audio, probablemente debido a la carga de más grabaciones de campo, lo que aumentó la duración promedio de los sonidos a 100 segundos cada uno.

La distribución de licencias Creative Commons para los nuevos sonidos muestra que el porcentaje de sonidos CC0 es el mismo que en 2022, pero el porcentaje de sonidos de Atribución No Comercial aumentó en un 5%. Con estas adiciones, Freesound ahora alberga un total de 616,881 sonidos, superando la marca de 600,000 sonidos, con una duración total de 429 días y 14 horas.

A pesar de las expectativas anteriores de alcanzar 700,000 sonidos en 2024, la tasa de crecimiento está ligeramente por debajo de la predicción debido a la disminución en la carga de sonidos en 2023 y la eliminación de una cuenta importante con 8,000 sonidos.

El «tag cloud» de las etiquetas más utilizadas en 2023 muestra que las etiquetas populares no han cambiado mucho. Se esperaba ver más etiquetas relacionadas con grabaciones de campo, pero el aumento en la duración promedio puede atribuirse a la contribución significativa de Philip_Goddard, quien subió 237 horas de contenido (aproximadamente 1 hora por sonido). Se destacan algunos de los sonidos largos mejor valorados subidos este año.

CORE presenta una completa nueva guía para proveedores de datos

CORE guidelines for Data Providers.

https://core.ac.uk/documentations

Para un proveedor de datos, ser indexado por CORE (COnnecting REpositories) es un proceso sencillo, ya que la indexación se realiza a través de OAI-PMH, que es un protocolo estándar para la interoperabilidad de repositorios. Plataformas de repositorios comunes como EPrints, DSpace u Open Journal Systems (OJS) admiten OAI-PMH. Sin embargo, existen varias etapas adicionales que se pueden llevar a cabo para asegurar que el repositorio esté configurado de la mejor manera posible para permitir que CORE indexe el contenido del repositorio de manera óptima.

En un esfuerzo continuo por ayudar a los Proveedores de Datos, CORE ha presentado una nueva guía detallada que proporciona una gran cantidad de información para gestores de repositorios y otros interesados. La nueva guía abarca todo, incluido cómo debe configurarse el repositorio para OAI-PMH. Lamentablemente, es un problema bastante común que el punto final OAI-PMH de un repositorio esté mal configurado o no funcione correctamente. Esto puede ocurrir incluso cuando otras funcionalidades del repositorio parecen estar operando sin problemas. Esto tiene un gran impacto en la visibilidad del repositorio ante el mundo exterior y repercusiones posteriores en la descubribilidad de su contenido.

La nueva guía aborda las mejores prácticas para repositorios en cuanto a metadatos y formatos de metadatos, e incluye recomendaciones para exponer esta información de la manera más interoperable posible. CORE admite varios perfiles de aplicación para metadatos.