Archivo de la etiqueta: Fuentes de información

Guía para la selección y expurgo de recursos en bibliotecas escolares

A Guide to the Selection and Deselection of School Library Resources. The Ontario School Library Association (OSLA), 2023

Descargar

Esta guía ofrece información, mejores prácticas y recursos para apoyar la selección y deselección de los recursos de aprendizaje de la biblioteca escolar. Recursos para ayudar a los consejos escolares a resolver preocupaciones, preguntas y/o retos relacionados con los materiales de las bibliotecas escolares.

Este recurso está dirigido a profesionales de bibliotecas escolares, educadores, personal, administradores, consejos escolares, estudiantes y familias. Se ha desarrollado pensando en el público en general, para cualquier persona interesada en comprender cómo se seleccionan los recursos para una Biblioteca Escolar de Aprendizaje Común (SLLC).

Esta guía llega en un momento crucial, cuando las bibliotecas escolares de Canadá se enfrentan a un creciente número de peticiones para eliminar o restringir el acceso a los libros, especialmente aquellos que reflejan perspectivas LGBTQIA2S+, contienen personajes de diversas identidades de género o de origen racial, y tratan de la salud sexual y la educación. Frente a esos desafíos al derecho de los estudiantes a leer y a la libertad de expresión, Ontario School Library Association (OSLA)  ha ampliado su Sample Selection Policy (2017)  en una guía completa para toda la comunidad escolar.

Esperamos que esta guía sirva como una herramienta útil para los profesionales de las bibliotecas escolares a medida que continúan perfeccionando su experiencia en el desarrollo de la colección de la biblioteca; y que además proporcione un marco para los consejos escolares que aún no han desarrollado una política de selección de recursos escolares complementarios disponible públicamente y una orientación sobre cómo afrontar los retos que se plantean a los materiales de las bibliotecas escolares, además de ayuda a informar a los estudiantes y a los padres sobre cómo se eligen los recursos para sus bibliotecas escolares.

Recursos para la visibilidad e indización de revistas académicas.

José Octavio Alonso Gamboa ; Felipe Rafael Reyna Espinosa. Recursos para la visibilidad e indización de revistas académicas. 2a ed. Latindex, 2023

Texto completo

Este documento compila una selección de recursos de información (bases de datos) que indizan revistas académicas iberoamericanas. Las bases de datos han sido clasificadas de la siguiente manera: servicios de índices y resúmenes, directorios de revistas, portales o hemerotecas virtuales, servicios de categorización y evaluación de revistas, servicios que informan sobre las políticas de acceso y uso de los contenidos y sistemas nacionales de clasificación de revistas, también conocidos como listas núcleo nacionales. Los autores seguiran trabajando y agregando más bases de datos en subsecuentes versiones.

Palace Bookshelf Home más de 16.000 libros electrónicos de libre acceso

 Palace Bookshelf collection

La colección Palace Bookshelf de más de 16.000 libros electrónicos de libre acceso, que puede consultar en palacebookshelf.dp.la o descargando la aplicación gratuita Palace Project para  iOS Android.

La colección incluye clásicos, libros infantiles, libros de texto, títulos en lenguas extranjeras y mucho más.

Las herramientas de IA generativa se están quedando rápidamente ‘sin texto’ para entrenarse advierte un experto de la UC Berkeley

Rivera, Gabriel. «Generative AI Tools Are Quickly “running out of Text” to Train Themselves on, UC Berkeley Professor Warns». Business Insider. Accedido 14 de julio de 2023. https://www.businessinsider.com/ai-could-run-out-text-train-chatbots-chatgpt-llm-2023-7.

Según el profesor Stuart Russell, experto en inteligencia artificial y profesor de la Universidad de California en Berkeley, existe una preocupación creciente de que los modelos de inteligencia artificial, como ChatGPT, estén alcanzando un límite en cuanto a la cantidad de texto disponible en el universo que los entrena para generar respuestas.

Los LLM (modelos lingüísticos de gran escala) que impulsan las herramientas de IA generativa más populares en la actualidad se entrenaron con cantidades masivas de texto publicado extraído de fuentes en línea públicas, incluidas fuentes de noticias digitales y sitios de redes sociales. Elon Musk, por ejemplo, ha mencionado que la «extracción de datos» de estos últimos es lo que lo llevó a limitar la cantidad de tweets que los usuarios pueden ver diariamente.

Un estudio realizado en noviembre pasado por Epoch, un grupo de investigadores de IA, estima que es probable que los conjuntos de datos de aprendizaje automático agoten todo el «texto de alta calidad» antes de 2026. Según el estudio, los conjuntos de datos de «alta calidad» provienen de fuentes como «libros, artículos de noticias, papers científicos, Wikipedia y contenido web filtrado».

Russell afirma en una entrevista que la tecnología utilizada para entrenar a estos bots de inteligencia artificial está empezando a enfrentarse a un desafío significativo. En otras palabras, estos bots no pueden absorber todo el texto digital necesario para su entrenamiento, lo cual fue mencionado en una entrevista con la Unión Internacional de Telecomunicaciones, una agencia de comunicaciones de la ONU, la semana pasada.

Este problema podría tener implicaciones en la forma en que los desarrolladores de inteligencia artificial generativa recopilen datos y entrenen sus tecnologías en el futuro. Sin embargo, Russell sigue sosteniendo la opinión de que la inteligencia artificial reemplazará a los humanos en muchas tareas relacionadas con el lenguaje, según lo describió en la entrevista como «lenguaje dentro, lenguaje fuera».

Russell afirmó en la entrevista que OpenAI, en particular, tuvo que «complementar» sus datos de lenguaje público con «fuentes de archivos privados» para crear GPT-4, el modelo de IA más avanzado y sólido de la compañía hasta la fecha. Sin embargo, reconoció en el correo electrónico a Insider que OpenAI aún no ha detallado los conjuntos de datos exactos utilizados en el entrenamiento de GPT-4. Varias demandas presentadas contra OpenAI en las últimas semanas alegan que la compañía utilizó conjuntos de datos que contenían información personal y materiales con derechos de autor para entrenar a ChatGPT. Una de las demandas más importantes fue presentada por 16 demandantes no identificados, quienes afirman que OpenAI utilizó datos sensibles como conversaciones privadas y registros médicos.

El último desafío legal, presentado por los abogados de la comediante Sarah Silverman y otros dos autores, acusa a OpenAI de infracción de derechos de autor debido a la capacidad de ChatGPT para escribir resúmenes precisos de su trabajo. Mona Awad y Paul Tremblay, dos autores adicionales, presentaron una demanda contra OpenAI a finales de junio que hace acusaciones similares. OpenAI ha evitado hacer comentarios públicos sobre el conjunto de demandas presentadas en su contra. Su CEO, Sam Altman, también se ha abstenido de discutir las acusaciones, aunque en el pasado ha expresado su deseo de evitar problemas legales.

OASPA y DOAJ presentan un nuevo conjunto de herramientas de acceso abierto para editores e investigadores

 Open Access Journals Toolkit.

Open Access Scholarly Publishing Association (OASPA) y DOAJ (Directory of Open Access Journals) publican hoy un nuevo conjunto de herramientas para revistas de acceso abierto. El lanzamiento de estas herramientas marca un hito importante en los esfuerzos de OASPA y DOAJ para promover la transparencia, la accesibilidad y la inclusión en la publicación académica. El conjunto de herramientas responde a la necesidad de un recurso en línea para ayudar a las revistas de acceso abierto nuevas y establecidas a navegar por el panorama rápidamente cambiante de la publicación en acceso abierto. El proceso de diseño de las Herramientas para Revistas de Acceso Abierto comenzó en noviembre de 2022 y finalizó en junio de 2023 con este lanzamiento.

Open Access Journals Toolkit es un proyecto de colaboración desarrollado con la aportación de un consejo editorial diverso. Entre sus principales características se incluyen

  • Un sitio web fácil de usar y accesible, con una navegación y una funcionalidad de búsqueda sencillas, que se adhiere a las directrices de accesibilidad del W3C, facilitando a todos los usuarios la búsqueda de información y recursos relevantes, independientemente de cómo accedan a Internet.
  • Una colección curada de recursos que cubren diversos aspectos de la publicación en acceso abierto, como políticas editoriales, licencias, metadatos e indexación.
  • Directrices y plantillas prácticas para ayudar a los editores a crear y mantener revistas de acceso abierto de alta calidad.
  • Una versión descargable para ayudar a las personas cuyas conexiones no permiten una navegación coherente de la versión web.
  • Disponible en varios idiomas, la versión francesa se lanzará en breve.

Archivos secretos de las Guerras Mundiales, Guerra Civil de España y Guerra Fría

Secret Files from World Wars to Cold War

coherentdigital.net/sefi

CONTENT Secret Files from World Wars to Cold War es una excelente recopilación de documentos primarios de Coherent Digital, alojada en su plataforma History Commons. La colección de 12.000 documentos explora los archivos secretos de inteligencia del gobierno británico sobre cuatro conflictos clave del siglo XX: la Guerra Civil Española, la Segunda Guerra Mundial, los primeros años de la Guerra Fría y la Guerra de Corea. Se hace hincapié en los materiales de la Segunda Guerra Mundial, ya que la mayoría de los expedientes del archivo datan de las décadas de 1930 y 1940.

El contenido consiste en directivas de correspondencia, informes financieros, mapas, actas de reuniones, memorandos, informes y miscelánea de inteligencia de señales. Los documentos proceden de nueve series de expedientes del Departamento del Subsecretario Permanente (PUSD), incluidos materiales del Subcomité Conjunto de Inteligencia, el Gabinete de Guerra y el Ministerio de Defensa. La base de datos está dirigida a estudiantes, investigadores, profesores y especialistas de bibliotecas académicas.

ChatGPT podría verse obligado a mostrar sus fuentes gracias al nuevo proyecto de ley de regulación de la IA de la Unión Europea

updated, Jeff Parsons last. «ChatGPT Could Be Forced to Show Its Sources Thanks to New AI Regulation Bill». Tom’s Guide, 28 de abril de 2023. https://www.tomsguide.com/news/new-ai-regulation-could-mean-a-big-change-for-chatgpt.

The Artificial Intelligence Act

Una de las primeras cosas de la que te das cuenta mientras pruebas ChatGPT es que las fuentes y citas utilizadas por el chatbot de IA no aparecen a menos que se le pidas

Se trata de un problema generalizado en el sector de la inteligencia artificial que ha provocado la ira tanto de editoriales como de profesionales creativos. La mayoría estamos de acuerdo en que es importante proporcionar información precisa y dar crédito a quienes la han creado.

En la actualidad, la Unión Europea está elaborando la primera normativa exhaustiva que regula el despliegue de la IA (opens in new tab). Y una de las normas más recientes incluidas en el documento es que los fabricantes de herramientas de inteligencia artificial estarán obligados a revelar cualquier material protegido por derechos de autor que hayan utilizado para crearlas.

En la nueva normativa, según un primer borrador, los desarrolladores de modelos generativos de IA tendrían que publicar un «resumen suficientemente detallado» de los materiales protegidos por derechos de autor que hayan utilizado como parte de su creación.

ChatGPT, Google Bard y otros grandes modelos lingüísticos rastrean enormes cantidades de datos (ya sea en la web o a través de conjuntos de datos curados) para proporcionar sus respuestas. A medida que aumentan las capacidades de estas herramientas de inteligencia artificial para, por ejemplo, incluir la generación de imágenes, también aumenta la cantidad de datos de contenido rastreados. Cuando esto se extiende a cosas como letras de canciones o código informático, muchas personas creen que se está infringiendo el derecho de autor.

ChatGPT mostrará citas y fuentes de la información que proporciona siempre que el usuario se lo pida.

De hecho, el pasado noviembre, OpenAI (creadora de ChatGPT) fue objeto de una demanda colectiva por parte de dos demandantes anónimos que alegaban que había monetizado indebidamente código fuente abierto de GitHub para entrenar el sistema.

Aún no está claro cuál será el impacto de la normativa en el desarrollo de la IA, ni cómo se aplicará, pero los legisladores europeos esperan que sirva de modelo para la política de IA en otras partes del mundo. La UE afirma que su política en materia de IA dará lugar a «nuevas normas mundiales para garantizar que se pueda confiar en la IA», del mismo modo que su ley GDPR se ha convertido en un punto de referencia para las normas de privacidad.

El proyecto de ley en sí no se ha finalizado, ya que los distintos Estados miembros de la UE tienen que ponerse de acuerdo para que se apruebe. No obstante, se espera que la versión final se confirme y apruebe este mismo año.

Archivos secretos de las Guerras Mundiales a la Guerra Fría: 12.000 documentos secretos de inteligencia del gobierno británico

Tench, Rob. «Secret Files from World Wars to Cold War | eReviews». Library Journal. Accedido 28 de febrero de 2023.

coherentdigital.net/sefi

Secret Files from World Wars to Cold War es una excelente recopilación de documentos primarios. La colección de 12.000 documentos explora los archivos secretos de inteligencia del gobierno británico sobre cuatro conflictos clave del siglo XX: la Guerra Civil Española, la Segunda Guerra Mundial, los primeros años de la Guerra Fría y la Guerra de Corea.

Openverse, la biblioteca con más de 600 millones de fotos, imágenes y archivos de audio libre y abierto de dominio publico

openverse.org

¿Buscas la imagen perfecta para ilustrar tu post? ¿Una melodía pegadiza para animar un vídeo? No busque más: Openverse, la inmensa biblioteca de fotos, imágenes y audio de archivo libre y abierto aportados al dominio público por personas de todo el mundo, está ahora disponible en su nuevo dominio: openverse.org.

Encontrar y utilizar obras libres y gratuitas nunca ha sido tan fácil: Sólo tienes que visitar Openverse, introducir algunas palabras clave y elegir tu imagen o música favorita entre los resultados. También puedes filtrar por tipo de contenido, fuentes, relación de aspecto, tamaño, estados de licencia abierta y dominio público, y mucho más, como la búsqueda de las palabras clave «arte» y «universo» que utilizamos para encontrar la imagen de este post.

Openverse se creó aquí en CC como «CC Search», trasladándose a la comunidad WordPress en 2021, y ha seguido prosperando en su nuevo alojamiento, catalogando ahora más de 600 millones de imágenes y pistas de audio, con nuevas colecciones de obras abiertas que se añaden continuamente, como la reciente incorporación de más de 15 millones de imágenes de iNaturalist, el proyecto que permite a los científicos ciudadanos y a los investigadores documentar y comprender la biodiversidad mundial.

ARIADNEplus provee acceso a más de 4 millones de fuentes de información sobre Arqueología

ARIADNEplus

https://portal.ariadne-infrastructure.eu/

Las personas interesadas en la arqueología pueden admirar fácilmente en línea colecciones arqueológicas de más de 50 países diferentes a través de ARIADNEplus. Se pueden buscar objetos arqueológicos, datos de excavaciones y prospecciones, pero también informes, imágenes y bases de datos de un total de 4 millones de fuentes. Se puede encontrar una gran variedad de datos arqueológicos de Europa y de otros lugares del mundo. Encuentra el tema de su interés mediante una búsqueda genérica, o una búsqueda más específica utilizando la línea del tiempo (desde la Edad de Piedra hasta la actualidad), puntos del mapa o seleccionando temas temáticos.