El Gobierno aprueba la primera Estrategia Nacional de Ciencia Abierta

Estrategia Nacional de Ciencia Abierta. Madrid: Ministerio de Ciencia e Innovación y FECYT, 2023

PDF

El día 3 de mayo de 2023, el Gobierno de España aprobó la primera Estrategia Nacional de Ciencia Abierta para el periodo comprendido entre 2023 y 2027. La elaboración de este documento ha sido liderada por el Ministerio de Ciencia e Innovación y ha contado con la coordinación técnica de la Fundación Española para la Ciencia y la Tecnología (FECYT).

La Estrategia Nacional de Ciencia Abierta (ENCA) tiene como objetivo principal fortalecer la calidad, transparencia y reproducibilidad de la actividad científica en España. Además, busca mejorar la difusión de los resultados científicos entre la comunidad científica y promover su transferencia a la sociedad en general. También se enfoca en diseñar las estrategias necesarias para afrontar los desafíos que la comunidad científica española enfrenta en este nuevo paradigma global.

Con esta iniciativa, se pretende fomentar la colaboración y el intercambio de conocimientos en el ámbito científico, impulsar la apertura y accesibilidad de los datos y publicaciones científicas, así como promover prácticas de investigación más abiertas y colaborativas. La Estrategia Nacional de Ciencia Abierta sienta las bases para que España se posicione como referente en este ámbito y contribuya al avance de la ciencia y la innovación en el país.

La Estrategia Nacional de Ciencia Abierta (ENCA) se enfoca en cuatro objetivos estratégicos:

  1. Garantizar la existencia de infraestructuras digitales sólidas y bien conectadas que sean interoperables, capaces de soportar la implementación de una política nacional de ciencia abierta y facilitar su integración en el contexto internacional y en la European Open Science Cloud. Se busca asegurar que estas infraestructuras estén preparadas para absorber los cambios necesarios y promover la colaboración a nivel global.
  2. Promover la gestión adecuada de los datos de investigación generados por el sistema nacional de I+D+I, utilizando los principios FAIR (Findable, Accessible, Interoperable, and Reusable), con el objetivo de aumentar su localización, accesibilidad, interoperabilidad y reusabilidad. Esto implica facilitar el acceso y la utilización de los datos de investigación de manera efectiva y eficiente.
  3. Implementar el acceso abierto y gratuito como norma para las publicaciones y resultados científicos financiados, de forma directa o indirecta, con fondos públicos. El objetivo es que estos resultados estén disponibles para toda la sociedad, sin restricciones, promoviendo así la difusión del conocimiento científico y el avance de la investigación.
  4. Establecer nuevos mecanismos de evaluación de la investigación y un sistema de incentivos y reconocimientos que impulsen las prácticas de ciencia abierta. Además, se busca capacitar a todo el personal involucrado en el ámbito de la investigación (investigadores, gestores, financiadores, evaluadores) para alinear su desempeño profesional con los principios de la ciencia abierta. Esto implica promover la adopción de prácticas abiertas, transparentes y colaborativas, y reconocer el valor de dichas prácticas en la comunidad científica.

Esta estrategia está alineada con las políticas y medidas impulsadas por la Unión Europea para avanzar hacia un modelo de investigación basado en la publicación en abierto de los resultados y datos de investigación.

Conocimiento, uso y reutilización de los datos abiertos en la ciencia española

Vidal Cabo, Christian. «Conocimiento, uso y reutilización de los datos abiertos en la ciencia española». Tesis doctoral, Universitat Politècnica de València, 2022. https://doi.org/10.4995/Thesis/10251/184664.

El Gobierno Abierto es un modo de política pública que se basa en los pilares de colaboración y participación ciudadana, transparencia y rendición de cuentas y derecho de acceso a la información pública. De la mano de las tecnologías de la información y las comunicaciones, gobiernos y administraciones llevan a cabo iniciativas de apertura de datos, movimiento conocido como Open Data (Datos Abiertos). Las plataformas digitales donde estas entidades ponen a disposición de la sociedad civil los datos son conocidas como portales de datos abiertos. Se trata de fuentes de información donde los conjuntos de datos son potencialmente reutilizables, con cualquier fin y sin ningún tipo de restricción, únicamente de referencia de autoría de los datos.

La comunidad científica, personal altamente cualificado dentro de la sociedad, pueden llegar a ser reutilizadores potenciales de estas fuentes de información. El producto derivado se traduce en producción científica: artículos, usos de datos abiertos en proyectos de investigación, comunicaciones y docencia. Este estudio aborda, por una parte, el conocimiento que tienen los investigadores e investigadoras acerca de los datos abiertos. Por otra, el uso y la reutilización de los datos abiertos para generar conocimiento científico.

Para llevar a cabo el estudio se ha desarrollado una metodología cuantitativa. Se ha elaborado una encuesta, distribuida en un bloque inicial de contexto con 6 preguntas y 6 bloques de carácter técnico con 24 preguntas, es decir, un cuestionario con 30 preguntas.

Se obtienen un total de 783 respuestas, procedentes de 34 provincias españolas. Los investigadores e investigadoras proceden de 47 universidades españolas y 21 centros de investigación, y existe representación 19 áreas de investigación de la Agencia Estatal de Investigación.

Con los datos obtenidos a través de esta metodología cuantitativa, se procesan, se normalizan y se lleva a cabo un análisis. Además, con los datos se desarrolla una plataforma para visualizar los resultados de la encuesta.

OpenAI se esta enfrentando a varias demandas que alegan que la compañía utilizó conjuntos de datos con información personal y materiales bajo derechos de autor para entrenar a ChatGPT

OpenAI ha enfrentado múltiples demandas en las últimas semanas debido al uso de conjuntos de datos que contienen información personal y materiales con derechos de autor en el entrenamiento de sus modelos de IA, como ChatGPT. Estas demandas plantean preocupaciones sobre presuntas infracciones de derechos de autor y el uso indebido de datos sensibles, como registros médicos y conversaciones privadas, sin el consentimiento apropiado.


OpenAI se ha enfrentado a varias demandas presentadas en las últimas semanas. Estas demandas han planteado preocupaciones sobre el uso de conjuntos de datos que contienen información personal y materiales con derechos de autor para entrenar a sus modelos de IA, como ChatGPT. Algunas de las demandas alegan infracciones de derechos de autor, mientras que otras afirman que OpenAI utilizó datos sensibles, como conversaciones privadas y registros médicos, sin el consentimiento adecuado.

Entre las demandas más destacadas se encuentra una demanda presentada por 16 demandantes no identificados que afirman que OpenAI utilizó datos sensibles en el entrenamiento de sus modelos de IA. Además, la comediante y autora Sarah Silverman, junto con los autores Christopher Golden y Richard Kadrey, han presentado demandas por infracción de derechos de autor contra OpenAI y Meta en un tribunal de distrito de Estados Unidos. Las demandas alegan, entre otras cosas, que los modelos ChatGPT de OpenAI y LLaMA de Meta fueron entrenados utilizando conjuntos de datos adquiridos ilegalmente que contenían sus obras, las cuales afirman haber sido obtenidas de sitios web de «bibliotecas piratas» como Bibliotik, Library Genesis, Z-Library y otros, mencionando que los libros están «disponibles en masa a través de sistemas de torrents». En la demanda contra OpenAI, los creadores presenta pruebas que demuestran que cuando se le solicita, ChatGPT resume sus libros, infringiendo sus derechos de autor. En las pruebas se muestra que el primer libro resumido por ChatGPT es Bedwetter de Silverman, mientras que también se utiliza como ejemplo el libro Ararat de Golden y el libro Sandman Slim de Kadrey. La demanda afirma que el chatbot no se preocupó por «reproducir ninguna de las informaciones de gestión de derechos de autor que los demandantes incluyeron en sus obras publicadas».

Una demanda presentada en un tribunal federal en San Francisco alega que OpenAI copió texto de libros ilegalmente al no obtener el consentimiento de los titulares de los derechos de autor, darles crédito ni compensarlos. La demanda, Tremblay v. OpenAI Inc, afirma que ChatGPT puede resumir de manera precisa los libros de ciencia ficción y terror de los autores. Esto sugiere que el chatbot ha leído y absorbido sus obras. Los autores alegan que ChatGPT violó la ley de derechos de autor al eliminar los avisos de derechos de autor de estos libros.

Otra demanda alega que los modelos de aprendizaje automático de OpenAI, incluyendo ChatGPT y DALL-E, recopilan ilegalmente la información personal de las personas en Internet, violando diversas leyes de privacidad. La demanda, conocida como PM v. OpenAI LP, afirma que OpenAI obtiene información privada de las personas directamente a través de sus sistemas de IA y otras aplicaciones que incorporan ChatGPT. La demanda alega que OpenAI ha incorporado sus sistemas en varias plataformas como Snapchat, Spotify, Stripe, Slack y Microsoft Teams. Afirma que OpenAI recopiló clandestinamente imágenes, ubicaciones, preferencias musicales, información financiera y comunicaciones privadas de los usuarios a través de estas integraciones. Además, la denuncia argumenta que esta recopilación y uso de datos violaron las leyes de privacidad, especialmente en lo que respecta a los datos de los niños.

Estas demandas han generado un debate sobre la ética y las prácticas de recopilación de datos utilizadas en el desarrollo de modelos de IA. OpenAI aún no ha hecho comentarios públicos específicos sobre las demandas y se espera que el proceso legal siga su curso para determinar los resultados. Las acusaciones resaltan la importancia de abordar de manera ética y legal la recopilación y el uso de datos en el desarrollo de la inteligencia artificial. El proceso legal determinará los resultados de estas demandas y puede tener implicaciones significativas para la industria, y la regulación en el campo de la IA.

Diferencias entre Inteligencia Artificial, Aprendizaje Automático, Aprendizaje Profundo e Inteligencia Artificial Generativa

La Inteligencia Artificial (IA), el Aprendizaje Automático (Machine Learning), el Aprendizaje Profundo (Deep Learning) y la Inteligencia Artificial Generativa son conceptos relacionados pero distintos en el campo de la tecnología y la ciencia de datos. Aquí tienes una descripción de cada uno de ellos:

Inteligencia Artificial (IA) La IA se refiere a la creación de sistemas o programas informáticos capaces de realizar tareas que normalmente requieren de inteligencia humana y que imitan el comportamiento humano al utilizar máquinas para aprender y ejecutar tareas sin instrucciones explícitas sobre qué producir como resultado.

Aprendizaje Automático (Machine Learning) El Aprendizaje Automático es una rama de la IA que se centra en desarrollar algoritmos y modelos que permiten a las máquinas aprender de los datos y mejorar su rendimiento sin ser programadas explícitamente. Estos modelos toman datos, como por ejemplo las condiciones climáticas, y los ajustan a un algoritmo para realizar predicciones, como cuánto dinero puede generar una tienda en un día determinado.

Aprendizaje Profundo (Deep Learning) El Aprendizaje Profundo es una subárea del Aprendizaje Automático que se basa en redes neuronales artificiales con múltiples capas. Estas redes neuronales profundas son capaces de aprender representaciones jerárquicas y complejas de los datos de entrada, para ello utilizan capas de algoritmos en forma de redes neuronales artificiales para ofrecer resultados en casos de uso más complejos.

Inteligencia Artificial Generativa (Generative AI) son un subconjunto de los modelos de aprendizaje profundo que pueden generar nuevo contenido basado en datos de entrenamiento. Estos modelos utilizan técnicas de Aprendizaje Profundo para crear nuevos ejemplos que se asemejan a los datos de entrenamiento. Pueden generar imágenes, música, texto u otros tipos de contenido. La Inteligencia Artificial Generativa se utiliza en aplicaciones como la creación de arte generativo, la síntesis de voz y la generación de texto automático.

En conclusión, la IA busca replicar la inteligencia humana, el Aprendizaje Automático se basa en algoritmos para aprender de los datos, el Aprendizaje Profundo utiliza redes neuronales profundas para extraer representaciones complejas, y la Inteligencia Artificial Generativa se enfoca en la generación de contenido nuevo y original. Estas áreas se complementan entre sí y tienen aplicaciones en diversos campos de la tecnología y la investigación.

Las herramientas de IA generativa se están quedando rápidamente ‘sin texto’ para entrenarse advierte un experto de la UC Berkeley

Rivera, Gabriel. «Generative AI Tools Are Quickly “running out of Text” to Train Themselves on, UC Berkeley Professor Warns». Business Insider. Accedido 14 de julio de 2023. https://www.businessinsider.com/ai-could-run-out-text-train-chatbots-chatgpt-llm-2023-7.

Según el profesor Stuart Russell, experto en inteligencia artificial y profesor de la Universidad de California en Berkeley, existe una preocupación creciente de que los modelos de inteligencia artificial, como ChatGPT, estén alcanzando un límite en cuanto a la cantidad de texto disponible en el universo que los entrena para generar respuestas.

Los LLM (modelos lingüísticos de gran escala) que impulsan las herramientas de IA generativa más populares en la actualidad se entrenaron con cantidades masivas de texto publicado extraído de fuentes en línea públicas, incluidas fuentes de noticias digitales y sitios de redes sociales. Elon Musk, por ejemplo, ha mencionado que la «extracción de datos» de estos últimos es lo que lo llevó a limitar la cantidad de tweets que los usuarios pueden ver diariamente.

Un estudio realizado en noviembre pasado por Epoch, un grupo de investigadores de IA, estima que es probable que los conjuntos de datos de aprendizaje automático agoten todo el «texto de alta calidad» antes de 2026. Según el estudio, los conjuntos de datos de «alta calidad» provienen de fuentes como «libros, artículos de noticias, papers científicos, Wikipedia y contenido web filtrado».

Russell afirma en una entrevista que la tecnología utilizada para entrenar a estos bots de inteligencia artificial está empezando a enfrentarse a un desafío significativo. En otras palabras, estos bots no pueden absorber todo el texto digital necesario para su entrenamiento, lo cual fue mencionado en una entrevista con la Unión Internacional de Telecomunicaciones, una agencia de comunicaciones de la ONU, la semana pasada.

Este problema podría tener implicaciones en la forma en que los desarrolladores de inteligencia artificial generativa recopilen datos y entrenen sus tecnologías en el futuro. Sin embargo, Russell sigue sosteniendo la opinión de que la inteligencia artificial reemplazará a los humanos en muchas tareas relacionadas con el lenguaje, según lo describió en la entrevista como «lenguaje dentro, lenguaje fuera».

Russell afirmó en la entrevista que OpenAI, en particular, tuvo que «complementar» sus datos de lenguaje público con «fuentes de archivos privados» para crear GPT-4, el modelo de IA más avanzado y sólido de la compañía hasta la fecha. Sin embargo, reconoció en el correo electrónico a Insider que OpenAI aún no ha detallado los conjuntos de datos exactos utilizados en el entrenamiento de GPT-4. Varias demandas presentadas contra OpenAI en las últimas semanas alegan que la compañía utilizó conjuntos de datos que contenían información personal y materiales con derechos de autor para entrenar a ChatGPT. Una de las demandas más importantes fue presentada por 16 demandantes no identificados, quienes afirman que OpenAI utilizó datos sensibles como conversaciones privadas y registros médicos.

El último desafío legal, presentado por los abogados de la comediante Sarah Silverman y otros dos autores, acusa a OpenAI de infracción de derechos de autor debido a la capacidad de ChatGPT para escribir resúmenes precisos de su trabajo. Mona Awad y Paul Tremblay, dos autores adicionales, presentaron una demanda contra OpenAI a finales de junio que hace acusaciones similares. OpenAI ha evitado hacer comentarios públicos sobre el conjunto de demandas presentadas en su contra. Su CEO, Sam Altman, también se ha abstenido de discutir las acusaciones, aunque en el pasado ha expresado su deseo de evitar problemas legales.

¿Ha comprado alguna vez en la biblioteca de su barrio? Bibliotecas y mercados agrícolas colaboran para ofrecerte alimentos frescos

«Libraries and Farmers Markets Work Together to Bring You Fresh Food». EveryLibrary Action. Accedido 14 de julio de 2023.

Ver información

Lo que puede parecer una alianza improbable entre bibliotecas públicas y mercados de agricultores no es un concepto totalmente extraño. En los últimos años, algunos de estos mercados comunitarios se han asociado con bibliotecas locales para reforzar el impacto que los agricultores y artesanos independientes tienen en sus barrios. El objetivo de estas colaboraciones es facilitar a las familias locales el acceso a alimentos frescos y a recursos que los compradores puedan utilizar para poner en marcha sus propios proyectos de jardinería u otros proyectos beneficiosos.

Un artículo publicado en octubre de 2016 hablaba de los esfuerzos combinados de la Farmers Market Federation of New York y Mid York Library System. Además de ofrecer a los neoyorquinos acceso a alimentos frescos cultivados localmente, la colaboración también produjo un programa llamado Farm Market Kids. Este programa combinaba actividades de la biblioteca, como la lectura de cuentos, con actividades relacionadas con la agricultura para que los niños se interesaran más por la producción sostenible de alimentos.

En otro artículo, el Boyle County Farmers Market de Kentucky se asoció con las bibliotecas locales para organizar eventos de mercado, una colaboración que pretendía hacer de las bibliotecas un recurso fiable para los residentes del condado de Boyle.

La colaboración entre bibliotecas y mercados de agricultores no ha desaparecido de la práctica. De hecho, Baton Rouge’s Red Stick Farmers Market se celebra actualmente en la biblioteca principal de la ciudad todos los martes por la tarde.

Petersburg Public Library, en Virginia, también promueve un Mercado de Agricultores Senior dirigido a ciudadanos mayores de sesenta años con ingresos limitados. El mercado ofrece alimentos frescos gratuitos a estas personas, cortesía de agricultores locales.

La Biblioteca del Área de Bayside organiza un evento de Flip Flop Farmer los jueves. Esta colaboración fue posible gracias a la Biblioteca Pública de Virginia Beach y al Departamento de Agricultura de Virginia Beach para hacer más accesibles a la comunidad los alimentos frescos cultivados localmente.

Por último, la Biblioteca Pública Sugar Grove de Illinois organiza Wintermarket,, un mercado agrícola cubierto que tiene lugar el segundo sábado de cada mes durante el invierno (de octubre a abril).

Esperemos que la tendencia siga creciendo y que más comunidades puedan aprovechar las numerosas ventajas que se derivan de la colaboración entre los agricultores locales y las bibliotecas públicas.

La relación entre las editoriales universitarias, los proveedores de libros electrónicos y las bibliotecas universitarias: Un análisis de la teoría de plataformas

Zhang, M., & Eschenfelder, K. (2023). The relationship between university presses, e-book vendors, and academic libraries: A platform theory analysisJournal of Librarianship and Information Science0(0). https://doi.org/10.1177/09610006231185883

Las editoriales universitarias, como uno de los principales proveedores de contenidos en el mercado de los libros electrónicos académicos, especialmente en el ámbito de las humanidades y las ciencias sociales (HSS), desempeñan un papel fundamental en la producción y distribución de nuevos conocimientos y cultura.

Se investigan las relaciones entre las editoriales universitarias, las bibliotecas académicas y los proveedores de libros electrónicos, examinando la percepción que tienen las editoriales universitarias de las bibliotecas académicas y los proveedores de libros electrónicos, y la percepción que tienen las editoriales de sí mismas y de la comunidad de editoriales universitarias.

Los resultados se extraen de entrevistas individuales con 19 participantes de 18 editoriales universitarias diferentes de Estados Unidos durante 2020-2021. Observamos una estructura de mercado para los libros electrónicos de FSS en la que la mayoría de las editoriales estaban satisfechas con los cuatro grandes proveedores de libros electrónicos, incluidos Project MUSE, EBSCO, ProQuest y JSTOR, y carecían de fuertes incentivos para buscar nuevos proveedores de libros electrónicos.

Se descubre que la mayoría de las editoriales suelen tratar a las bibliotecas, incluso a las de la misma institución, como sus clientes, con interacciones limitadas; los resultados también muestran la variada autoimagen de las editoriales universitarias, junto con una percepción compartida sobre la colegialidad de la comunidad de editoriales universitarias. A continuación, se analiza la cuestión de por qué el mercado está dominado por las Cuatro Grandes a través de la lente teórica desarrollada en la bibliografía sobre plataformas, y además se examinan los factores que contribuyen a la escasa comunicación entre las editoriales universitarias y las bibliotecas académicas en relación con la distribución de libros electrónicos.

Estudio sobre la disponibilidad comercial de videojuegos clásicos: casi el 90% de los videojuegos han desaparecido del mercado

Phil Salvador. (2023). Survey of the Video Game Reissue Market in the United States. Zenodo. https://doi.org/10.5281/zenodo.7996492

Texto completo

La Video Game History Foundation, en colaboración con la Software Preservation Network, ha realizado el primer estudio sobre la disponibilidad comercial de videojuegos clásicos, y los resultados son desoladores. El 87% de los videojuegos clásicos lanzados en Estados Unidos están en peligro crítico.

Imagina que la única forma de ver Titanic fuera encontrar una cinta VHS usada y mantener tu propio equipo antiguo para poder seguir viéndola. ¿Y si ninguna biblioteca, ni siquiera la Biblioteca del Congreso, pudiera hacerlo mejor? Podrían conservar y digitalizar ese VHS de Titanic, pero tendrías que ir hasta allí para verlo. Parece una locura, pero esa es la realidad que vivimos con los videojuegos, una industria de 180.000 millones de dólares, mientras los juegos y su historia desaparecen.

Para acceder a casi 9 de cada 10 juegos clásicos, hay pocas opciones: buscar y mantener juegos y hardware vintage de colección, viajar por todo el país para visitar una biblioteca o… la piratería. Ninguna de estas opciones es deseable, lo que significa que la mayoría de los videojuegos son inaccesibles salvo para los aficionados más acérrimos y dedicados. Esto es bastante triste.

Aquí es donde deberían entrar las bibliotecas y los archivos. Cualquiera debería poder explorar, investigar y jugar fácilmente a videojuegos clásicos, del mismo modo que puede leer novelas clásicas, escuchar álbumes clásicos y ver películas clásicas. Pero las obsoletas leyes de derechos de autor impiden a instituciones como la nuestra hacer nuestro trabajo.

La formación del bibliotecario en Chile con Paulina Arellano. Planeta Biblioteca 2023/07/13 

La formación del bibliotecario en Chile con Paulina Arellano.

Planeta Biblioteca 2023/07/13 

Ir a descargar

Julio Alonso entrevista a Paulina Arellano. Paulina Antonieta Arellano Rojas es Directora de Bibliotecología de la Universidad de Playa Ancha en Valparaiso (Chile). Con ellos también interviene el profesor e investigador de Biblioteconomía y Documentación de la USAL, José Antonio Frías.

Beneficios de las actividades extraescolares para los niños: un enfoque sobre la inclusión social y los niños de entornos desfavorecidos y vulnerables

Directorate-General for Employment, Social Affairs and Inclusion (European Commission). Benefits of Extracurricular Activities for Children: A Focus on Social Inclusion and Children from Disadvantaged and Vulnerable Backgrounds. Publications Office of the European Union, 2021. Publications Office of the European Unionhttps://data.europa.eu/doi/10.2767/254969.

Muchos consideran que los actos organizados fuera de la jornada escolar, también conocidos como actividades extraescolares (AEA), permiten a los niños convertirse en ciudadanos activos de su comunidad y desarrollar aptitudes interpersonales como la autoestima y la resiliencia. Las ECA pueden ser muy variadas e incorporar muchos tipos de actividades diferentes que se ofrecen además del plan de estudios obligatorio. Algunos ejemplos son los clubes deportivos, los clubes juveniles, los clubes musicales (aprender a tocar un instrumento musical y tocar en una orquesta/banda), los grupos basados en la educación (tutorías basadas en asignaturas escolares) y otras actividades extraescolares como el voluntariado y los Scouts y Guías. Pueden ser ofrecidos por distintos proveedores, como escuelas, ayuntamientos y grupos de voluntarios, y pueden tener su sede tanto en escuelas como en otros entornos (centros juveniles, centros de ocio, parques, bibliotecas). En la actualidad, la investigación sobre los beneficios específicos de las ECA para los niños es fragmentaria y no existen resúmenes exhaustivos de la investigación existente. Esto se debe quizás al hecho de que las ACE no son un concepto bien definido. Dado el potencial de las ACE para fomentar la inclusión social, también es sorprendente que ningún estudio haya explorado hasta qué punto las ACE apoyan la inclusión social, o cómo ofrecer mejor las ACE para apoyar a los niños desfavorecidos y vulnerables para que asistan y participen en las ACE en toda la UE.