El CERN anuncia una nueva política de datos abiertos en apoyo de la ciencia abierta

CERN announces new open data policy in support of open science
11 December, 2020

Ver noticia

Una nueva política de datos abiertos para los experimentos científicos en Large Hadron Collider (LHC) hará que la investigación científica sea más reproducible, accesible y colaborativa.

El CERN fue pionero en el acceso abierto a la literatura científica con el consorcio SCOAP3, una asociación mundial de bibliotecas, organismos de financiación e instituciones de investigación de 46 países y organizaciones intergubernamentales, que es ahora la mayor iniciativa de acceso abierto del mundo. Además, el CERN colabora con muchas organizaciones, como la Comisión Europea y la UNESCO, en sus esfuerzos por promover las prácticas de ciencia abierta más allá de la física de partículas.

Los cuatro principales colaboradores del LHC (ALICE, ATLAS, CMS y LHCb) han respaldado unánimemente una nueva política de datos abiertos para los experimentos científicos en Large Hadron Collider (LHC), que se ha presentado hoy al Consejo del CERN. La política se compromete a hacer públicos los llamados datos científicos de nivel 3, el tipo necesario para realizar estudios científicos, recogidos por los experimentos del LHC. Los datos comenzarán a publicarse aproximadamente cinco años después de su recogida, y el objetivo es que el conjunto de datos completo esté disponible públicamente al final del experimento en cuestión. La política aborda el creciente movimiento de ciencia abierta, que tiene por objeto hacer que la investigación científica sea más reproducible, accesible y colaborativa.

Los datos de nivel 3 que se publiquen pueden contribuir a la investigación científica en la física de las partículas, así como a la investigación en el campo de la informática científica, por ejemplo para mejorar los métodos de reconstrucción o análisis basados en técnicas de aprendizaje por máquina, un enfoque que requiere ricos conjuntos de datos para la capacitación y la validación.

Se considera que los datos científicos tienen diferentes niveles de complejidad. Los datos del nivel 3 son del tipo que se utiliza como entrada para la mayoría de los estudios de física y se publicarán junto con el software y la documentación necesarios para utilizar los datos. Su publicación permitirá un análisis de alta calidad por parte de diversos grupos: científicos que no pertenecen al CERN, científicos de otros campos, iniciativas educativas y de divulgación y el público en general.

La política también abarca la publicación de los conjuntos de datos de nivel 1 y nivel 2, de los que ya se dispone de muestras. El nivel 1 corresponde a la información de apoyo de los resultados publicados en artículos científicos, y el nivel 2 corresponde a conjuntos de datos científicos específicos diseñados con fines educativos y de divulgación.

En la práctica, los conjuntos de datos científicos se publicarán a través del Portal de Datos Abiertos del CERN (Open Data Portal), que ya alberga un amplio conjunto de datos relacionados con LHC y otros experimentos. Los datos estarán disponibles utilizando las normas FAIR, un conjunto de directrices de datos que garantizan que los datos sean localizables, accesibles, interoperables y reutilizables.

Esta estrategia complementa la actual política de acceso abierto del CERN, que ordena que todos los resultados de las investigaciones del CERN se publiquen en acceso abierto. También está en consonancia con la reciente actualización de la Estrategia Europea de Física de las Partículas anunciada en junio de 2020. La nueva política podría utilizarse como un modelo para otros experimentos en el CERN y en otras organizaciones científicas.