
Nüst D, Sochat V, Marwick B, Eglen SJ, Head T, Hirst T, et al. (2020) Ten simple rules for writing Dockerfiles for reproducible data science. PLoS Comput Biol 16(11): e1008316. doi:10.1371/journal.pcbi.1008316
La ciencia computacional ha mejorado enormemente mediante el uso de contenedores para el software de empaquetado y las dependencias de datos. En un contexto académico, los principales impulsores del uso de estos contenedores son la transparencia y el apoyo a la reproducibilidad; a su vez, la reproducibilidad de un flujo de trabajo puede verse muy afectada por las elecciones que se toman con respecto a la construcción de contenedores. En muchos casos, el proceso de compilación de la imagen del contenedor se crea a partir de las instrucciones proporcionadas en formato Dockerfile. En apoyo de este enfoque, se presenta un conjunto de reglas para ayudar a los investigadores a escribir Dockerfiles comprensibles para flujos de trabajo típicos de ciencia de datos.

Siguiendo las reglas de este artículo, los investigadores pueden crear contenedores adecuados para compartir con otros científicos, para incluirlos en comunicaciones académicas, como artículos educativos o científicos, y para flujos de trabajo personales efectivos y sostenibles