Guide to Social Science Data Preparation and Archiving: Introduction. ICPSR Inter-university Consortium for Political and Social Research, 2012
Archivos y repositorios especializados preservan y difunden los datos sociales y de comportamiento realizan un servicio esencial para la comunidad académica y la sociedad en general, asegurando que estos materiales culturalmente significativos sean accesibles a perpetuidad. El éxito de esta propuesta depende en última instancia de la disposición de los investigadores para depositar sus datos y documentación para uso de otros.
En los últimos años, varias organizaciones científicas nacionales e internacionales han emitido declaraciones y políticas que subrayan la necesidad de un inmediato archivo de los datos, y algunos organismos de financiación han comenzado a exigir que los datos procedentes de investigaciones que financian sean depositado en un archivo público. Los Institutos Nacionales de Salud (NIH) requieren un plan de intercambio de datos para grandes proyectos, y en 2011 la National Science Foundation (NSF) comenzó a exigir un plan de gestión de datos como parte de cada solicitud de subvención. La Fundación Nacional para las Humanidades (NEH) y el Instituto de Servicios de Museos y Bibliotecas (IMLS) han seguido su ejemplo. La Dirección Social, Comportamiento y Ciencias Económicas de la NSF también ha diseñado recientemente una política de archivo de datos.
Estas declaraciones de las principales agencias de financiación de la investigación demuestran que la ética del intercambio de datos es esencial para maximizar el impacto y los beneficios de la investigación. La experiencia ha demostrado que la durabilidad de los datos aumenta el coste de procesamiento y la preservación de los datos y disminuye cuando los depósitos son adecuados.
El intercambio de datos también permite a los científicos analizar y reproducir los resultados de los demás.
Hay muchos beneficios derivados del intercambio de datos que van más allá de replicación. Fienberg (1994) sostiene que el intercambio de datos:• Refuerza la investigación científica abierta. Cuando los datos están ampliamente disponibles, las posibilidades de auto-corrección de la ciencia son más eficaces.
• Alienta la diversidad de análisis y opiniones. Si los investigadores tienen acceso a los mismos datos pueden más fácilmente desafiar los análisis y conclusiones de los otros.
• Promueve la investigación y permite la comprobación de los métodos nuevos o alternativos. Existen muchos ejemplo de datos que se utilizan de una manera que los investigadores originales no habían previsto.
• Mejora métodos de recogida y medición de datos a través del escrutinio de los demás. La puesta a disposición del público permite a la comunidad científica llegar a un consenso sobre los métodos.
• Reduce los costes evitando los esfuerzos de recolección de datos duplicados. Algunos conjuntos de datos estándar tales como encuestas sociales y electorales producen miles de documentos que no podría haber sido publicados si los autores tuvieron que recoger sus propios datos.
• El archivado pone a disposición de todos los datos para no se tengan que invertir recursos adicionales para reunir esencialmente la misma información.
• Proporciona un recurso importante para la formación en investigación. Los datos secundarios son extremadamente valiosos para los estudiantes, que luego tienen acceso a datos de alta calidad como modelo para su propio trabajo.
• El archivado inmediato puede permitir a un investigador mejorar el impacto (y, ciertamente, la visibilidad) de un proyecto.
La gestión de datos y planes de difusión deben ser desarrollados en conjunto con con el objetivo de maximizar la utilidad de los datos y garantizar la disponibilidad de los datos en el futuro.
Los archivos de datos se comprometen a mantener los datos de investigación en ciencias sociales a largo plazo, en beneficio de los futuros investigadores y creadores de datos para ayudar en el cumplimiento de las estipulaciones de sus organismos financiadores. El cumplimiento del Modelo de Referencia OAIS (PDF) es también un factor importante a considerar al seleccionar un archivo para su depósito.
El ciclo de vida de los datos
Los investigadores deben planificar un proyecto eventual de archivo y difusión de los datos antes de que los datos incluso llegan a existir. El archivo de datos debe comenzar temprano en un proyecto e incorporar un calendario para depositar productos en el transcurso del ciclo de vida de un proyecto y para la creación y preservación de metadatos precisos, para garantizar la facilidad de uso de los propios datos de la investigación. Tales prácticas incorporarían archivado y preservación como parte del método de investigación.
Ofrecemos aquí un diagrama esquemático que ilustra las consideraciones clave pertinentes a archivar en cada paso del proceso de creación de datos. El proceso real puede que no sea tan lineal como sugiere el diagrama, pero es importante desarrollar un plan para hacer frente a las consideraciones de archivos que entran en juego en todas las etapas del ciclo de vida de los datos. (Jacobs y Humphrey, 2004)
La guía es una compilación de las mejores prácticas extraídas de la experiencia de muchos profesionales de la información e investigadores. La Guía no pretende abordar las políticas y procedimientos específicos para ciertos archivos, ya que los procedimientos varían de unos a otros. La mayoría de los repositorios públicos de ciencias sociales animan a los investigadores a contactar con ellos en cualquier momento del proceso de investigación para discutir sus planes con respecto al diseño y preparación de conjuntos de datos públicos.