
Warden, Pete. Big Data Glossary. O’Reilly Media, 2011
Este práctico glosario también incluye un capítulo de términos clave que ayudan a definir muchas de las herramientas utilizadas en la producción y análisis de grandes conjuntos de datos: bases de datos NoSQL, MapReduce, Almacenamiento, Servidores, Procesamiento, Procesamiento de lenguaje natural, Aprendizaje automático, Visualización, Adquisición, Serialización.
Esta guía describe 60 de las innovaciones más recientes, desde las bases de datos NoSQL y MapReduce, hasta las herramientas de aprendizaje y visualización. Las descripciones se basan en experiencias de primera mano con estas herramientas en un entorno de producción.