Archivo de la etiqueta: Big Data

Gestión de grandes conjuntos de datos de imágenes: captura, bases de datos, procesamiento de imágenes, almacenamiento, visualización.

 

management-of-large-sets-of-image-data

Kozak, K. (2014). [e-Book]  Management of large sets of image data: Capture, Databases, Image Processing, Storage, Visualization BookBoom, 2014.

Texto completo

 

“Digital Imaging” proporciona las habilidades y conocimientos esenciales para producir datos de alta calidad. En su forma más básica, un sistema de información de imágenes debe almacenar con precisión los datos de las imágenes obtenidos de cámaras digitales con una amplia gama de capacidades de imagenología, junto con información accesoria (metadatos de datos), el sistema de adquisición, e información básica sobre el usuario, ubicación, fecha, etc. El libro ofrece una visión integral de las imágenes digitales introduciendo: formatos de imagen, cámaras digitales, soluciones de almacenamiento, métodos de visualización, métodos de procesamiento de imágenes desde la adquisición de imágenes hasta la extracción de los datos de interés. El libro cubre además la descripción del hardware, la introducción en archivos digitales, la gestión de datos de imagen, la historia y el ejemplo de pocas disciplinas en las que la imagen digital desempeña un papel esencial. Este libro puede ayudar a entender el fondo de las imágenes digitales, incluyendo herramientas de software para manejar una gran cantidad de datos de imagen.

Anuncios

Gestión de datos de investigación en Biología

large-scale-data-handling-in-biology

Kozak, K. [e-Book]  Large Scale Data Handling in Biology, BookBoom, 2017.

Texto completo

La gestión de datos de investigación en Biología – la aplicación de métodos computacionales y analíticos a problemas biológicos – es una disciplina científica en rápida evolución. Escrito en un estilo claro y atractivo, Large Scale Data Handling in Biology va dirigido a científicos y estudiantes que están aprendiendo enfoques computacionales de la biología. El libro cubre el sistema de almacenamiento de datos, enfoques computacionales a los problemas biológicos, una introducción a los sistemas de flujo de trabajo, minería de datos, visualización de datos y consejos para adaptar el software de análisis de datos existente a las necesidades individuales de investigación.

Uso de datos para las telecomunicaciones: cómo los datos pueden ayudar a los operadores de telecomunicaciones a virtualizar, rentabilizar y hacer frente a los big data

 

ebook-fast-data-use-cases-for-telco

Byrne, C. (2017). [e-Book]  Fast Data Use Cases for Telecommunications: How Fast Data Can Help Telcos Virtualize, Monetize, and Deal with the Data Deluge, O’Really, 2017

Texto completo

 

 

Los Datos rápidos (fast data) son los datos en movimiento: un flujo incesante de eventos generados por seres humanos y máquinas que deben ser analizados y actualizados en tiempo real. Las aplicaciones de datos rápidas deben gestionar grandes cantidades de datos en un flujo continuo, al tiempo que mantienen su análisis en tiempo real y toman decisiones instantáneas en el flujo de datos en vivo. Para las empresas de telecomunicaciones, una aplicación de datos rápidos podría permite diseñar políticas, realizar ofertas personalizadas en tiempo real a los clientes, asignar recursos de red o ordenar el mantenimiento predictivo basándose en los datos del sensor Internet of Things (IoT). La base de datos NewSQL en memoria de VoltDB se ha vuelto popular entre las empresas de telecomunicaciones por su capacidad para manejar la velocidad y la escala de los datos rápidos. Este libro refleja las experiencias de los ingenieros y clientes de VoltDB que han implementado múltiples casos de uso de datos rápidos de telecomunicaciones.

Papel y la utilidad de los Big Data en la investigación social

small_datafiedsoccoverfinal_medium

Schäfer, M. T. and K. v. Es (2017). [e-Book] The Datafied Society. Studying Culture through Data, Amsterdam University Press, 2017

Texto completo

 

A medida que más y más aspectos de la vida cotidiana se convierten en datos legibles por máquina, los investigadores disponen de más y más ricos recursos para investigar la sociedad. Los nuevos métodos y herramientas necesarios para trabajar con estos datos requieren no sólo nuevos conocimientos y habilidades, sino también una nueva forma de pensar sobre las mejores prácticas de investigación. Este libro reflexiona de manera crítica sobre el papel y la utilidad de los Big Data, desafiando las expectativas excesivamente optimistas sobre lo que dicha información puede revelar, introduciendo prácticas y métodos para su análisis y visualización y planteando importantes cuestiones políticas y éticas sobre su colección, manejo y presentación.

BigQuery el Big data de Google que ofrece a los usuarios acceso a una serie de conjuntos de datos públicos

google_big_query_icon_256x256

Google BigQuery es un almacén de datos para análisis de datos a gran escala, que ofrece a los usuarios acceso a una serie de conjuntos de datos públicos en los que puede ejecutar consultas en SQL

 

Google BigQuery es un almacén de datos empresariales de Google de bajo coste, totalmente administrado y apto para analizar petabytes de datos. BigQuery no requiere servidor. Como no hay que administrar ninguna infraestructura ni se necesita un administrador de bases de datos, puedes centrarte en analizar los datos para obtener información importante mediante el conocido lenguaje SQL. BigQuery es una potente plataforma de análisis de Big Data empleada por todo tipo de empresas, desde startups hasta compañías de la lista Fortune 500.

BigQuery escanea terabytes en cuestión de segundos y petabytes en cuestión de minutos. Puedes cargar los datos desde Google Cloud Storage o Google Cloud Datastore o transmitirlos a BigQuery para permitir analizarlos en tiempo real. Con BigQuery puedes escalar fácilmente tu base de datos de gigabytes a petabytes.

Aprender a amar la ciencia de los datos

51wt4dpacjl-_sx345_bo1204203200_

Barlow, M. (2017). [e-Book] Learning to Love Data Science, O’Reilly Media, 2017

Texto completo

Hasta hace poco mucha gente pensaba que los “big data” eran una moda pasajera, y que la “ciencia de los datos” era un término misterioso. Hoy en día los  datos masivos son tomados en serio, y la ciencia de los datos se considera como atractiva. Esta antología de informes del  periodista Mike Barlow, ayudará a apreciar cómo la ciencia de los datos está cambiando nuestro mundo. Barlow describe de manera fácilmente entendible el espacio de datos emergentes y explica las nuevas técnicas y herramientas sobre el uso de datos para el bien social.

A través de esta antología, aprenderemos cómo:

  • Los analistas obtienen resultados de sus consultas de datos casi en tiempo  real.
  • Los fabricantes están difuminando las líneas entre el hardware y el software.
  • Las empresas tratan de equilibrar su deseo de rápida innovación con la necesidad de reforzar la seguridad de los datos.
  • La analítica avanzada y los sensores de bajo costo están transformando el mantenimiento de equipos de un centro de coste a un centro de beneficio.
  • Las nuevas herramientas de análisis permiten a las empresas ir más allá del análisis de datos  directamente a la toma de decisiones.

Desarrollo de flujos de trabajo para científicos de datos

development-workflows-1

Development Workflows for Data Scientists. O’Reilly Media, 2017

Texto completo

GitHub se asoció con O’Reilly Media para examinar cómo los equipos de análisis de datos de varias organizaciones están mejorando la forma en que definen, aplican y automatizan los flujos de trabajo basados en servicios de datos.

  • Definición de la estructura y las funciones del equipo
  • Preguntas interesantes
  • Examen de trabajos previos
  • Recolección, exploración y modelado de datos
  • Prueba, documentación e implementación de códigosde producción
  • Comunicación de los resultados

Este informe esclarecedor muestra cómo, a pesar de que el ritmo de cambio es rápido y el deseo por el conocimiento y la visión de los datos es cada vez mayor, las disciplinas duales de ingeniería de software y la ciencia de los datos están a la altura de la tarea.