Archivo de la etiqueta: Big Data

Papel y la utilidad de los Big Data en la investigación social

small_datafiedsoccoverfinal_medium

Schäfer, M. T. and K. v. Es (2017). [e-Book] The Datafied Society. Studying Culture through Data, Amsterdam University Press, 2017

Texto completo

 

A medida que más y más aspectos de la vida cotidiana se convierten en datos legibles por máquina, los investigadores disponen de más y más ricos recursos para investigar la sociedad. Los nuevos métodos y herramientas necesarios para trabajar con estos datos requieren no sólo nuevos conocimientos y habilidades, sino también una nueva forma de pensar sobre las mejores prácticas de investigación. Este libro reflexiona de manera crítica sobre el papel y la utilidad de los Big Data, desafiando las expectativas excesivamente optimistas sobre lo que dicha información puede revelar, introduciendo prácticas y métodos para su análisis y visualización y planteando importantes cuestiones políticas y éticas sobre su colección, manejo y presentación.

Anuncios

BigQuery el Big data de Google que ofrece a los usuarios acceso a una serie de conjuntos de datos públicos

google_big_query_icon_256x256

Google BigQuery es un almacén de datos para análisis de datos a gran escala, que ofrece a los usuarios acceso a una serie de conjuntos de datos públicos en los que puede ejecutar consultas en SQL

 

Google BigQuery es un almacén de datos empresariales de Google de bajo coste, totalmente administrado y apto para analizar petabytes de datos. BigQuery no requiere servidor. Como no hay que administrar ninguna infraestructura ni se necesita un administrador de bases de datos, puedes centrarte en analizar los datos para obtener información importante mediante el conocido lenguaje SQL. BigQuery es una potente plataforma de análisis de Big Data empleada por todo tipo de empresas, desde startups hasta compañías de la lista Fortune 500.

BigQuery escanea terabytes en cuestión de segundos y petabytes en cuestión de minutos. Puedes cargar los datos desde Google Cloud Storage o Google Cloud Datastore o transmitirlos a BigQuery para permitir analizarlos en tiempo real. Con BigQuery puedes escalar fácilmente tu base de datos de gigabytes a petabytes.

Aprender a amar la ciencia de los datos

51wt4dpacjl-_sx345_bo1204203200_

Barlow, M. (2017). [e-Book] Learning to Love Data Science, O’Reilly Media, 2017

Texto completo

Hasta hace poco mucha gente pensaba que los “big data” eran una moda pasajera, y que la “ciencia de los datos” era un término misterioso. Hoy en día los  datos masivos son tomados en serio, y la ciencia de los datos se considera como atractiva. Esta antología de informes del  periodista Mike Barlow, ayudará a apreciar cómo la ciencia de los datos está cambiando nuestro mundo. Barlow describe de manera fácilmente entendible el espacio de datos emergentes y explica las nuevas técnicas y herramientas sobre el uso de datos para el bien social.

A través de esta antología, aprenderemos cómo:

  • Los analistas obtienen resultados de sus consultas de datos casi en tiempo  real.
  • Los fabricantes están difuminando las líneas entre el hardware y el software.
  • Las empresas tratan de equilibrar su deseo de rápida innovación con la necesidad de reforzar la seguridad de los datos.
  • La analítica avanzada y los sensores de bajo costo están transformando el mantenimiento de equipos de un centro de coste a un centro de beneficio.
  • Las nuevas herramientas de análisis permiten a las empresas ir más allá del análisis de datos  directamente a la toma de decisiones.

Desarrollo de flujos de trabajo para científicos de datos

development-workflows-1

Development Workflows for Data Scientists. O’Reilly Media, 2017

Texto completo

GitHub se asoció con O’Reilly Media para examinar cómo los equipos de análisis de datos de varias organizaciones están mejorando la forma en que definen, aplican y automatizan los flujos de trabajo basados en servicios de datos.

  • Definición de la estructura y las funciones del equipo
  • Preguntas interesantes
  • Examen de trabajos previos
  • Recolección, exploración y modelado de datos
  • Prueba, documentación e implementación de códigosde producción
  • Comunicación de los resultados

Este informe esclarecedor muestra cómo, a pesar de que el ritmo de cambio es rápido y el deseo por el conocimiento y la visión de los datos es cada vez mayor, las disciplinas duales de ingeniería de software y la ciencia de los datos están a la altura de la tarea.

 

Big Data: Una revolución que transformará nuestra forma de vivir, trabajar y pensar

 

big-data_custom-3d8fb20dcdb9e19ba1875bce868b46b1d319da84-s6-c101

 

Mayer-Schnberger, V. and K. Cukier [e-Book]  A summary of the book Big Data: A revolution that will transform how we live, work and think, Kimhartman, 2013.

Texto completo

 

En la era de los grandes datos estamos empezando a cosechar algunos beneficios y posibilidades derivados de la gestión, utilización, procesamiento y análisis de esta ingente cantidad de datos, tales como: el seguimiento de los signos vitales para prever infecciones mortales, la predicción de incendios, conocer el mejor momento para comprar un billete de avión, viendo la inflación en tiempo real y el control de los medios de comunicación social con el fin de identificar las tendencias. Pero hay un lado oscuro de los datos grandes. ¿Serán las máquinas, y no las personas, las que toman las decisiones? ¿Cómo se regula un algoritmo? ¿Qué pasará con la privacidad? ¿Serán castigados los individuos por actos que todavía aún no  cometieron? Dos de los más respetados expertos en datos del mundo revelan la realidad de un gran mundo de datos y delinean pasos claros y realizables que equiparán al lector con las herramientas necesarias para esta próxima fase de la evolución humana

Big Data: tecnologías disruptivas para un cambio en el juego

bigdataanalytics-sathi

 

Sathi, A. (2012). [e-Book]  Big Data Analytics: Disruptive Technologies for Changing the Game, IBM, 2012.

Texto completo

 

Este libro recopila varios casos y experiencias de uso de los Big Data, y a partir de ellas hace algunas consideraciones sobre la arquitectura y el surgimiento de nuevos espacios de observación (sociales, geoespaciales, etc.), además de cubrir algunos de los problemas más delicados relacionados con la privacidad de los datos. El espacio de observación de una organización disponible (datos que pueden obtener en sus manos dentro de la ley y la política) está creciendo más rápido que su capacidad de darle sentido. A medida que las organizaciones luchan por mantenerse al día, se ven obligadas a reconsiderar qué tipo de infraestructura será necesaria para aprovechar Big Data

Valoración e impacto de los datos de investigación: curación y recursos compartidos

 

synthesis1-211x300

Beagrie, N. and Houghton J.W. (2014) The Value and Impact of Data Sharing and Curation: A synthesis of three recent studies of UK research data centres, Jisc. PDF (24 pages)

Texto completo

La GDI es la base de la investigacion actual y del futuro, pero también de los mandatos de financiación, repositorios de acceso abierto, la reputación de los investigadores y los rankings institucionales. Sin embargo, la sostenibilidad financiera de una adecuada gestión de datos requiere de una importante inversión. Ya que los costos que implica la implementación y mantenimiento de repositorios de datos son mucho más cuantiosos que los necesarios para repositorios institucionals tradicionales. Aun así, la institución debe iniciar una política de datos, ya que los beneficios de un servicio de gestión de datos son mucho mayores en términos de investigación e impacto que los altos costos asociados a su implementación como demuestra esta investigación. Además de ser un servicio ineludible a medio plazo si se quiere seguir siendo competitivo

Este informe pretende resumir y reflexionar sobre los resultados de una serie de estudios realizados por Neil Beagrie de Charles Beagrie y John Houghton de la Universidad de Victoria, en torno al valor y el impacto de tres centros de datos de investigación: the Economic and Social Data Service (ESDS), the Archaeology Data Service (ADS), and the British Atmospheric Data Centre (BADC). Se proporciona un resumen de las principales conclusiones de la investigación y reflexionan sobre: los métodos que se pueden utilizar para recopilar datos; los métodos analíticos que se pueden utilizar para explorar de valor, impactos, costos y beneficios; y las lecciones aprendidas y recomendaciones derivadas de la serie de estudios en su conjunto.

Los estudios de los centros de datos combinan los enfoques cuantitativos y cualitativos con el fin de cuantificar el valor en términos económicos y otros impactos y beneficios no económicos. Los tres estudios muestran un patrón similar de resultados, con el intercambio de datos a través de los centros de datos que tienen un gran impacto medible en la eficiencia de la investigación y el retorno de la inversión sobre los propios datos y servicios. Estos hallazgos son importantes para los proveedores de fondos, tanto para el caso económico para la inversión en la infraestructura de datos de curación, como para el intercambio de datos y la propia  investigación, para asegurar la sostenibilidad de este tipo de centros de datos de investigación.

El análisis económico cuantitativo indica que:
· El valor para los usuarios excede la inversión hecha en el intercambio de datos y la preservación a través de los centros en los tres casos – con los beneficios de 2,2 a 2,7 veces los costes.
· Aumentos muy significativos en la eficiencia del trabajo por parte de los usuarios como consecuencia del uso de los centros y servicios de datos – con aumento de la eficiencia de entre 2 a 20 veces sobre los costos.
· Al facilitar el uso adicional, los centros de datos aumentan significativamente los rendimientos de la inversión en la creación / recogida de los datos alojados – con incrementos en los rendimientos de entre 2 a 12 veces sobre los costos.
El análisis cualitativo indica que:
· Por su parte, los usuarios académicos informan que los beneficios de la implementación de centros de datos son muy o extremadamente importantes para su investigación, pues en opinión de entre el 53% y el 61% de los encuestados la no disponibilidad de un servicio de datos hubiera tenido un impacto grave o muy grave sobre su trabajo.
· Para los depositantes, que tiene los datos conservados a largo plazo y garantizada su difusión a la comunidad académica, estos servicio son vistos como los aspectos más beneficiosos de depositar de datos en este tipo de centros. Además el depósito de datos incrementa las posibilidades de ser citados.

Un objetivo importante de este estudios fue el de contribuir al desarrollo de métodos de evaluación de impacto que pueden proporcionar estimaciones del valor y los beneficios de la infraestructura de datos de investigación y las inversiones. Esta síntesis se refleja las lecciones aprendidas y proporciona una serie de recomendaciones que podrían ayudar a desarrollar futuros estudios de este tipo. Las áreas clave para la investigación adicional incluyen: extender tales estudio a nuevos centros o a centros de menores niveles de agregación.