Archivo de la etiqueta: Big Data

Valoración e impacto de los datos de investigación: curación y recursos compartidos

 

synthesis1-211x300

Beagrie, N. and Houghton J.W. (2014) The Value and Impact of Data Sharing and Curation: A synthesis of three recent studies of UK research data centres, Jisc. PDF (24 pages)

Texto completo

La GDI es la base de la investigacion actual y del futuro, pero también de los mandatos de financiación, repositorios de acceso abierto, la reputación de los investigadores y los rankings institucionales. Sin embargo, la sostenibilidad financiera de una adecuada gestión de datos requiere de una importante inversión. Ya que los costos que implica la implementación y mantenimiento de repositorios de datos son mucho más cuantiosos que los necesarios para repositorios institucionals tradicionales. Aun así, la institución debe iniciar una política de datos, ya que los beneficios de un servicio de gestión de datos son mucho mayores en términos de investigación e impacto que los altos costos asociados a su implementación como demuestra esta investigación. Además de ser un servicio ineludible a medio plazo si se quiere seguir siendo competitivo

Este informe pretende resumir y reflexionar sobre los resultados de una serie de estudios realizados por Neil Beagrie de Charles Beagrie y John Houghton de la Universidad de Victoria, en torno al valor y el impacto de tres centros de datos de investigación: the Economic and Social Data Service (ESDS), the Archaeology Data Service (ADS), and the British Atmospheric Data Centre (BADC). Se proporciona un resumen de las principales conclusiones de la investigación y reflexionan sobre: los métodos que se pueden utilizar para recopilar datos; los métodos analíticos que se pueden utilizar para explorar de valor, impactos, costos y beneficios; y las lecciones aprendidas y recomendaciones derivadas de la serie de estudios en su conjunto.

Los estudios de los centros de datos combinan los enfoques cuantitativos y cualitativos con el fin de cuantificar el valor en términos económicos y otros impactos y beneficios no económicos. Los tres estudios muestran un patrón similar de resultados, con el intercambio de datos a través de los centros de datos que tienen un gran impacto medible en la eficiencia de la investigación y el retorno de la inversión sobre los propios datos y servicios. Estos hallazgos son importantes para los proveedores de fondos, tanto para el caso económico para la inversión en la infraestructura de datos de curación, como para el intercambio de datos y la propia  investigación, para asegurar la sostenibilidad de este tipo de centros de datos de investigación.

El análisis económico cuantitativo indica que:
· El valor para los usuarios excede la inversión hecha en el intercambio de datos y la preservación a través de los centros en los tres casos – con los beneficios de 2,2 a 2,7 veces los costes.
· Aumentos muy significativos en la eficiencia del trabajo por parte de los usuarios como consecuencia del uso de los centros y servicios de datos – con aumento de la eficiencia de entre 2 a 20 veces sobre los costos.
· Al facilitar el uso adicional, los centros de datos aumentan significativamente los rendimientos de la inversión en la creación / recogida de los datos alojados – con incrementos en los rendimientos de entre 2 a 12 veces sobre los costos.
El análisis cualitativo indica que:
· Por su parte, los usuarios académicos informan que los beneficios de la implementación de centros de datos son muy o extremadamente importantes para su investigación, pues en opinión de entre el 53% y el 61% de los encuestados la no disponibilidad de un servicio de datos hubiera tenido un impacto grave o muy grave sobre su trabajo.
· Para los depositantes, que tiene los datos conservados a largo plazo y garantizada su difusión a la comunidad académica, estos servicio son vistos como los aspectos más beneficiosos de depositar de datos en este tipo de centros. Además el depósito de datos incrementa las posibilidades de ser citados.

Un objetivo importante de este estudios fue el de contribuir al desarrollo de métodos de evaluación de impacto que pueden proporcionar estimaciones del valor y los beneficios de la infraestructura de datos de investigación y las inversiones. Esta síntesis se refleja las lecciones aprendidas y proporciona una serie de recomendaciones que podrían ayudar a desarrollar futuros estudios de este tipo. Las áreas clave para la investigación adicional incluyen: extender tales estudio a nuevos centros o a centros de menores niveles de agregación.

 

 

 

 

Datos abiertos para todos

open_data_for_all_title_page_2016

 

 

Roest, A. and A. R. Mashariki (2015). [e-Book] Open Data For All. New York, City of New York.

Texto completo

NYC Open Data: Open Data for All New Yorkers

Home

 Los datos son más que números, fundamentalmente es información que puede ayudar a  resolver problemas cotidianos de las personas. La promesa de un gobierno de datos abiertos, transparentes  y accesibles contribuye a la mejora las capacidades y oportunidades de todos los ciudadanos. Open data puede cambiar el punto de vista sobre nuestro entorno, trasformando problemas anteriormente considerados impenetrables en problemas solucionables. 

 

Los datos abiertos no sólo son de interés para los científicos, ya que a través de ese tipo de iniciativas podemos tener un mejor conocimiento de nuestro entorno, para saber más y aprovechar mejor todas las oportunidades que ofrece el lugar en que vivimos, trabajamos, compramos, o nos divertimos; pudiendo de esta manera responder a cuestiones tales como: ¿Dónde puedo encontrar Wi-Fi pública en mi vecindario? ¿Qué clase de árbol está delante de mi oficina? ¿Cuál es la mejor zona para abrir un negocio sobre vinos?, ¿Cuál es la calidad del aire de mi zona de ocio? o ¿Dónde puedo encontrar rutas para pasear en bicicleta?

Entre los beneficios frecuentemente citados de los datos abiertos está su potencial para equipar a las personas con el conocimiento con el objetivo de mejorar sus vidas. para crear oportunidades y resolver problemas;  de este modo, los ciudadanos pueden utilizar estos datos para tomar decisiones más y mejor informadas, involucrarse en sus comunidades o convertir sus sueños en realidad. Por ejemplo, si una persona está interesada en abrir un negocio necesita información sobre cuantos establecimientos similares hay en la zona, licencias de negocios, locales en alquiler, precios de los alquileres en una zona, flujos ciudadanos, etc. De manera que esta información que anteriormente no estaba disponible o sólo era accesible para quienes pagaran por ella, ahora este a disposición de todos sin ninguna excepción.

 

open_data_for_all_timeline

Desarrollo histórico de la política de datos abiertos de la ciudad de New York

Una cuestión clave para reducir la brecha de acceso es crear una «cultura de datos», para ello la ciudad de New York  ha creado un taller piloto sobre habilidades de análisis de datos y a puesto a disposición de los ciudadanos una guía de datos para iniciados

Informes publicados por el equipo Open Data de la Ciudad de Nueva York, incluyendo el plan anual de cumplimiento de la agencia publicado cada año.

 

 

 

Aplicaciones del Big Data en el mundo real

 

3658b1a352341a3-261x361

 

Soto, V., J. M. Luna, et al. [e-Book]  Big Data on Real-World Applications  InTech, 2016

Texto completo

A medida que avanza la tecnología se van generando cada día grandes y valiosos volúmenes de datos. Su gestión se se ha convertido en una prioridad para las empresas y las entidades de investigación, que requieren de nuevas tecnologías para la gestión adecuada y análisis para que sirvan de apoyo a la toma de decisiones y a la generación de servicios de datos con la posibilidad de ser reutilizados por parte de las instituciones y los ciudadanos.

 

La implementación de una plataforma de datos inteligente: ¿Cómo sobreviven las organizaciones en la era de los datos inteligentes?

pic-book

 

 

Lin, Y. and W. Xiao (2017). [e-Book] Implementing a Smart Data Platform: How Enterprises Survive in the Era of Smart Data. London, O’Really, 2017

Texto completo

 

Con el auge de los Big Data, del Internet de las cosas (IO), y el desarrollo de aplicaciones de inteligencia artificial (AI), entramos en una nueva era de datos inteligentes. Por desgracia, muchas empresas e instituciones no están preparados para ello. Por lo tanto esas empresas son deficientes en la gestión de datos, en la medida que carecen de sistemas de gestión de datos que impiden tomar decisiones de peso basadas en la explotación de los mismos. Algunos simplemente se quedan en la ciencia de los datos. El resultado final es que muchas empresas no disponen de una plataforma avanzada para la creación de aplicaciones basadas en IA-IO.

Este informe examinó cómo las plataformas de gestión de datos inteligentes  permiten a las empresas aumentar su capacidad de gestión y explotación de datos, que involucra a los propios datos, los productos de la plataforma, las aplicaciones de datos, y el servicios de consultoría, componentes que completan y refuerzan sus plataformas de datos actuales.

States Perform: permite comparar los datos de desempeño entre los 50 estados federales de EE.UU.

newstatesperform_header

http://www.statesperform.org/

States Perform es un portal que proporciona a los usuarios acceso a datos comparativos de medición de desempeño comparativos, personalizables y actualizados de 50 estados en seis áreas clave: económica, seguridad y justicia, energía y medio ambiente, transporte, salud, servicios sociales y educación.

La ciencia de los datos abiertos se está comiendo el mundo

 

33358449395_5a80be33d9_o_d

Chambers, M., C. Doig, et al. (2016). [e-Book] Breaking Data Science Open How Open Data Science Is Eating the World. Sebastopol, CA, O’Reilly Media, 2016.

Texto completo

La ciencia de los datos está captando la atención del todos como la tendencia tecnológica más importante en estos momentos. Ya no es sólo una palabra de moda para referirse al software analítico avanzado; la ciencia de los datos está a punto de cambiar todos los aspectos clave de cualquier organización: los clientes potenciales, los planes de expansión, la ingeniería y proceso de fabricación, cómo se interactúa con los proveedores y y otras cuestiones.

La ventaja principal de este tsunami llamada Open Data Science, es una combinación de tendencias innovadoras en los negocios y la tecnología, que promete un futuro más inteligente basado en la combinación de software de código abierto y colaboración entre organizaciones. Open Data Science es un movimiento que hace que las herramientas de código abierto y la ciencia de datos (datos, análisis y computación) trabajen juntas como si fueran un ecosistema.

En esta edición  de Breaking Data Science Open, aprenderá:

  • Cómo la ciencia de los datos entró en los negocios
  • Qué equipos utiliza la ciencia de datos
  • Por qué la ciencia de los datos cambiará la toma de decisiones
  • Qué aplicaciones se utilizan actualmente en la ciencia de los datos abiertas
  • Cómo iniciar el proceso de gestión de datos

Big Data Now: 2016 Edition

cat

Big Data Now: 2016 Edition
Current Perspectives from
O’Reilly Media

Texto completo

PDF

ePuib

Mobi

El informe anual de Big Data Now de O’Reilly recapitula las tendencias, herramientas, aplicaciones y pronósticos a lo largo de 2016. Esta colección de artículos escrita por pensadores y expertos en la materia, aborda un conjunto de temas significativos:

  • Herramientas y arquitectura para grandes datos
  • Aplicaciones inteligentes en tiempo real
  • Infraestructura de la nube
  • Aprendizaje mecánico: modelos y formación
  • Aprendizaje profundo e inteligencia artificial

Gestión de datos de investigación con Fernanda Peset. Planeta Biblioteca 2016/12/21.

31428520590_4e68433a16_b_d

ESCUCHAR EL PROGRAMA

Ir a descargar

En esta ocasión ha estado en nuestro programa FERNANDA PESET profesora titular de la Universidad Politécnica de Valencia con quien hemos charlado sobre Gestion de Datos de Investigación, además es miembro de MAREDATA. Fernanda nos ha hablado de qué  son y qué implicaciones tienen los Big Data, los desafíos que se plantean en el contexto de la investigación científica, cómo se realiza la gestión que permite intervenir en el ciclo vital de los datos, qué políticas se están siguiendo al respecto y las implicaciones para el futuro de la profesión.

Geovisualización de grandes volúmenes de datos ambientales: diseño e implementación de un sistema para el acceso y la difusión de datos globales

20150720-congreso-ci-geovisualizacion-1

Álvarez Francoso, J. I., M. F. Pita López, et al. (2016). [e-Book] Geovisualización de grandes volúmenes de datos ambientales: Diseño e implementación de un sistema para el acceso y la difusión de datos globales. Sevilla, Universidad de Sevilla, 2016.

Texto completo

PDF

El dato climático es una representación abstracta que se utiliza para intentar alcanzar un mayor grado de comprensión de una realidad extraordinariamente compleja. De forma paradójica, el formidable crecimiento de la capacidad para registrar y almacenar datos los ha convertido en otra realidad tan compleja, que se revela imprescindible la utilización de sistemas que ayuden a descifrarlos. Uno de los aspectos fundamentales de la información climática es la importancia de su dimensión espacial, que se presta especialmente bien a la exploración mediante herramientas de visualización. Además, el desarrollo de las tecnologías de la información ha propiciado que hoy en día, el número de usuarios interesados que pueden acceder a la información climática haya aumentado también de manera sustancial. Pero el simple acceso no es suficiente para una transmisión efectiva de la información, sino que esta debe organizarse de manera adecuada y acompañarse de los medios y herramientas para su exploración y comunicación. En este sentido, la geovisualización web juega un papel fundamental. Esta tesis doctoral hace una aportación en el campo de la geovisualización web de datos climáticos haciendo en primer lugar una revisión de los principales aspectos de la misma: los datos, los sistemas de geovisualización y los usuarios; y proponiendo posteriormente una metodología para el diseño e implementación de dos sistemas abiertos para la geovisualización web de datos climáticos a dos escalas: global y regional. Los resultados demuestran la efectividad de la metodología propuesta, basada en un adecuado diseño, tanto del modelo de datos en el que se sustentan los sistemas, como de los flujos de los procesos implicados en el funcionamiento de los mismos.

La planificación de Big Data

51xb0qa9z2l

Planning for Big Data : A CIO’s Handbook to the Changing Data Landscape O’Reilly Radar Team. [e-Book] Cambridge, O’Reilly, 2012

Descargar

Big Data (del idioma inglés grandes datos) es en el sector de tecnologías de la información y la comunicación una referencia a los sistemas que manipulan grandes conjuntos de datos (o data sets). Las dificultades más habituales en estos casos se centran en la captura, el almacenado, búsqueda, compartir, análisis, y visualización. La tendencia a manipular ingentes cantidades de datos se debe a la necesidad en muchos casos de incluir los datos relacionados del análisis en un gran conjunto de datos relacionado, tal es el ejemplo de los análisis de negocio, los datos de enfermedades infecciosas, o el combate con el crimen organizado.