Archivo de la etiqueta: Gestión de datos de investigación

La importancia de crear una infraestructura de datos

 

oreilly-ebook-575x863-1_0

 

LaPlantte, Alicia. Building a Unified Data Infrastructure. Sebastopol, California: O’Really, 2020

Texto completo

 

Este informe demuestra la importancia de crear una infraestructura de datos holística. Explica cómo la virtualización de datos, la gestión de datos maestros y la gestión de metadatos en combinación ayudan a cumplir los objetivos organizacionales. Descubre los beneficios de combinar estas capacidades en una plataforma de datos unificada y aprende a:

  • Cómo las operaciones, el análisis y la gestión pueden utilizar los datos con gran ventaja
  • Un enfoque pragmático y holístico para construir una infraestructura de datos unificada
  • Las capacidades críticas necesarias para un enfoque holístico, incluida la capacidad de aprovechar la tecnología existente
  • Seis prácticas óptimas para combinar las capacidades de gestión de datos

Este informe es de lectura obligada para los directores de datos, arquitectos de empresas, líderes analíticos y ejecutivos de línea de negocios.

 

La ética de la privacidad en la era de los Big Data

 

cable_racks_at_grid_computing_center_fermilab_with_blue_lights-2-min-1744x1159-1

Data, privacy & the individual | IE CGC, 2020

Texto completo

 

Los datos son el principal combustible de nuestras economías digitales. Nuestras transacciones financieras, movimientos, comunicaciones, relaciones e interacciones con gobiernos y empresas, tanto en línea como fuera de ella, generan datos que son recopilados, comprados y vendidos por corredores de datos y empresas interesadas en establecer perfiles de personas.

 

A medida que la recopilación y el análisis de datos se hacen más sofisticados y precisos, y a medida que los conjuntos de datos crecen hasta convertirse en Big Data, las oportunidades que se presentan parecen infinitas. Sin embargo, los riesgos también son grandes, ya que la información que se maneja sobre los individuos es extremadamente sensible. Conseguir la privacidad correcta es uno de los mayores retos de esta nueva década del siglo XXI. Los últimos años han demostrado que todavía hay mucho trabajo por hacer en la privacidad para domar los aspectos más oscuros de la economía de los datos. A medida que siguen surgiendo escándalos relacionados con los datos, abundan las preguntas sobre cómo interpretar y hacer cumplir la reglamentación, cómo diseñar nuevas y mejores leyes, cómo complementar la reglamentación con una mejor ética y cómo encontrar soluciones técnicas a los problemas de los datos.

Este proyecto de investigación explora algunas de las cuestiones éticas clave planteadas por las tecnologías emergentes de hoy en día, y analiza nuevos métodos técnicos que los gobiernos y las empresas pueden utilizar para sacar provecho de la información respetando las reglamentaciones y manteniendo la confianza tanto de sus clientes como de los ciudadanos.

 

Estudio sobre blockchain: aspectos legales, de gobernanza e interoperabilidad

 

450_1000

 

Study on Blockchains – Legal, governance and interoperability aspects SMART 2018/0038. Luxembourg: Publications Office of the European Union, 2020

Texto completo

 

Blockchain y Distributed Ledger Technologies (DLT) como un conjunto de tecnología de confianza es una clave en el flujo libre de datos que sustenta cada sociedad impulsada por los datos. El estudio proporciona un análisis extenso sobre escenarios en la construcción de un marco legal de la UE para desarrollar e implementar blockchain y DLT.

El objetivo general del estudio es proporcionar pruebas y apoyo a los enfoques de política y las medidas concretas en el marco de la iniciativa europea de blockchain y contribuir a la elaboración de una estrategia de la UE a la luz de la la tecnología de blockchain. Por consiguiente, en el estudio se analiza y evalúa el marco jurídico de la UE en relación con la tecnología blockchain y se presentan opciones de política en los casos en que es necesario hacer ajustes o aclaraciones. En el estudio también se evalúa los efectos de la blockchain y estas opciones de política con miras a considerar la evolución futura de la política de la cadena en bloque.

 

Impacto económico del Open Data

 

captura-6

The Economic Impact of Open Data: Opportunities for value creation in Europe”. Capegnini, 2020

Texto completo

 

Los datos abiertos hacen referencia a la información recopilada, elaborada o encargada por organismos públicos que puede utilizarse, modificarse y compartirse libremente por cualquier persona. Entre sus ventajas están un aumento en la transparencia y responsabilidad gubernamental, así como beneficios financieros tangibles para los ciudadanos, negocios y la sociedad civil

 

El estudio destaca las oportunidades cuantificables que ofrecen la utilización y la reutilización de series de datos abiertos, como el incremento de la eficiencia, la reducción de costes y ayuda para la consecución de objetivos sociales y medioambientales. El informe se ha elaborado a petición de la Comisión Europea en el marco de la iniciativa del Portal Europeo de Datos bajo la dirección de Capgemini Invent

El estudio de Capgemini publicado en 2015 para el lanzamiento del Portal Europeo de Datos estimó un valor de 75.700 millones de euros en volumen de mercado para Open Data en 2020, con un aumento significativo de aproximadamente un 37% entre 2016 y 2020. En este contexto, la Unión Europea lanzó el Portal Europeo de Datos, que recopila información sobre los datos disponibles en cada país europeo. Hasta la fecha, engloba 35 países, 82 catálogos, enlaces a casi un millón de conjuntos de datos en toda Europa y ofrece una serie de recursos de aprendizaje y ejemplos de uso de datos abiertos.

Esta edición del estudio, publicado por primera vez en 2015, examina de qué forma los datos abiertos (open data) pueden crear valor económico de múltiples formas. En concreto, muestra que el open data puede ser beneficioso en diversos sectores, de formas distintas y para una variedad de usuarios como empresas, administraciones públicas y ciudadanos. El informe revela también que los datos abiertos permiten un acceso más sencillo y rápido a un volumen mayor de información, contribuyendo así a mejorar el proceso de toma de decisiones. Estas son las principales conclusiones del estudio:

Dimensión del mercado de datos abiertos: En un escenario conservador de crecimiento, el tamaño del mercado de datos abiertos en la UE27+ llegará a los 199.510 millones de euros en 2025. En un marco optimista, la cifra alcanzaría los 334.200 millones; una diferencia de 143.690 millones de euros.

Empleo en el ámbito del open data: También se espera que crezca el número de personas que trabaja con el movimiento de datos abiertos. Según las previsiones, en 2025, este sector puede llegar hasta los 1,97 millones empleados directos e indirectos en un escenario optimista, 884.000 más que ahora —el escenario conservador augura alcanzar 1,12 millones de empleos—. Si en 2025 el valor creado por cada empleado superase los 169.000 euros (tal y como ocurrió en 2019), el tamaño del mercado de datos abiertos podría ser incluso mayor del previsto.

Incremento de la eficiencia y reducción de los costes gracias a los datos abiertos: El valor creado por los datos abiertos no se limita exclusivamente a los beneficios económicos. Los datos abiertos no solo ayudan a las empresas y las administraciones públicas a generar más ingresos por la creación de nuevos servicios y a reducir costes gracias a una mayor eficiencia en el trabajo, sino que también pueden ayudar a salvar vidas, ahorrar tiempo, conservar el medio ambiente y mejorar la transferencia de conocimientos a través de servicios lingüísticos.

Oportunidades para alcanzar el pleno potencial de los datos abiertos: Si se examina la creación de valor del open data, puede observarse que las oportunidades no solo residen en el tamaño de la fuerza de trabajo, sino, también, en la forma en que se crea y puede crearse valor en el futuro. Para ello es necesario que haya un suministro adecuado de series de datos abiertos. En la actualidad, existe un gran volumen de datos aptos para su publicación como open data, pero que todavía no están abiertos, lo que supone perder una oportunidad potencial. Al mismo tiempo, muchas series de datos no son adecuadas para su libre disponibilidad en su forma original, porque son confidenciales o porque contienen datos personales, como es el caso de los historiales médicos, y que se deben someter a un proceso de agregación o anonimización antes de que puedan ser distribuidos.

Esther Huyer, consultora de Capgemini Invent e investigadora jefe y autora del informe, ha señalado: “El open data está ahí para enriquecer nuestros proyectos basados en datos, permitir la adopción de decisiones informadas y mejorar nuestros procesos, servicios y productos. El potencial económico se materializa cuando incrementamos nuestro nivel de conocimiento y competencia para descubrir y aprovechar oportunidades. Debemos explorar y mejorar los enfoques dados a la reutilización de datos, ajustándolos a principios éticos y de sostenibilidad, dándoles la utilidad requerida y combinando potencialmente datos abiertos con datos personales, compartidos o de fuentes participativas”.

Desarrollo de un marco de política de datos de investigación para todas las revistas y editores

 

data_management

 

Hrynaszkiewicz, I., Simons, N., Hussain, A., Grant, R. and Goudie, S., 2020. Developing a Research Data Policy Framework for All Journals and Publishers. Data Science Journal, 19(1), p.5. DOI: http://doi.org/10.5334/dsj-2020-005

 

Cada vez más revistas y editores, y agencias e instituciones de financiación, están introduciendo políticas de datos de investigación. Pero a medida que aumenta la prevalencia de las políticas, existe la posibilidad de confundir a los investigadores y al personal de apoyo con numerosos conflictivos de requisitos de políticas. En el artículo se definen y describen 14 características de las políticas de datos de investigación de revistas que se organizan en un conjunto de seis tipos de políticas estándar o niveles, que pueden ser adoptados por revistas y editores para promover el intercambio de datos de una manera que fomenten las buenas prácticas y sea apropiados para el público.

Las características de la política incluyen cobertura de temas tales como citas de datos, repositorios de datos, declaraciones de disponibilidad de datos, estándares y formatos de datos, y revisión por pares de datos de investigación. Estas características y tipos de políticas se han creado al revisar las políticas de varios editores académicos, que publican colectivamente más de 10.000 revistas, y a través de discusiones y construcción de consenso con múltiples partes interesadas en la política de datos de investigación a través del Data Policy Standardisation and Implementation Interest Group de Research Data Alliance. También se proporcionan pautas de implementación para las políticas estándar de datos de investigación para revistas y editores, junto con textos de políticas de plantilla que pueden ser implementados por las revistas en su información para autores y flujos de trabajo de publicación.

Se concluye con una llamada a la colaboración entre la comunidad académica editorial y de investigación en general para impulsar una mayor implementación y adopción de políticas consistentes de datos de investigación. y a través de discusiones y construcción de consenso con múltiples partes interesadas en la política de datos de investigación a través de Research Data Alliance. También se proporcionan pautas de implementación para las políticas estándar de datos de investigación para revistas y editores, junto con textos de políticas que pueden ser implementados por las revistas en su información para autores y flujos de trabajo de publicación.

El trabajo en la era de los datos

 

es_el-trabajo-en-la-era-de-los-datos

 

‘El trabajo en la era de los datos’. Madrid: BBVA OpenMind, 2020

Texto completo

PDF

ePub

mobi

 

El aumento exponencial de la capacidad de almacenamiento, transmisión y procesamiento de datos, junto con la reducción de su coste unitario que la revolución digital ha traído consigo, supone el comienzo de una nueva era, la «era de los datos».

 

Vivimos un periodo de transformación acelerada de la economía, la sociedad y los modos de vida. Y estas transformaciones están afectando de forma particularmente profunda al ámbito del trabajo.

Diecinueve grandes expertos de todo el mundo esbozan las reformas ambiciosas y radicales necesarias para encarar los desafíos de la era de los datos y aprovechar la tecnología como una fuerza poderosa que mejore de manera radical las condiciones de trabajo y el nivel de vida a escala global.

El libro busca hacer, en primer lugar, una revisión de los efectos de la revolución digital sobre el crecimiento, la distribución de la renta, la productividad y la inversión, con implicaciones relevantes sobre el mercado de trabajo a escala global.

Adicionalmente, se analizan los cambios fundamentales en la propia estructura del mercado de trabajo, tales como la polarización en el crecimiento del empleo; es decir, el crecimiento del empleo en los segmentos superiores e inferiores del mercado, en detrimento de los segmentos medios, que contribuye al aumento de la desigualdad; o la explosión reciente de formas de trabajo alternativas, que han sido bautizadas en su conjunto como gig economy.

Por último, el libro busca fomentar el análisis y el debate sobre las decisiones que debemos tomar, de manera individual o colectiva, para conseguir un mercado de trabajo en la era de los datos más justo, eficiente y productivo. Asimismo, plantea una reflexión final sobre los principales retos globales que debemos superar para asegurar que el enorme potencial de la tecnología se traduzca, efectivamente, en mejoras de las condiciones de trabajo y del bienestar para el conjunto de la población.
En definitiva, hemos de promover una transformación muy compleja y radical. Pero la alternativa es un mundo más desigual e inestable en el que, además, se perderían un tiempo y una energía preciosos para utilizar la tecnología como herramienta decisiva en la resolución del gran problema de todos: la amenaza creciente sobre la sostenibilidad del planeta.

Marco de referencia para la publicación de datos abiertos comprensibles basado en estándares de calidad

 

datos-abiertos-2-1024x899-1

 

Cadena Vela, Susana G. Marco de referencia para la publicación de datos abiertos comprensibles basado en estándares de calidad. Tesis Universidad de Alicante, 2019

Texto completo

Haz clic para acceder a tesis_susana_graciela_cadena_vela.pdf

Los portales donde se publican datos abiertos son una oportunidad para democratizar el acceso a la información generada por las instituciones del sector público, así como potenciar su reutilización. Esta reutilización de datos abiertos permite el desarrollo de nuevos productos y servicios digitales, creando oportunidades de desarrollo social y económico. Sin embargo, la reutilización de estos datos se enfrenta con diversas barreras en su expansión, debido a diversos problemas relacionados con la calidad de datos que van desde la incompletitud de los datos hasta la falta de actualización de los mismos. En concreto, un criterio relevante de calidad de datos abiertos es la comprensibilidad, ya que un proceso de interpretación errónea de los datos abiertos provocará ambigüedades o malentendidos que desmotivará su reutilización. Por esta razón, un aspecto importante en el acceso a los datos abiertos son sus metadatos, es decir aquellos datos que describen el contenido del conjunto de datos abiertos, cuya finalidad es facilitar su comprensión. Con el fin de mejorar la comprensibilidad de los datos abiertos, las propuestas actuales se centran en la evaluación de los datos ya publicados, no existiendo propuestas que evalúen cómo se puede mejorar la comprensibilidad de los datos abiertos desde los sistemas de información de origen del dato. Esta tesis doctoral revisa y analiza los trabajos de investigación en datos abiertos mediante el desarrollo de un mapeo sistemático, incluyendo un análisis de barreras en la reutilización de datos abiertos, así como buenas prácticas y estándares aplicables al proceso de publicación de datos en formatos abiertos. Este análisis sistemático de trabajos previos de investigación ha servido como punto de partida para la definición de un marco de referencia que permita la publicación de datos abiertos comprensibles. En este marco de referencia se considera la comprensibilidad de los datos abiertos mediante la gestión de los metadatos desde las mismas fuentes de datos en los sistemas de información de origen, incluyendo el concepto de fichero de datos maestros de apertura. Finalmente, cabe destacar que, a través de la aplicación del método de investigación-acción, se ha validado el marco de referencia, utilizando entrevistas y grupos de discusión con varios administradores de portales de datos abiertos.

 

Facebook pone a disponibles un conjunto de datos para investigación académica a través de Social Science One

 

0ljps3akkvq2kt5iy

 

Gary King and Nathaniel Persily. Unprecedented Facebook URLs Dataset now Available for Academic Research through Social Science One. February 13, 2020

Ver noticia

 

Social Science One y Facebook han completado, y ahora están poniendo a disposición de los investigadores académicos, uno de los conjuntos de datos de ciencias sociales más grandes jamás construidos.

Se procesaron aproximadamente un exabyte (un quintillón de bytes, o mil millones de gigabytes) de datos brutos desde la plataforma. El conjunto de datos contiene un total de más de 10 billones de números que resumen información sobre 38 millones de URL compartidas más de 100 veces públicamente en Facebook (entre el 1/1/2017 y el 31/07/2019). También incluye características de las URL (como si los usuarios las verificaron o marcaron como discurso de odio) y los datos agregados sobre los tipos de personas que vieron, compartieron, dieron me gusta, reaccionaron, compartieron sin ver e interactuaron de otra manera con estos enlaces.

Este conjunto de datos permite a los científicos sociales estudiar algunas de las preguntas más importantes de nuestro tiempo sobre los efectos de las redes sociales en la democracia y las elecciones con información a la que nunca antes habían tenido acceso.

 

Tecnologías emergentes en el deporte: reimaginando la experiencia del aficionado

captura-9

Emerging technologies in sports: reimagining the fan experience’ Instituto de Investigación Capgemini, 2020

Texto completo

Infografía

 

Las experiencias positivas de los aficionados con la tecnología brindan múltiples oportunidades nuevas a las organizaciones deportivas, los atletas la utilizan cada vez más para el entrenamiento, la prevención de lesiones y la mejora del rendimiento.  El estudio,  utiliza las respuestas de más de 10.000 aficionados de todo el mundo que observan y siguen regularmente los principales deportes.

 

Los atletas utilizan cada vez más una variedad de tecnologías emergentes para actividades como el entrenamiento, la prevención de lesiones y el seguimiento del rendimiento. Por ejemplo, la Zona 7, una empresa que utiliza datos y análisis para identificar y evitar posibles lesiones que pongan en peligro la carrera de los atletas, ha logrado una precisión del 95% en la predicción de lesiones y ha podido reducir las posibles lesiones en un 75%

El estudio, además muestra que para el 69% de los aficionados, el uso de tecnologías emergentes, como la realidad virtual (RV), la inteligencia artificial (IA) y la realidad aumentada (RA), ha mejorado su experiencia visual general tanto dentro como fuera del estadio; una experiencia positiva con las tecnologías también mejora la participación general de los aficionados. De los encuestados a los que les gustó su experiencia tecnológica, el 56% dijo que, como resultado, iría a más partidos al estadio de su equipo, y el 60% dijo que retransmitiría más partidos en línea. Casi la mitad de los aficionados (49%) han aumentado a menudo su gasto en la mercancía del equipo después de una buena experiencia y el 42% ha aumentado este gasto unas cuantas veces, mientras que el 92% dijo que había aumentado su gasto en suscripciones online para ver los partidos (ya sea a menudo o unas cuantas veces). El informe también muestra que los aficionados que han experimentado las tecnologías emergentes durante una visita reciente a un estadio están más satisfechos con su experiencia en general, destacando una diferencia de 25 puntos entre los aficionados que han experimentado las tecnologías emergentes y los que no.

¿Deberían las bibliotecas ocuparse de los datos públicos de sus ciudades?

 

 

original

 

Linda Poon «Should Libraries Be the Keepers of Their Cities’ Public Data?«, CityLab 2020

Texto completo

El artículo de Linda Poon analiza las formas en que las bibliotecas públicas se ocupan de los datos abiertos y, en ese proceso, plantea interesantes cuestiones sobre la ética de la difusión de datos y la función de las bibliotecas en la protección de la privacidad.

Aunque se centra en las bibliotecas públicas, este artículo plantea cuestiones interesantes que se aplican también a los entornos académicos, en particular a medida que las bibliotecas universitarias aumentan su compromiso con los datos digitales, la alfabetización digital y los proyectos de DH que implican datos públicos.

En los últimos años, docenas de ciudades de EE.UU. han liberado grupos de datos públicos. Es un esfuerzo para mejorar la transparencia e impulsar la innovación, y si se hace bien, puede tener éxito en ambos: Los gobiernos, las organizaciones sin fines de lucro y los desarrolladores de aplicaciones por igual han acogido con entusiasmo esos datos, con la esperanza de mejorar todo, desde las condiciones de las comunicaciones hasta la calidad del aire y la entrega de alimentos.

Pero lo que a menudo se pierde en la conversación es la idea de cómo se deben recopilar, gestionar y difundir los datos públicos para que sirvan a todos -en lugar de sólo a unos pocos ciudadanos- y para que se protejan la privacidad y los derechos de las personas. Ahí está el papel de los bibliotecarios en la gestión de datos.

«En cuanto a la forma en que deben manejarse los datos privados y públicos, no existe realmente un modelo sólido», dice Curtis Rogers, director de comunicaciones de Urban Library Council (ULC), una asociación de las principales bibliotecas de América del Norte. «Así que tener a la biblioteca como la institución local de mayor confianza, y darles esa responsabilidad, es un paradigma totalmente nuevo de cómo se podrían manejar los datos en un gobierno local».

De hecho, los bibliotecarios han sido durante mucho tiempo defensores de la inclusión digital y la alfabetización. Ya que las bibliotecas se comprometen a proteger los datos de los usuarios y a menudo eliminan los registros de las búsquedas. Pero, ¿qué significa para el compromiso de la biblioteca con sus usuarios? Las bibliotecas necesitarán un apoyo importante. No sólo en cuanto a financiación y habilidades, sino también en cuanto a la autonomía de las decisiones que toman con los datos.

Las bibliotecas ya están involucradas con los datos de sus ciudades. La Biblioteca Pública de Chattanooga (que no formaba parte del grupo de trabajo, pero es miembro de la ULC) empezó a albergar el portal de datos abierto de la ciudad en 2014, convirtiendo una institución tradicionalmente centrada en un centro de datos comunitario.

Bajo una iniciativa financiada por la Fundación Knight llamada Open Data to Open Knowledge, Boston se asoció con su biblioteca pública para renovar el programa de datos abiertos de la ciudad en 2015 con el objetivo de impulsar el compromiso entre el público y los datos de la ciudad. La biblioteca, que forma parte del grupo de trabajo de la ULC, ayudó en última instancia a catalogar el tesoro de datos existentes de Boston en un portal fácil de usar. Al hacerlo, dejaron claro que los datos son parte del dominio público, sin restricciones de acceso.

Para asegurar que los datos sean verdaderamente equitativos, la iniciativa de la ULC hará hincapié en la educación. Es decir, ayudar a los residentes a comprender cómo utilizan sus datos los gobiernos y las entidades privadas, así como las implicaciones de esos usos, y a conocer su privacidad y sus derechos sobre los datos.

Las bibliotecas públicas ya proporcionan servicios como capacitación en informática, apoyo técnico y preparación para el trabajo. Para Pam Ryan, directora de desarrollo e innovación de servicios de la Biblioteca Pública de Toronto, enseñar a conocer los datos es el siguiente paso: «Las bibliotecas públicas son las primeras defensoras de la privacidad digital; tenemos experiencia en políticas de datos y gestión de la información, y hace tiempo que desempeñamos ese papel en la construcción de la ciudad», afirma.