Metodología de curación de datos de investigación con la herramienta OpenRefine

 

c4176d84c3fed661bc703225e6c685d0

Metodología de limpieza de datos con la herramienta de OpenRefine. Ciudad de México, México: CONACYT, 2016

 

Texto completo

 

En los últimos años la disponibilidad de datos abiertos ha sido de gran ayuda para analistas e investigadores en diversas áreas y ámbitos. Sin embargo, a pesar de la disponibilidad de la información, a menudo esta no es fácilmente utilizable, debido a errores e inconsistencias (hablando en términos técnicos) que posee, o la diversidad de formatos en los cuales se puede encontrar. Es otras palabras, es muy común que los datos encontrados en internet estén sucios o se encuentren en formatos incompatibles. Por lo tanto, antes de que la información sea utilizable, es necesario que sea sometida a un proceso de limpieza. Es posible encontrar diversas herramientas en línea gratuitas o de paga que sirvan al propósito de limpieza de datos, sin embargo, la gran mayoría son poco prácticas.

OpenRefine (anteriormente, Google Refine), es una herramienta de código abierto que puede ayudar a convertir datos sucios en datos limpios y utilizables de manera sencilla. OpenRefine se ejecuta como un servidor web en el ordenador del usuario, de tal manera que no se consumen muchos recursos del mismo. Este utiliza un navegador web como su interfaz, para que los datos se guarden en el ordenador local. Una gran ventaja que posee es que es capaz de manejar volúmenes grandes de información.

 

Un pensamiento en “Metodología de curación de datos de investigación con la herramienta OpenRefine

  1. Pingback: Metodología de curación de datos de investigación con la herramienta OpenRefine | Universo Abierto – Educación, Investigación y Trabajo

Los comentarios están cerrados.