Minería de Datos para las masas

[]

North, M. [e-Book]  Data Mining for the Masses. OpenLibra, 2012

.

Texto completo

Monográfico sobre Minería de datos

 

 

Emulando el título del famoso disco de Depeche Mode “Music from the masses”, la minería de datos como disciplina forma parte de la vida cotidiana de cualquier persona sin que se sea consciente de ello, ya que cada vez que hacemos compra con una tarjeta de crédito o navegamos por la Web estamos generando datos. Estos datos se almacenan en grandes conjuntos de poderosas computadoras propiedad de las empresas con las que tratamos todos los días. Y esos conjuntos de datos sirven para establecer indicadores de patrones de de nuestros intereses, nuestros hábitos y nuestros comportamientos. La minería de datos permite a las personas localizar e interpretar esos patrones, lo que ayuda a tomar decisiones mejor informadas y para servir mejor a los intereses de las empresas y de sus clientes. Dicho esto, también hay una cierta preocupación por la práctica de la minería de datos, sobre todo lo relacionado con la privacidad y los grupos de vigilancia, ya que las empresas acumulan grandes cantidades de datos, algunos de los cuales pueden ser muy personales en su naturaleza. La intención de este libro es presentar los conceptos y prácticas comunes de la minería de datos. Está destinado principalmente para estudiantes universitarios de grado y profesionales de negocios que puedan estar interesados en el uso de sistemas y tecnologías de la información para resolver problemas de sus negocios mediante la minería de datos. Aunque la minería de datos es la fusión de la estadística aplicada, la lógica, la inteligencia artificial, el aprendizaje automático y los  sistemas de gestión de datos, no es necesario tener una sólida formación en estos campos para utilizar este libro. Aunque tener conocimientos previos de estadística y bases de datos será de gran utilidad.

La minería de datos o exploración de datos (es la etapa de análisis de “Knowledge Discovery in Databases” o KDD) es un campo de las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, que involucra aspectos de bases de datos y gestión de datos, procesamiento de datos, el modelo y las consideraciones de inferencia, métricas de Intereses, consideraciones de la Teoría de la complejidad computacional, post-procesamiento de las estructuras descubiertas, la visualización y actualización en línea.

El término es una palabra de moda, y es frecuentemente mal utilizado para referirse a cualquier forma de datos a gran escala o procesamiento de la información (recolección, extracción, almacenamiento, análisis y estadísticas), pero también se ha generalizado a cualquier tipo de sistema de apoyo informático decisión, incluyendo la inteligencia artificial, aprendizaje automático y la inteligencia empresarial. En el uso de la palabra, el término clave es el descubrimiento, comúnmente se define como “la detección de algo nuevo”. Incluso el popular libro “La minería de datos: sistema de prácticas herramientas de aprendizaje y técnicas con Java” (que cubre todo el material de aprendizaje automático) originalmente iba a ser llamado simplemente “la máquina de aprendizaje práctico”, y el término “minería de datos” se añadió por razones de marketing. A menudo, los términos más generales “(gran escala) el análisis de datos”, o “análisis” -. o cuando se refiere a los métodos actuales, la inteligencia artificial y aprendizaje automático, son más apropiados.

Deja un comentario