Día a día se generan grandes cantidades de información la cual se registra en diversas aplicaciones o dispositivos. Esta información proviene desde el registro de entrada/salida al trabajo hasta el conteo de cantidad de automóviles que pasan por minuto en una determinada vía. Incluso todas las operaciones que se registran a través de nuestros teléfonos celulares, computadores, transacciones comerciales. Esta información no solo proviene de nuestro día a día, sino la expansión de las empresas y la necesidad de ver el histórico de sus operaciones hace que cada vez se generan y almacenan grandes cantidades de datos. Todo este fenómeno ha venido en aumento gracias al avance tecnológico en almacenamiento de datos(el cual ahora tiene una tendencia a estar en la nube) la intercomunicación de los equipos, el abaratamiento de la tecnología y la expansión del internet. Minería de datos.
La generación masiva de estos datos crea un problema denominado infoxicación, disponer de tanta información que a veces hace imposible organizarla con efectividad. Es acá donde se hace útil la minería de datos para sacar el máximo provecho de las grandes cantidades de información que poseemos.
Link infoxicación: https://www.citiuschool.com/blog/content-curator-terror-de-la-infoxicacion-marketing-digital/
La minería de datos es un proceso de búsqueda que se realiza en conjuntos grandes de datos. Con el objetivo de descubrir patrones, tendencias, agrupaciones, comportamientos que puedan apoyarnos en la toma de decisiones. Se busca extraer conocimiento de los datos para poder predecir qué puede pasar en diferentes escenarios y encontrar información que no está a simple vista, utilizando estadística y probabilidad de información que se encuentra oculta en los datos.
Pasos de la Minería de Datos
Dentro del proceso de minería de datos se encuentran los siguientes pasos:
- Determinación de Objetivos y Recolección de datos. Según las necesidades del cliente se pregunta qué tipo de información se desea tener.
- Procesamiento de los datos. Se seleccionan, limpian y se transforman los datos.
- Selección del modelo. Se crea un modelo o algoritmo para obtener el mejor resultado posible se pueden usar algoritmos desarrollados en diferentes areas de la inteligencia artificial como: regresión lineal, redes neuronales, machine learning, etc. También se realiza un primer borrador de la visualización gráfica.
- Análisis de resultados. Se verifica si los resultados son coherentes, lógicos y responden a las preguntas realizadas en los objetivos.
- Actualización del modelo. Se realiza para que no quede obsoleto con el paso del tiempo
Ventajas de usar minería de datos
Algunas de las ventajas de usar minería de datos se listan a continuación:
- Contribuye a gestionar la información de una forma más eficiente.
- Descubrir información que estaba oculta y no esperábamos obtener.
- Dar a las empresas la posibilidad de ofrecer productos y servicios que los clientes necesiten.
- Contribuye a la toma de decisiones estratégicas.
- Prevenir o predecir situaciones adversas usando modelos y datos estadísticos
- Los resultados son fáciles de entender e interpretar.
Desventajas de la minería de datos
Las características de la minería de datos hace que tengamos más ventajas que desventajas, pero si existiera una desventaja a mencionar esta sería la complejidad a la hora de utilizar diferentes técnicas de minería de datos dependiendo los datos que se desean trabajar. Otra sería la inversión inicial y esto depende de qué datos se desean recolectar y si estos ya se encuentran en una base de datos o se hace necesario obtener tecnologías diferentes para esa recolección.
Una alta inversión inicial dependiendo de la infraestructura de cada empresa parecería una desventaja en la implementación, pero no lo parece tanto teniendo en cuenta que con la minería de datos podemos realizar una detección temprana de problemas, predecir desgaste de activos y anticipar el mantenimiento, mantener la línea de producción de una forma más continua.
Diferencia entre el análisis y la minería de datosEs muy fácil relacionar estos 2 términos y en varios textos se confunden o se tratan de la misma manera, pero existe una línea delgada que separa al análisis de la minería de datos. Los 2 son subdominios de la ciencia de datos y utilizan procesos similares sin embargo el análisis de datos realiza el procesamiento de datos y modelado para encontrar información útil que sugiere conclusiones para apoyar la toma de decisiones trabajando con métricas e indicadores específicos. Además por lo general no se trabaja con una hipótesis para guiar el trabajo si no que se procesan datos para realizar un seguimiento constante y crear reportes. La minería de datos es una técnica de análisis de datos pero usada con un enfoque diferente. Esta se utiliza para el descubrimiento de información oculta y predicción de comportamientos. La minería está más enfocada para ser usada en conjuntos grandes de datos denominados Big Data.