Saltar al contenido

Introducción al Data Mining

Data Mining

El objetivo del actual artículo de data mining, es el de mostrar un sencilla técnica estadística de análisis. La mayoría de las empresas crean y almacenan gran cantidad de información.

  • ¿Cómo almacenar de manera segura esa información?
  • ¿Es posible lograr el máximo rendimiento de la información utilizable en las organizaciones?
  • ¿Con qué medios referimos para la gestión eficiente de los datos?

Algunos sistemas que son sólo parcialmente distinguidos, causan una cantidad inmensa de datos; estos datos con frecuencia sujetan valiosa información que puede trascender muy útil. Se trata de auténticas vetas de oro para los ejecutivos de una corporación.

¿Cuál es el problema?

La mayoría de las multinacionales forman más información en una semana que la que cualquier persona podría leer en toda su vida, e incluido las pequeñas empresas crean un volumen de datos que no son capacitados de manejar.

El Data Mining se reflexiona un área multidisciplinar del medio de la Inteligencia de Negocio constituida por un conjunto de metodologías y herramientas que admiten extraer conocimiento ventajoso para soportar la toma de decisiones, comprensión y mejora de los procesos y sistemas, a partir de grandes cantidades de datos.

¿Cuándo posee ventaja aplicar las técnicas de Minería de Datos?

  • Cuando la toma de decisiones debe estar determinada en la comprensión.
  • Cuando el escenario es cambiante.
  • Si los métodos aprovechables no son óptimos o el sistema es parcialmente desconocido.
  • Cuando se instala de un gran volumen de datos, asequibles y con potencial de información atrayente.

Campos de diligencia de las técnicas de Minería de Datos

Negocios

  • Marketing dirigido
  • Descubrimiento de fugas de clientes
  • Conducta del cliente en negocios ciertos días del mes.
  • Inversiones, deportes y entrenamiento, telecomunicaciones, e-Commerce,  etc.

Webs

  • Componentes de búsqueda, rastreadores de páginas web, etc.

Gobierno

  • Perfeccionamiento de las leyes, detección de fraudes, anti-terrorismo, etc.

Algunas técnicas que se aplican en Data Mining:

Asociación:

  • La asociación soluciona problemas del tipo “Análisis de la Bolsa de la Compra”, con el fin de lograr las tendencias de compra de los clientes.
  • Trata la potencial relación entre dos sucesos aparentemente independientes.
  • La expresión de una regla de asociación posee 2 componentes, el informe (cuando se cursa una materia), y el consecuente (cursan existe algo optativa)

Secuenciación

  • Es análogo a la asociación, pero contiene el tiempo de análisis añadiendo cotejos de tiempo, como el análisis del tiempo acontecido entre el suceso inductor y el suceso inducido.
  • Internamente de los 6 primeros meses, al cabo de 15 días la próxima vez.

Clasificación

  • Agrupa unas herramientas que consienten asignar un elemento a un expreso grupo o clase.
  • Se maneja en la detección de transacciones fraudulentas, riesgo en la trasmisión de créditos, identificación de procedimientos médicos, etc.
  • Maneja datos históricos (conjunto de entrenamiento) para predecir una conducta futuro en cada clase (perfil de la clase).

Se maneja para:

  • Clasificar cada mecanismo a partir de los valores de sus variables.
  • Ver que variables intervienen en otras.

Regresión

  • Similar a la clasificación.
  • El modelo creado intenta predecir el valor más probable para una observación.

Agrupamiento

  • Se maneja en Marketing (población con las mismas afinidades), biología (plantas con las mismas proteínas).
  • Partición de la base de datos en subconjuntos en base a un criterio, de representación que los elementos posean comportamientos comunes en sus variables.
  • Diferencia con clasificación: NO se fragmento de un conjunto de entrenamiento.
¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)