Analizar influenciadores claves (I)

La herramienta Analizar influenciadores clave nos permite seleccionar una columna que contiene un resultado deseado o valor de destino y, a continuación, analizar los patrones de los datos para determinar qué factores han influido más en el resultado. Pues bien, seleccionamos la columna Comprador que contiene los datos de los clientes que han comprado bicicletas.

Luego, desde la ventana Selección avanzada de columnas, podemos determinar si queremos que en el análisis aparezca o no una columna determinada. Por ejemplo yo descarto la columna Id entendiendo que no aporta nada el tener asociado un número u otro. Lo importante es anular la selección de columnas que contengan identificadores o nombres, que no son importantes para el análisis de patrones.

Al ejecutar el Asistente se produce un proceso de Análisis de patrones, todo esto en el servidor de Analysis Services donde está alojado el motor de minería de datos. Si se detectan patrones, el asistente crea un informe en una nueva hoja de cálculo que muestra los patrones. El informe se denomina Influenciadores clave de <columna>.

El informe que se crea de forma predeterminada contiene las cuatro columnas siguientes:
Columna El nombre de la columna que contiene el factor de diferenciador.
Valor El valor que está asociado más firmemente al destino.
Favorece El resultado o valor de destino que predice el factor.
Impacto relativo Una barra sombreada que indica la solidez de la asociación.

En este caso, el análisis da como resultado que las columnas claves son: Coches, Estado Civil y Región, veamos los valores que destacan en cada caso para estas columnas y si estos valores favorecen o no al valor que existe en comprador.

Los colores de la barra de sombreado son arbitrarios, aunque podríamos cambiar los colores estableciendo las opciones para el diseño de tabla en Excel. Si seleccionamos cada una de las filas de la columna Impacto relativo vemos los valores que se obtienen, por ejemplo, en este caso para coches con valor cero favorece con un valor de 76.

Además podemos crear filtros, como el que se muestra en la siguiente figura.

Si nos vamos a ver los datos que han dado origen a estos resultados vemos que al combinar los filtros Coches con valor cero o uno, Estado Civil con valor Single y Región con valor Pacific se obtienen 40 resultados, de los cuales en 34 casos se compraron bicicletas. Sin dudas es una combinación importante. Este tipo de análisis sería muy difícil de realizar “a mano”, por lo que la posibilidad de emplear los algoritmos de minería de datos nos permite llegar a razonamientos muy importantes dentro del análisis de nuestros datos.

Resumiendo podríamos decir que cuando la herramienta Analizar influenciadores clave analiza los datos, hace lo siguiente:

  • Crea una estructura de minería de datos que almacena información clave sobre los datos.
  • Crea un modelo de minería de datos mediante el algoritmo Bayes naive de Microsoft.
  • Crea predicciones que ponen en correlación cada columna de datos con el resultado especificado y, a continuación, utiliza la puntuación de confianza de las predicciones para identificar los factores que más influyen para producir el resultado que se persigue.
  • Crea un informe y ofrece la opción de crear un segundo informe que compara dos columnas.

En la próxima entrada veremos otro aspecto relativo a los influenciadores claves dentro de las Herramientas de Análisis de Datos.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.