Explorar datos discretos con anomalías con DM desde MS Excel

Hemos visto antes el patrón “correcto” y “coherente”, mostrado por tres columnas de los datos de muestra que podemos descargar con el Add-ins de Minería de Datos para Excel. No olvidemos que toda coherencia dependerá de las reglas del negocio al que nos estamos refiriendo en esos casos.

Vamos a forzar un cambio en los datos para mostrar cómo destacaríamos una anomalía de estos datos. Basta con cambiar un valor en la columna Married, tal y como se muestran en estas dos imágenes, un antes y un después.

En el momento de Explorar los datos, se observa que en la muestra de datos ya se ha tenido en cuenta el cambio que hemos hecho.

Tras ejecutar el Asistente para Explorar datos, este sería el resultado

Es decir, identifica que hay 3 posibles valores; pero dado el tamaño del gráfico no le es posible mostrar las cantidades para el valor Casada, porque es una cifra muy pequeña en comparación con las cantidades correspondientes al resto de valores. Si conseguimos aumentar la altura del gráfico, podemos ver, que en efecto, se dibuja la sombra azul, correspondiente a la cantidad (1) en la que se ha encontrado este valor Casada.

Este valor «huele mal». Tras analizar el negocio podríamos llegar a cualquier tipo de conclusiones, es posible incluso que el dato resulte bueno; pero está claro que huele mal, está fuera de los patrones habituales y es sin lugar a dudas una anomalía en los datos. No nos interesará realizar ningún estudio a partir de este valor Casada, por lo que seguramente lo modificaremos y esto lo veremos en otras opciones de este grupo Preparar datos que estamos revisando.

La siguiente entrega tratará de Explorar datos continuos.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.