Tratamiento de valores atípicos discretos en Excel 2010

Una vez definidos los umbrales de valores atípicos, para datos continuos o discretos,  estamos en condiciones de definir cómo queremos procesar los valores atípicos seleccionados. Las opciones que tenemos disponibles varían dependiendo de si los datos son discretos o continuos y nos permiten,  por ejemplo, eliminar las filas que contengan los valores atípicos o bien reemplazar los valores por un valor promedio, un valor NULL u otro valor especificado.

Para valores discretos, las posibilidades que tenemos son las que se muestran a continuación:

Si desplegamos el botón veremos el resto de variantes existentes para cambiar el valor.

Por lo que tenemos ya la primera de las vías para limpiar este valor Casada, en este caso por Married, con lo cual quedaría el dato limpio, tendríamos dos posibles valores (Married / Single ) con un balance lógico en cuanto a sus casos. Esta opción nos vale para reemplazar todos los valores atípicos (en este caso es sólo uno), por un valor seleccionado en una lista de valores disponibles o por la cadena “Otro”. Por cierto, esta cadena se puede modificar por cualquier “otra”. 🙂

Tenemos otras opciones, Cambiar valor a NULL (datos vacíos), elimina el contenido de la celda,  ya que reemplaza los valores atípicos por valores NULL. También podemos Eliminar filas que contengan valores atípicos, lo que nos permite eliminar eliminar cualquier fila donde existan estos valores  que han sido definidos antes como atípicos. Esta opción es muy arriesgada, estamos optando por eliminar todos los datos de este elemento de nuestro conjunto, esto podría atentar contra procesos futuros.

Hemos limpiado el dato, muy bien, veamos ahora otra posible funcionalidad que nos ofrece este Asistente, Crear nuevos Grupos de datos.

¿Qué pasaría si nos encontramos trabajando sobre la columna Regions? Pues igual, si quitamos la región Pacific, y aun más si quitamos Pacific y Europe podíamos tener todos estos datos agrupados en un nuevo grupo Otros.

Para finalizar el Asistente debemos decidir dónde colocar los datos tras cambiarlos y las opciones que se nos ofrecen para datos discretos son:

Las opciones se explican por si solas, la ventaja es que tenemos varias posibles soluciones, por lo que lloverá a gusto de todos 🙂 En este caso, agregamos el resultado del Asistente en una nueva columna

Con esta nueva agrupación de nuestros datos, estamos en condiciones de hacer el análisis de las ventas o lo que sea de North America y el conjunto que forman todos los demás valores agrupados en Otros como muestra la imagen.

En la próxima entrega veremos cómo se pueden procesar los valores continuos sobre los que sea han definido valores atípicos con el Cliente de Minería de datos para Excel 2010.

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.