La pasada entrega estuvimos viendo cómo se pueden procesar los valores discretos identificados como atípicos con el Cliente de Minería de datos para Excel.
Hoy veremos lo que podemos hacer con valores continuos.
Partimos de la columna Income
En el paso Tratamiento de valores atípicos tenemos que indicar cómo deseamos cambiar estos valores.
En todos los casos estas acciones se realizan únicamente sobre los valores atípicos, por lo que los valores que se encuentran en el rango aceptado, que es mayor o igual que 47000 y menor o igual que 139480 permanecerán sin ninguna modificación.
En el primer caso, Cambiar valor a límites especificados, lo que ocurre es que se van a reemplazar todos los valores atípicos por los límites que establecimos en el paso anterior. Entonces, todos los valores menores que 47000 se van a sustituir por 47000. Por su parte todos los valores mayores que 139480 se van a sustituir por 139480. El resultado se observa en la columna Income2.
En el segundo caso, Cambiar valor a promedio, el valor para sustituir es siempre el mismo, lo que queremos es reemplazar todos los valores atípicos por un único valor, el promedio. El resultado se observa en la columna Income3.
Una opción extra es Cambiar valor a NULL (datos vacíos), aquí eliminamos el contenidode la celda al reemplazar los valores atípicos por valores NULL. El resultado se observa en la columna Income3.
Y por último, la más arriesgada, Eliminar filas que contengan valores atípicos, sirve para eliminar cualquier fila que contenga valores atípicos. Antes de eliminar vemos que contamos con 1003 registros y después apenas 553. Esto se puede ver en estos recortes de pantalla.
Como vimos para datos discretos, el paso final será Seleccionar destino, que es igual que en discreto, recordando que paea Eliminar filas … no es posible utilizar la misma localización de los datos y mantener el resto de columnas … en fin que o los reemplazamos o buscamos una nueva hoja de cálculo.
De esta forma termino el viaje por la Herramienta Limpiar datos atípicos. La siguiente entrega empezaremos a Limpiar datos cambiando sus etiquetas con el Cliente de Minería de datos para Excel