En la entrada anterior mostramos cómo el Asistente para datos de muestra del Cliente de Minería de datos para Excel obtuvo un resultado se ajustaba exactamente a lo que habíamos pedido, 500 casos y de ellos 250 mujeres y 250 hombres. Misión cumplida, no? Bueno, también dejamos la pregunta, ¿Es posible cumplir siempre con la solicitud realizada en la página Sobremuestreo de estados con escasa representación del Asistente? Pues no, la respuesta es: no es posible cumplir siempre con la solicitud. Sigue leyendo
Archivo de la categoría: Excel 2010 y Minería de Datos
Obtener Sobremuestreo de Datos con Minería de datos en Excel
Hemos visto antes cómo ejecutar el Asistente para datos de Muestra en el grupo Preparación de Datos del Cliente de Minería de datos para Excel 2010. Antes hablé de Muestreo de datos con datos Excel, hoy hablaré de Sobremuestreo, también con datos Excel, porque esta opción no admite trabajo con datos externos. Sigue leyendo
Obtener Datos de muestra con Minería de datos en Excel
La última tarea que vamos a describir en el grupo Preparación de datos es Datos de muestra. Se trata de un asistente que ofrece dos métodos para crear conjuntos de datos equilibrados para entrenar y probar modelos. Las dos posibilidades son: muestrear aleatoriamente los datos de conjuntos de datos grandes y sobremuestrear datos para reequilibrar un conjunto de datos. Aquí vamos a describir las dos. Sigue leyendo
Limpiar datos cambiando etiquetas (II)
Vamos a continuar, justo donde lo dejamos la pasada entrega. Para ponernos en situación, recordemos que estamos hablando de cambiar etiquetas de los datos que forma parte de las acciones de Limpieza de datos que a su vez forma parte de las acciones de Preparación de datos con el Cliente de Minería de datos. Sigue leyendo
Limpiar datos cambiando etiquetas (I)
Cuando comencé esta serie, allá por el mes de abril de este año 2011 comentaba que nuestro objetivo es saber qué tipo de datos nos está enviando el cliente, cuál es su estructura y su contenido, ver si es válido y limpio para lo que necesitamos y ver si hay que retocar esta estructura y contenido de alguna forma para que se ajuste a nuestras necesidades. Pues bien, justamente este sigue siendo nuestro objetivo cuando vamos a utilizar la opción Limpiar datos cambiando sus etiquetas, desde el menú Preparación de datos del Cliente de Minería de datos para Excel. Sigue leyendo
Tratamiento de valores atípicos continuos en Excel 2010
La pasada entrega estuvimos viendo cómo se pueden procesar los valores discretos identificados como atípicos con el Cliente de Minería de datos para Excel. Sigue leyendo
Tratamiento de valores atípicos discretos en Excel 2010
Una vez definidos los umbrales de valores atípicos, para datos continuos o discretos, estamos en condiciones de definir cómo queremos procesar los valores atípicos seleccionados. Sigue leyendo
Detectar valores atípicos continuos con DM desde Excel 2010
En la pasada entrega comencé a hablar de Limpieza de datos, concretamente del tratamiento de los datos discretos con el Asistente para Valores atípicos, de la Herramienta Limpiar datos del Cliente de Minería de datos de MS Excel 2010. Sigue leyendo
Detectar valores atípicos discretos con DM desde Excel 2010
En días pasados hemos visto algunas labores de Preparación de datos, concretamente las referidas a Explorar datos con las Herramientas de Minería de datos desde MS Excel 2007-2010. A partir de hoy vamos a estar hablando de Limpieza de datos. Sigue leyendo
Creando datos discretos al agregar nueva columna de datos con DM en Excel
Hoy vamos a terminar lo relativo a Explorar datos continuos y se trata de buscar la primera opción, de varias que veremos en esta serie, de convertir los datos continuos en discretos. Sigue leyendo