Archivo de la etiqueta: DM

Obtener Sobremuestreo de Datos con Minería de datos en Excel (II)

En la entrada anterior mostramos cómo el Asistente para datos de muestra del Cliente de Minería de datos para Excel obtuvo un  resultado se ajustaba exactamente a lo que habíamos pedido, 500 casos y de ellos 250 mujeres y 250 hombres. Misión cumplida, no? Bueno, también dejamos la pregunta, ¿Es posible cumplir siempre con la solicitud realizada en la página Sobremuestreo de estados con escasa representación del Asistente? Pues no, la respuesta es: no es posible cumplir siempre con la solicitud. Sigue leyendo

Obtener Sobremuestreo de Datos con Minería de datos en Excel

Hemos visto antes cómo ejecutar el Asistente para datos de Muestra en el grupo Preparación de Datos del Cliente de Minería de datos para Excel 2010. Antes hablé de Muestreo de datos con datos Excel, hoy hablaré de Sobremuestreo, también con datos Excel, porque esta opción no admite trabajo con datos externos. Sigue leyendo

Obtener Datos de muestra con Minería de datos en Excel

La última tarea que vamos a describir en el grupo Preparación de datos es Datos de muestra. Se trata de un asistente que ofrece dos  métodos para crear conjuntos de datos equilibrados para entrenar y probar modelos. Las dos posibilidades son: muestrear aleatoriamente los datos de conjuntos de datos grandes y sobremuestrear datos para reequilibrar un conjunto de datos.  Aquí vamos a describir las dos. Sigue leyendo

Limpiar datos cambiando etiquetas (II)

Vamos a continuar, justo donde lo dejamos la pasada entrega. Para ponernos en situación, recordemos que estamos hablando de cambiar etiquetas de los datos que forma parte de las acciones de Limpieza de datos que a su vez forma parte de las acciones de Preparación de datos con el Cliente de Minería de datos. Sigue leyendo

Limpiar datos cambiando etiquetas (I)

Cuando comencé esta serie, allá por el mes de abril de este año 2011 comentaba que nuestro objetivo es saber qué tipo de datos nos está enviando el cliente, cuál es su estructura y su contenido, ver si es válido y limpio para lo que necesitamos y ver si hay que retocar esta estructura y contenido de alguna forma para que se ajuste a nuestras necesidades. Pues bien, justamente este sigue siendo nuestro objetivo cuando vamos a utilizar la opción Limpiar datos cambiando sus etiquetas, desde el menú Preparación de datos del Cliente de Minería de datos para Excel. Sigue leyendo

Tratamiento de valores atípicos discretos en Excel 2010

Una vez definidos los umbrales de valores atípicos, para datos continuos o discretos,  estamos en condiciones de definir cómo queremos procesar los valores atípicos seleccionados. Sigue leyendo