Obtener Sobremuestreo de Datos con Minería de datos en Excel (II)

En la entrada anterior mostramos cómo el Asistente para datos de muestra del Cliente de Minería de datos para Excel obtuvo un  resultado se ajustaba exactamente a lo que habíamos pedido, 500 casos y de ellos 250 mujeres y 250 hombres. Misión cumplida, no? Bueno, también dejamos la pregunta, ¿Es posible cumplir siempre con la solicitud realizada en la página Sobremuestreo de estados con escasa representación del Asistente? Pues no, la respuesta es: no es posible cumplir siempre con la solicitud.

Recordemos que podemos realizar un sobremuestreo de los datos para asegurarnos de que obtenemos una muestra suficientemente grande del valor en concreto que necesitamos. Cuando se realiza un sobremuestreo, se toma más cantidad de un determinado tipo de datos de la que se esperaría en un muestreo de datos aleatorio. El sobremuestreo resulta útil cuando se tienen pocos ejemplos de un determinado patrón. Gracias al sobremuestreo, aumenta la probabilidad de ese patrón. Podemos aumentar el muestreo para lograr un porcentaje concreto o podemos realizar un sobremuestreo en un determinado número de filas.

Es posible que el asistente no pueda cumplir con nuestras expectativas, veamos este caso:

Según esta imagen estamos pidiendo 1000 registros de los cuales 500 sean Mujeres. Esto no va a ser posible, recordemos la distribución de los valores para esta columna: 509 para Male y  apenas 491 para Female. Recordemos que este recuento lo tenemos cómodamente en el Asistente Cambiar etiquetas que hemos analizado hace muy poco.

Por tanto, a lo más que se podría aspirar para obtener un conjunto de datos con el 50% de Mujeres es 491 filas de mujeres* 2 = 982 filas

Sobre esto nos habla el mensaje emitido por el Cliente de Minería de datos para MS Excel

Tras lo cual obtenemos la nueva Hoja de cálculo Datos muestreados con 982 filas en las que se cumple el 50% solicitado.

Otra vez, misión cumplida, aunque con menos registros. El porcentaje solicitado se ha garantizado.

Hasta la próxima entrada, después de Navidad, en que continuaremos examinando las tareas y opciones del Cliente de Minería de Datos para Excel.

¡¡¡ Feliz Navidad a tod@s !!! 🙂

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.