Detectar categorías

Continuamos analizando datos en tablas de MS Excel 2007, esta vez empezaremos a ver la herramienta Detectar categorías, que busca automáticamente las filas de una tabla que tienen características similares. Cuando la herramienta finaliza, genera un informe que muestra las categorías encontradas junto con sus características distintivas. Tenemos nuestros datos de cliente, los mismos de antes, no tenemos requisitos especiales en cuanto a cantidad ni tipo de datos para este algoritmo.

Lo primero, al ejecutar el asistente, será definir las columnas que se emplearán para detectar las categorías.

De forma predeterminada, agrega una nueva columna a la tabla de datos que contiene la categoría propuesta para cada fila de datos. Después, podremos revisar las categorías y cambiar su nombre. Si desactivamos la casilla Anexar una columna Categoría a la tabla de Excel original no se agrega esta columna y estamos perdiendo una ventaja en cuanto a las funcionalidades que brinda esta herramienta. Además, podemos indicar un número máximo de categoría o dejar, como en nuestro ejemplo, que sea detectado automáticamente.

Como resultado del análisis, el Informe de categorías contiene dos tablas y un gráfico Perfiles de categoría.

Veamos la primera tabla que muestra las categorías nuevas con sus nombres provisionales (Categoría 1, Categoría 2, etc.). Esta tabla también muestra el recuento de filas de los datos originales que se clasificaron en esa categoría.

Para que sea más fácil trabajar con las categorías, podemos revisar la lista de características y asignar otro nombre a la categoría. Por ejemplo, en nuestro ejemplo, si analizamos las características de Categoría 1 vemos que incluyen los ingresos (columna Ingresos con valor Muy bajo<39050) y la región del cliente (columna Región con valor Europe), puede hacer clic en el nombre Categoría 1 en el gráfico superior y escribir “Clientes de la región Europa con bajos salarios“. La nueva etiqueta de categoría se propagará inmediatamente al otro gráfico y a la columna de asignación de categorías de la hoja de cálculo de los datos de origen.

Veamos las características de la categoría en la segunda tabla, que muestra detalles acerca de las similitudes encontradas en la categoría. Como vimos en los Influenciadores clave, podemos hacer clic en el botón Filtrar que se encuentra en la parte superior de la columna Categoría para ver las características de cada categoría. Las otras  columnas de esta segunda tabla son:

Columna es el nombre de la columna, que suele ser un atributo como Edad.

Valor es el valor de la columna, como 25 (años de edad).

Importancia relativa es una barra con sombreado que indica la importancia del atributo y del par de valores como factor diferenciador. Cuanto más larga sea la barra, más posibilidades existen de que el atributo sea representativo de esta categoría.

Aquí vemos un ejemplo de tabla

En la siguiente entrega estaremos prestando atención al Gráfico de perfil de categorías que se obtiene en el informe de la herramienta Detectar categorías

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.