En la pasada entrada vimos cómo desde la tarea Flujo de datos, podemos ir viendo el estado de nuestros datos mientras se mueven por las transformaciones del flujo de datos. En aquel entonces vimos Visores de datos tipo tabla, hoy veremos estos visores, del tipo Histograma.
Queremos saber cómo se comportan los precios de los productos, qué tal es su distribución
Si nos vamos a SQL Server Management Studio 2008
El valor mínimo es cero y el máximo 3578.27
Vamos a pensar que tenemos 3 600 como máximo y ahora el objetivo es ir estudiando la muestra, ¿será que la mayoría serán valores bajos o altos?
Resultado: 469 Entendido, la muestra se mueve más por la mitad más cercana al mínimo que al máximo, ¿Y si volvemos a probar? Vamos a cambiar 1800, por 900
Resultado: 418 Entendido, la muestra se mueve más por la cuarta parte más cercana al mínimo que al máximo, ¿Y si volvemos a probar? Vamos a cambiar 900 por 450
Resultado: 368 Entendido, la muestra se mueve más por la cuarta parte más cercana al mínimo que al máximo, ¿Y si volvemos a probar? Vamos a cambiar 900 por 225
Resultado: 317, aun es mayoría y así sucesivamente …
En SSIS a partir de 2005 tenemos la posibilidad de analizar los datos numéricos a través de un Histograma como Tipo de visor de datos.
Luego de asignar Nombre y tipo al visor, pasamos a la ficha Histograma a definir la columna que se emplea como dato de origen al Histograma, en nuestro caso es la columna ListPrice.
Ejecutamos
Este histograma refleja lo que ya sabíamos, el grueso de la muestra de productos tiene precios que no rebasan los 225.00
Al ver la enorme columna tan cercana al cero decidí agregar una nueva pregunta desde SSMS, por curiosidad probé con cero.
Encontré que de una muestra de 504 productos, hay 200 que tiene precio cero… ¿bueno o malo?… el dueño de estos productos sabrá, puede ser un buen samaritano y regalar 200 de sus 504 productos (no creo) o puede tener un grave problema en sus datos, esto es bastante más probable… ¡¡ para esto también está SSIS !!
Hasta aquí nuestra aproximación a los Visores de datos, en la próxima entrega hablaremos de Variables