Tarea generación de perfiles SSIS 2008 – Patrones exactos y aproximados.

Estamos analizando la tarea Perfiles de datos de SSIS 2008. Hemos visto toda la información que es capaz de ofrecer, pues bien, el resultado que obtuvimos antes es Aproximado. Hoy veremos dos formas de mejorar este perfil para lograr mayor exactitud y por tanto más valioso.

Análisis de datos excluyendo valores nulos.

El siguiente paso fue crear una tabla eliminando los valores NULL, que como vimos eran casi la mitad de los datos existentes:

recuentonull

De esta forma obtuvimos un Perfil de patrón de columnas exacto y la posibilidad de ver los valores que estaban fuera de los patrones.

perfilpatronmasexacto

Perfiles de patrones exactos y aproximados

Hasta este momento hemos mostrado la generación de perfiles rápidos, sin modificar propiedades. Si queremos obtener datos más precisos, debemos modificar las propiedades de la solicitud de perfil correspondiente, en este caso, patrón de columnas.

Regresamos al Business Intelligence Management Studio, donde alojamos nuestro proyecto SSIS 2008 con la tarea que creamos antes.

tareageneracioncodigossucios

Doble clic sobre la tarea o clic derecho editar. Desde el editor de tareas de Generación de perfiles, ficha Solicitudes de Perfil – Solicitud de perfil de patrón de columnas

editortareageneracion

Veamos las propiedades configuradas por el perfil rápido.

propiedadeseditor

Con el objetivo de obtener datos más exactos, los cambios aplicados fueron: indicar el 100% del total de datos y tener en cuenta las mayúsculas y minúsculas.

propiedadeseditormodificadas

El resultado obtenido es el siguiente

perfilpatronmasexacto

Si intentamos explorar a profundidad, vemos que no hay datos.

perfilpatronnoprofundidad

En este caso, todas las anomalías, que se salen de los dos patrones mayoritarios, están recogidas en el tercer patrón.

Hasta la próxima, en que estaremos hablando de la tarea Ejecutar proceso.

Saludos,

Ana