Tarea generación de perfiles I – Configuración

Uno de los objetivos que tenemos cuando creamos paquetes con SSIS es el chequeo de la consistencia de los datos y la limpieza de los mismos. A partir de SQL Server 2008, contamos con una funcionalidad que nos permite realizar un análisis de los datos en tiempo breve, dándonos, entre otras cosas, información sobre las posibles columnas candidatas, distribución de longitud de las columnas, los patrones existentes y la dependencia funcional entre las columnas.

Veamos primero cómo configurar la tarea. Partimos del proyecto creado en el escrito anterior donde teníamos un paquete creado y que está vacío, vamos a aprovecharlo. Lo primero es cambiarle el nombre al paquete por algo más descriptivo como EjemploGeneracionPerfiles. Debemos tener sumo cuidado con mantener la extensión dtsx y se nos pide responder a esta pregunta:

preguntacambiarnombreproyecto

Esta pregunta se refiere al nombre del objeto dentro del código XML que se genera como parte del proyecto SSIS.  Antes de cambiar el nombre esto era lo que aparecía en el nombre del objeto:

vernombrepaquete

Para acceder a este código: Menú – Ver – Código, este es el aspecto después del cambio:

verdatosproyecto

Para ver el lugar donde se describe el paquete avanzamos un poco o aplicamos las técnicas habituales para buscar texto.

vernombrepaquete2

Pues ya tenemos el paquete y el objeto del código con el nombre deseado.

nombrecambiado

En el panel Cuadro de Herramientas buscamos la tarea que necesitamos:

tareaperfiles

Arrastramos la tarea al panel Flujo de control:

tareaperfilesenflujo

Aquí vemos una señal de error que nos avisa que la tarea no está correctamente configurada y una flecha verde.

El error en concreto que tenemos es el siguiente:

errortareaperfiles

Esto se debe a que no hemos definido ningún Administrador de conexión asociado a la tarea. Aquí tenemos otro de los elementos fundamentales de un paquete SSIS, los Administradores de conexión que son los encargados de tender los puentes entre orígenes, tareas y/o transformaciones y destinos. Unas líneas más y veremos cómo solucionarlo.

Las flechas que entran y salen de las tareas de Flujo de control se denominan Restricciones de precedencia. Al ser de color verde está indicando que solamente se pasará a la siguiente tarea (en caso de que existiera) si la tarea actual (Generación de perfiles) se ejecutara satisfactoriamente. En otro momento regresaremos al tema con más detalle.

Para configurar la tarea hacemos doble clic sobre la misma y nos aparece el Editor de tareas de generación de perfiles de datos.

Desde la ficha General vamos a definir el destino del perfil que se va a generar. Tenemos dos tipos de destinos: FileConection y Variables, escogemos el primero ya que queremos que el análisis se guarde en un archivo. A continuación vamos a definir la conexión:

destinoperfil

El archivo destino puede existir o crearse en el momento, se debe indicar su ruta y es aconsejable que sea extensión XML.

editorconexionesdestinoperfil

Ya tenemos la conexión, ha sido solucionado el error, se agregó un Administrador de conexión de archivos planos al panel Administradores de conexión

conectadoeditorperfil

Volviendo al editor, en la ficha General, seleccionamos en botón Perfil rápido…, para seleccionar el origen de datos que hay que analizar.

formularioperfiltablaunica

Necesitamos una nueva conexión, así que seleccionamos Nuevo… y en la ventana Administrador de conexiones definimos el origen de datos. Aunque no hemos definido qué tabla será analizada, en este punto ya se ha creado el Administrador de conexión con el origen de datos como queda reflejado en el panel.

administradores

Seleccionamos la tabla [Purchasing].[Vendor] de la Base de datos AdventureWorks y rellenamos todas las casillas para obtener todos los perfiles.

conexiontabla

La segunda ficha del Editor se configura a partir de lo que hemos seleccionado previamente y tiene el siguiente aspecto:

editortareasgeneracion

En este caso no definiremos ninguna expresión por lo que no pasamos a la tercera ficha.

Sólo nos queda ejecutar la tarea, para ello entre otras formas, puede ser clic derecho del ratón – Ejecutar tarea. La tarea va cambiando de color según la fase de procesamiento en la que se encuentre, mientras esté en blanco, no ha comenzado de ejecutarse, en amarillo está en proceso, en verde, concluyó satisfactoriamente y en rojo ha habido algún error y no se ha cumplido.

colorestareaperfiles

Bueno… ha sido más largo de lo que pensaba, lo dejamos por hoy, para la próxima veremos qué ha ocurrido con esta tarea.

Saludos,

Ana