Introducción a la serie sobre Modelado dimensional

En los últimos meses he notado en los clientes algunas carencias en temas de Modelado dimensional, por lo que he pensado que podría ser de utilidad escribir un poco sobre este asunto, del que por cierto, me queda todo por aprender. En estos años de trabajo con Inteligencia de Negocio desde MS SQL Server 2005 al 2012 he notado algunos patrones que podemos identificar en nuestro trabajo. Me dispongo entonces a hablar con ustedes, a partir de hoy y durante unos días de aspectos relativos al Modelado dimensional de datos.

Antes de entrar en materia me gustaría recomendar materiales, para que los que deseen, profundicen en estos temas… antes, durante y después de acometer un proyecto BI :). En ellos encontraremos explicación a “fenómenos raros” que ocurren con nuestros datos y encontraremos, sobre todo, un sinfín de Buenas prácticas, con las que nos debemos armar para enfrentar los retos del proyecto BI.

Microsoft viene publicando, desde SQL Server 2005, Guías de Optimización para SSAS, aquí les dejo un par de ejemplos:

SQL Server 2008 White Paper: Analysis Services Performance Guide

Analysis Services 2008 R2 Performance Guide

Puedo recomendar además, en castellano, la extensa serie de artículos escritos por el amigo y mentor Salvador Ramos que están publicados en el Blog de SolidQ sobre BI en general, y sobre aspectos del Modelado dimensional en particular

Y para finalizar; pero no menos útil. Como material muy importante o mejor dicho, imprescindible, puedo recomendar, en inglés, el valioso material que podemos encontrar en el sitio del Grupo Kimball, así como sus libros, que son una fuente inagotable de conocimientos sobre estos temas.

En cambio, esta serie que comenzamos hoy no pretende ser un libro, ni siquiera un tutorial, el lector lo debe tomar apenas como un intento de compartir ideas y experiencias.

Cuando hablamos de Modelado Dimensional, lo primero que me gustaría es ver algunas de las definiciones que más relevancia han tenido en los proyectos BI. Veamos, ¿qué se entiende por Data Warehouse (DW) o almacén de datos?

Por una parte, Bill Inmon plantea: “A data warehouse is a subject-oriented, integrated, time-varying, non-volatile collection of data in support of the management’s decision-making process.”

A partir de esta definición entendemos que un DW es una colección de datos destinada al proceso de toma de decisiones, con datos integrados, orientados a temas, variantes en el tiempo y lo que es muy importe, no volátiles.

Por otro lado, Ralph Kimball plantea:  “A data warehouse is a copy of transactional data specifically structured for querying and analysis”

Es decir, según este criterio, a partir del modelo transaccional los datos se agrupan específicamente para cumplir dos tareas: consultas y análisis.

Otra opinión válida puede ser la de Barry Devlin quien expresa: “A data warehouse is simply a single, complete, and consistent store of data obtained from a variety of sources and made available to end users in a way they can understand and use it in a business context.”

La idea, en este caso, se centra en un único, completo y consistente almacén de datos integrados a partir de varios orígenes, dispuestos para que el cliente final pueda entenderlos y utilizarlos en contextos de negocio.

Como vemos, contamos con varios puntos de vista. Hoy nos quedamos con todos 🙂 y en los días venideros los iremos desarrollando en la medida que veamos las características y componentes del Modelo Dimensional.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.