Categories
Talks

Data Warehouse – Almacén de datos

I had to do a small talk/presentation about Data Warehouse for my Master in Software Engineering, I’m sorry it’s in Spanish, but I want it to be shared and here is the best place I can do it.

Data Warehouse

Un Data Warehouse es una colección de datos en la cual se encuentra integrada la información de la Institución y que se usa como soporte para el proceso de toma de decisiones de una administración.

El soporte al procesamiento informático provee de una plataforma sólida, a partir de los datos históricos para hacer análisis.

Facilita la integración de sistemas de aplicación no integrados. Organiza y almacena los datos que se necesitan sobre una amplia perspectiva de tiempo.

Como características importantes de un buen Data Ware house:

  • Flexible, ha de permitir cualquier tipo de dato de la organización y de cualquier fecha (tiempo).
  • Escalable, no sabemos cuanto puede llegar a crecer una organización, por ello el sistema debe de ser lo suficientemente escalable para crecer sin problemas.
  • Orientado a temas, el DW esté integrado con la lógica del negocio es imprescindible.
  • Integrado, uno de los aspectos mas importantes del DW es que la información encontrada interna esté siempre integrada.
  • Amigable, debe de ser simple de usar y fácil de acceder a el, sin estas premisas, los usuarios no lo emplearán.


No se tiene un enfoque único para construir un Data Warehouse que se adapte a las necesidades de las empresas, debido a que las necesidades de cada una de ellas son diferentes, al igual que su contexto.

Cabe destacar que, para ampliar un negocio, se necesita que la información sea comprensible y accesible por todos.

Como esquema resumido del funcionamiento un Data Warehouse:

data_warehouse

Consideración en plan de sistemas


Un Data Warehouse no se puede comprar, tiene que ser construido a medida y dependiendo de la complejidad de la organización o de los datos existentes, este puede ser muy complicado de implementar e influir mucho en el tiempo necesario para su desarrollo.

Estamos hablando de un proceso con altos beneficios a largo plazo, pero muy costoso de implementar. La total aprobación desde la dirección es imprescindible (top-down), para no tener que estar justificando gastos.

Es importante tener un equipo preparado para la implementación, ya que existe un alto grado de fracaso del proyecto. Por ello se recomienda una implementación por iteraciones.

Antes de comenzar se recomienda un pequeño desarrollo piloto, para demostrar los beneficios de esta práctica, de este modo los usuarios potenciales podrán entender la tecnología y probar los aportes que ofrece.

Por lo tanto, considerar que un Data Warehouse implica una serie de riesgos que se han de considerar en todo plan de sistemas, ya que involucra grandes recursos (dependiendo dimensión del proyecto).


Buenas practicas derivadas


El flujo de datos que comenzará a manejar la empresa debe de ser analizado.

Gracias a la organización de los datos, la administración debería obtener ventaja estratégica frente la competencia. La experiencia y la evolución que se obtiene gracias a los datos es el mayor beneficio de cara al plan de empresa. Como claro resultado será la obtención de mejores decisiones en el negocio, más oportunidades y más claridad de trabajo.

Continuar con el desarrollo de sofisticación y uso del Data Warehouse, conseguiría que los datos acumulados dentro de una empresa llegarán a ser más organizados, más conectados, más accesibles y, en general, más disponibles a más empleados.

Otra buena práctica derivada sería enlazar el Data Warehouse a otros sistemas (tanto internos como externos a la organización), se puede compartir información con otras entidades comerciales con poco esfuerzo.