Data Mart
Short Description
Base de datos orientadas a data mart...
Description
Data Mart
Introducción •
•
•
•
•
Un Data Mart es una versión especial almacén de datos (data warehouse). La dife difere renc ncia ia princ princip ipal al es que que la crea creaci ción ón de un data data mart mart es especíca para una necesidad de datos seleccionados enfati!ando el f"cil acceso a una información relevante. relevante. Los pro product ductos os Data ata #are arehous house e han han nacid acido o para para resol esolv ver pro$lemas de an"lisis de %randes masas de información. &implica el desarrollo de todo el mecanismo de su $ase de datos ' con ello $aa su$stancialmente todo el coste del pro'ecto así como su duración. ormalmente Data Mart resuelve aplicaciones a nivel departamental. &on su$conuntos de datos con el propósito de a'udar a que un "re "rea espe espec cíca ca dent dentrro del del ne%o ne%oci cio o pued pueda a tom tomar me meore ores decisiones.
Defniciones de Data Mart
Un Data mart es una $ase de datos departamen departamental tal especiali!ad especiali!ada a en el alm almacen acenam amie ient nto o de los los dato datos s de un "rea "rea de ne%o ne%oci cio o especíca.
&e caracteri!a por disponer la estructura óptima de datos para anali!ar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento.
Un data mart es un almacén de datos históricos relativos a un departamento de una or%ani!ación así que puede ser simplemente una copia de parte de un Data #arehouse ? para uso departamental.
*l Data mart es un sistema orientado a la consulta en el que se producen procesos $atch de car%a de datos (altas) con una frecuencia $aa ' conocida. *s consultado mediante herramientas OLAP
Conclusiones
lo tanto para crear el Datamart de un "rea funcional de la empresa es preciso encontrar la estructura óptima para el an"lisis de su información.
*n síntesis se puede decir que los data marts son peque+os data warehouse centrados en un tema o un "rea de ne%ocio especíco dentro de una or%ani!ación.
¿Data mart vs Data warehouse?
,l ha$lar de los data marts es inevita$le la comparación con los data warehouse ' al nal se aca$a diciendo (o entendiendo) que son como estos pero en peque+o ' en cierto modo esto es así pero esta idea suele hacer caer en los si%uientes errores so$re la implementación ' funcionamiento de los data marts.
Características Data Mart
&on po$lados por usuario nales
&e actuali!an contantemente
-ontiene información detallada
*scala$le
rientada al tema
Benefcios Data Mart
,celera las consultas reduciendo el volumen de datos a recorrer
*structura los datos para su adecuado acceso por una herramienta
&e%mentar los datos en diferentes plataformas de hardware
Los costos que implica la construcción de un Data Mart son muchos menores a un Data #arehouse
Desventaa Data Mart
o permite el maneo de %randes vol/menes de información
Mercados De Datos Data Mart
Data mart es especíca para una necesidad de datos seleccionados enfati!ando el f"cil acceso a una información relevante.
Data Mart se destaca por una denición de requerimientos m"s f"cil ' r"pida. 0am$ién se simplica el desarrollo de todo el mecanismo de su $ase de datos ' con ello $aa su$stancialmente todo el coste del pro'ecto así como su duración.
¿Data mart vs Data warehouse?
&on m"s simples de implementar que un Data #arehouse1 2,L& la implementación es mu' similar 'a que de$e proporcionar las mismas funcionalidades.
&on peque+os conuntos de datos ' en consecuencia tienen menor necesidad de recursos1 !AL"O una aplicación corriendo so$re un data mart necesita los mismos recursos que si corriera so$re un data warehouse.
Las consultas son m"s r"pidas dado el menor volumen de datos1 !AL"O el menor volumen de datos se de$e a que no se tienen todos los datos de toda la empresa pero sí se tienen todos los datos de un determinado sector de la empresa por lo que una consulta so$re dicho sector tarda lo mismo si se hace so$re el data mart que si se hace so$re el data warehouse.
*n al%unos casos a+ade tiempo al proceso de actuali!ación1 !AL"O actuali!ar el data mart desde el data warehouse cuesta menos ('a que los formatos de los datos son o
suelen ser idénticos) que actuali!ar el data warehouse desde sus fuentes de datos primarias donde es necesario reali!ar operaciones de transformación (*0L).
#a$ones %ara crear un Data Mart
Dar a los usuarios acceso a los datos que ellos necesitan para anali!arlos mas a menudo
3ueden f"cilmente e4tenderse a la toma de decisiones estraté%icas que pueden $rindar $enecios %randes ' tan%i$les.
3ermite entender ' administrar simult"neamente macro ' micro5 perspectivas del "rea de comercio e4terior lo que puede ahorrar inconta$les horas de tra$ao ' a'udar a evitar errores que pueden ser el resultado de suposiciones que se hicieron con $ase en datos incompletos o incorrectos.
&entaas ' Desventaas de Data Mart
&entaas(
-ampos -ompartidos ri%en com/n 3rocesamiento Distri$uido Desventaas(
0iempo desarrollo
lar%o
de
)lementos B*sicos de un Data +arehouse
)lementos B*sicos de un Data Mart
Al,unas -erramientas ).L
•
,$ 6nitio
•
7arracuda &oftware (6nte%rator )
•
Ma8e#are &oluciones 0ecnolo%icas http199
•
7enetl
•
7ia$le http199www.visiontecnolo%ica.com www.ma8eware.net
•
760ool 5 *0L &oftware http199www.$itool.com9
•
73& 0L:5; rhiscom ($ac85o?ce 3&)
•
-lover*0L @AB
•
-o%nos Decisionstream
•
Data 6nte%rator (herramienta de 7usiness $ects)
•
Data Mi%raton 0oolset de 7ac8o?ce ,ssociates (7o,) http199www.$oawe$.com9mi%rationtoolset.htm
•
:enio Cummin%$ird
•
67M #e$sphere Data&ta%e (3reviousl' ,scential Data&ta%e)
•
6nform"tica 3ower-enter
•
meta#E& ( Document 0ools)
•
Microsoft D0& (incluido en &FL5&erver G>>>)
•
Microsoft 6nte%ration &ervices (M& &FL &erver G>>H)
•
M'&FL Mi%ration 0ool8it
•
&criptella *0L 5 Li$re ,pache5licensed *0L
•
racle #arehouse 7uilder
•
#e$2ocus5i#a' DataMi%rator &erver
!ases de construcción/ Data Mart
-onstrucción del Data mart
-onstrucción de los 3rocesos de -ar%as
-onstrucción de los reportes analíticos
-onstrucción de los procesos de prue$a
!ases de construcción Construcción del Data mart: Esta actividad tiene el objetivo de construir el modelo de datos, la metadata de la herramienta de Explotación y La Arquitectura del Modelo Multidimensional en la herramienta de explotación. Construcción de los Procesos de Cargas: En ésta actividad es cuando se debe desarrollar los procesos de carga de datos, las rutinas de limpiea, los !ujos de cargas de datos, las inter"a de acceso, los importadores e integradores de datos, los programas de entrada de datos. Construcción de los reportes analíticos: #onsiste en construir los reportes, tableros de control, dashboard, scorecard. Construcción de los procesos de prueba: $e debe construir los programas, reportes, in"ormes que permita probar los procesos de cargas y los reportes entregados.
Modelo
Modelo 7ottom up
*l Modelo 3aralelo
Modelo 0op down con etroalimentación.
Modelo 7ottom up con etroalimentación
Modelo 3aralelo con etroalimentación
El modelo Top Down:
Est% basado en la estructura de la &ata 'arehouse, la cual se construye a partir de los datos que se puedan obtener de los di"erentes sistemas operacionales o externos (datos aislados) a
través de un proceso de extracción, trans"ormación y transportación (E**).
Top Down:
*iene como base un sistema de &ata 'arehouse para toda la empresa y a partir de este se desarrollan los &ata marts para las divisiones o departamentos. Modelo Bottom up:
En este modelo los &ata marts se construyen a partir de los datos dispersos y la &ata 'arehouse se construye a partir de los &ata marts existentes, esta construcción se realia a través de dos procesos di"erentes de extracción, trans"ormación y transportación. El Modelo Paralelo:
El dise+o del modelo paralelo se basa en dos alternativas, en la primera se tratan los &ata marts con entidades independientes de los &ata 'aehouse y en la segunda, esta independencia se trata de "orma temporal. Modelo Top down con Retroalimentación:
Este modelo incluye la posibilidad de agregar datos que no estén presentes en la &ata 'arehouse y que se requieran para cumplir con los requerimientos de un an%lisis espec-co.
Modelo Bottom up con Retroalimentación:
ermitir que la integración de los datos e in"ormación dada en los &ata marts se pueda implementar durante la construcción de la &ata 'arehouse.
Modelo Paralelo con Retroalimentación:
El desarrollo principalmente trabaja con la retroalimentación que tenga el &ata mart, ya que su inicio depende de un perodo de ajuste entre éste y el modelo de datos de la &ata 'arehouse. Mientras las entradas y salidas se estén dando en los &ata marts, en la &ata 'arehouse estos mismos se est%n realiando, dado a las caractersticas de paralelismo que existe entre ellos.
01012 !ases de construcción1 Posi3les eta%as %ara la construcción de un Data mart(
,n"lisis.
-onstrucción.
3ost5producción.
Metodolo,ías de dise4o1 •
*n los manuales de racle se su%iere la si%uiente metodolo%ía1
•
,rtículo1 Desi%n the Data Mart
•
•
•
,utor1 racleI 7usiness 6ntelli%ence &tandard *dition ne 0utorial elease A>% (A>.A.J.G.A) *A>JAG5>A http199download5 west.oracle.com9docs9cd9*A>JHGK>A9doc9$i.A>AJ9eA>JAG9dmKdesi% n.htm -lic aquí para enlace local al documento.
Metodolo,ías de dise4o1
Mood' ' Eortin8 descri$en una opción de metodolo%ía en el artículo1
,rtículo1 2rom *nterprise Models to Dimensional Models1 , Methodolo%' for Data #arehouse and Data Mart Desi%n
,utores1 Daniel L. Mood' Mar8 ,.. Eortin8
-lic aquí para un enlace local al documento.
01010 .ecnolo,ías1
,l%unos autores clasican las tecnolo%ías de software en las cate%orías de frontKend ' $ac85end. *l front5end es la parte del software que interact/a con el o los usuarios ' el $ac85end es la parte que procesa la entrada desde el front5end.
La separación del sistema en Nfront endsN ' N$ac8 endsN es un tipo de a$stracción que a'uda a mantener las diferentes partes del sistema separadas. La idea %eneral es que el front5end sea el responsa$le de recolectar los datos de entrada del usuario que pueden ser de muchas ' variadas formas ' procesarlas de una manera conforme a la especicación que el $ac85end pueda usar. La cone4ión del front5end ' el $ac85end es un tipo de interfa!.
.ecnolo,ías1 Una clasicación m"s especíca del software para los Data mart ' Data warehouse ' al%unos eemplos1 •
Cerramientas de -onsulta ' eporte (-r'stal eports).
•
Cerramientas de 7ase de Datos (L,3 ?ce ,nal'sis &ervices).
•
&istemas de 6nformación *ecutivos
•
7ases de Datos usados para Data #arehouse (racle M'&FL &FL &erver etc.).
.)C5OLO6IA" DA.AMA#.(
,spect Data Mart es una solución completa de reportes para la empresa que le proporciona un ma'or entendimiento de las operaciones de sus ne%ocios ' reduce el tiempo que consumen estas tareas. *sta solución consolida datos de m/ltiples fuentes para darle una perspectiva de las operaciones del centro de contacto de su empresa ' así poder identicar r"pidamente los procesos de cam$io necesarios.
.)C5OLO6IA"
Cerramientas 2ront5end
⇒
Cerramientas de 7D
⇒
-)##AMI)5.A" !#O5.7)5D 0am$ién conocidas como herramientas de acceso a los datos o herramientas de presentación. *l front5end es la parte del software que interact/a con el o los usuarios Cerramientas front5end O -erramientas de consulta( usan consultas predenidas ' las capacidades de información incorporadas para que los usuarios ten%a accesos a los datos. A%licaciones de usuarios( Muchos pro%ramas de aplicación comunes como Microsoft *4cel pueden proporcionar acceso front5end a $ases de datos de apo'o.
O -erramientas de desarrollos de %ro,ramas( Muchas instalaciones cliente5servidor necesitan aplicaciones front5end especiales personali!ados para sus tareas de o$tención de datos. &on esenciales para acceder ' anali!ar los datos en el datamart.
*l valor de un datamart es difícil de determinar por la ha$ilidad del usuario para e4traer la información m"s si%nicativa so$re la cual se toman las decisiones del ne%ocio.
Un interfa! de usuario efectivo minimi!a el n/mero de acciones de usuario requeridas para o$tener el resultado deseado por lo que de$er" estar nave%ando intuitivamente a no ser que el usuario memorice los comandos.
Las herramientas de acceso a la información pueden soportar acceso an"lisis visuali!ación ' data minin% de los datos de una forma predenida
6nterfa! 2ront5*nd. *s una aplicación donde los usuarios interact/an directamente con las funciones del sistema cu$re
todas las interfaces con las cuales un usuario interact/a con los sistemas 'a sean locales o remotos sus funciones principales son1
Dise+o de formatos.
3resentación.
Ló%ica de la aplicación.
Manipulación de datos.
Cerramientas de consulta.
Utilerías9men/s
View more...
Comments