Algoritmos de Distribucion de Datos

Share Embed Donate


Short Description

Download Algoritmos de Distribucion de Datos...

Description

Algoritmos de distribucion de datos 1. Los algoritmos de distribución de datos (carga) de procesamiento independiente proveen un conjunto de beneficios a las aplicaciones paralelas tales como: la minimización de su tiempo de ejecución, la maximización de uso de los recursos, etc. pero por su naturaleza paralela, la implementación de un algoritmo de distribución de datos es compleja lo que puede originar que no cumpla con las especificaciones para las que fue diseñado. 2.5.1 Algoritmos Distribución Datos No Replicados Debido al uso que se da a las redes de computadoras en la actualidad incluyendo Internet, cada vez es más factible implementar Sistemas de Bases de Datos Distribuidas, sin embargo, esta tecnología lleva a los desarrolladores a enfrentar un problema, la carencia de metodologías y herramientas de apoyo para su diseño que permitan decidir la ubicación de los datos en cada uno de los diferentes sitios que componen la red de computadoras. Este problema se conoce como Diseño de la Distribución y nace de la necesidad de especificar las unidades de almacenamiento adecuadas, ya sea fragmentos verticales, horizontales o mixtos, junto con su ubicación dentro de la aplicación . El Modelo FURD, ha sido desarrollado para resolver el problema del diseño de las Bases de Datos Distribuidas, el cual esta divido en dos etapas o fases: la fragmentación y la ubicación de fragmentos. Estas fases ya se concentran en el Modelo FURD. Una vez que se resuelve el Modelo FURD se puede dar solución al problema del diseño. Sin embargo la dificultad radica precisamente en la forma de resolverlo, pues es un problema de optimización muy complejo que a medida que va creciendo su tamaño, se va haciendo más difícil la forma de resolverse. 2.5.2 Algoritmos Distribución Datos Replicados Al tratarse de algoritmos de distribución replicados o no replicados la definición de nuestro problema y variables será diferente. Estas restricciones son: 1ª Restricción. Cada atributo se almacena solamente en un solo sitio (Para bases de datos distribuidas no replicadas) 2ª Restricción. Cada atributo m se ubica en un sitio i que al menos ejecute una consulta que involucre al atributo (Para bases de datos distribuidas replicadas)

2.5 DISTRIBUCION DE DATOS Describe el proceso de decidir donde localizar los datos. Una de las decisiones más importantes que el diseñador de bases de datos distribuidas debe tomar es el posicionamiento de los datos en el sistema y el esquema bajo el cual lo desea hacer Replicación de datos La replicación de datos se refiere al almacenamiento de copias de datos en sitios múltiples servidos por una red de computadoras. Pueden guardarse copias de fragmento para satisfacer requerimientos de información específicos. La replicación en SQL Server consiste, en el transporte de datos entre dos o más instancias deservidores. Base de datos totalmente replicada guarda varias copias de cada fragmento de la base de datos en varios sitios. No es práctica debido la cantidad de carga impuesta al sistema. Base de datos parcialmente replicada , guarda múltiples copias de algunos fragmentos de la base de datos en múltiples sitios. Se tiene un buen manejo Base de datos no replicada , guarda cada fragmento de base de datos en un solo sitio. Suponga que la base de datos A esta dividida en fragmentos: A1 Y A2 dentro de una base de datos distribuida replicada, es posible el escenario ilustrado en lafig.10.20: el fragmento A1 se guarda en los sitios S1 y S2, mientras que el A2 se guarda en los sitios S2y S3.

Los datos replicados requiere que todas las copias de fragmentos de datos sean idéntica, por consiguiente para mantener la consistencia de los datos entre las replicas, el DDBMS debe garantizar que se realice una actualización de la base de datos donde existen replicas. La

replicación exige más complejidad de procesamiento del DDBMS por que cada copia de dato debe ser mantenida por el sistema. Si la base de datos está fragmentada el DDBMS debe decidir que copia accesa Una operación read (lectura) selecciona la copia más cercana parasatisfacer la transacción. Una operación write (escritura) requiere que todas las copias se seleccionen y se actualizan. Tipos de replicación Los tipos básicos de replicación son: replicación de instantáneas replicación transaccional replicación de mezcla REPLICACIÓN DE INSTANTÁNEAS En la replicación de instantáneas los datos se copian tal y como aparecenexactamente en un momento determinado.Por consiguiente, no requiere uncontrolcontinuo de los cambios.Las publicaciones de instantáneas se suelen replicar con menos frecuencia queotros tipos de publicaciones.Puede llevar mástiempopropagar las modificaciones de datos a los suscriptores.Se recomienda utilizar: cuando la mayoría de los datos no cambian con frecuencia REPLICACIÓN TRANSACCIONAL En este caso se propaga una instantánea inicial de datos a los suscriptores, ydespués, cuando se efectúan las modificaciones en el publicador, lastransacciones individuales se propagan a los suscriptores REPLICACIÓN DE MEZCLA Permite que varios sitios funcionen en línea o desconectados de maneraautónoma, y mezclar más adelante las modificaciones de datos realizadas en unresultado único y uniforme. TIPOS DE RELACIONES:1.- RELACIONES BASE O REALES: Corresponde al concepto de Tabla esdecir una relación autónoma cuya importancia está dada por el diseñador para unuso especifico dentro de una aplicación 2.- RELACIONES VIRTUALES: (Relaciones de Vistas) Una vista es unarelación derivada con nombre representada dentro del sistema exclusivamentemediante su definición en término de otras relaciones, no posee datos

almacenados propios, separados y distinguibles a diferencia de las relacionesBases, en si una VISTA. 3.- RELACIONES INSTANTANEAS: (Snap Shop) Es también una relaciónderivada con nombre como una vista pero a diferencia de esta última lasinstantáneas son reales no virtuales, es decir, están representadas no solo por sudefinición, en término de otras relaciones con nombre, sino, también por suspropios datos almacenados:(Snap Shop = consulta rápida, corta)Las estrategias que se tienen son: Colocación centralizada de los datos, toda la base de datos se guarda enun sitio Colocación particionada de los datos, la base de datos se divide en variaspartes desarticuladas (fragmentos) y se guardan en varios sitios. Colocación replicada de los datos, se guardan copias de uno o másfragmentos de la base de datos en varios sitios. La distribución de los datos se logra mediante la partición de los datos,replicados de los datos o mediante una combinación de ambas. La colocación de los datos está estrechamente relacionada en como la BDse divide o fragmenta. La colocación de los datos ve que datos localizar yen donde. Los algoritmos de colocación de los datos consideran varios factores,incluidos: Objetivos de desempeño y disponibilidad de los datos. Tamaño, numero de filas y el número de relaciones que una entidadmantiene con otras entidades. Tipos de transacciones a ser aplicadas a la base de datos. 2.5 1 ALGORITMOS DE DISTRIBUCION DE DATOS NO REPLICADOS Permite maximizar el costo de comunicación y al mismo tiempo maximizar eltiempo de respuesta. El administrador de bases de datos debe de evaluar el modode operar de la base de datos, es decir como su nombre lo indica no podemosrealizar el algoritmo en aquellas copias, pero debe ser sobre la base de datosoriginal. La fragmentación hibrida es de preferencia lo que debe de llevar este tipode algoritmos, porque estas utilizan las tres fragmentaciones y las másaconsejables.Hablar de algoritmos implica sobre la ProgramaciónHay gestores que son muy flexibles en cuestiones de programación, mientras queotros ofrecen más rendimiento. Así, al diseñar el algoritmo tendrá que hacer todala información referente a la vida de la base de datos pero por otro lado deberá buscar siempre de darle soluciones al usuario, pues este será el que al final decuentas interesa.Existen en la actualidad infinidad de tecnologías en cuanto a los gestores de labase de datos se refiere, el que utilizaremos (el más actual) será SQL SERVER,este gestor comenzó a crearse por la década de los 90´s, ofrece muchas ventajassobre otros gestores, la única

desventaja que podríamos encontrar en sucompatibilidad con los Windows más comerciales como el 98, XP entre otros.Se preguntaran que tiene que ver el gestor con los algoritmos de datos noreplicados, sin embargo la respuesta es muy sencilla, y esta es que este algoritmoes fácil de implantar en SQL SERVER. 2.5.2 ALGORITMOS DE DISTRIBUCION DE DATOS REPLICADOS Se refiere al almacenamiento de copias de datos en sitios múltiples, puede ser para satisfacer requerimientos de información, además de mejorar ladisponibilidad de los datos y el tiempo respuesta; finalmente estas copias reducenlos costos de comunicación y de consulta total.Los datos replicados se someten a la regla de consistencia mutua, la cual requiereque todas las copias de fragmentos de datos sean idénticas, esto quiere decir quecuando hay una actualización de la base de datos se realiza en todos los sitiosdonde hay replicas.El algoritmo de distribución de datos replicados será realizado principalmente paralos datos que ya tengan una copia aunque es muy útil, lo cual podemos asegurar que su utilización y programación dependerá de un 100% del gestor que seutilizandoSQL SERVER a pesar de su facilidad de utilización también incorporaherramientas sofisticadas para aquellos usuarios de nivel avanzado. Entre algunasde las novedades que trae SQL SERVER, es que integra un servidor completo yun módulo para la transformación de datos.Otras de las características que posee SQL SERVER es un bloqueo dinámico anivel de fila, paralelismo entre consultas; consultas distribuidas y permite aceptar bases de datos de gran tamaño.Para crear una base de datos en SQL SERVER lo podemos hacer primeramenteusando el asistente de base de datos y la interfaz predefinida para la creación debase de datos. Tabla en SQL SERVER Columna NameData TypeLenghtAllow Nulls Esta parte se debecolocar todos losnombres de loscampos que tendrála tabla.Aquí se coloca eltipo de dato quelleva el campoanteriormenteubicado.Tamaño delcampo.Si se activa estaopción significaraque esta opciónpermitirá valoresnulos. Propiedades de los campos de las tablas Descripción.- Esta propiedad es exclusiva para el diseñador o bien para eladministrador.Default value.- Se usa para especificar un valor predeterminado para la columna.Precisión.- Se utiliza para campos numéricos, por aquí se indica la cantidad dedígitos que llevara un número.Scale.- Indica el número de dígitos decimales.Identify.- Si esta opción se marca con un si estaremos indicando que el campotendrá un número generado automáticamente.Identify Seed.- Indica el valor inicial para el primer registró.Identify Increment.- Indica el valor del incremento.Is Row Guid.- Esta propiedad creara un contenido global y único. Cualquier tablapuede tener este tipo de columna en el momento que se crea necesario por eldiseñador.Fórmula.- Es una propiedad exclusiva y diseñadas para aquellos campos quenecesitan alguna función.Collation.- En este campo se debe de especificar a qué base de datos pertenecela tabla que estamos generando se hace por default esta tabla pertenecerá a labase de datos desde donde fue fragmentada

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF