Semantica de Fallos
Short Description
Descripción: Sistemas Distribuidos...
Description
Semántica de fallos Los sistemas distribuidos constan de una multitud de componentes hardware y software que pueden fallar. En muchos sistemas, estos fallos pueden llegar a producir inconsistencias y, por lo tanto, la no disponibilidad del servicio que estaban ofreciendo.
Una primera clasificación de acuerdo a la gravedad de fallos Fallo de tipo crash: En este modo, el fallo de un proceso consiste en una parada prematura, es decir, un proceso actúa en el sistema correctamente y, en un momento dado, deja de estar operativo. Derivaciones de este modo de fallo son: o Fallo silencioso. Cuando un proceso falla, deja de interactuar con el resto del sistema. o Fallo parada. Cuando un proceso falla, avisa de ello a todos los procesos del sistema y luego se para.
Fallo de omisión. Este modo contiene al fallo de tipo crash y, además, en él se contemplan omisiones en los mensajes que se envían o reciben. Es equivalente a decir que, además de fallar un proceso, el servicio de comunicación puede perder mensajes.
Fallo de temporización. En los sistemas de tiempo real no sólo es importante que los resultados obtenidos sean correctos, sino que además deben haberse conseguido dentro de unos requisitos temporales. Un fallo de temporización, además de contener el modo de fallo de omisión, aparece cuando un proceso se ejecuta más rápida o lentamente de lo definido en su especificación. Si se asocia al servicio de comunicación, es equivalente a decir que la red transporta los mensajes más rápidos o más lentamente de lo que dice su especificación.
Fallo arbitrario. También conocido como fallo bizantino o malicioso, es un modo de fallo que define un comportamiento no determinista de los procesos. En este modo se engloban todos los modos de fallo anteriores. Los elementos del sistema pueden no respetar su especificación en cualquier momento.
La segunda clasificación de fallos de acuerdo a su rendimiento
Fallo transitorio: se produce de manera aislada y desaparecen al cabo de un tiempo. La forma en que aparecen y la duración es aleatoria.
Fallo intermitente: se produce aleatoriamente de vez en cuando, se deben a cierta combinación específica del sistema.
Fallo permanente: permanece hasta ser reparado.
Se utiliza una tercera clasificación acorde a la naturaleza del fallo.
Fallos accidentales: se producen de manera accidental.
Fallos intencionales: son provocados de forma maliciosa.
Para construir un sistema tolerante a fallos, habitualmente se consideran dos alternativas. La primera consiste en ejecutar sistemas software sobre hardware especializado tolerante a fallos (CPU y memoria principal replicadas, discos espejo, varios buses y rutas de datos, entre otros.) pero; debido a razones económicas fundamentalmente no es tan viable. La segunda aproximación consiste en usar hardware estándar para soportar tolerancia a fallos, replicando ese hardware y manteniendo esa replicación a nivel software. De esta forma se consigue un sistema distribuido tolerante a fallos.
http://www.iuma.ulpgc.es/users/lhdez/inves/pfcs/memoriaivan/node2.html#SECTION00250000000000000000 cours_tolerance pp 16,22,23,24 del pdf.
Pdf thes-samir-jafar, pp. 27,28.
View more...
Comments