La tolerancia a fallos, o failover, se refiere a la capacidad que tiene un sistema de recuperarse de un error sin afectar a la disponibilidad del servicio.
Como siempre una imagen es mejor que mil palabras. Lo importante de todo es que al final hay uno que sigue funcionando.
Pongamonos en situación…
Queremos crear un sistema tolerante a fallos o con failover. ¿Qué tenemos que hacer?
Obviamente, para poder generar un sistema redundante tolerante a fallos, necesitamos capital suficiente. A mayor capital, mayor resistencia a fallos. No es posible crear tolerancia a fallos sin invertir capital.
Para tener un sistema tolerante a errores debemos configurar lo que comúnmente se denomina “Sistema Redundante”, es decir, dos o mas sistemas configurados para que pese a estar conectados y dispongan de la misma información, puedan funcionar de forma independiente por si el otro falla. Mediante este sistema, incluso en el peor de los casos (la rotura de un disco duro, un desbordamiento de memoria que mate un proceso vital, o incluso que alguien le pegue una patada al cable) puede seguir funcionando
Hay muchas formas de conseguir un sistema redundante. Podemos, como hemos explicado utilizar varios sistemas completos que funcionen siempre, con lo que además, reducimos la carga del conjunto de los sistemas. (Si tenemos una maquina cargada al 80%, si ponemos un sistema redundante de dos maquinas en ese mismo lugar, cada maquina tendrá una carga aproximada del 40%). También podemos tener el sistema de “equipo inactivo”, donde un equipo está esperando a que el otro falle para activarse tan pronto como le llegue la notificación.
One response to “FailOver o Tolerancia a Fallos”
Verónica Galán Bueno liked this on Facebook.