Alta Disponibilidad – Preguntas III (y ultimo)


Llegamos al tercer y ultimo articulo sobre preguntas de la Alta Disponibilidad, siento si se os ha hecho muy largo, pero lo he resumido de forma que tampoco sea excesivamente largo cada artículo.

Más Alta Disponibilidad para todos

¿Cuales son las estrategias mas comunes para la protección de datos?

Las estrategias mas comunes para la protección de datos son:

  • Copias de seguridad enviadas a otro lugar físico de respaldo de forma periódica.
  • Copia de seguridad mantenidas en el mismo clúster, para agilizar la recuperación
  • Respaldo de los datos en servidores fuera de la empresa. Normalmente se realiza con una red SAN
  • Respaldo y Replicación de los datos en tiempo real

Que medidas se aplican a los proveedores externos para la protección de datos de una empresa?

En las empresas, normalmente se aplican una serie de medidas para la recuperación veloz de los sistemas.

  • Copias locales sincronizadas, como RAID.
  • Protectores de tensión, para evitar los aumentos de energía en equipos.
  • Sistema de Alimentación Ininterrumpida (SAI) y generadores para cortes y fallos de suministro.
  • Prevención de incendios, Control de Acceso y Sistemas Antivirus

Que es el SPOF?

El SPOF (Single Point of Failure) es el Punto Simple de Fallo, es decir, es el momento en el que en una red redundada se queda con un único soporte activo.

Poniendo un ejemplo, en clúster de dos balanceadores, en el momento en el que uno falle, el otro se convierte en el SPOF del balanceo, es decir, si este último falla, se corta completamente el suministro y afecta gravemente al funcionamiento de la organización.

Que es el FailOver?

El FailOver es la capacidad de cambiar de nodo en el momento en el que un servicio falla. Por ejemplo, en casa podríamos tener Fibra en casa y si esta falla, tenemos conectado un Router 3G que nos ofrece internet en caso de que la red principal falle.

Que es el TakeOver?

El TakeOver es el proceso por el cual se realiza automáticamente un failover. Notese que se realiza antes de que el nodo falle, para que así pueda ser sustituido o reparado antes de finalizar su vida útil reduciendo los efectos negativos sobre la disponibilidad del servicio.

Que es el GiveAway?

Un giveaway o switchover es el failover forzado para realizar, normalmente, tareas de mantenimiento sobre el nodo retirado.

Que es el Splitbrain?

Para gestionar los servidores y poder comprobar si se están dando los valores de SLA y alta disponibilidad ofrecidos, los nodos se envían mutuamente paquetes de control para conocer si los otros nodos están vivos. El splitbrain sucede cuando varios nodos se creen que el resto se encuentra inactivo, con lo cual se intentan hacer cargo a la vez del trabajo del otro creando un conflicto. Para esto aparece un “testigo” llamado quorum que es el que indica que en caso de conflicto, el poseedor del quorum será el que se haga cargo del servicio. Este fallo debe ser solucionado por los administradores del sistema en la configuración para evitar consecuencias peores.

Que es HotSwap?

El HotSwap o Cambio en Caliente es la capacidad de un equipo el tener cambios en su hardware mientras este está encendido. Por ejemplo, si a un equipo le falla el disco duro y tiene la posibilidad de cambiarlo sin que existan fallos en el sistema sin apagarlo, este equipo permite hotswap. Actualmente todos los sistemas permiten esta característica, solo que la facilidad para realizarlo es diferente.

Que es el bonding?

El bonding es la unión de diferentes tarjetas de red para tratarlas como una sola, uniendo sus velocidades de red. Por ejemplo, si tenemos un equipo con dos interfaces Gigabit y las conectamos a la misma red, podemos generar un bond para unir lógicamente las interfaces, con lo que la velocidad real del equipo serian 2 Gigabit. De esta manera, aumentamos el SPOF de red, permitiendo alta disponibilidad.

Que es un clúster?

Hemos hablado muchas veces de clúster y de que los necesitamos para ofrecer alta disponibilidad, pero nunca explicado que son exactamente…

Un clúster en informática se refiere a un conjunto de equipos que se comportan como un único equipo. Los clústeres los podemos clasificar según sus características:

  • Clúster de Alto Rendimiento o hight performance computing cluster son clústeres que ejecutan tareas con una gran necesidad computacional o de memoria. Este tipo de tareas suelen requerir bastante tiempo del clúster.
  • Clúster de Alta Disponibilidad o hight availabilty computing clúster son clústeres que ofrecen disponibilidad por encima de todo, con software de detección de fallos y hardware tolerante a SPOF.
  • Clúster de Alta Eficiencia o hight throughtput computing clusters son clústeres en los que su objetivo es la realización de la mayor cantidad de tareas en el menor tiempo posible.

Que es un balanceador de carga tolerante a fallos?

Un balanceador de carga tolerante a fallos es un sistema para ofrecer redundancia y alta disponibilidad de servicios haciendo que estos actúen como uno solo. Por ejemplo en un servicio web pueden haber varios equipos detrás ofreciendo el servicio y el balanceador de carga repartirá el trafico según varios parámetros establecidos, como carga del sistema, tipos de cliente, etc.. La tolerancia a fallos viene cuando un nodo de servicio cae, con lo que el balanceador de carga automáticamente reajusta las peticiones a servidores activos para evitar cortes de servicio que pudieren reducir el SLA.

Que es RoundRobin?

RoundRobin es un algoritmo para seleccionar en un grupo de elementos el orden de procesamiento de estos. Clúster, esto se utiliza para balancear las redes repartiendo equitativamente mediante un protocolo ignorando el estado de los servidores.

Que es el LVS?

LVS son las siglas de Linux Virtual Server, es un sistema de alta escalabilidad y alta disponibilidad construido sobre un clúster de servidores físicos. La arquitectura diseñada es totalmente transparente a los usuarios y los usuarios sienten que están tratando por un único servidor final.

Que es Heartbeat?

El heartbeat es un daemon que permite a clientes de clústeres el conocer el estado de los servicios del mismo para así poder controlar que se esté dando una alta disponibilidad.


Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies. ACEPTAR

Aviso de cookies