¿Cómo se compara HP (Tandem) Non stop con los clústeres de Linux?

https://stackoverflow.com/questions/271514

06-07-2019
|

Pregunta

Los sistemas HP NonStop (anteriormente conocidos como '' Tandem '') son conocidos por su alta disponibilidad y confiabilidad, y por su mayor precio.

¿Cómo se comparan los clústeres basados ??en Linux o Unix con ellos, en estos aspectos y en otros?

Solución

En una máquina tolerante a fallas, la tolerancia a fallas se maneja directamente en hardware y transparente para la aplicación. La programación de un clúster requiere que maneje explícitamente la tolerancia a fallas en la aplicación.

En la práctica, una arquitectura de aplicación en clúster es mucho más compleja de construir y propensa a errores que una aplicación creada para una plataforma tolerante a fallas como NonStop. Esto significa que existe un margen mucho mayor para la falta de fiabilidad debido a errores de aplicación, ya que la Bolsa de Londres descubrió el camino difícil. Tenían un sistema basado en Tándem establecido, que era una arquitectura bastante común para las aplicaciones comerciales de bolsa. Su nuevo CEO tuvo la brillante idea de que Microsoft era el camino a seguir y una gran consultora construyó un sistema .Net basado en un clúster de 120 servidores.

El problema con las aplicaciones en clúster es que las fallas pueden correlacionarse. Si existe un error de aplicación o configuración en el sistema, generalmente se replicará en todos los nodos. Esto significa que puede obtener una única situación o evento que puede eliminar todo el clúster. La complejidad adicional de las aplicaciones en clúster las hace más propensas a desarrollar y desplegar errores, lo que aumenta las probabilidades de que esto suceda. Un sistema agrupado basado en (por ejemplo) Linux y J2EE es vulnerable a los mismos tipos de modos de falla.

En mi humilde opinión, esta es una gran ventaja de las arquitecturas de mainframe de estilo antiguo. Varios proveedores (IBM, HP, DEC y probablemente varios otros en los que no puedo pensar) hicieron sistemas tolerantes a fallas. El modelo de programación subyacente para este tipo de sistema es algo más simple que un servidor de aplicaciones en clúster de n niveles. Esto significa que hay relativamente poco para salir mal y para un esfuerzo determinado puede lograr un sistema más confiable. Una sorprendente cantidad de arquitecturas más antiguas todavía están vivas y bien y viven bastante cómodamente en sus nichos de mercado. IBM todavía vende muchas máquinas de las series Z e I; Unisys todavía fabrica las series A y 2200; VMS y NonStop siguen vivos dentro de HP. Las ventas de estos sistemas no son solo para clientes existentes; por ejemplo, un sistema de suscripción comercial (GENIUS) se ejecuta en ISeries y sigue siendo un líder de mercado en este nicho con nuevos despliegues mientras escribo esto. La aplicación ha sobrevivido a dos intentos de reescribirla (1 en Java y 1 en .Net) que conozco y la plataforma 'Old School' realmente no parece estar obstaculizando su estilo.

Todavía no pondría en corto ningún vendedor de raspadores de pantalla ...

Gray & amp; Procesamiento de transacciones: conceptos y técnicas de Reuter es algo seco y académico, pero tiene un Buen tratamiento de la arquitectura de sistemas tolerantes a fallos. Uno de los autores fue un jugador clave en el diseño de los sistemas de Tandem.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow