Domanda

Sono interessato a strategie di fail-over cross-colo per le applicazioni Web, in modo tale che se il sito principale fallisce gli utenti arrivano senza problemi al sito di fail-over in un altro colo.

Il lato applicativo delle cose sembra essere per lo più capito con un'impostazione del database master-slave tra le colonne e i servizi progettati per il recupero e per essere in grado di raccogliere a metà flusso. Sto cercando di capire la strategia per spostare il traffico dal sito principale al sito di failover. Il failover DNS, anche con TTL bassi, sembra avere un latenza.

Quali strategie consiglieresti per spostare rapidamente il traffico tra le colonne, supponendo che i server nel colo principale non siano raggiungibili?

Se hai altre interessanti esperienze / parole di saggezza sul failover cross-colo, mi piacerebbe sentire anche quelle.

È stato utile?

Soluzione

I meccanismi basati su DNS sono problematici, anche se si inseriscono TTL bassi nei file delle zone.

La ragione di ciò è che molte applicazioni (ad esempio MSIE) mantengono le loro cache che ignorano il TTL. Altri software eseguiranno un singolo gethostbyname () o una chiamata equivalente e memorizzeranno il risultato fino al riavvio del programma.

Ancora peggio, è noto che molti server DNS ricorsivi di ISP ignorano i TTL al di sotto del loro minimo preferito e impongono i loro TTL più elevati.

Alla fine, se il sito deve essere eseguito da entrambi i data center senza modificando il suo indirizzo IP, è necessario esaminare le disposizioni per " Multihoming " tramite annunci di route BGP4 globali.

Con il multihoming è necessario ottenere almeno un netblock / 24 di "quot indipendente dal provider" (alias "quot" PI "), quindi lo spazio degli indirizzi IP deve essere annunciato sulla tabella di routing globale dal sito di backup solo se il sito principale non è in linea.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top