L’implementazione di un cluster distribuito geograficamente è una strategia di ridondanza avanzata che consente di aumentare l’affidabilità e la continuità operativa di un’infrastruttura IT.

Si realizza dislocando nodi in diverse ubicazioni fisiche, spesso in città o regioni diverse. Questa configurazione è ideale per garantire la resilienza e la disponibilità continua dei servizi, riducendo il rischio di perdita di dati e di interruzioni dovute a eventi catastrofici locali.

7.1 Numero Minimo di Nodi

Un cluster geograficamente distribuito richiede un numero minimo di nodi e di siti per garantire la funzionalità e la resilienza. Il numero esatto dipende dalla complessità dell’ambiente e dalle politiche di ripristino aziendali, ma di solito è necessario un minimo di tre nodi distribuiti tra almeno tre sedi diverse. Questo permette di implementare una maggioranza di nodi in caso di divisione geografica. Come per il numero minimo di nodi, anche le sedi che ospiteranno i nodi dovranno essere di numero dispari maggiore di 2. Valgono, dunque, le stesse considerazioni fatte nel capitolo dove è stato affrontato l’argomento del quorum.

7.2 Connettività Affidabile

Una connettività di rete affidabile tra i nodi è essenziale. Questa connessione dovrà essere ottenuta tramite linee Internet dedicate, collegamenti VPN sicuri o reti MPLS (Multiprotocol Label Switching). La bassa latenza e la larghezza di banda adeguata sono fondamentali per garantire prestazioni ottimali e tempi di ripristino rapidi.

7.3 Il networking tra i nodi

Come per una soluzione implementata localmente, anche un cluster geograficamente distribuito dovrà avere i nodi interconnessi l’uno all’altro. Questo comporterà che ogni sede dovrà essere connessa alle altre mediante connessioni a bassa latenza. È dunque facile notare che al crescere del numero delle sedi, le connessioni tra di esse saranno sempre più numerose. Di seguito uno schema esemplificativo dove i cerchi rappresentano le sedi e i segmenti rappresentano le connessioni tra le sedi.

Cluster - Il networking tra i nodi

Come si può notare il numero di connessioni aumenterà esponenzialmente con l’aumentare del numero delle sedi.

Per il calcolo del numero di connessioni tra sedi, si sta effettivamente riferendo a una formula combinazionale. Il numero di connessioni è dato dalla formula:

 Cluster - Per il calcolo del numero di connessioni tra sedi

Dove n è il numero di sedi.

N. di sedi Connessione tra le sedi
3 3
4 6
5 10

La connessione tra le sedi può rappresentare un limite all’implementazione di questa tecnologia che prevede la distribuzione geografica delle risorse, per via della difficoltà ad ottenere un’ampiezza di banda adeguata e basse latenze.

Per i cluster geograficamente distribuiti, distribuiti su molte sedi, si dovrebbe considerare l’uso di Global Load Balancers (GLB) per distribuire il traffico tra diverse regioni. Questo può fornire un ulteriore livello di resilienza, distribuendo il carico non solo tra i nodi in una singola posizione, ma tra diverse posizioni geografiche.

7.4 Tipi di Replica tra i nodi delle sedi

La replica dei dati tra i nodi delle varie sedi è il cuore di un cluster distribuito. Ecco alcuni approcci comuni di cui abbiamo già approfondito gli aspetti nel capitolo dedicato precedente.

7.5 Replica Sincrona

La replica sincrona implica che i dati vengano scritti su tutti i nodi contemporaneamente prima che una conferma venga inviata al nodo mittente. Questo garantisce che i dati siano coerenti tra i nodi, ma può aumentare la latenza delle operazioni di scrittura a causa della necessità di attendere la conferma da tutti i nodi. Tipicamente questa tecnologia è ad oggi difficilmente (praticamente impossibile) implementabile per via delle tecnologie di telecomunicazione che al momento della stesura di questo testo non sono ancora mature o economicamente accessibili.

7.6 Replica Asincrona

Nel caso della replica asincrona, i dati vengono scritti su un nodo e successivamente replicati in altri nodi. Questo riduce la latenza delle operazioni di scrittura, ma potrebbe comportare la perdita di alcuni dati in caso di guasto improvviso. Questa è la tecnologia maggiormente utilizzata.

Nel contesto della replica dei dati, è anche importante conoscere il concetto di “latency budget”. Si tratta del massimo ritardo che si può tollerare per la replicazione dei dati tra i nodi, soprattutto in un ambiente geograficamente distribuito. Questo sarà un fattore limitante nella scelta tra replica sincrona e asincrona.

Cluster Iperconvergente Proxmox VE 3 Nodi
Cluster Proxmox VE 2 Nodi