CreateYourVPN Academy
Corso: come funziona

Monitoraggio dei server e rete mesh

Come CreateYourVPN tiene sotto controllo lo stato dei server: auto-controlli, una rete mesh di controlli reciproci tra server e l'occultamento automatico dei server irraggiungibili agli utenti.

Un server può deluderti nel momento peggiore possibile: un servizio va in crash, il provider riavvia la macchina — o, peggio ancora, il server viene bloccato nel paese di un utente e smette di essere raggiungibile pur essendo tecnicamente attivo. I tuoi utenti non dovrebbero mai accorgersi di nulla di tutto ciò. Questa lezione tratta come CreateYourVPN sorveglia i tuoi server e cosa succede quando uno di essi ha dei problemi.

Due livelli di controlli

Il sistema osserva ogni server da due angolazioni.

1. Il server controlla se stesso

Ogni pochi minuti, ciascun server invia un rapporto: il listener del traffico sulla porta 443 è attivo, e il servizio VPN è in esecuzione? Le metriche della lezione 3 arrivano con lo stesso rapporto. Se il rapporto dice "non sto bene", il server ottiene lo stato "Server non disponibile". Se i rapporti smettono del tutto di arrivare, lo stato diventa "Nessun dato dal server" — la macchina potrebbe essere spenta o aver perso la rete.

2. I server "bussano" l'uno all'altro

Gli auto-controlli non possono cogliere il caso più subdolo: un server crede di stare bene, ma dall'esterno non può essere raggiunto — per esempio, il suo IP è stato bloccato. Ecco perché tutti i tuoi server sono uniti in una rete mesh di controlli reciproci: ogni server prova regolarmente a raggiungere ogni vicino — proprio come farebbe l'app di un utente.

Da lì, subentra un "voto":

  • Un singolo tentativo fallito non significa nulla — la rete potrebbe aver appena avuto un intoppo. Contano solo le serie prolungate di fallimenti.
  • Un server viene contrassegnato "Non raggiungibile dai tuoi server" solo quando diversi server indipendenti falliscono costantemente nel raggiungerlo — l'opinione di un solo server non è un verdetto.
  • C'è anche una protezione contro il "testimone inaffidabile": se un server improvvisamente dichiara di non riuscire a vedere metà dei suoi vicini, il problema è probabilmente il suo — e i suoi voti vengono scartati.

Questo è esattamente lo schema che coglie i blocchi: se un server viene bloccato in un paese in cui vivono i tuoi altri server, i vicini di quel paese smetteranno rapidamente di raggiungerlo, si forma un quorum, e il sistema contrassegna il server come irraggiungibile. Nel frattempo, i server nei paesi senza il blocco continueranno a vederlo — e la differenza di opinioni rende evidente il quadro.

Cosa succede a un server problematico

Gli stati confluiscono direttamente nel bilanciamento: i server con gli stati "Server non disponibile" e "Non raggiungibile dai tuoi server" vengono tirati fuori dalla rotazione — non vengono inviate loro nuove connessioni, e negli abbonamenti degli utenti il loro posto viene preso da server sani delle stesse route.

Allo stesso tempo, il sistema è prudente — è costruito sul principio "non fare danni":

  • Una route non viene mai lasciata vuota. Se ogni server di una route risulta "cattivo", il sistema servirà agli utenti la migliore opzione disponibile piuttosto che una lista vuota — altrimenti le app deciderebbero che i server sono spariti e li cancellerebbero.
  • Il silenzio non è un verdetto. Lo stato "Nessun dato dal server" non rimuove da solo un server dalla rotazione: senza dati aggiornati, il sistema non fa mosse azzardate.

Tutto si autoripara

Nessuno degli stati "resta appiccicato" per sempre — lo stato viene ricalcolato dai dati aggiornati:

  • il server invia di nuovo un rapporto sano → "Server non disponibile" viene revocato;
  • i vicini iniziano di nuovo a raggiungerlo → la serie di fallimenti si azzera, e il marchio "Non raggiungibile dai tuoi server" scompare;
  • i rapporti riprendono → "Nessun dato dal server" scompare.

Ripara il server (o attendi che venga sbloccato) — e si rimette da solo in servizio. Nessun "riaccendilo tu manualmente".

Dove vederlo nel pannello

Apri la scheda di qualsiasi utente → la sua lista di server: accanto a ogni server c'è un puntino di stato, e quando qualcosa non va — una didascalia con il motivo: "Server non disponibile", "Non raggiungibile dai tuoi server" (incluso quanti dei tuoi server non riescono a vederlo), o "Nessun dato dal server". Segnali indiretti compaiono anche sulle schede dei server: un'etichetta "obsoleto" sulle metriche e "Nessun dato — agente non risponde".

I controlli mesh sono estremamente parsimoniosi: sono minuscoli tocchi di sonda con un rigido limite di volume giornaliero — non hanno alcun impatto sul traffico o sulle prestazioni dei tuoi server.

Punti chiave

  • Due livelli di controllo: un server controlla se stesso, e i suoi vicini mesh lo controllano dall'esterno.
  • I blocchi vengono colti da un "voto" di diversi server — nessun panico per singhiozzi occasionali.
  • I server problematici escono dalla rotazione; gli utenti passano silenziosamente a quelli sani.
  • Tutto si autoripara: nel momento in cui un server torna in vita, si riunisce automaticamente.

Prossima lezione

L'infrastruttura sa come ripararsi da sola, ma c'è una cosa che vale la pena proteggere separatamente — la tua base utenti.

On this page