Storie dalla Sala Macchine


Home Page | Commenti | Articoli | Faq | Documenti | Ricerca | Archivio | Storie dalla Sala Macchine | Contribuire | Imposta lingua:en it | Login/Register


Il Backup Ca$$o!!!

Giornatina interessante oggi... andiamo con ordine.

Rewind di circa 2 mesi

Siamo in ruinione con $sysadmingiovaneerincoglionito (SGR) che sta presentando uno degli ultimi ritrovati della tecnologia moderna: High-Availability Cluster.

SGR- Yada yada yada DRBD, blah blah yada Clustering, Yada yada blah Hearthbeat, blah blah yada, High-availability, yada blah yada, raid! yada yada...
IO - Si, si.. tutto bello, ma un backup viene fatto di sta roba?
SGR- Ma non serve il backup! Yada yada DRBD! Yada yada Raid! yada yada high-availability! Yada...
IO - Io dico che un backup serve lo stesso, tanto per stare sul tranquillo.
SGR- ...yada yada DRBD! Yada yada Raid! Yada yada...
IO - Sivvabbe'...

Fast-forward ad oggi

Arrivo in ufficio e noto che SGR pare sulle spine. Non ci metto molto a capire che l'High-Availability cluster e' abbastanza 'down'... poco dopo SGR balza in bicicletta e si dirige alla volta dell'hosting center.

Vabbe', non e' un problema mio quindi...

la scena ora cambia e ci ritroviamo davanti al rack (aperto) presso l'hosting provider, dove SGR sta tentando di far ripartire il suo "high availability cluster". Cluster composto da due server: Server A (SA) e Server B (SB).

SA - tutto funziona per il meglio! PANIC: FATAL: Memory parity error on the motherboard Parity error at address 0xNNNNNNNN, tutto funziona per il meglio! PANIC: FATAL: Memory parity error on the motherboard Parity error at address 0xNNNNNNNN, tutto funziona...
SGR - ca$$...pork...mign... molla il foxxuto DRBD!
SB - Inizio procedura di takeover... procedura fallita.
SGR - mortacc...dannazz...
SA - tutto funziona per il meglio! PANIC: FATAL: Memory parity error on the motherboard Parity error at address 0xNNNNNNNN, tutto
SGR - clicckety-click heartbeat stop!
SA - tutto funz...HUUUUUURRKKKK...

A questo punto SA ha finalmente mollato il controllo del DRBD, che (imho) tanto sano non era piu'... ed SB ci e' balzato sopra come un'avvoltoio su una bella bistecca sanguinolenta...

SB - Procedura di takeover! Controllo stato DRBD... DRDB in stato inconsistente, inizio procedura di pulizia. Rimossi 60 files... 90 files... 200 files...

SGR, visto che SB stava zappando via files peggio che un tosaerba automatico, ha reagito schissando il tasto di reset... purtroppo pero' ha schissato il tasto di reset del server sbagliato, provocando il risveglio di SA.

Risvegliatosi dal torpore, SA ha scippato via il DRBD dalle sgrinfie di SB ed ha proceduto, seduta stante, a tostarlo come non mai, per poi collassare in cumulo di 'PANIC ERROR'. SB, vistosi privato del suo giocattolo, ha probabilmente pensato "vabbe', ma allora io che ci sto affare qui'?". Ed ha subitaneamente dato le dimissioni. Il che si traduce con uno schermo pieno di "Data error (cyclic redundancy check)" ed a terminare con un cursore non lampeggiante sul fondo...

Dal canto suo, SGR, resosi conto che il cluster era probabilmente tostato, e' scappato a nascondersi nel cesso dal quale e' riemerso solo un paio d'ore dopo. O almeno, questo e' cio' che penso io, dato che, dopo che le due macchine hanno completamente smesso di rispondere non abbiamo piu' avuto sue notizie per un paio d'ore.

cell.. cell.. cellofon...

IO - Cosa?
SGR- Hummmm... sono SGR...
IO - Si, che c'e'?
SGR- Abbiamo un modo per trasportare due server da qui all'ufficio?
IO - Ce ne sono tanti di modi, hai l'autorizzazione dell'hosting center?
SGR- ?? in che senso??
IO - Nel senso che non puoi rimuovere niente senza informare PRIMA l'hosting center.
SGR- Ma sei sicuro?
IO - Abbastanza sicuro, ma se vuoi verificare da te quanto e' buona la mira della guardia armata fai pure...
SGR- Hemmm... no... ti richiamo...

Dopo un po' il telefono risuona, ed e' sempre SGR che e' riuscito ad accalappiare al telefono qualcuno con la capcita' di inviare un fax all'hosting e dare l'autorizzazione necessaria. Cosi' salto in macchina e vado la'.

Li' scopro che SGR ha avuto l'ottima idea (notare il velato sarcasmo) di risolvere il problema di collegarsi ai suoi server infilando una tastiera ed un monitor dentro al rack. Il che non sarebbe un grosso problema se non fosse che li ha infilati alla base del rack. Cosi' l'unico modo per usare tale tastiera e monitor e' di infilarsi dentro al rack sdraiati sullo stomaco. Ed il che potrebbe spiegare il motivo per cui ha schissato il tasto sbagliato al momento sbagliato...

Cosi' smontiamo sti due cosi e li infiliamo in macchina.

IO - (guidando verso l'ufficio) Ce lo hai un backup ti sta roba?
SGR- Hemmm... ma li abbiamo usati solo per un paio di mesi...
IO - Ce lo hai un backup?
SGR- Ma.... yada yada... DRBD... yada yada... Raid...yada yada... High Availability...
IO - (tagliando corto ed imboccando la tangenziale) Ripeti con me: "Il backup e' Bello, Il Backup e' Buono, Il Backup mi fa dormire sereno alla notte..."

Davide
17/01/2009 14:17

Precedente Successivo

I commenti sono aggiunti quando e soprattutto se ho il tempo di guardarli e dopo aver eliminato le cagate, spam, tentativi di phishing et similia. Quindi non trattenete il respiro.

2 messaggi this document does not accept new posts

RaId

RaId Di RaId postato il 10/11/2008 08:33

eeehhhh il mantra del bravo sysadmin... quando mai impareranno???

scassamarroni

scassamarroni Di scassamarroni postato il 21/12/2008 19:47

a me SGR m'ha fatto un po' pena perņ...


a me no


Precedente Successivo


Il presente sito e' frutto del sudore della mia fronte (e delle mie dita), se siete interessati a ripubblicare uno degli articoli, documenti o qualunque altra cosa presente in questo sito per cortesia datemene comunicazione (o all'autore dell'articolo se non sono io), cosi' il giorno che faccio delle aggiunte potro' avvisarvi e magari mandarvi il testo aggiornato.


Questo sito era composto con VIM, ora e' composto con VIM ed il famosissimo CMS FdT.

Questo sito non e' ottimizzato per la visione con nessun browser particolare, ne' richiede l'uso di font particolari o risoluzioni speciali. Siete liberi di vederlo come vi pare e piace, o come disse qualcuno: "Finalmente uno dei POCHI siti che ancora funzionano con IE5 dentro Windows 3.1".

Web Interoperability Pleadge Support This Project
Powered By Gojira