Avanti Indietro Indice

5. Fare il test

Se pensate di usare il RAID per avere tolleranza ai guasti (fault-tolerance), potreste voler testare il vostro sistema per vedere se funziona veramente. Ora, come simulare un guasto?

In breve, non potete, eccetto forse che facendo passare un ascia infuocata attraverso il disco di cui volete simulare il guasto. Non potrete mai sapere cosa accadrà quando un disco cessa di funzionare. Esso potrebbe bloccare elettricamente tutto il bus a cui è collegato, rendendo tutti i dischi su quel bus inaccessibili. Sebbene non mi sia noto nessun accadimento del genere. Il disco potrebbe solo notificare un guasto di lettura/scrittura al layer SCSI/IDE, il che permetterà al layer RAID di gestire questa situazione in modo positivo. Questo è per fortuna il modo in cui le cose vanno di solito.

5.1 Simulare il malfunzionamento di un disco

Se volete simulare il guasto di un disco, scollegatelo. Dovreste farlo per mezzo del pulsante di spegnimento. Se siete interessati a testare se i vostri dati possano sopravvivere con un disco in meno del numero solito, non c'è problema nel fare l' "hot-plug cowboy" ora. Spegnete il sistema, scollegate il disco e fate un nuovo boot.

Controllate nel syslog e date un'occhiata a/proc/mdstat per vedere cosa sta facendo il RAID. Funziona?

Ricordate, voi dovete far girare il RAID-{1,4,5} sul vostro array per poter sopravvivere al guasto di un disco. Linear-raid o RAID-0 perdono tutto quando un disco si guasta.

Quando avrete di nuovo collegato il disco (con la macchina spenta, naturalmente, ricordate), potete agggiungere il ``nuovo'' dispositivo al RAID nuovamente, con il comando raidhotadd.

5.2 Simulare il danneggiamento dei dati

Il RAID (sia hardware- che software-), considera che se la scrittura su un disco non genera un errore, allora la scrittura è avvenuta correttamente. Allora, se il vostro disco danneggia i dati senza generare errori, tutti i vostri dati saranno corrotti. Questo naturalmente è molto spiacevole che accada, ma è possibile e porterebbe ad avere un filesystem corrotto.

Il RAID non può e non è progettato per controllare il danneggiamento dei dati sui supporti. Perciò non ha alcun senso il corrompere di proposito i dati (utilizzando dd per esempio) su un disco per vedere come il sistema RAID riesce a gestire questa situazione. E' molto probabile (a meno che si corrompa il RAID superblock) che il RAID layer non si accorga di niente riguardo al danneggamento, ma che il vostro filesystem sul dispositivo RAID sia danneggiato.

Questo è il modo in cui le cose si suppone che funzionino. Il RAID non è una garanzia per l'integrità dei dati, esso ci permette solo di conservare i nostri dati se un disco si blocca (con i livelli RAID maggiori od uguali ad 1, naturalmente).


Avanti Indietro Indice