Portál AbcLinuxu, 2. května 2025 05:38
RAID 1 nasazujeme, abychom nepřišli o data, pokud nám selže disk. Existují ale mnohem zákeřnější hrozby, než selhání disku.
Nedávno jsem se kvůli jednomu incidentu začal obávat, že se můj disk se spoustou nezazálohovaných dat připravuje na cestu do věčných lovišť. Nakoupil jsem tedy dva stejně velké disky, připojil je přes PCI SATA řadič s čipsetem SiI 3114, rozdělil je a vytvořil na nich sw raid 1. Data jsem na toto pole úspěšně zálohoval.
K očekávanému kolapsu původního disku nedošlo, obavy o jeho ztrátu se rozplynuly, a tak jsem začal přemýšlet, co s tím vším místem navíc. Prozatím jsem se rozhodl na něm ponechat zálohy všeho, co jsem umístil do raidu. Velmi moudrá volba.
Za pár týdnů jsem zjistil, že md5 součty souborů nějak nesouhlasí s původními zálohami. Větší soubory na raidu měly odlišné součty. Poruchu některého z disků jsem rychle vyloučil, operace v rámci každého z disků byly prováděny v přádku. Problém nastával pouze při operacích nad raidem. Šestiportový (4 int., 2 ext.) PCI SATA řadič to prostě nějak nezvládal, ačkoliv jsem obsadil pouze dva porty.
Problém jsem vyřešil přehozením jednoho z disků na jiný řadič, ale data na raidu již byla plná drobných chyb. Při opakovaném čtení stejného souboru jsem dostával různé výsledky (podle toho, ze kterého disku se ten či onen fragment souboru četl). Naštěstí jsem reálně přišel jen o naprosté minimum dat, neboť jsem měl zálohy skoro všeho na původním disku. Moje přehnaná opatrnost se vyplatila.
Když zvážím, co všechno se mohlo stát, kdybych si toho nevšiml, běhá mi mráz po zádech. Když selže disk nebo souborový systém, tak si toho člověk velmi rychle všimne, ale drobných chyb při čtení a zápisu ne, alespoň ne hned. A až si toho konečně všimne, chvíli trvá, než objeví pravou příčinu. Já jsem podezříval jednu paměťovou kartu, že přestává fungovat a vrací mi porušené fotky, zatímco celou dobu byl příčinou raid, na který jsem je ukládal.
Bral jsem v úvahu lecos - kolaps jednoho z disků nebo souborového systému, omylem puštěné "rm -rf /
" (chattr +i
je neocenitelným pomocníkem), ale něco takového tedy ne. Až do této chvíle. Od teď budu md5sum
používat mnohem častěji...
Tiskni
Sdílej:
data budu zrcadlit cronem prostřednictvím rsync jednou denně.takže v podstatě zase online zálohování... To není šťastná volba
RAID 1 nasazujeme, abychom nepřišli o data, pokud nám selže disk. Existují ale mnohem zákeřnější hrozby než selhání disku.
Například uživatelé… :-)
Ten můj Kouwell má 3512, tak doufám že to je ok. Náhodou si něco o něm neslyšel? Jen jestli ho mám střelit a koupit Adaptec se kterým jsem na serveru moc spokojený :) MD5 součty zatím sedí, ale nemám tu žádný 100GB soubor abych to vyzkoušel pořádně :(
Taky je možná otázka, jestli pisatel použlil soft raid v linuxu nebo softraid na tom řadiči.
dd if=/dev/urandom of=testfile bs=1M count=1500
Pozor na diskovou cache, tj. testovací soubor se prověřovat čtením z disku, ne z paměti, kam se samozřejmě při práci natáhne, pokud není dost veliký. Já vytvářel testovací soubory o velikosti 1,5G.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.