Bezpečnost dat na PC především

3.1.2006 00:24 | Přečteno: 3906× | Ochrana dat | poslední úprava: 4.1.2006 03:06

Cíl: Vytvořit RAID na naší workstation, aby byla zajištěna ochrana dat při havárii jednoho z disků a aby se po havárii dalo okamžitě pokračovat v práci.

Trochu teorie

RAID neboli Redundant Array of Inexpensive Disks, česky snad pole s nadbytečnými levnými disky, je takový způsob zápisu dat, aby se zaručila jejich bezpečnost i při havárii disků, anebo aby se zvýšila rychlost zápisu a čtení. V nejlepším případě obojí. Bez hardwarového řadiče lze úspěšně provozovat Linear RAID, RAID 0, RAID 1, případně RAID 10, které CPU prakticky nezatěžují. RAID 5 a podobné s počítáním XOR bitů kladou při výpočtu parity už vyšší nároky na CPU a pravděpodobně bych upřednostňoval hardwarové řešení.

Než se budeme věnovat jednotlivým typům RAID, zdůrazním, co RAID neumí. RAID neochrání vaše data ani před uživatelovou neopatrností, ani před chybně napsaným software, ani před zlým úmyslem. RAID pomůže jen při havárii disku, takže svá data musíte stále pravidelně zálohovat. Jak zálohovat si povíme příště.

Linear mode

Disky jsou logicky přidávány za sebe, čímž vznikne jeden velký logický disk. Disková kapacita tak zůstane zachována, ale data se ukládají stále v jedné kopii, takže při havárii alespoň o část z nich přijdeme.

RAID 0 (stripping)

Alespoň dva disky jsou zkombinovány do jednoho velkého disku. Data jsou na ně zapisována střídavě v pruzích (stripes). Disková kapacita tak zůstává zachována a zvýší se rychlost čtení i zápisu. Data jsou však zapisována jen v jedné kopii a navíc v pruzích, takže při havárii jednoho disku přijdeme o všechna data. Pravděpodobnost havárie s množstvím takto zapojených disků přirozeně roste.

RAID 1 (mirroring)

Na alespoň dva disky se zapisují stejná data. Disková kapacita se tak sníží v nejlepším případě na polovinu, za to jsou všechna data ukládána ve více kopiích. Rychlost čtení se zvýší, neboť stejná data mohou být čtena z více disků zároveň.

RAID 10 (mirroring + striping)

RAID 10 vyžaduje alespoň čtyři disky, přičemž kombinuje výhody RAID 1 a RAID 0. Data jsou zapisována do RAID 0 pole (stripping), jehož jednotlivé disky jsou tvořeny RAID 1 poli (mirroring). Zapojení RAID 1+0 je výhodnější než zapojení RAID 0+1. Pokuste se zamyslet proč.

Požadavky

Toliko obecné teorie a nyní přejdeme k praxi. Co budeme pro začátek potřebovat? Dva SATA disky a fukční v jádře zprovozněný SATA řadič. Analogicky lze postupovat i s PATA disky. Co naopak potřebovat nebudeme? Podporu RAID od základní desky.

Poznámka: Na většině moderních desek bývá integrován RAID řadič. V naprosté většině případů se však nejedná o pravý hardwarový RAID, ale o softwarový RAID se softwarem uloženým v BIOS. Linux si s některými takovými RAID řadiči rozumí díky projektu dmraid, přesto vám doporučuji použít nativní RAID Linuxu. Vezměte v potaz třeba skutečnost, že jednou budete měnit základní desku, ať již dobrovolně, či z donucení (po havárii). Jistě si dokážete představit, v jaké situaci se pak ocitnete při používání integrovaného řadiče na RAID. V případě nativního RAID Linuxu žádné potíže nehrozí. Výkonostně jsou obě řešení srovnatelná.

Rozdělení disků

Do softwarového RAID budou zapojeny dva SATA disky Hitachi Deskstar 160 GB. První věc, kterou musíme s disky provést, je vytvoření tabulky oddílů (partition table). RAID se totiž vytváří nad jednotlivými oddíly. Z mnoha důvodů, které vysvětlím nakonci článku, jsem se rozhodl pro rozdělení ukázané ve výpisu. Vaše rozdělení se může lišit podle vašich možností a potřeb. Oba disky (sda a sdb) však musí být rozděleny naprosto stejně. U všech oddílů až na swap nastavíme typ FD (Linux raid auto), u oddílů se swapem typ 82 (Linux swap). Označení oddílů typem FD místo 83 (Linux) je pro správnou funkci RAID nezbytné. Jádro totiž při startu automaticky sestavuje z takto označených oddílů RAID zařízení.

Vytvoření RAID zařízení

Teď je nejvhodnější doba pro instalaci mdadm (multiple device admin), nástroje, umožňujícího správu RAID zařízení v Linuxu.

Hned po instalaci se můžeme pustit do vytváření vlastních RAID zařízení:

Aby jádro mohlo s RAID zařízeními pracovat, musí být pro ně zakompilována podpora (Device Drivers / Multi-device support (RAID and LVM)). Já jsem ji měl zakompilovanou přímo v jádře, vy ji můžete mít jako modul md. Po natažení modulu či rebootu (je-li podpora zakompilovaná přímo v jádře), by se měly v /dev objevit zařízení md0, md1… Jádro automaticky a ve správném pořadí sdruží všechny oddíly, které mají nastavený typ FD. Za správné sdružení odpovídá tzv. persistent-superblock, který je zapsán na každém zařízení tvořícím RAID.

Pro jistotu zkontrolujeme, jestli běží vše, jak má: cat /proc/mdstat. Je-li vše v pořádku, můžeme vytvořit na zařízeních /dev/md0, /dev/md1… souborové systémy podle našich preferencí obvyklým způsobem, např. mkfs.ext2 /dev/md0. Na sda3 a sdb3 nezapomeneme vytvořit swap příkazem mkswap /dev/sda3, resp. mkswap /dev/sdb3.

Grub a bootování

Zařízení md0 připojíme třeba do /mnt/tmp-boot a nainstalujeme na něj jádro, které podporuje RAID (Device Drivers / Multi-device support (RAID and LVM)). Z pochopitelných důvodů (adresář / je v RAID) musí být tato podpora zakompilována přímo do jádra, modul nestačí.

Dále na stejné místo nainstalujeme grub a zavaděč zapíšeme do MBR obou disků. K tomu použijeme následující příkazy v grub-shellu:

Zbytek systému jsem překopíroval na příslušné oddíly ze starého disku příkazy cp -ax. Pokud se vám stane jako mě, že jádro naběhne, ale ještě před initem se systém resetuje, zapomněli jste vytvořit adresář /dev a v něm základní soubory pro zařízení. Před rebootem musíme ještě adekvátně upravit nový /etc/fstab.

Reboot

Tak a rebootujeme do nového RAID pole. Pokud jsme na nic nezapomněli, tak systém naběhne hned na první pokus.

Simulace havárie disku

Chceme-li se přesvědčit, že se nám podařil splnit cíl, tedy že po havárii jednoho z disků jsme schopni okamžitě pokračovat v práci, tak jeden disk odpojíme a pokusíme se nabootovat.

Objeví se množství chybových hlášek, ale systém nabootuje. Z /etc/fstab vyřadíme automatické připojení oddílů, na kterých je RAID 0, stejně nám jsou nyní k ničemu, a pokusíme se nabootovat znovu. Počet chybových hlášení by měl klesnout a systém by měl naběhnout bez problémů.

Disk opět připojíme a nabootujeme. Jádro hlásí, že oddíly nejsou synchronizovány. Výpisem /proc/mdstat zjistíme, kteréže oddíly se používají a ostatní se s nimi pokusíme synchronizovat. K tomu použijeme příkaz mdadm /dev/md1 -a /dev/sda2. Takhle přidáme do příslušných RAID 1 zařízeních všechny chybějící oddíly. Mezitím můžeme výpisem /proc/mdstat sledovat, jak postupuje synchronizace.

Něco více k rozdělení disku

Slovo závěrem

Před rokem jsem si užíval pořádné trable s diskem. Už nikdy nechci zažít tu nejistotu, pokusy o záchranu dat a opakované instalace a konfigurace systému. Od té doby jsem se naučil zálohovat a nyní jsem investoval i do dalšího disku, abych mohl vytvořit RAID. Necelých 2700 Kč je myslím si dobrá investice, i když doufám, že se o její potřebnosti nebudu muset přesvědčovat. Data totiž skutečně patří k tomu nejcennějšímu, co v počítači mám.

Článek si rozhodně nedělal ambice být podrobným průvodcem mezi RAID. Ukázal tu nejjednodušší možnost, jak si na workstation v Linuxu postavit RAID a snad vás i přesvědčil, abyste tak učinili. Článek cudně zamlčel konfiguraci RAID 5, nezmínil se o hot-spare, ani nevyčerpal manuálové stránky man mdadm. Ale to jistě napraví zvídavý čtenář sám. ;-)

Změny

Anketa

Komentáře

proc nepouzit mdadm?

ten grub je take takhle spravne? neco takoveho budu taky delat, ale ... kdybych prisel o sda a potreboval bootvat z sdb ...tak vlastne v te dobe take bude sda ;) , takze ,neni tam treba delat nejake mapovani? pred rokem jsem to delal na dvou strojich, hrozne dlouho mi trvalo prijit na spravny postup, ale pak jsem si to nezapsal :/

Urine should only be green if you're Mr. Spock.

3.1.2006 00:33 Libor Klepac | skóre: 45 | Mýto
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

btw, takhle vypada muj /etc/mdadm/mdadm.conf

DEVICE /dev/sda* /dev/sdb*
ARRAY /dev/md2 level=raid0 num-devices=2 UUID=bb559ba2:d2e1589e:8986872e:5f8ed4b9
   devices=/dev/sda5,/dev/sdb5
ARRAY /dev/md1 level=raid1 num-devices=2 UUID=73fd3e1f:045eccb4:656dc484:d7b5a1ef
   devices=/dev/sda3,/dev/sdb3
ARRAY /dev/md0 level=raid1 num-devices=2 UUID=072208f8:3a9860c3:104e539d:3428df1e
   devices=/dev/.static/dev/sda1,/dev/.static/dev/sdb1

(ty radky devices=neco jsou uz asi zastarale)

viz. vypis

mdadm --detail --scan

Urine should only be green if you're Mr. Spock.

3.1.2006 02:38 Ritchie | skóre: 27 | blog: Ritchie's | Berlin
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

Takže jestli jsem správně pochopil z manu k mdadm, jak pomocí něj se RAID vytvoří:

Do souboru /etc/mdadm.conf zapsat řádek
DEVICE /dev/sda* /dev/sdb*
Pomocí příkazů
mdadm -C /dev/md0 -l 1 -n 2 -c 32 /dev/sda1 /dev/sdb1,
vytvořit RAID na jednotlivých zařízeních
Příkazem
mdadm -s -d >> /etc/mdadm.conf,
dokončit konfigurační soubor

Je to tak prosím správně, abych nevnesl do článku nějakou mýlku?

3.1.2006 00:36 Ritchie | skóre: 27 | blog: Ritchie's | Berlin
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

A proč jo? ;-)

Grub je takhle správně. Když jsem odpojil disk sda, tak jsem bez potíží naběhl na sdb, které v té době bylo sda. Do MBR grubu zapisuju „bootuj ze svého disku”, takže by to fungovat vážně mělo.

3.1.2006 00:44 Libor Klepac | skóre: 45 | Mýto
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

A proč jo?

protoze je raidtab zastaraly?

Grub je takhle správně. Když jsem odpojil disk sda, tak jsem bez potíží naběhl na sdb, které v té době bylo sda. Do MBR grubu zapisuju „bootuj ze svého disku”, takže by to fungovat vážně mělo.

ok, diky za info, az se dostanu k tomu stroji, tak to zkusim ;)

Urine should only be green if you're Mr. Spock.

Moje zkusenosti jako nekoho, kdo instaloval cca. 400 Linuxovych masin s RAIDem: - pominuls naprosto v tom prehledu RAID 5 (jo, ja vim, ze u 2 disku to nema smysl, ale to ani RAID 10, ktery tam uvadis), natoz "moderni" RAID 6 - jak se tady jiz psalo, /etc/raidtab a vubec raid-tools jsou jiz delsi dobu "depracated" - doporucuje se pouzivat JEN mdadm - podle mne je naprosto zbytecne pouzivat TOLIK RAIDu - jen tim riskujes, ze ti nekde dojde misto a bez kompletni reinstalace systemu budes v haji - netusim, na co presne pouzivas /mnt/backup a /mnt/media, ale osobne si myslim, ze backup slouzi jako "meziskladiste" pro backupy (pak nepotrebujes RAID 0 - neni to casove kriticke) a media pro filmy/mp3 (pak opet nepotrebujes RAID 0 - pro cteni (prehravani) je RAID 1 naprosto dostacujici) - pokud chces mi fakt rychly system, tak ho nejvice urychlis tim, ze /usr a /lib bude umisteno na RAID 0

3.1.2006 01:34 Ritchie | skóre: 27 | blog: Ritchie's | Berlin
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

RAID 5 jsem nepominul, ale konstatoval jsem, že počítání parity bude zátěž pro CPU.

O /mnt/media a o /mnt/backup a o pohnutkách píšu v předposledním odstavci. RAID 1 je na ně naprosto zbytečný, raději uvítám více místa, tak jsem se rozhodl pro RAID 0.

V podobné konfiguraci (méně místa pro backup a media) jsem používal starý disk skoro rok a místo nedocházelo, takže si myslím, že jsem rozdělení rozvrhl rozumně. Až mně místo bude docházet, obávám se, že běžné kapacity disků se budou blížit 1 TB, takže nové přerozdělení se bude konat na nových discích. Nechci rychlý systém, chci bezpečný systém, který půjde v případě havárie disku rychle zprovoznit.

Nástroj mdadm nastuduji a případně článek aktualizuji.

3.1.2006 02:15 Abraxis
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

RAID 5 jeho zatez CPU neni tak hrozna. Postavil jsem nekolik masin dokonce na VIA C3 CPU s 700 MHz a 1 TB pole (4x250 GB) chodilo zapis kolem 30 MB/s (tzn. pokud mas nejaky "aktualni" CPU, tak to ani nepostrehnes).

OK, zalezi, na co system pouzivas. Ja kdyz na systemu aktivne pracuju jako programator, tak furt taham a kompiluju ruzny verze a porad nekde narazim na nedostatek mista :-(

4.1.2006 23:23 Jan Mikuš | skóre: 20 | Kladno
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

Opravdu to pole melo 1TB? Mam takovej pocit, ze kapacita RAID5 pole je (n-1)*[kapacita].

Ma zkusenost veli oproti doporucenim nepouzivat stejne serie disku, zejmena ne IDE a ne na RAID-1 a RAID-5. Odejdou +/- ve stejny okamzik (tj. jeden zahlasi chybu, stopnete stroj a druhy disk uz taky nenabehne). Kdyz tak pouzivat alespon SMART a byt paranoidni.

Věda má v sobě určitou zpupnost, že čím dokonalejší techniku vyvineme, čím více se dozvíme, tím lepší budou naše životy.

3.1.2006 01:30 Abraxis
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

No, proslo mi rukama par tisicovek disku nainstalovanych do Linuxoveho SW RAIDu a tohle jsem jeste nezazil. SMARTy jsou super vec, ale je nutne je pravidelne kontrolovat (cti - mit program, ktery to udela za tebe a hlasi ti podezrele stavy).

Co se tyce poruchovosti - kriticke jsou prvni tydny nasazeni systemu, je potreba system maximalne zatizit a dat diskum co proto. Pokud system vydrzi 2-3 mesice, tak je dosti hodne pravdepodobne, ze disky vydrzi dalsi 2-3 roky.

3.1.2006 08:19 Jiří (BoodOk) Kadeřávek | skóre: 19 | blog: BoodOk | Brno
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

Moje poznamka se take ale spise tyka disku na konci zivotnosti, treba po 2-3 letech intenzivniho provozu. Asi jsem mel smulu :-/

Věda má v sobě určitou zpupnost, že čím dokonalejší techniku vyvineme, čím více se dozvíme, tím lepší budou naše životy.

Raidtab je skutecne obsolete :)

Nejjednodussi je asi upravit jadro tak aby melo md ovladac primo v sobe (ne jako modul, a to ani kdyz se pouziva initrd), nastavit tem partisnam jako typ "linux raid autodetect" (hexove tusim fd? cfdisk bude vedet), a na nejaky konfiguracni soubory se vykaslat - jadro si prohleda vsechny linux raid autodetect a sestavi a nastartuje pole samo. Potom je uplne ukradeny ze se zmeni poradi disku nebo ze se nastartuje 2.4 jadro a sata disky jsou tam hdx misto sdx, ten system ty pole stejne najde.

Pokud je md v jadru jako modul, tak ho system (alespon Debian) nastartuje podle /etc/mdadm.conf z initrd, ale potom to vsechno visi na tom konfiguracnim souboru a staci prehodit nejakej ata disk z master na slave (= z hda na hdb) a musim zmenit konfiguracni soubor, jinak se nam pri startu rozsynchronizuje pole.

Tohle je spis otazka vkusu nez nejaky obektivity, ale neni lepsi vzit celej system na raid1 na xfs, dat si na raid 1 i swap (tak to byt musi, pokud to ma by hotplugovatelny) a vykaslat se na to rozdelovani podle vyuziti? ono usetrit par (desitek) giga je sice hezky, ale kdyz se potom s tim systemem neco stane, tak je hned jednodussi pracovat s dvouma partisnama namisto peti, navic ten narust vykonu je taky malicko diskutabilni. No, jeden duvod mne napada, a to sice debilni debiani instalator, ale to se neda nic delat :( :)

A jeste jedna vec - data vzdycky radeji kopiruju pomoci

tar c . | { cd /mnt/kamchcikopirovat ; tar x }

protoze buhvi jak se takovy cp tvari na hardlinky a tak.

Dobry je taky si to pole parkrat resyncnout kdyz se instaluje, aby se ty disky synchronizovaly treba petkrat - zabere to hodne casu, ale je to skvelej zatezovej test a kdyz ten disk prezije petkrat zkopirovani 200 GB sem a tam, tak pravdepodobne prezije par let provozu :)

Tak, a ted by to chtelo tohle vsechno tady kolem shrnout a dat do clanku ... a honorar venovat na maturitni vecirek Ivana Novakova :)

3.1.2006 10:36 imro | skóre: 19 | blog: hovado
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

1.mas vo svojom skriptiku zle zatvorky 2.ak sa uz bojis co ti urobi so subormi cp a preto pouzivas tar,tak to radsej pouzivaj rovno star,pretoze ak tam mas napr. rozsirene acl prava,tak ti ani tar nepomoze.

3.1.2006 10:46 Vskutečnosti Saýc | skóre: 7
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

Nemam. { prikaz } spusti prikaz v subshellu, tohle v tom subshellu spusti cd a pak tar. Jinak by to vsechno dostalo cd a nebylo by to k nicemu - ale tar ma i parametr kterym se da urcit adresar kterej povazuje pri rozbalovani za nejvyssi - tusim -d, takze to jde napsat i jako

 tar c . | tar x -d /mnt/cokoli

ale mne se to s tema zavorkama libi vic :)

Ze gnutar neumi zpracovat acl je prava, ale nepouzivam je, takze mne to nejak nenapadlo :) ale star pouziva malicko jinou hlavicku nez gnutar, coz se projevuje tim ze to starovyho archivu se neda v mc vstoupit a ja byl vzdycky linej to resit.

3.1.2006 12:55 Zdeněk Burda | skóre: 61 | blog: Zdendův blog | Praha
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

V použití {} a () je trochu rozdíl... pouštěl jsi ten příkaz, co jsi sem napsal?

tar cf - adresar/  | (cd /kam/to/chci/poslat/; tar xf - )

-- Nezdar není hanbou, hanbou je strach z pokusu.

3.1.2006 13:32 Vskutečnosti Saýc | skóre: 7
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

Jo. Kopiroval jsem tim system z jedny partisny na druhou.

Ted kdyz to tady zkousim, tak to chce strednik na konec, kdezto u () ho psat nemusim, ale vypada to ze v tom asi bude malicko vetsi rozdil :) Jdu se podivat do man bash.

3.1.2006 13:35 Vskutečnosti Saýc | skóre: 7
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

Nojooo, tak jsem si to prohodil :) Se stane.

3.1.2006 10:56 Ritchie | skóre: 27 | blog: Ritchie's | Berlin
Rozbalit Rozbalit vše Re: Bezpečnost dat na PC především – RAID

Initrd nepoužívám, jádro jsem si připravil na míru. Ostatně pokud tak člověk může udělat, je zbytečné se o initrd starat. ;-)

Konfigurační soubory slouží pro práci s RAID, např. k jeho vytvoření. Jádro si hotový RAID skutečně najde při bootu samo, žádný konfigurační soubor k tomu není využíván. Aby to tak fungovalo, musíme u raidtools zvolit persistent-superblock, mdadm to provede automaticky.

Hotplug můj chipset nepodporuje, takže swap na RAID 1 u mě postrádá smysl. Pokud se se systémem stane něco skutečně ošklivého, že i RAID selže, tak je výhodné mít /home a jiná uživatelská data na zvláštním oddílu. Obnova je pak o něco snazší. Jak píšu už ve článku, pro /home dělám zvláštní oddíl vždy. Již několikrát mě to uchránilo před ztrátou dat (souborový systém na / nepoužitelný, /home netknutý). Debian nepraktikuji a 90 GB ušetřeného místa pro mě není zanedbatelných.

tar cl vs. cp -ax by mělo být naprosto rovnocené a je otázkou osobní oblíbenosti. Oboje to správně zachází s hardlinky, právy, časy, atd. a ACL to neumí ani jedno.

Článek určitě ještě upravím a rozšířím, třeba raidtools nahradím mdadm. Jsem rád, že se v diskuzi dozvídám spoustu nových postřehů. Ostatně napsat článek je celkově pozitivní věc – člověk si udělá pořádek ve svých znalostech, z diskuze se dozví nové věci a náhodný čtenář je snad také obohacen.