Portál AbcLinuxu, 27. dubna 2024 01:55


Dotaz: Operační systém a souborový systém pro vytížený backup server

29.1.2014 21:38 vasek
Operační systém a souborový systém pro vytížený backup server
Přečteno: 400×
Odpovědět | Admin
Ahoj,

nějakou dobu už mi běží na backup serveru FreeBSD 9.1 se souborovým systémem ZFS (ostatně kvůli tomu tam mám také freebsd). Zálohuji na něj servery a většinou pomocí BackupPC - pro každý server 1x týdně full backup, 1x denně inkrementální. Serverů je celkem 13 a až na 2 výjimky to jsou linuxové servery. U nich je velikost full backup +-20 GB. 2 servery jsou Windows zálohované přes rsync skrze ssh tunel a u nich je velikost plné zálohy cca 600 GB pro každého. Všechny tyto servery se zálohují do nekomprimovaného zfs poolu. Kromě BackupPC také zálohuji 1x týdně virtuální stroje, resp. jejich disky manuálně pomocí vlastního skriptu (+-50GB * 6) - tady využívám zfs snapshoty a pomocí rsync posílám pouze rozdílová data (trvá to déle, ale ušetří to díky zfs veliké množství místa na disku anichž bych musel používat deduplikaci).

Teď k jádru problému: zálohovací stroj přestal stíhat zálohování. Má na toto dost slabý hardware a není dost finančních prostředků na nějakou jeho změnu. Je to taková skládačka - AMD Dual-Core Athlon X2 4450e (45W), 2300MHz, 5 GB RAM (nonECC - vím že je to risk na ZFS...), 4x SATA 2 TB disky. Jak nabobtnalo množství zálohovaných a i již zazálohovaných dat, tak prudce klesl výkon - pravděpodobně za to může ZFS v raidz1.

Mám několik oẗázek: Jak je na tom nyní btrfs s ohledem na spolehlivost a rychlost na linuxu oproti zfs na freebsd? Když jsem před rokem zkoušel asi měsíc btrfs, pokaždé se mi nakonec rozsypal. Nebo si myslíte, že na takové množství dat bude lepší klasika např. ext4 (tam bych ale zase přišel o snapshoty)? Šel bych určitě do linuxu, protože po roční zkušenosti s freebsd mi připadá, že linuxové jádro daleko lépe zvládá vysokou zátěž (asi lepší IO scheduler či co).

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

30.1.2014 00:25 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: Operační systém a souborový systém pro vytížený backup server
Odpovědět | | Sbalit | Link | Blokovat | Admin
Myslím že hlavní problém je v BackupPC. Používám na domácím serveru zálohování všech domácích strojů, celkem 6 linuxových systému, HW stroje AMD E-350 Processor na 1600MHz 4GB paměti, zálohování na mdadm RAID 10 s ext4. Typický zálohovací objem 50G. Inkrementální zálohy 1,2,3,4,1,2,3,4,1,2,3,4 a pak uplná. Komprimovaný pool. A výsledek: Když běží BackupPC, je zátěž disků mezi 85%-100% zátěž procesorová také blízko 100% s tím že spoustu času je to ve wait stavu. Měřeno pomocí atop a také se to zobrazuje na grafech munin. Typický čas pro úplnou zálohu je 120Min a pro inkrementální 20-40min. Z každé stanice je to cca 200-400 000 souborů. Celkem má záloha kolem 1,2 mil souborů.

Nejdříve mě to připadalo strašně dlouhé. Ale když jsem se díval, co zálohování na cíli vyrobí, tak jsou to soubory nazvané svými hash hodnotami, rozdělené do 3 úrovní adresářů podle prvních 3 hexa znaků hashe. V jednotlivých zálohách konkrétních systémů jsou pak hardlinkované odkazy na tento hashový pool. A protože při jak inkrementální tak úplné záloze stejně musí sytém projít všechny soubory jestli je má zazálohované v aktuální verzi, tak jsem dospěl k názoru, že stejně to rychleji nepůjde, protože když u disku je tak cca 100 IOPS tak 200 000 souborů je odhadem 2000 sekund. Pro mne výhoda je, že jak mají všechny systémy stejné distro, tak soubor, který je stejný je hardlinkovaný ze záloh všech strojů (vyzkoušeno pomocí find /var/lib/BackupPC -samefile fvi) (konkrétně záloha vi má u mne 170 hardlinků). A čistě ten find běžel asi 35 minut, jak je ten strom velký. Takže si myslím, že změna file systému nepomůže. A
30.1.2014 01:32 cronin | skóre: 49
Rozbalit Rozbalit vše Re: Operační systém a souborový systém pro vytížený backup server
Odpovědět | | Sbalit | Link | Blokovat | Admin
Nepíšeš, čo vlastne zálohuješ. "Záloha servera" je dosť široký pojem. Zálohovanie celých systémov hlava-nehlava je síce v prvom kole jednoduché, ale ako si sám zistil, veľmi rýchlo to prerastie únosné medze. Preto je možno lepšie robiť aplikačne špecifické zálohy: dumpy databáz, exporty VCS a pod. Veľkou úsporou je identifikovať to, čo zálohovať netreba, pretože sa to buď dá naištalovať (aplikácie), vygenerovať z iných zdrojov (dokumentácie), stiahnuť z internetu (artifactory), alebo to prinajhoršom možno oželieť (logovacie súbory), alebo to dokonca vôbec nie je potrebné (rôzne pomocné indexy a cache). Až na ten zvyšok treba použiť zálohovanie na úrovni súborového systému.

Hlavne netreba zabudnúť zálohy testovať a proces obnovenia pravidelne precvičovať. Mať zálohu, ktorá nejde použiť, je oveľa zúfalejší stav ako nemať žiadnu zálohu.
30.1.2014 10:56 vasek
Rozbalit Rozbalit vše Re: Operační systém a souborový systém pro vytížený backup server

Tím záloha serverů myslím opravdu všechno, co na těch strojích je. V podstatě těch systémových souborů moc není, jde o uživatelská data - typicky nejhorší asi bude několik gigabajtů mailů v malých souborech či rozsáhlé webové stránky a hlavně stovky tisíc malých souborů na windows serverech (jsou to fileservery).

Ono ten backup server se jeví podle monitorování jako nezatížený - nízké využití sítě, malé rychlosti zápisu na disky, procesor podle topu nevyužitý - nicméně v něčem mi freebsd asi kecá. Disky mají dost práce - přes dd naměřím rychlost zápisu kolem 2-5 MB/s, pořád běží dost procesů find programu BackupPC. Načtení web statistiky BackupPC trvá i přes 30 sekund. Podle mě to padlo na limity HW + ZFS filesystému (i bez zálohování výkonnost ZFS nic moc na tomto HW). Proto nevím jestli bych si třeba btrfs na linuxu nepolepšil ...

30.1.2014 13:12 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: Operační systém a souborový systém pro vytížený backup server
Ano tak to je. Rychlost je mezi 1-8MB/s přestože záloha je na gigabitové síti a na dvou klientech zálohuje data z SSD disků. 8 je jen pro úplnou zálohu. inkrementální jsou mezi 1-3MB/s. Můj procesor je využitý jen díky tomu, že vše se kompresuje. Zkuste nainstalovat BSD implementaci atop a uvidíte, že limit je v discích. BSD nekecá, ale prostě disky víc atomárních zápisů a čtení malých souborů nedají. A vše ostatní nemá co dělat.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.