BTRFS - jak opravit RAID 1 po výpadku disku (vyřešeno)

Jde o znamou feature btrfs, kdy kdyz ti odejde 1 disk v raid 1 tak jsi v zadely a rw ho nenamontujes. Spravny postup je pry primountovat ho degraded mount -t btrfs -o degraded /dev/sda1 /archiv a pak btrfs replace start /dev/sdd1 /dev/sdc1 /archiv. Ty devices si uprav dle sveho skutecneho stavu.

31.8.2017 08:26 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No, škoda, že tuhle "feature" člověk zjistí, až když se to po...

V read-only nefunguje btrfs replace, do write nejde v degraded namountovat.

Spíš si říkám, že to nově udělám tak, že RAID vytvořím pomocí mdadm a btrfs až nad ním, aby ty dva disky vůbec neviděl.

Ještě tak vymyslet, jak tam přesunout všechna data, protože co den, to snapshot...

31.8.2017 08:38 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

btrfs-send by snad měl na migraci fungovat.
Zdar Max

Měl jsem sen ... :(

31.8.2017 14:13 citanus | skóre: 12 | Cork (Ireland)
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

no vono je dobry se na pripadnou havarii pripravit predem... Nez neco nasadim v produkci tak otestuju DR.

31.8.2017 15:30 jekub
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Vy necetli, a presto rozmrazili? Wonderful! Bystry narod.

31.8.2017 17:11 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No, škoda, že tuhle "feature" člověk zjistí, až když se to po...

To záleží na každém, kdy si přečte dokumentaci. Je dost lidí, kteří si ji přečtou před tím, než začnou používat něco, co má docela dost různých vlastností, přičemž je známo, že některé ještě nefungují správně (jako třeba RAID 5).

31.8.2017 17:18 karlik
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To mi připomíná výrok prodavače při reklamaci bot:

"Pane, vy jste snad v těch botech chodil?"

31.8.2017 17:30 R
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ano, aj take sracky sa dnes predavaju. Nazyva sa to "vysoko modna obuv". Pritom to vyzera ako normalna obuv, ale hned sa rozpadne a reklamaciu neuznaju.

No a tento slavny RAID je na tom velmi podobne...

31.8.2017 20:57 petr
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Filipe, to je vymluva jako Hyundai. Kdyz jsem pred x lety porizoval Hyundai, melo to USB s podporou MP3. To, ze to podporovalo max 16GB usb, ze soubory museli mit lowercase mp3 extension, ze to ignorovalo soubory s jakoukoliv diakritikou nebo mezerami a ze mp3 nesmeli byt vbr ale jen cbr se mozna psalo nekde v dokumentaci, ale prodejce mi rikal o tom jak budu moci poslouchat muziku v aute. A vis co bylo nejvice k nasrani? Ze si to nepamatovalo last played song a furt to startovalo od prvniho souboru. Auto slo po pul roce z domu, misto slibovanych 7 litru zralo skoro 15. Tak nejak je to s btrfs, feature to ma spousty, ale ja to vidim tak se tech ruznych omezeni je proste spousta a dlouhou dobu.

1.9.2017 11:16 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jaká výmluva? Stížnost byla na to, že se o téhle vlastnosti člověk dozví, až když to nastane. Tedy Vandrovnik by požadoval, aby se o té vlastnosti dozvěděl dříve. Jedna možnost, kterou jsem uvedl, je ta, že si sám dobrovolně před použitím přečte dokumentaci. Napadá mne už jenom jeden další způsob, jak zajistit, aby se o vlastnostech dozvěděl uživatel předem – při instalaci mu zobrazit manuál, po manuálu bude následovat test, a teprve pokud ho dotyčný správně vyplní, bude instalace pokračovat. Což je u btrfs trochu problém, protože je to opensource, takže by se vzápětí objevil fork bez toho testu – a zase by si to někdo nainstaloval a pak si stěžoval, že se o vlastnostech nedozvěděl včas.

Nebo vy máte nějaký jiný nápad, než výše uvedené, jak zajistit, aby se uživatel o vlastnostech systému dozvěděl včas?

3.9.2017 21:01 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No kdybych takovýhle bug implementoval ve svém softwaru, tak bych uživateli zobrazil jedno varování při vytváření RAID 1 a druhé varování v okamžiku, kdy by ten degradovaný svazek přimountoval rw, aby věděl, že to příště už rw nenamountuje (lepší samozřejmě se zeptat, zda opravdu chce rw, neb má jen jediný pokus).

Mohl jsem si pochopitelně lépe nastudovat dokumentaci, je možné, že se to v ní dokonce někde píše, to nevylučuju, ale při hledání informací o btrfs jsem na tohle prostě nenarazil a rozhodně mě ani náhodou nenapadlo, že by to mohlo být takhle hloupě udělané.

3.9.2017 21:07 R
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Presne tak. Neverim, ze sa takato sracka dostala do kernelu a nie je tam ziadne varovanie. Ked si predstavim, ze na tuto "feature" narazi Linus so svojimi datami, tak si viem zivo predstavit ten mail (a v nom pouzity slovnik), ktory by nasledoval...

4.9.2017 00:30 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jaký bug? O čem to píšete? Jediný problém je v tom, že pro odstranění vadného disku musíte souborový systém odmountovat a přimountovat v režimu degraded, a po odstranění vadného disku jej opět přimountovat v normálním režimu.

4.9.2017 09:21 alkoholik | skóre: 40 | blog: Alkoholik
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Kvuli vymene vadneho disku v RAID1 musim odmountovat fs? To je u me bug jako krava!

4.9.2017 09:24 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

O parametru remount jsi už někdy slyšel?

4.9.2017 11:36 alkoholik | skóre: 40 | blog: Alkoholik
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jirsak jasne pise "musíte souborový systém odmountovat". Nekdo z vas dvou tu teda keca.

4.9.2017 12:43 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jirsák jasně napsal:

musíte souborový systém odmountovat a přimountovat v režimu degraded

Tak neargumentuj jak Miloš Zeman, ok? Parametr remount dělá totiž přesně tohle, akorát že v jednom příkazu.

4.9.2017 15:00 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Parametr remount dělá totiž přesně tohle, akorát že v jednom příkazu.

Remount se u btrfs chová odlišně od ostatních filesystémů? Pokud ne, tak se mýlíte - remount souborový systém neodpojí, pouze změní nastavení toho připojeného mountpointu.

Quando omni flunkus moritati

4.9.2017 09:30 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Kromě toho je zcela evidentní, že ti uniká podstata věci. Tím že přemountuješ do režimu degraded jenom říkáš, že se holt dočasně extenty nebudou replikovat. Defakto jsi tím donucen problém řešit a ne že to necháš jet s neúplným raidem, než ti to exne všechno.

Pokud ti zůstane disků víc než jeden, tak to vůbec dělat nemusíš, protože si ten FS ty extenty přeháže rovnou a po tobě bude jenom chtít abys vyhodil ten vadný disk. Kapišto?

Jenže v době opojení ultratenkými notebooky mezi ušima funkční nervovou uzlinu abys pohledal.

4.9.2017 09:49 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Kvuli vymene vadneho disku v RAID1 musim odmountovat fs? To je u me bug jako krava!

V tom případě nevíte, co je to bug. Bug je chyba, program neplní to, co je jeho účelem. Tady se ale bavíme jenom o nedostatku v použitelnosti – souborovému systému nějak musíte dát najevo, že řešíte problém s diskem, tedy že je v degradovaném režimu. Jediný nedostatek spočívá v tom, že to musíte udělat pomocí remountu, že to nemůžete nastavit jako příznak běžícímu souborovému systému.

4.9.2017 11:37 alkoholik | skóre: 40 | blog: Alkoholik
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To neni bug, to je feature!

4.9.2017 09:24 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Problém je v tom, že jakmile btrfs s raid 1 jednou namountujete v degraded režimu pro read-write, tak už později nemáte možnost přidat nový disk. (Což jsem u žádného jiného systému pro raid neviděl.)

4.9.2017 09:34 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Co to je za pitomost? Jak už jsem napsal o kousek výše. V degradovaném režimu vypnete replikaci extentů. Ale jinak by disk měl jít normálně přidat. Ovšem nevylučuji, že s tím verze btrfs tools, kterou jste zkoušel použít, má problém. Ovšem to lze jen těžko posoudit, na to co jste se vlastně s tím pokoušeli dělat křišťálovou kouli nemám.

4.9.2017 09:38 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No, měl by jít přidat, taky jsem o tom byl přesvědčený. Ale nešel :-)

Co jsem s tím dělal, je napsané hned v úvodním dotazu.

Umřel disk, po restartu jsem btrfs pro archiv provozoval v degraded režimu, read-write. Přišel nový disk, takže vypnutí, instalace disku, zapnutí - a už nebylo možné disk přidat, protože v degraded režimu naběhne jen read-only (a přidání disků neprojde).

Novější verze prý umí přidat jakýsi globální hot-spare disk, verze na Centos 7.3 to ale neumí.

btrfs version
btrfs-progs v4.4.1

4.9.2017 09:53 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Tak. Ten disk byl zároveň systémový, nebo ne? Pokud ano, je nutné udělat ty opičárny v ramdisku, kdy nic na ten disky nezkouší zapisovat. Pokud ne, lze je udělat normálně když je systém v běhu.

Pokud jste provozoval Btrfs v degraded módu, pak to znamená jen to, že měl zakázáno replikovat extenty. A v degraded módu by měly jít disky normálně přidat, i když je FS ve stavu read-only. Ale jak už jsem psal, nevylučuji, že s tím má ta starší verze btrfs-progs problém. Ovšem něco to muselo napsat, nebo ne?

Jinak pokud jde o Btrfs, tak jednoznačně platí - čím novější jádro a btrfs-progs, tím lépe. Protože od jádra 4.4 se udělalo docela dost změn. Osobně mám velice dobrou zkušenost s jádrem 4.6, 4.9 a 4.12

4.9.2017 10:17 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Disk systémový nebyl. V read-only disky přidat nešly - kdyby šly, bylo by to snadné.

4.9.2017 10:19 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Umřel disk, po restartu jsem btrfs pro archiv provozoval v degraded režimu

Proč?

provozoval v degraded režimu, read-write vs. protože v degraded režimu naběhne jen read-only

Protiřečíte si. Možná si po sobě ještě jednou přečtěte svůj dotaz a výpisy v něm uvedené – abyste zjistil, co se doopravdy dělo. Problém byl v tom, že jste z btrfs odstranil disk (logicky, ne fyzicky) před tím, než jste přidal náhradní. Tím pádem se počet připojených disků (ať už bezvadných nebo vadných) snížil pod počet požadovaných disků a proto šel přimountovat jedině v read-only režimu. Btrfs se vyrovná s tím, že je nějaký disk vadný nebo fyzicky chybí. Ale špatně se vyrovnává s tím, když mu správce řekne „vše má být uložené alespoň na dvou discích, tady na to máš jediný disk“. Protože btrfs pozná, že to je nesplnitelný požadavek, a že tedy správce asi dělá nějakou hloupost.

Jinak kdybyste si vygoogloval „btrfs degraded mode“, najdete spoustu popisů, jak se má vadný disk v btrfs RAIDu vyměnit. Celý problém byl v tom, že vy jste se na to vrhnul, nevěděl jste, jak to máte udělat, a když vás btrfs začal varovat, že asi něco děláte blbě, ignoroval jste to a dál jste se to snažil dělat svým způsobem.

4.9.2017 10:27 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Umřel disk, po restartu jsem btrfs pro archiv provozoval v degraded režimu
Proč?

Protože nám přišlo lepší po dobu reklamace mít archiv na jednom disku než ho nemít vůbec.

provozoval v degraded režimu, read-write vs. protože v degraded režimu naběhne jen read-only

Poprvé to v degraded v read-write funguje. Po restartu to v degraded už v read-write nelze namountovat a musí se jen read-only, ve kterém ale v téhle verzi nejde přidat nový disk. (To je ta "feature", o které jsem nevěděl, a kterou považuju spíš za bug než výhodu.)

4.9.2017 10:39 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Nezlobte se na mě, ale poněkud mě zaráží situace, kdy nemáte po ruce ani jeden náhradní disk a musíte čekat, než vám přijde z reklamace ten starý, nebo náhradní.

Druhá věc co mě zaráží, že vám to normálně v degraded režimu ve stavu rw jelo a teď najednou ne. To byl ten stroj po celou dobu bez restartu? Jestli na to nejde udělat rw remount už teď asi zřejmě nevyzkoušíte.

4.9.2017 10:49 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Je to jen jedno z míst, kde jsou zálohovaná data. Žádný restart mezitím opravdu nebyl, ten vadný disk byl pryč tak 10 dní.

4.9.2017 10:48 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Poprvé to v degraded v read-write funguje. Po restartu to v degraded už v read-write nelze namountovat a musí se jen read-only, ve kterém ale v téhle verzi nejde přidat nový disk. (To je ta "feature", o které jsem nevěděl, a kterou považuju spíš za bug než výhodu.)

Akorát že žádná takováhle feature neexisuje, je to jen váš výmysl – a je to vidět např. v tom výpisu, který jste na začátku uvedl.

To, že šel souborový systém namountovat jen v read-only režimu, vůbec nesouvisí s tím, že to bylo po restartu nebo že jste to mountoval podruhé. Příčina je jiná – ta, že jste ten vadný disk z RAIDu logicky odstranil, tedy jste po btrfs chtěl, aby provozovalo RAID1 nad jedním diskem. Což samozřejmě nejde. Tady je to v tom vašem výpisu:

BTRFS: missing devices(1) exceeds the limit(0), writeable mount is not allowed

4.9.2017 10:54
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

https://btrfs.wiki.kernel.org/index.php/Gotchas#raid1_volumes_only_mountable_once_RW_if_degraded

4.9.2017 10:54 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Obávám se, že se mýlíte.

https://www.mail-archive.com/linux-btrfs@vger.kernel.org/msg60979.html

4.9.2017 11:12 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

OK, máte pravdu, že tam zatím je tahle jednoduchá kontrola na počet připojení. Vždycky jsem degraded mód chápal jako režim pro opravu RAIDu, takže jsem ho nikdy nepotřeboval připojovat opakovaně.

7.9.2017 11:44 bigBRAMBOR | skóre: 36
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

tak ted teda nevím co je tam videt, kdyz ta feature existuje.

Akorát že žádná takováhle feature neexisuje, je to jen váš výmysl – a je to vidět např. v tom výpisu, který jste na začátku uvedl.

4.9.2017 09:59 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Problém je v tom, že jakmile btrfs s raid 1 jednou namountujete v degraded režimu pro read-write, tak už později nemáte možnost přidat nový disk. (Což jsem u žádného jiného systému pro raid neviděl.)

Problém je v tom, že se s tím souborovým systémem snažíte dělat nesmysly. Degradovaný režim je jakýsi nouzový režim určený pro vyřešení specifických situací, např. odstranění vadného disku. Nechápu, proč se v takovém režimu pokoušíte do systému přidat disk. Disk se do systému přidává v normálním režimu.

A ještě navíc si vymýšlíte, přestože v tom výpisu nahoře je uvedené něco jiného. V tom výpise, který jste uvedl, máte pro oba dva případy jasně napsaný důvod, proč nejde udělat akce, kterou jste zamýšlel.

4.9.2017 10:08 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

A ještě navíc si vymýšlíte, přestože v tom výpisu nahoře je uvedené něco jiného. V tom výpise, který jste uvedl, máte pro oba dva případy jasně napsaný důvod, proč nejde udělat akce, kterou jste zamýšlel.

Já bych na něj zase tak ostrý nebyl. Je fakt, že když je člověk ve stresu dělá různé blbosti a pokud nemá zkušenosti, ani někoho kdo mu kouká pod ruce, tak o tom ani neví.

4.9.2017 10:24 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Já bych na něj zase tak ostrý nebyl. Je fakt, že když je člověk ve stresu dělá různé blbosti a pokud nemá zkušenosti, ani někoho kdo mu kouká pod ruce, tak o tom ani neví.

Teď ale ve stresu není. A místo toho, aby si znovu přečetl svůj dotaz, kde má ty výpisy napsané, tak si vymýšlí věci, které jsou v rozporu s těmi výpisy.

To, že dělal hlouposti při samotné akci, bych pochopil (i když v okamžiku, kdy mi začne souborový systém na příkazy odpovídat chybami, radši bych si šel dohledat, jak se to má udělat správně, než abych dál souborový systém přesvědčoval, že se to udělá po mém). Kritizuju to, že teď, místo aby se snažil pochopit, jak to funguje, vymýšlí si věci, které jsou v rozporu s těmi výpisy.

4.9.2017 10:21 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Nechápu, proč se v takovém režimu pokoušíte do systému přidat disk. Disk se do systému přidává v normálním režimu.

A to jde udělat? Když je vadný disk mrtvý, tzn. v tomhle raid 1 zbyl jen jeden disk? Přišlo mi, že abych disk mohl přidat, musím svazek namountovat. A abych ho mohl namountovat jen s jedním zbývajícím diskem, musím mountovat v degraded režimu.

4.9.2017 10:42 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Musíte rozlišovat mezi vadným diskem případně chybějícím diskem, který je ale pořád součástí RIADu (takže btrfs ví, že je tam něco špatně a že je to selhání techniky, ne záměr administrátora), a případem, kdy disk odebere administrátor. RAID1 s tím, že administrátor poskytne jen jeden disk, zkrátka provozovat nelze. RAID1 lze provozovat tak, že administrátor poskytne dva disky, ale jeden z disků vykazuje chyby při čtení nebo je úplně nefunkční. V takovém případě přidáte do RAIDu třetí disk, řeknete, že nahrazuje ten nefunkční, btrfs na něj zmigruje data a teprve pak ten nefunkční disk z RAIDu odstraníte. To, že příčina toho, že se ten vadný disk systému nehlásí, je v tom, že jste ten disk dávno vytáhl a poslal na reklamaci, v tom nehraje roli – logicky musí být součástí RAIDu do té doby, než ho nahradíte jiným diskem. A nebo můžete snížit počet kopií, které po BTRFS vyžadujete (tj. zrušíte RAID1), a pak ten disk můžete (logicky) odstranit rovnou, protože není potřeba.

Pořád je to ten základní přístup, že když chce správce RAID1, poskytne dva disky a jeden z nich selže, je to věc, se kterou se btrfs umí vyrovnat – je to chyba techniky a s tou se v RAIDu počítá. Pokud správce řekne, že chce RAID1 a poskytne jenom jeden disk, je to logický rozpor, chyba správce – a to se btrfs nesnaží řešit, protože správce by měl vědět, co dělá.

4.9.2017 12:02 R
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Disk kludne umrie tak, ze uplne zmizne zo systemu. To programoval nejaky teoretik alebo je to len pokus o obhajenie neobhajitelneho?

4.9.2017 12:12 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Disk kludne umrie tak, ze uplne zmizne zo systemu.

Ano, to je ten případ, kdy je disk úplně nefunkční.

To programoval nejaky teoretik alebo je to len pokus o obhajenie neobhajitelneho?

To jste jenom četl nepozorně můj komentář. I když disk úplně zmizí ze systému, pořád je to technická chyba, se kterou si btrfs poradí. A pořád je to něco jiného, než když administrátor ten disk svým zásahem vyřadí z RAIDu. Mimochodem, pro ten zmizelý disk má btrfs i speciální variantu příkazu – btrfs device delete missing /mountpoint. To klíčové slovo missing právě odkazuje na (první) disk, který v RAIDu úplně chybí.

7.9.2017 11:50 bigBRAMBOR | skóre: 36
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

správce řekne, že chce RAID1 a poskytne jenom jeden disk, je to logický rozpor, chyba správce to bude zase nejaka feature BTRFS, u HW RAIDu se toto bezne pouzíva. U nekterých výrobců je to dokonce jediná možnost jak přidat single disk.

4.9.2017 12:29 jekub
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Když jsem sestavoval poprvé sw raid1 na linuxu, také jsem nečetl celou dokumentaci. Ovšem první věc, než jsem to pusitl do provozu, byl test (resp. několik), jak obnovit rozbité pole.

4.9.2017 12:33 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ale napadlo tě testovat to dvakrát, protože při prvním mountu degradovaného pole se podaří a při druhém už ne (viz to prapodivné počítadlo)?

4.9.2017 12:47 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Nepomohlo by dvakrát to testovat, při druhém testu by to počítadlo běželo zase od nuly. Tenhle případ by navodil jedině tak, že by systém remountoval v degraded režimu, a pak, místo aby systém opravil, by jej odmountoval a znova přimountoval v degraded režimu.

4.9.2017 13:01 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Což je celkem běžná situace a očekával bych, že se bude chovat stejně. Možná by to udělalo i pouhé vypnutí/zapnutí stroje, ne?

Nicméně má reakce byla o tom, že se úvodním testováním takovéto "vychytávky" ani náhodou neobjeví.

4.9.2017 13:23 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ano, i reboot to počítadlo zvýší a rw už nelze namountovat.

4.9.2017 13:30 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Njn, co na to říct...

4.9.2017 13:35 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Mně to jako běžná situace nepřipadá – znamená to, že nastane nějaký problém před rozhodnutím, jak degradované pole obnovit.

Zrovna v tomhle případě by se ta „vychytávka“ objevila, protože použít degradovaný režim btrfs RAIDu pro běžný provoz místo pro obnovu pole byl zjevně záměr, takže by se to tak mělo i testovat. A velice brzy by Vandrovnik přišel na to, že degradovaný režim je určený pro obnovu pole, a pokud chce souborový systém (byť dočasně) provozovat bez redundance, je potřeba souborový systém zkonvertovat na single nebo dup.

Možná je problém v odlišném postupu, kdy hardwarové RAIDy neumožňují snadno provádět konverzi mezi různými profily, takže umožňují provoz i v degradovaném režimu, kdy RAID sice nezaručuje ty parametry, které má mít, ale je v provozu alespoň nějak. btrfs naopak umožňuje profily průběžně měnit, takže když máte něco v RAID1 a chcete to dočasně provozovat bez jednoho disku, zkonvertujete to na single, a když později seženete další disk, zase to zkonvertujete zpět na RAID1.

4.9.2017 14:11 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Umí to konverzi z RAID1 na single jenom přehozením metadat, nebo to musí znovu zapsat všechny bloky?

4.9.2017 14:41 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Opět odkazuji na svůj zk..ý manuál (odkaz je výše), kapitola Balancing.

4.9.2017 14:56 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No z toho jsem pochopil, že to je potřeba - ale doufal jsem, že tam třeba někdo dopsal inplace konverzi.

Takže místo „vypadl disk, pole se automaticky přehodí do degradovaného módu, a já jdu koupit nový; mezitím všechno normálně funguje“ to je „vypadl disk, nejde to namountovat rw, konverze na single nemá cenu, protože by běžela den nebo možná měsíc (1, 2 + osobní zkušenost na FS se zálohama se 150 snapshoty), takže služba prostě nepojede dokud nedojdu vyměnit disk“.

Dokud balancovaný souborový systém neobsahoval před balancováním žádná data, tak po vybalancování nebude obsahovat žádný datový extent. To není na závadu, pokud nemají být datové extenty ukládány v raid módu.
Pokud však mají být datové extenty kupř. v módu raid1, je třeba provést vybalancování po zapsání alespoň jednoho datového extentu. Jinak se datové extenty začnou zapisovat v režimu single, přes to, že při balancování byla pro datové extenty nastavena konverze na mód raid1!

LOL, to je lepší než jak kdysi implementovali kompresi, ale už neimplementovali dekompresi.

Já myslím, že teď už je naprosto jasné, že btrfs do produkce prostě nasadit nejde.

4.9.2017 15:03 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Točíte se na obrtlíku napsaném před třemi lety.

4.9.2017 15:07 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

A je to dnes jinak?

4.9.2017 15:18 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Nevím, protože neřeším. Pokud dělám Btrfs v raid1 tak je dělám rovnou jako raid1. Konverzi single na raid1 jsem od té doby dělal jenom jednou a to už na tom poli data byly. Navíc se za ty tři roky dost hodně věcí změnilo. Stačí se podívat na changelog.

4.9.2017 15:10 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jenda: Jak to je implementované?

AK: Přečti si tento manuál.

Jenda: To je teda implementované pěkně blbě!

AK: Ten manuál je zastaralý a ve skutečnosti už je to jinak.

4.9.2017 16:50 Want
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Zkus to laskavě bez podsouvání. Nepsal jsem že je to jinak, ale že nevím jak je to nyní, protože mám na starosti jiné věci, než vodit někoho za ruku. Upozornil jsem na věc, která mě zaskočila tehdy. Takže kdo si to přečetl, věděl na co si když tak dát pozor.

4.9.2017 20:58 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Zkus to laskavě bez podsouvání.

Jenda: Jak to je implementované?

AK: Přečti si tento manuál.

Jenda: To je teda implementované pěkně blbě!

AK: Ten manuál je zastaralý a už to může být klidně jinak.

4.9.2017 21:32 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jenda: Umí to konverzi z RAID1 na single jenom přehozením metadat, nebo to musí znovu zapsat všechny bloky?

AK: Opět odkazuji na svůj zk..ý manuál (odkaz je výše), kapitola Balancing.

Jenda: …bla bla bla … nejde … bla bla bla … nemá cenu … bla bla bla … nasadit nejde.

AK: S takovou jdi do prdele milý Jeníku, protože ti to nikdo nenutí. A když máš zamálo se to naučit používat tak se dál cackej s čím chceš.

4.9.2017 22:11 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Mám pocit, že ti někdo podstrčil úplně jiný text, než co jsem napsal.

5.9.2017 08:40 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Vidíš, a není tomu tak.

4.9.2017 16:00 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

vypadl disk, pole se automaticky přehodí do degradovaného módu, a já jdu koupit nový; mezitím všechno normálně funguje

Jak jste přišel na to, že by to mělo být jinak?

4.9.2017 20:44 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Z předchozího threadu jsem nabyl dojmu, že to po výpadku disku nejde namountovat více než jednou.

4.9.2017 22:00 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No jo, tady se psalo nesmyslů… Po výpadku disku (pokud počet disků neodpovídá požadavané úrovni RAIDu) se jednou namountuje v degradovaném režimu, pole se uvede do stavu, v jakém má dále pracovat (což není stav, kdy je počet disků menší než požadovaná úroveň RAIDu) a pole se znovu přimountuje v normálním režimu. Jako není to zrovna user friendly a člověk při tom musí dávat pozor, co dělá, ale to by měl vždycky, když pracuje s polem v degradovaném režimu. Problém s tím mají především ti, kteří si jen tak pokusně přimountovávají pole v degradovaném režimu, jenom aby si vyzkoušeli, že to fakt jde.

4.9.2017 22:11 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

pole se uvede do stavu, v jakém má dále pracovat (což není stav, kdy je počet disků menší než požadovaná úroveň RAIDu)

Problém je v tom, že tohle uvedení nejspíš znamená přeházet na disku pár tera (a pak je tady ten faktor překvapení, mně se to taky stalo, protože - přiznám se - v dokumentaci jsem si toho nějak nevšiml a když jsem to zkoušel, tak mě nenapadlo zkoušet to přimountovat třikrát. Minimálně mně to přijde jako dost nečekaná vlastnost.).

4.9.2017 22:17 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Proč by to znamenalo přehazovat nějaká data? Jenom se sníží požadovaný počet uložení jednoho bloku, to je jen zápis do metadat. Přehazování dat by to mohlo znamenat při složitějších konfiguracích, ale ne při 1+1 disk.

4.9.2017 22:38 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Pořád nechápu, co je normálního na tom, že se pole musí různě přemontovávat, dokonce se smí jen jednou (proč?). Prostě normální je vyměnit disk a spustit rebuild. Za běhu a plného provozu (hotswap) či mezitím to klidně několikrát restartnout (nehotswap, vypadne napájení s korektním shutdownem UPSkou, to vše se stává).

4.9.2017 22:56 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Přemountování do degraded režimu je myslím nutné jedině v případě, kdy je potřeba z pole odstranit disk, který už se v systému vůbec nehlásí. Ano, je to divné chování. Pokud je disk vadný ale je vidět v systému, normálně se přidá nový disk, v btrfs se vymění za ten vadný a po rebuildu se ten vadný odebere.

To omezení na jedno přemountování se vztahuje jen na přimoutování s parametrem degraded v situaci, kdy máte méně disků, než vyžaduje aktuální úroveň RAID. A je to tak (snad zatím) z toho důvodu, že btrfs si v takovém okamžiku neumí zjistit přesný stav souborového systému a přizpůsobit se mu, takže místo toho dovolí správci jednou přimountovat souborový systém v degradovaném režimu a očekává, že během toho přimountování správce daný problém nějak vyřeší.

4.9.2017 23:02 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Normální je disk fyzicky vyměnit za jiný, ne přidat jiný (co když není volný slot?), počkat hodiny na zasynchronizování a pak odebrat ten starý poškozený, který mi mezitím může třeba dělat neplechu na napájecí lince, protože už má načatou elektroniku.

Nějaké předpokládání, že během jednoho mountu nedojde k výpadku napájení, to je... nic pro mě.

4.9.2017 23:14 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Normální je, že ten náhradní disk už je v poli přidaný jako spare disk a použije se automaticky, nečeká se až někam někdo fyzicky s diskem přijde. Vyndavat zbytečně disk, na kterém je spousta čitelných dat, mi naopak jako moc normální nepřipadá – úplně zbytečně riskujete, že ta data necháte jen na zbývajících discích, odkud se budou muset při resynchronizaci navíc všechna přečíst (nejviditelnější je to na RAIDU1 se 2 disky – data necháte na jednom disku, ten zatížíte pro čtení dvojnásobně, protože musí zastat práci i za druhý disk, a jako bonus mu ještě naložíte přečtení celého disku). Pokud nemáte volný slot nebo odchází elektronika disku, je to větší výpadek, a v současné době to u btrfs bohužel znamená remount s -o degraded.

5.9.2017 08:59 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Spare je nesporně užitečný. Leč na méně kritických systémech to není standard - jako třeba ty naše dvoudiskové pracovní stanice, kde je raid kvůli úspoře času při výměně disku.

Vyndavat zbytečně disk, na kterém je spousta čitelných dat, mi naopak jako moc normální nepřipadá

Ten disk už je vyhozený z raidu, takže ničemu nepomůže, nijak se nepoužívá. Rozhodně nechci, aby z něj raid něco četl a pořád řešil jeho chyby. Nejlepší cesta, jak zaseknout SATA (možná i SAS) řadič i pro ostatní disky. Pokud bych jej potřeboval, jsou jeho data už stejně zastaralá. A nakonec nemusím jej hned sešrotovat, může zůstat na stole, dokud resync nedojede...

Jen mimo hru - jak se do btrfs raid1 přidá spare disk? https://btrfs.wiki.kernel.org/index.php/Project_ideas#Hot_spare_support tolik asi tak k tomu "hloupé zfs a md raid" od jiného diskutéra.

5.9.2017 09:19 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Btrfs nepracuje s pojmem spare. Kdy už to probůh pochopíte. Btrfs v raid1 zajímá jenom to, aby každý extent putoval na dvě různá zařízení. Pokud máte dva disky, rozhazuje to mezi ně. Když jich máte víc, tak to rozhazuje rovnoměrně i přes ty ostatní. Když některý z nich chcípne, tak pro extenty které měly svůj duplikát na disku který chcípnul udělá tam kde je místo – ale opět na jiném disku než jsou extenty, které zůstaly.

A proč se takhle chová? Protože do toho luxusu, vyhradit jeden celý disk jako spare, se nikomu nechce. Takhle se využívají všechny disky rovnoměrně. A pokud je jich dost tak je to i bez starostí. Logika je prostá — souborový systém by nikdy neměl být zapráskaný tak, aby na discích nezbylo dost místa na to, aby se tam vešly datové exenty z disku který chcípnul.

Právě z toho důvodu je lepší mít Btrfs raid 1 sestavený z několika menších disků, než jenom ze dvou velkých. Ty jsou nejenom drahé, ale také pomalé a jakákoliv operace s nimi přináší akorát opruz. Jsou to jednoduché počty, ve kterých hrají roli otáčky, propustnost sběrnice, kapacita a cena. A pak jsou ještě další veličiny se kterými se dá počítat – hlučnost, spotřeba, teplo které je třeba odvést,…

Jinak pokud jde o výměnu disku. Já teda nevím, ale svoje stroje kvůli výměny disku restartovat nemusím. Stačí do boxu zasunout nový disk a původní disk nahradit.

V tomto bodě bych zmínil perličku. Kolega nedávno řešil disky a s překvapením zjistil, že při výrobě došlo k posunu číslování, takže uid kterým se disk hlásil v systému byl jiný než na štítku. A protože to byly disky z jedné série, tak to bylo posunuté u dobré poloviny z nich.

K čemu taková situace vede? No zjistíte který disk je vadný, vyndáte ho - a ajta krajta. On to byl zrovna ten klíčový co tam měl zůstat.

5.9.2017 09:37 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Díky za info. Vzhledem k tomu, že takhle složité věci obvykle obsahují spousty chyb a omezení (což je nakonec vidět), nic pro mě. Ale držím palce.

5.9.2017 23:22 RAID89564
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

"Logika je prostá — souborový systém by nikdy neměl být zapráskaný tak, aby na discích nezbylo dost místa na to, aby se tam vešly datové exenty z disku který chcípnul."

Takze kdyz bude zapraskany, tak mi pole pojede bez redundance? To je nejaky novy slunickovy pristup k SPARE diskum? "Chcete SPARE disky? Ale my vime, ze je nepotrebujete!" S takovym debilnim pristupem bych se nedivil, kdybych u skoro zaplnenych filesystemu prisel i o data. BTRFS je evidentne zmetek urovne Win3.0.

5.9.2017 09:42 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Vy tady pořád mícháte dohromady co nejlepší RAID a podprůměrný RAID. RAID se dvěma disky je takové šidítko, nemůžete od toho chtít žádné zázraky. Stejně tak ta výměna disku až když bude pořád hlásit chyby při čtení. Když ho vyměníte už v okamžiku, kdy začne odcházet podle SMART, neohrožujete pole tím, že v něm budete mít některá data uložená jenom jednou. btrfs vám hlavně umožňuje co nejlépe využít pořádný RAID. Pokud máte dvoudiskový RAID1, z pohledu RAIDu se na tom toho moc vymyslet nedá, takže tam btrfs nemá co nabídnout.

5.9.2017 09:58 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Nám většinu disků vyhodí pole při chybě ATA komunikace, což se ve smartu projeví až následně (ATA errors), pokud vůbec. Vždy jdou rovnou na výměnu a pokud byly v záruce (málokdy), nikdy nebyl problém s reklamací. Ke špatným/realokovaným sektorům ve smartu dochází spíše výjimečně. Takže smart to obvykle nijak dopředu neohlídá.

Používáme dvoudiskové md RAID1 pro stanice a mnohodiskové md RAID10 se spare pro interní servery. Externí na netu mají většinou HW raidy. Na interních serverech přejdeme na ZFS, především kvůli snapshotům pro konzistentní zálohy a zfs send/receive při vytváření externích záložních kopií, které se zatím dělají na zálohovacím serveru mirrorem md raid1 se zapnutou write-intent bitmapou. Jo, už jsme z nich za těch 15 let asi dvakrát datové pole zálohovacího serveru obnovovali.

5.9.2017 10:03 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jak jsem psal, na dvoudiskovém RAIDu podle mne nemá btrfs RAID co nabídnout, nevidím důvod nepoužívat tam md raid.

5.9.2017 10:16 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Tak to jsme asi došli ke stejnému závěru :-)

Díky za diskusi.

4.9.2017 20:55
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jestliže se pole přehodí do degradovaného rw režimu, tak to je právě ten první pokus. A pakliže disk není hotswap, tak je potřeba vypnout a znovu zapnout počítač. A to další rw připojení je druhé a nazdar bazar.

4.9.2017 21:52 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Tak pokud někdo dělá pokusy na produkčním systému… Já bych třeba pole jen tak pokusně do degradovaného režimu neremountoval. Když vím, že budu počítač kvůli vyjmutí vypínat, tak pole přimountuju v degradovaném režimu až po znovuzapnutí. Stejně bude po tom zapnutí konfigurace systému jiná (nebude tam ten disk), takže předchozí pokusný remount do degradovaného režimu je úplně k ničemu.

4.9.2017 22:08
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ne tak jsem to nemyslel. V předchozích příspěvcích se psalo, že pole se automaticky přehodí do degradovaného režimu. Z toho jsem to odvozoval.

Tak co tedy udělá zapnutý btrfs raid1 v rw režimu, kterému odejde jeden disk do věčných lovišť? (Musím se zeptat, protože nemám, jak si to nasimulovat.) Pracuje dál, ale nadává? Přepojí se do ro? Přestane pracovat úplně? Co udělá?

4.9.2017 22:14 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Pokud odejde za běhu, tak ti vynadá do dmesg (podobně jako MD RAID) a vše funguje normálně dál. Dokonce ho pak můžeš dvakrát :) odpojit a znovu připojit a potřetí už to nejde. (zajímalo by mě, jak se proboha stalo, že něco jde namountovat dvakrát a potřetí už ne -- jestli je to technická limitace (nenapadá mě jak se to povede), nebo tam je fakt counter, který ti ukáže prostředníček)

4.9.2017 22:36
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Takže disk odejde, systém nadává, ale jede. Já ho nervózně vypnu a v tu ránu už ho nenahodím, dokud nemám po ruce náhradní disk. To abych měl ještě náhradní systém, který by přebral funkci. :-)

Možná by bylo lepší, kdyby se tahle fíčura dala nějak vypnout.

Nebo, jestliže btrfs ví, kolikrát byl namountován v degradovaném režimu, tak to bude někde na disku zapsané a možná by stačil nějaký hexaeditor a změnit nějakou jedničku za nulu.

4.9.2017 22:33 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

pole se automaticky přehodí do degradovaného režimu

Ale automatické přehození je něco úplně jiného, než ruční přemountování správcem. Automatické přehození do degradovaného režimu je provozní stav, se kterým se normálně počítá, od toho tam ten RAID je. Přimountování disku s parametrem degraded je způsob, jakým správce sdělí systému, že řeší ten problém, a ten parametr říká, že se má souborový systém připojit, i když je v degradovaném režimu (protože se připojuje právě za účelem opravy, ne za účelem běžného provozu).

Tak co tedy udělá zapnutý btrfs raid1 v rw režimu, kterému odejde jeden disk do věčných lovišť?

Pracuje dál a nadává.

Trochu divné je, že do tohohle stavu se lze dostat jedině s přimountovaným systémem, ale jakmile jej jednou odmountujete (třeba kvůli restartu), tak už se do něj nejde vrátit a btrfs vás před dalším mountem donutí nějak se tím zabývat. Na jednu stranu je to pochopitelné, protože RAID s menším počtem disků, než je požadavek, by se měl řešit co nejdříve. Na druhou stranu to vede k situaci, kdy je na nějaké vyřešení jenom jeden pokus, a bohužel jsou situace, které správce ovlivnit nemůže – třeba výpadek napájení. Zase je ale dobré dodat, že to počítadlo mountů v degradovaném režimu je podle odkazovaných e-mailů jenom dočasné řešení a plánuje se úprava, která bude kontrolovat skutečný stav filesystému. Navíc tahle situace je specifická pro RAID1 se dvěma disky, pokud těch disků bude víc a nebudou zaplněné až po okraj, nemělo by k téhle situaci vůbec dojít.

4.9.2017 22:40
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

OK. Díky za vysvětlení.

4.9.2017 17:25 jekub
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jelikož jsem s tím neměl žádné zkušenosti, tak ještě vícekrát. Od několika restartů po fyzicky odpojeném disku za běhu, restarty v průběhu syncu po připojení disku, ... Přišlo mi to jako samozřejmost.

1.9.2017 06:57 2017
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

musim vas podporit. je odpovednost kazdeho kdo to nasadi si o tom zjistit jak to funguje. druha vec by byla, pokud by to byla nedokumentovana "featuresa"

stejne jako se zalohovanim. kdo zalohuje a nikdy si nenasimuloval zavadu a obnoveni dat, tak musi mit nekde v kredenci lahvicku s virem stesti.

31.8.2017 22:08 Want
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ale jde. Dá se to ošidit, když tomu dáš nějaký soubor přes loop. Klidně vytvořený v tmpfs. On zkrátka potřebuje někam cpát ty věci, než mu dáte ten druhý disk. Pak se ten vadný disk vykopne a místo něj se dá nový. A pro změnu se vyndá ten druhý. A proč sem pletete md raid, který s Btrfs v raid 1 nemá nic společného?

1.9.2017 07:30 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Uveď prosím příklad, nevím, jak to myslíš.
Mdadm zmiňuje proto, protože přemýšlí, že ho použije místo raid fce v btrfs, nevím, co je na tom k nepochopení. Pokud narážíš na případné nevýhody, nebo zbytečnost, tak z tohoto threadu tato myšlenka vzešla.
Jelikož jsi ani ty neposkytl řešení ("najdi si návod, co jsem psal", to je opravdu originální pomoc :) ), tak se mu není co divit.
Zdar Max

Měl jsem sen ... :(

1.9.2017 08:57 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Zdar Maxi. Nepsal jsem mu aby si našel návod co jsem psal, ale že pokud bude hledat, tak na něj možná při troše snahy narazí.

Jinak pokud jde o ten konkrétní problém. To mám zatím jenom ve svých poznámkách - ještě jsem to nepřežvýkal pro ty blbce ;-) Rozepsal jsem to, ale nějak se navalila jiná práce a už jsem to nestačil dotáhnout.

V kostce ale mohu odkázat na zdejší blogpost co jsem psal - Výměna SSD disků systémového disku s Btrfs v módu raid1. Je to v zásadě to samé co potřebuje vyřešit tazatel. Celý vtip je v tom, že musí nejdřív přidat nějaké zařízení, aby mělo Btrfs v raid1 splněnu základní podmínku: Mám možnost ukládat na dvě bloková zařízení. Pak přestane stávkovat a dá se normálně připojit readwrite. No a pokud to není zrovna loop do tmpfs, ale na něco co má dostatečně velkou kapacitu, tak je po problému. V podstatě jde o zcela normální stadardní postup. Nic extra. Takže tahle sekvence příkazů:

stroj :~# btrfs fi show /
…
        *** Some devices missing
stroj :~# btrfs device stats /
stroj :~# btrfs device add /dev/loop0 /
stroj :~# btrfs balance start /…
…
stroj :~# btrfs device delete missing /…
stroj :~# btrfs device stats /…

Aha show ukazuje že je nějaký disk v háji. No tak koukneme na stat, ať víme který, že. Pokud máme raid1, ale zbyl nám pouze jeden disk, musíme situaci nějak vyřešit, že? Kdybychom měli disků víc, tak tenhle krok můžeme klidně přeskočit. Tož přidáme nový disk. Bodneme do USB něco na čem se dá vytvořit alespoň prozatimně image, tu připojíme na loop0, přidáme jako nový disk a spustíme balance. Pak se zbavíme toho co je missing.

No a pokud chce používat ten disk zase jenom na jednom disku, tak holt musí trochu pohledat, našel by možná ten můj zk..ý manuál, tam by se dočetl něco o tom jak to vlastně funguje a třeba by mu došlo, že k tomu musí udělat balancing s konverzí extentů. Ovšem proč by to dělal, když chce jenom vyměnit disk, že?

Fakt nechápu co ty lidi vede k tomu, používat Btrfs v single mode a ještě jenom nad jedním blokovým zařízením, když jeho elegance vyniká až u raid1. Já už doma od md raidu dávno upustil. Nemám prachy na to, abych pokaždé kupoval 4 stejné, nebo pokud možno větší disky. Takhle mám ve stroji 6 disků, když jeden chcípne, tak si to Btrfs samo přeháže, místo na to má. A já pak jenom vyměním ten disk za nový.

1.9.2017 09:10 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Důležitá poznámka - není jedno, jak bylo to Btrfs v raid1 vytvořeno! Nevím jak je to teď, ale u starších verzí bylo nutné, pokud se ze single mode udělal raid1 udělat rebalancing, aby byly zreplikované všechny extenty - píšu o tom v tom manuálu.

Zkrátka je třeba prozkoumat co vrací Btrfs pro device.

3.9.2017 22:47 xxl | skóre: 26
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Dobrý zk..ý manuál ;-)

. Díky. A taky díky tazateli, že se vůbec zeptal. Přimělo mě to konečně k vyzkoušení btrfs. A ty možnosti mě fakt zaujaly.

A i ten btrfs raid1 jsem dokázal sestavit, cvičně rozbít a zase opravit. Zase tolik práce to nedalo. Aby člověk opravil rozbitý mdraid, taky si musí něco nastudovat.

4.9.2017 08:58 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Potěšení na mé straně. A to tam ještě fakt dost zajímavých věcí které mám v poznámkách chybí.

4.9.2017 09:07 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jinak ještě k tomu raidu u Btrfs. Problémový byl dlouhou dobu raid5/6, ale pokud vím už by to mělo být opravené. Ale ruku na srdce, když člověk pochopí, jak vlastně u Btrfs funguje raid 1 tak mu přijde nasazení raid5/6 až zbytečné. Proto to zřejmě u vývojářů nemělo až takovou prioritu. Rozdíl je totiž v tom, že datové extenty nejsou na dvou blokových zařízeních (jako u raid1) ale na třech. Ovšem jaká je pravděpodobnost, že chcípnou dva disky současně? Podle mě zhruba stejná, jako kdyby měly umřít tři a v takovém případě už je to úplně jedno.

Když mám tedy 4 disky, je lepší nad nima mít Btrfs v raid 1, než md raid 6 – jak jsem to dřív míval – a nad ním Btrfs v single modu. A úplně nejlepší je to mít tak (jak to mám teď já), aby v případě výpadku největšího z disků byly schopné všechny ostatní disky se o jeho kapacitu podělit.

4.9.2017 23:58 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Pokud vím, RAID5/6 je stále u btrfs nepoužitelný, stále v režimu unstable a nedoporučuje se jeho používání s produkčními daty.
Dívám se na status u kernelu 4.12 a je to stále tak : BTRFS : Status(write hole still exists, parity not checksummed)
Další né moc pěkná věc je pak "gets stuck on devices with bad sectors".
Ještě čeká vývojáře hodně práce. Každopádně já osobně btrfs používám bez problémů, ale většinou na desktopu/ntb s jedním diskem, nikdy jsem u něj nezkoušel fce raidu.
Zdar Max

Měl jsem sen ... :(

5.9.2017 08:57 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Pokud vím, RAID5/6 je stále u btrfs nepoužitelný, stále v režimu unstable a nedoporučuje se jeho používání s produkčními daty.

Je to možné. Já ho taky nikomu nedoporučuji, protože Btrfs v raid1 bohatě stačí. Chápu že to tady někteří stále nedokáží pobrat jak to vlastně funguje. Také jsem měl z toho dlouho obavy. Používal jsem md raid 6, protože jsem měl 4 disky a byl jsem i v situaci, že dva z nich byly pryč. Byly vadné kontakty na jedné větvi u zdroje – od té doby se vyhýbám modulárním zdrojům jak čert kříži.

Btrfs v raid 1 ti poskytne totéž, pokud ti zbylé disky poskytnou dostatečnou kapacitu za ty co vypadnou. Navíc máš s dispozici další možnosti, jak v případě nutnosti uvolnit další místo (defragmentace, reflinky, rekomprese,…). Proto mám kupř. zcela záměrně vypnutou u Btrfs kompresi. Jednak to snižuje zátěž za provozu, a pak – když je zle, je kam sáhnout abych uvolnil místo.

U klasického md raidu vypadlý a opět přidaný disk znamenal 8 hodin resynchronizace. U Btrfs nic takového není.

5.9.2017 09:17 R
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Vypadnuty a znovupridany disk riesi write-intent bitmap.

5.9.2017 10:54 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Tak tak, ale má to samozřejmě své režie :-/.
Zdar Max

Měl jsem sen ... :(

5.9.2017 09:49 vandrovnik | skóre: 21
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jestli jste výpadkem napájení přišel o dva disky, tak raid 6 bude fungovat dál, ale btrfs raid 1 podle mého soudu ne - má data na dvou místech a pokud obě ta místa byla na těch odpojených discích...

5.9.2017 10:44 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To je sice pravda, ale to ještě nic neznamená. Jakmile má ty disky zase k dispozici, normálně najede. U toho md raidu to tak jednoduše nešlo. Jinak ten systém by pravděpodobně nenajel a pokud by najel, tak by řval, že něco není v pořádku, protože by mu chyběly extenty co jsou na chybějících discích.

Btrfs raid1 neřeší všechny situace, ale řeší situaci kdy disky umírají postupně. Kupř. na notebooku ho používám proto, že na něm mám SSD. Zažil jsem několikrát chcíplé SSD. Vždycky to bylo náhle, bez příznaků a totálně. A opravdu nemám na to ztrácet čas reinstalací a obnovou záloh. Nehledě na to, že ten SSD disk může umřít v situaci, kdy se k nim ani nemohu dostat.

4.9.2017 14:16 Michal
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Zakladni myslenka RAID1 je takova, ze po vypadku disku vse funguje bezvypadkove, bez zasahu admina a hlavne RW jako by se nechumelilo. Produkce musi bezet, proto tam mam snad sakra RAID ne? Btrfs RAID1 to zjevne nesplnuje tudiz to neni RAID1 ale nejaka ... neco jineho.

4.9.2017 14:34 Petr
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To ale lidem co maji bŕŕŕfs nekde doma nevysvetlis. Stejne jim nevysvetlis to, ze raid1 ve kterem musi byt 3 disky jenom kvuli nedodelkum tohodle fs znamena +33% narust na storage costs a ono je to asi jedno u stroje ve kterem jsou 3 nebo klidne 20 disku, ale jestli mate tech serveru x stovek nebo x tisicu tak to jiz jedno neni. To same i io costs.

4.9.2017 14:49 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

RAID není primárně určen k tomu aby služba jela bezvýpadkově, bez zásahu admina. Ale k vytvoření úložiště s větší kapacitou, než umožňuje jedno blokové zařízení. A v případě raid polí vyšších než 0 odstínit souborový systém od chyb na blokovém zařízení. Což je přesně to co Btrfs dělá, pokud je v raid1 a má k dispozici více než jeden disk. Pokud tedy chceš aby ti Btrfs fungovalo bezvýpadkově, tak to nesmíš šmudlat jen se dvěma disky. Dej si tam alespoň tři a budeš mít k dispozici nejenom vyšší kapacitu, ale i to po čem toužíš - FS, který je schopen fungovat bezvýpadkově.

4.9.2017 18:15 petr
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Takze kdyz budu mit 1000 serveru, budu muset mit o 1000 disku navic kvuli brtfs logice ze v raid1 je zapotrebi minimalne 3 disky abych mohl fungovat nez se nekdo stavi do datacentra vymenit vadny disk. Takze treba o 200k$ navic investice. To by me sefove pochvalili. Kdyz odejde jeden disk v klasickem raid1, jede se dal a az se vymeni (treba u nas 1 tydne), tak se data syncnou. Kdyz selze i druhy, je aktivni jeste minimalne 1 stroj v ha poskytujici danou sluzbu a dany node se proste obnovi ze zalohy. Nekdy mi prijde ze btrfs muze do produkce obhajovat clovek co ma 2 servery s 5 disky a negarantovanou dostupnosti. S btrfs v produkci to musi byt Sranda.

4.9.2017 19:02 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Vymýšlíte absurdnosti, a nějak jste se do toho zamotal. NA RAID1 nepotřebujete tři disky, stačí dva. Ale pokud máte v datacentru 1000 serverů a v každém dva disky, nejvíc ušetříte, když použijete diskové pole, které ty servery budou sdílet.

4.9.2017 19:15 alkoholik | skóre: 40 | blog: Alkoholik
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ten ja fakt dobry.
;)

4.9.2017 19:49 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Takze kdyz budu mit 1000 serveru, budu muset mit o 1000 disku navic kvuli brtfs logice ze v raid1 je zapotrebi minimalne 3 disky abych mohl fungovat nez se nekdo stavi do datacentra vymenit vadny disk.

Když budu mít 1000 serverů, tak použiju v prvé řadě distribuovaný souborový systém. A pak by bylo úplně jedno kolik v nich bude disků, protože bych je udělal disklessové. A pokud jde o vaše počty. Sorry, ale 6x 2TB je rozhodně lepší volba než 2x 6TB, Vyjde to lépe cenově, bylo by to lepší z hlediska výkonu a taky by to přineslo mnohem větší úspory při výměně disků co by odešly.

5.9.2017 16:18 MP
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No jak se to vezme :-)

1] 2x6T vs 6x2T...cena je nyni bez dph 5k za WD RED 6T, 2k za 2T variantu, cili 10k vs 12k

2] performance...bude lepsi u 6x2T

3] hw...2x6T se vejde do 1U, 6x2T do 1U nenacpete, plus prislusny radic/pocet portu sata, ramecky atd

4] spotreba...maximalka je 3.5W u 6T, 4.4W u 2T, cili 7W vs 26.4W

5] nahradni disk...lepsi u 2T

5.9.2017 18:22 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ano jak se to vezme. Je výrazný rozdíl SATA versus SAS. 2.5-inch versus 3.5-inch. A enterprise versus obyčejný desktopový disk.

Pokud chceš mít servery 1U, tak tam nebudeš cpát 6x3.5-inch, ale dáš tam jen 3x3.5-inch a nebo použiješ šasi, které má 8x2.5-inch. Ovšem enterprise SAS disk o kapacitě 2TB nestojí 2K. Musíš si rozmyslet co chceš, jestli výkonné úložiště se spolehlivými disky, nebo low cost s disky co na to vůbec nejsou stavěné.

6.9.2017 07:10 JMP | skóre: 30
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

nezapomínejte na vlastní význam "RAID" - tedy Redundant Array of Inexpensive Disks

každý má své potřeby/možnosti nastavené jinak (jen pro příklad - když budu mít mini ITX desku na ní 2x SATA, na tom si udělám sw RAID1, tak to nikdy server s 8x SAS prostě nebude ... )

a pokud něco nazvete RAID1 (mirror je jasný a zavedený - co na jednom disku to na druhém disku), tak by se to tak mělo chovat, jinak to není RAID1, pak je to totiž zavádějící a vznikají z toho nečekané komplikace viz toto vlákno o chování btrfs s "RAID1" (dtto provoz v degradovaném režimu a výměna porouchaného disku ... )

6.9.2017 09:10 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ty komplikace vzniknou pouze tehdy, když nepostupujete tak jak máte. Správný postup je takový, že když vám ve stroji chcípne disk, strčíte místo něj nový a nahradíte ten co chcípl. A ne, že budete dál používat degradované pole, jako by se nechumelilo.

To že to umožňuje md raid ještě neznamená, že je to správně. U Btrfs je to zkrátka tak, že vás to situaci donutí řešit ať chcete, nebo nechcete.

6.9.2017 09:21 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

V tom je přeci svoboda, ne? Proč by mi měl někdo diktovat, co a jak mám dělat? Když chce někdo provozovat pole v degradovaném režimu, je to jeho věc (ať už jsou důvody jakékoli), ale řešení jako takové by to nemělo nijak omezovat, maximálně by na to mělo upozorňovat.
Zdar Max

Měl jsem sen ... :(

6.9.2017 11:49 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

A i za takových okolností by se RAID1 měl chovat tak, jak má ve zvyku něco, co se nazývá RAID1 - fungovat, dokud někdo do toho pole disk zase nevrátí. A nevymýšlet nesmysly.

Quando omni flunkus moritati

6.9.2017 12:39 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Těžko se může chovat stejně něco, co funguje úplně jinak. Smiřte se laskavě s tím, že to není raid celého blokového zařízení, ale datových extentů.

6.9.2017 13:30 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Takže to vlastně není Redundant Array of Inexpensive Disks, tedy raid, a nemělo by se to tak nazývat. Když už použili tenhle název, tak se měli držet sémantiky. Nebo to nazvat RAIDE.

Quando omni flunkus moritati

6.9.2017 19:38 k3dAR | skóre: 63
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

prihodneji to meli (v BTRFS) nazvat spis PRDEL1...

porad nemam telo, ale uz mam hlavu... nobody

6.9.2017 12:37 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To máš pravdu. Na druhou stranu víš jak to chodí, když někdo něco zapinká, protože mu technologie dovolí, a pak všude troubí, že o data přišel díky špatné technologii. O své blbosti a šlendriánu taktně pomlčí.

To že je to s tím počítadlem jak to je, má zřejmě nějaký svůj důvod. A jelikož jde o věc, která zřejmě nikoho zase až tak moc nikoho nepálí, zůstává bez řešení, které by uspokojilo uživatele se sklony nechávat věci v riskantním stavu.

6.9.2017 12:57 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Přesně takový pocit riskantního stavu bych měl, kdybych na něco klíčovějšího nasadil BTRFS s tímto raidem a mohl jenom doufat, že se při výměně disku vše podaří správně, že před přidáním nového disku nevypnou proud (nebo jiný korektní reboot z jakéhokoliv důvodu), atd.

Ale za tuhle diskusi jsem moc rád. Už vím, co vůbec nemusím ještě hodně dlouho řešit.

6.9.2017 13:20 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Nedělal bych unáhlené obecné závěry z okrajového případu (RAID1 nad dvěma disky, z nichž jeden kompletně odešel), na který není btrfs zaměřen a který lze řešit jinými nástroji (takže logicky nebude v centru zájmu vývojářů btrfs).

6.9.2017 13:40 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Raid1 ze dvou disků je pro mě konkrétně zcela klíčový případ (konzistentní snapshot na btrfs by potenciálně zlepšil zálohování pracovních stanic s dvoudiskovými raid1). A očividně zdaleka nejsem sám. A jakmile disk vrátí chybu a pole ho vyhodí, tak pro mě "kompletně odešel" a v poli ho nechci, žádný jiný stav neřeším.

Takže tohle pro mě rozhodně není unáhlený obecný závěr. ZFS na servery a i nadále md raid na stanice. Třeba bude za pár let situace jiná.

6.9.2017 14:19 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To, že je něco klíčový případ pro vás, ještě neznamená, že je to klíčový případ pro btrfs a že je pro to btrfs ideální volba.

6.9.2017 14:50 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Proto jsem také ve svém příspěvku psal o svém pohledu na riskantní stav a svém rozhodnutí, viz výše. Každý nechť se zařídí dle svého.

4.9.2017 22:16 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Takze kdyz budu mit 1000 serveru, budu muset mit o 1000 disku navic kvuli brtfs

Ne. Jenom nemůžeš dělat RAID1 přes 2 disky, ale přes 3 (pozor, to neznamená, že ztratíš dvě třetiny kapacity (a že by data byla fyzicky třikrát)). Což může být trochu k naštvání, pokud jsou to servery jako Sun Fire X2250, které mají defaultně dva sloty na disky ;).

4.9.2017 16:07 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Zakladni myslenka RAID1 je takova, ze po vypadku disku vse funguje bezvypadkove, bez zasahu admina a hlavne RW jako by se nechumelilo. Produkce musi bezet, proto tam mam snad sakra RAID ne?

To máte dost zvláštní představu o RAIDu. Jednou budete velmi nemile překvapen, až vám třeba v RAID1 nebo RAID5 vypadne jeden disk, vy to necháte běžet dál,jako by se nechumelilo, a později vypadne další disk. Pokud „produkce musí běžet“, používá se např. replikace dat.

Btrfs RAID1 to zjevne nesplnuje

Na to jste přišel jak? Já bych spíš řekl, že děláte zjevně nesmyslné závěry z toho, že jeden člověk neumí vyměnit vadný disk v RAIDu.

4.9.2017 16:34 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

A co by to mělo udělat jiného, než běžet dál (a zahájit synchronizaci spare disku) a správce bombardovat hláškami o problému, aby disk vyměnil co nejdříve? Zajímalo by mě, jaké servery spravuješ, kde se při výpadku disku v raidu migrují na jiný server a raid přepíná do read-only. Zní to zajímavě, ale zajímaly by mě konkrétní zkušenosti z praxe. Sekundární server s hot daty samozřejmě máme, ale při výpadku disku z raidu nepřehazujeme, to by muselo spadnout pole celé.

4.9.2017 17:03 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jste si jistý, že reagujete na správný příspěvek? Já nevím, co by to mělo dělat jiného – myslím si, že by to mělo dělat přesně to, co popisujete, a jak se to také chová. Různé úvahy o tom, jak se jim souborový systém po výpadku disku sám remountuje do degraded módu v read-only režimu tady psali jiní, ne já. O migraci dat na jiný server v okamžiku výpadku tu zase píšete vy.

Ještě jednou, RAID není žádná magická ochrana proti výpadkům disků. RAID umožňuje (mimo jiné) zmenšit následky výpadků disků. Když máte požadavek, že data musí být uložena alespoň na dvou discích, máte je uložena právě na dvou discích a jeden disk vám vypadne, nemůžete jet dál jakoby se nechumelilo, protože původní požadavek na dva disky v tom okamžiku není zajištěn. Existují ale i měkčí požadavky, třeba že data musí být vždy alespoň na dvou discích, s výjimkou případu, kdy jeden disk vypadne – pak musí okamžitě začít synchronizace na záložní disk. Tenhle požadavek ale vyžaduje, že v poli máte spare disk (což asi nebude efektivní řešení pro RAID1 se dvěma disky). A nebo ještě měkčí požadavek, jako to měl Vandrovnik, že může být pole degradované i po dobu, kdy se čeká na výměnu disku v servisu. Přičemž u těch variant, kdy je dočasně snížená redundance, se mohou dělat další opatření, třeba informovat uživatele nebo nemazat odjinud data, která se přenášejí na to pole.

To všechno jsou přípustné varianty, jenom to musí vždy správce řešit, nemůže se při výpadku disku tvářit, že se nic neděje.

4.9.2017 20:15 Michal
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Teda pohyboval jsem se v mnoha prostredich od male firmy az po enterprise ale na RAID1/5/10 byl vzdy jeden jediny pozadavek - aby to po vypadku disku jelo dal. Ty vase tvrde pozadavky nemel nikdo neb je pro ne RAID nevhodnym resenim. By me fakt interesovalo, kdo ma pozadavek na data ve dvou kopiich a resi to RAIDem tedy disky ve stejne lokaci postizitelne stejnou zivelnou pohromou, stejnym hardwarovym problemem (vadny zdroj co odpali cely zbytek pocitace, vadny radic zapisujici pseudonahodne hodnoty na disky,...), stejnym clovekem, stejnym sw problemem,...

Teda vlastne jo, v jedne nejmenovane firme si mysleli, ze kdyz maji data na RAID6 tak nemusi zalohovat. Doplatili na to.

4.9.2017 22:09 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

aby to po vypadku disku jelo dal

Což je ale podstatně jiný požadavek, než „aby to po výpadku disku jelo dál, jako by se nic nestalo“. Protože v tom vašem případě, kdy se bere v úvahu, že se něco stalo a pole není ve standardním režimu, se pravděpodobně hned vymění vadný disk za nový a začne resynchronizace pole. Takže doba, kdy pole nesplňuje ty tvrdé požadavky, se omezí „jen“ na dobu nutnou k resynchronizaci.

neb je pro ne RAID nevhodnym resenim

To už tady padlo několikrát, ale někteří si to nenechají vymluvit a pořád trvají na tom, že účelem RAIDu je hlavně nepřijít o data. Zjevně ta nejmenovaná firma s RAIDem 6, co nemusela zálohovat, má své následovníky – i tady v diskusi.

4.9.2017 22:51 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ale houby, každý pochopí, že tím "jako by se nic nestalo" myslel vliv na chod aplikací. To dá rozum, že se musí disk urychleně vyměnit, řešíš tu nesmysly, nikdo tu nenavrhuje, aby se disk nevyměnil za jiný a nechalo se to běžet tak.

4.9.2017 23:04 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Právě že takové požadavky tady byly – bez zásahu admina, jako by se nic nestalo.

Pokud je to běžná situace, že disk začne vykazovat chyby, normálně se přidá další disk, v btrfs se jím nahradí ten vadný a až doběhne rebalance, ten vadný se může odstranit. mount -o degraded je nutné použít jedině v případě, kdy příslušný disk v systému úplně chybí, nebo má vadný superblok.

4.9.2017 23:09 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ale nebyly, to si jenom hraješ se slovíčky. Bez zásahu admina je myšleno, že to běží dál bez zásahu admina, to je přece jasné. Nikdo tu netvrdil, že se nemá disk vyměnit. A výměnou se myslí výměna, ne přidání dalšího a odebrání starého, až se to celé zasynchronizuje. To tam půjde admin dvakrát? Ve školní laborce možná jo, v reálném nasazení je to nesmysl.

4.9.2017 23:18 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Běží to dál bez zásahu admina, admin tam jde jenom jednou po resynchronizaci a vymění vadný disk za nový spare disk.

4.9.2017 23:45 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Já většinou na spare disky nejedu :). U společného storage spare mám, když mám servery plný SAS disků s hw raidem, tak to mám většinou řešeno tak, že mi v šuplíku leží od každého modelu jeden náhradní disk. Tzn., třeba 4 disky k hafec serverům.
Je to jednak z důvodu úspory (nemusím mít nakoupeno tolik disků) a jednak z důvodu, že pro spare disk už třeba nemám místo (třeba HP má většinou šasi pro 8x SAS a se 7x hdd se dělá blbě RAID10).
Vadné disky pak na pobočkách mění obyčejný user, který nemá s IT nic společného :).
To je jen příklad proti tvému idealismu se spare diskama :).
Zdar Max

Měl jsem sen ... :(

5.9.2017 09:47 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To je jen příklad proti tvému idealismu se spare diskama :).

To je problém příkladů, které popisuje Dustin. Na jedné straně je všechno ideální a vše se děje samo bez zásahu admina, na druhé straně je to ten nejhorší možný RAID se dvěma disky. Těžko pak uhodnout, zda řešíme, jak by to mělo fungovat co nejlépe, nebo zda řešíme alespoň nějaký RAID pro dva disky.

6.9.2017 15:41 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

No já nevím, Murphy nikdy nespí a události se řadí tak, aby napáchaly co největší škodu. V klasických HW polích spare máme všude, jednak se tím o něco málo odloží nutnost výměny disku (ty to musíš udělat ASAP), ale taky už se nám stalo, že v RAID10 s 8 diskama během 1. měsíce odešly 4 disky a jednou dokonce dva v rozmezí hodiny (naštěstí z různých mirrorů). Pole s 12 disky v R10 jsme raději od počátku nechali další dva disky jako spare a dvě pozice volné. Už tak je dost stresu (jak je ostatně vidět i z tvého zápisku z práce), tak proč si ještě přidávat další s rychlou výměnou disků. (Takto si třeba dovolím nechat výměnu až na pracovní den a neřešíme to o víkendu. Kdyby byl degradované pole, tak bych si to na produkci teda nelajznul nechat tak.)

Apropos, zrovna řešíme jedno pole, kde není místo na spare. Ve stejném racku jsou sice i náhradní disky, ale stejně to ještě předěláme tak, aby se tam tem spare vlezl. Tohle byla chyba minulého kolegy (který už tady není a napáchal trochu víc problémů).

Heron

7.9.2017 09:32 MP
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Od toho mame v datacentru onsite support, ktery predpripraveny disk v racku vymeni :-)

7.9.2017 10:50 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jo, to my taky, ale pořád mi přijde, že spare disk se aktivuje trochu rychleji, než podpora.

Heron

7.9.2017 18:07 j
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

A co budes delat, kdyz se na tebe ten onsite support vysere ...

5.9.2017 09:05 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Spare v nějaké "produkční" verzi brtfs?

5.9.2017 09:52 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

S btrfs je lepší používat všechny dostupné disky, zvýší se tím propustnost a sníží čas potřebný na resynchronizaci – místo „spare“ disku je pak potřeba mít na celém poli alespoň tolik volného místa, jaká je kapacita největšího disku. Ale jinak můžete samozřejmě i s btrfs používat opravdový spare disk – princip spare disku je v tom, že je to disk okamžitě připravený k použití, nemusí být použit automaticky, ale ručně na zásah admina. A nebo si to klidně můžete naskriptovat, že když nějaký disk začne podle S.M.A.R.T. vykazovat moc chyb, vyměníte ho automaticky.

5.9.2017 10:13 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Spare je standardně sdílený mezi více poli (což u btrfs asi nedává smysl, tam bude pole asi jedno, rozparcelované přes subvolumes). Pokud bych jej měl mít u jednoho raid1 a chtěl okamžité připravení - rovnou jej strčím jako další mirror disk toho raidu. Tak mi přijde, že je to u btrfs - spare není, protože se ve standardním provozu předpokládají alespoň 3 disky, co jsem z této diskuse pochopil...

31.8.2017 17:08 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Trochu podrobněji to popsal třeba Heron v Chování při výpadku disku. Pokud chcete používat btrfs, doporučuji přečíst si celý jeho miniseriál.

Tak jsem si vyzkoušel btrfs raid1:

#!/bin/sh
set -x
uname -a

dd if=/dev/zero of=disk1 bs=1 count=0 seek=1G
dd if=/dev/zero of=disk2 bs=1 count=0 seek=1G
losetup /dev/loop1 disk1
losetup /dev/loop2 disk2
mkfs.btrfs -f -m raid1 -d raid1 /dev/loop1 /dev/loop2
mkdir -p btrfsmnt
mount /dev/loop1 btrfsmnt
btrfs fi df btrfsmnt
btrfs fi show btrfsmnt
btrfs fi usage btrfsmnt
dd if=/dev/zero of=btrfsmnt/file1 bs=1M count=100
dd if=/dev/zero of=btrfsmnt/file2 bs=1M count=100
dd if=/dev/zero of=btrfsmnt/file3 bs=1M count=100
dd if=/dev/zero of=btrfsmnt/file4 bs=1M count=100
dd if=/dev/zero of=btrfsmnt/file5 bs=1M count=100
#dd if=/dev/zero of=btrfsmnt/file6 bs=1M count=100
btrfs fi df btrfsmnt
btrfs fi show btrfsmnt
btrfs fi usage btrfsmnt
btrfs balance start -f --full-balance btrfsmnt
dmesg | tail

s tímto výsledkem:

+ uname -a
Linux debian 4.9.0-3-amd64 #1 SMP Debian 4.9.30-2+deb9u3 (2017-08-06) x86_64 GNU/Linux
+ dd if=/dev/zero of=disk1 bs=1 count=0 seek=1G
0+0 záznamů přečteno
0+0 záznamů zapsáno
0 bajtů zkopírováno, 0,00010714 s, 0,0 kB/s
+ dd if=/dev/zero of=disk2 bs=1 count=0 seek=1G
0+0 záznamů přečteno
0+0 záznamů zapsáno
0 bajtů zkopírováno, 9,4216e-05 s, 0,0 kB/s
+ losetup /dev/loop1 disk1
+ losetup /dev/loop2 disk2
+ mkfs.btrfs -f -m raid1 -d raid1 /dev/loop1 /dev/loop2
btrfs-progs v4.7.3
See http://btrfs.wiki.kernel.org for more information.

Performing full device TRIM (1.00GiB) ...
Performing full device TRIM (1.00GiB) ...
Label:              (null)
UUID:               
Node size:          16384
Sector size:        4096
Filesystem size:    2.00GiB
Block group profiles:
  Data:             RAID1           102.38MiB
  Metadata:         RAID1           102.38MiB
  System:           RAID1             8.00MiB
SSD detected:       no
Incompat features:  extref, skinny-metadata
Number of devices:  2
Devices:
   ID        SIZE  PATH
    1     1.00GiB  /dev/loop1
    2     1.00GiB  /dev/loop2

+ mkdir -p btrfsmnt
+ mount /dev/loop1 btrfsmnt
+ btrfs fi df btrfsmnt
Data, RAID1: total=102.38MiB, used=128.00KiB
System, RAID1: total=8.00MiB, used=16.00KiB
Metadata, RAID1: total=102.38MiB, used=112.00KiB
GlobalReserve, single: total=16.00MiB, used=0.00B
+ btrfs fi show btrfsmnt
Label: none  uuid: 947f1aac-ffd3-46e4-89bd-5dc1a0110aa7
	Total devices 2 FS bytes used 256.00KiB
	devid    1 size 1.00GiB used 212.75MiB path /dev/loop1
	devid    2 size 1.00GiB used 212.75MiB path /dev/loop2

+ btrfs fi usage btrfsmnt
Overall:
    Device size:		   2.00GiB
    Device allocated:		 425.50MiB
    Device unallocated:		   1.58GiB
    Device missing:		     0.00B
    Used:			 512.00KiB
    Free (estimated):		 913.50MiB	(min: 913.50MiB)
    Data ratio:			      2.00
    Metadata ratio:		      2.00
    Global reserve:		  16.00MiB	(used: 0.00B)

Data,RAID1: Size:102.38MiB, Used:128.00KiB
   /dev/loop1	 102.38MiB
   /dev/loop2	 102.38MiB

Metadata,RAID1: Size:102.38MiB, Used:112.00KiB
   /dev/loop1	 102.38MiB
   /dev/loop2	 102.38MiB

System,RAID1: Size:8.00MiB, Used:16.00KiB
   /dev/loop1	   8.00MiB
   /dev/loop2	   8.00MiB

Unallocated:
   /dev/loop1	 811.25MiB
   /dev/loop2	 811.25MiB
+ dd if=/dev/zero of=btrfsmnt/file1 bs=1M count=100
100+0 záznamů přečteno
100+0 záznamů zapsáno
104857600 bajtů (105 MB, 100 MiB) zkopírováno, 0,0473304 s, 2,2 GB/s
+ dd if=/dev/zero of=btrfsmnt/file2 bs=1M count=100
100+0 záznamů přečteno
100+0 záznamů zapsáno
104857600 bajtů (105 MB, 100 MiB) zkopírováno, 0,045225 s, 2,3 GB/s
+ dd if=/dev/zero of=btrfsmnt/file3 bs=1M count=100
100+0 záznamů přečteno
100+0 záznamů zapsáno
104857600 bajtů (105 MB, 100 MiB) zkopírováno, 0,0449962 s, 2,3 GB/s
+ dd if=/dev/zero of=btrfsmnt/file4 bs=1M count=100
100+0 záznamů přečteno
100+0 záznamů zapsáno
104857600 bajtů (105 MB, 100 MiB) zkopírováno, 0,0486156 s, 2,2 GB/s
+ dd if=/dev/zero of=btrfsmnt/file5 bs=1M count=100
100+0 záznamů přečteno
100+0 záznamů zapsáno
104857600 bajtů (105 MB, 100 MiB) zkopírováno, 0,0406407 s, 2,6 GB/s
+ btrfs fi df btrfsmnt
Data, RAID1: total=518.38MiB, used=128.00KiB
System, RAID1: total=8.00MiB, used=16.00KiB
Metadata, RAID1: total=102.38MiB, used=112.00KiB
GlobalReserve, single: total=16.00MiB, used=0.00B
+ btrfs fi show btrfsmnt
Label: none  uuid: 947f1aac-ffd3-46e4-89bd-5dc1a0110aa7
	Total devices 2 FS bytes used 256.00KiB
	devid    1 size 1.00GiB used 628.75MiB path /dev/loop1
	devid    2 size 1.00GiB used 628.75MiB path /dev/loop2

+ btrfs fi usage btrfsmnt
Overall:
    Device size:		   2.00GiB
    Device allocated:		   1.23GiB
    Device unallocated:		 790.50MiB
    Device missing:		     0.00B
    Used:			 512.00KiB
    Free (estimated):		 913.50MiB	(min: 913.50MiB)
    Data ratio:			      2.00
    Metadata ratio:		      2.00
    Global reserve:		  16.00MiB	(used: 0.00B)

Data,RAID1: Size:518.38MiB, Used:128.00KiB
   /dev/loop1	 518.38MiB
   /dev/loop2	 518.38MiB

Metadata,RAID1: Size:102.38MiB, Used:112.00KiB
   /dev/loop1	 102.38MiB
   /dev/loop2	 102.38MiB

System,RAID1: Size:8.00MiB, Used:16.00KiB
   /dev/loop1	   8.00MiB
   /dev/loop2	   8.00MiB

Unallocated:
   /dev/loop1	 395.25MiB
   /dev/loop2	 395.25MiB
+ btrfs balance start -f --full-balance btrfsmnt
ERROR: error during balancing 'btrfsmnt': No space left on device
There may be more info in syslog - try dmesg | tail
+ dmesg
+ tail
[170304.296218] BTRFS info (device loop2): has skinny extents
[170304.296219] BTRFS info (device loop2): flagging fs with big metadata feature
[170304.297580] BTRFS info (device loop2): creating UUID tree
[170304.789212] BTRFS info (device loop2): relocating block group 462159872 flags 17
[170305.101215] BTRFS info (device loop2): relocating block group 136708096 flags 17
[170305.490432] BTRFS info (device loop2): relocating block group 29360128 flags 20
[170305.857469] BTRFS info (device loop2): found 6 extents
[170306.180689] BTRFS info (device loop2): relocating block group 20971520 flags 18
[170306.580826] BTRFS info (device loop2): found 1 extents
[170306.994521] BTRFS info (device loop2): 1 enospc errors during balance

Takže když by jeden disk odešel, já bych ho musel vyměnit a musel bych tudíž v nějakém okamžiku udělat btrfs balance, tak ho neudělám, protože btrfs raid1 už na to nemá místo při zaplnění asi na 50% své kapacity. Takže na raidu1 se dvěma disky, kde vědomě obětuji kapacitu celého disku, nevyužiju ani půlku toho jednoho disku, aniž bych se pak dostal do problémů?????

5.9.2017 08:58 Kandidat vied
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

BTRFS s RAID1 nad 2 diskami je koledovanie si o velky pruser... RAID1 mostly OK Needs at least two available devices always. Can get stuck in irreversible read-only mode if only one device is present.

5.9.2017 09:04
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Díky kandidáte.

Ale ten můj příklad má pořád ještě dva funkční disky v raidu. A přesto při zaplnění asi tak na 50% nedokáže provést balance.

5.9.2017 10:00 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

musel bych tudíž v nějakém okamžiku udělat btrfs balance

Proč?

tak ho neudělám, protože btrfs raid1 už na to nemá místo při zaplnění asi na 50% své kapacity

Což jste si ale způsobil sám tím, že jste požadoval rebalancovat rovnou celý disk a ještě jste btrfs řekl, že vás před tím nemá varovat. Je vždycky podezřelé, když někdo chce dokázat, jak nějaký nástroj dělá něco špatně, a při tom vypíná varování toho nástroje.

5.9.2017 10:20
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

OK. Tak tedy:

#btrfs balance btrfsmnt
WARNING:

        Full balance without filters requested. This operation is very
        intense and takes potentially very long. It is recommended to
        use the balance filters to narrow down the balanced data.
        Use 'btrfs balance start --full-balance' option to skip this
        warning. The operation will start in 10 seconds.
        Use Ctrl-C to stop it.
10 9 8 7 6 5 4 3 2 1
Starting balance without any filters.
ERROR: error during balancing 'btrfsmnt': No space left on device
There may be more info in syslog - try dmesg | tail

To jsem si fakt pomohl.

5.9.2017 11:09 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

OK. Tak tedy:
#btrfs balance btrfsmnt

Připadá vám, že tohle je vytažení disku ze šuplíku?

Po případné výměně disku nemusím balance udělat?

Nemusíte. Prostě jenom btrfs řeknete, který disk má vyměnit za který.

btrfs replace start 2 /dev/sdc /mnt

5.9.2017 11:18
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

OK. Díky.

5.9.2017 10:25
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jo, ještě tohle:

musel bych tudíž v nějakém okamžiku udělat btrfs balance
Proč?

Po případné výměně disku nemusím balance udělat?

5.9.2017 10:48 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Myslím že ne. Měl by stačit scrub. Při balancování se přežonglují extenty tak, aby byly po všech discích rozhozeny rovnoměrně, kdežto když se spustí scrub, jen doplní chybějící repliku.

5.9.2017 13:05 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Jen poznámku. Se zájmem sleduji diskusi, ale vzhledem k tomu že nikde btrfs RAID nemám pouze ppřimý btrfs na discích tak diskuse je možná pohled do budoucna. ale k balanci. To co se mi vypláci je balancovat postupně

btrfs balance start -dusage=10
btrfs balance start -dusage=30
btrfs balance start -musage=10
btrfs balance start -musage=30

mi přežongluje část extentů a každý příkaz je rychlý a na konci je zase konzistentní stav FS. Přenese konzistentní stav do jiného konzistentního stavu.

5.9.2017 18:21 karlik
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Tak po přečtení celé debaty jsem konečně pochopil kauzu Btrfs a podpora Red Hat.

Nečekal jsem, že to bude až takový nedodělek.

5.9.2017 19:16 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

V tom případě jste nic nepochopil. Ani tu diskusi, ani postoj RedHatu. V případu RedHat a btrfs jde o to, že má RedHat problém s backportováním změn. Btrfs se rychle vyvíjí a RedHat nemá kapacitu na to backportovat všechny změny do svých „stabilních“ verzí, tak se rozhodli zatím obětovat btrfs.

5.9.2017 21:20 karlik
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Přesně tak.

Btrfs není stabilní a mění se "pod rukama" tak rychle, že RedHat není schopný garantovat stabilitu/podporu tohoto produktu.

Nejedná se o chyby, ty se dají dát do "readme", jde o to, že co platilo před hodinou už teď nemusí být pravda (viz i tato debata).

6.9.2017 07:17 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

To je zvláštní druh humoru, napsat „přesně tak“ a pak napsat opak. Tak ještě jednou – nejde o nějakou stabilitu nebo podporu btrfs, jde o to, že RedHat nemá dostatek kapacit na backportování změn v btrfs.

6.9.2017 08:29 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Z diskuse https://news.ycombinator.com/item?id=14907771, které se účastní i bývalí vývojáři redhatu, těch důvodů může být víc:

RH má tým specialistů na XFS a nepodařilo se mu sehnat vývojáře na btrfs, kteří by byli ochotni pro RH pracovat https://news.ycombinator.com/item?id=14910150.

Zdaleka nejde jen o backporty, ale i vlastní vývoj, protože hlavní přispěvatel btrfs Facebook míří svým směrem, který nemusí odpovídat potřebám klientů RH (kteří údajně o btrfs v této fázi až tak moc zájem neprojevují) https://news.ycombinator.com/item?id=14915666 .

Odstraněním backportovaného btrfs z redhatího kernelu může RH tlačit na Oracle (který údajně na svém Unbreakable Linuxu s redhatím jádrem btrfs klientům podporuje), aby místo pracného a drahého backportování btrfs (které už za něj nebude dělat RH) uvolnil ZFS pod GPL licencí a to se tak mohlo legálně dostat do kernelu https://news.ycombinator.com/item?id=14911843.

Je tam toho víc, zajímavá diskuse.

6.9.2017 09:01 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

RH má tým specialistů na XFS a nepodařilo se mu sehnat vývojáře na btrfs, kteří by byli ochotni pro RH pracovat

Toto je podle mě informace hodná zamyšlení. Stejně jako ty následující. Nevypovídá to totiž nic o Btrfs jako takovém, jako spíš o tom, že jde především o "politickou" záležitost. Red Hat potřebuje vydělávat a jeho klienti nechtějí Btrfs ale ZFS, které však nemůže z licenčních důvodů použít. A proč chtějí jeho klienti radši ZFS? K tomu stačí přečíst tuhle diskuzi.

6.9.2017 09:06 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Nevypovídá to totiž nic o Btrfs jako takovém, jako spíš o tom, že jde především o "politickou" záležitost.

Vypovídá i o tom, že na btrfs je ještě potřeba spoustu práce, aby to klienti RH chtěli.

6.9.2017 11:40 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

A hlavně aby jim to RH byl ochoten nabídnout jako "enterprise" věc.

Quando omni flunkus moritati

6.9.2017 09:12 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Ano, ale nejde o vlastnosti/chyby btrfs, ale o kapacitu vývojářů. Vítám to, že se RedHat snaží některé vlastnosti btrfs dostat do XFS – bude jedině dobře, když těch moderních FS bude víc. Navíc první generace průkopníků často nepřežije, protože sice přijdou s něčím novým, ale zároveň se udělá spousta chyb. U druhé generace se už ví, o co je zájem a jak se toho dá docílit, ale zároveň se můžeme vyvarovat těch chyb.

místo pracného a drahého backportování btrfs (které už za něj nebude dělat RH)

Je otázka, zda to bude na Oracle platit, zvlášť když je čím dál jasnější, že backportování „oprav“ je neudržitelné. Zejména ve světě cloudů, na který se Oracle zaměřuje.

6.9.2017 13:55 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: BTRFS - jak opravit RAID 1 po výpadku disku

Zkuste si totéž při nějaké normální velikosti disků. Btrfs má velikost alokační skupiny 1GB. Když mu (jistě schválně ;-)

) vytvoříte 1G disky, tak po zapsání dat má volných přesně 0 alokačních skupin. Tudíž je nemá kam zkopírovat při rebalance. Teoreticky by stačilo mít jednu skupinu volnou, ovšem v normálním provozu je více než vhodné mít toho místa o něco víc. Dřív udávané pravidlo plnit fs do 80% podle mě platí stále. Nebo ještě lépe jak píše Aleš.

Heron

Dotaz: BTRFS - jak opravit RAID 1 po výpadku disku

Odpovědi