Portál AbcLinuxu, 13. května 2025 20:26

Dotaz: smartctl -t short vyhazuje disk z RAIDu

2.11.2009 21:29 happymaster23 | skóre: 9
smartctl -t short vyhazuje disk z RAIDu
Přečteno: 326×
Odpovědět | Admin
Zdravím,

mám už víc jak rok fungující MD na dvou discích (RAID 1) a napadlo mě, že bych mohl spustit krátký test disků pomocí smartctl -t short abych se podíval, jak na tom jsou. Problém nastal, že u jednoho z disků to způsobilo jeho vyhození z RAIDu, tedy přesněji jenom z toho pole, kde je systém a probíhá tam nejspíš intenzivnější zápis než na oddíl kde jsou data. Disk je jinak fyzicky naprosto v pořádku, bez jediného vadného sektoru (vyzkoušeno i pomocí badblocks) a jediný chybový údaj ve SMARTu je raw_read_error_rate, který souvisí právě s tou chybou při tom testu, jeho hodnota je 1128. Tuhle chybu se mi podařilo reprodukovat vícekrát (zhruba každé druhé až třetí spuštění smartctl -t short způsobí jeho vyhození), nicméně ve výsledku testu je, že test proběhl bez chyb. Dále ve výpisu konkrétních chyb se přímo píše, že chyba nastala v průběhu SMART testu. Konkrétně se jedná o IDNF error, podařilo se mi vygooglit, že může být způsoben softwarovou chybou testovacího nástroje a sám o sobě není nijak závažný. Osobně to tipuju na neúplně ladící kombinaci disku, smartctl a MD, kterážto způsobí jednu chybičku, která by na systému bez RAIDu nic neznamenala, nicméně RAID tento disk pro jistotu vyhodí.

RAID sám o sobě běží naprosto v pořádku, mám zajištěný monitoring, takže o každé chybě bych věděl okamžitě. Kabelem to určitě nebude, na ten stroj nikdo víc jak rok nesáhl. Jedná se o CentOS 5.4 i386 a WD RE2...

Co byste s tím udělali vy?
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

2.11.2009 22:08 R
Rozbalit Rozbalit vše Re: smartctl -t short vyhazuje disk z RAIDu
Odpovědět | | Sbalit | Link | Blokovat | Admin
To vyzera ako bug vo firmware toho disku. Tieto testy vykonava disk sam a pri beziacom teste disk musi fungovat rovnako ako normalne (akurat pomalsie).
2.11.2009 22:16 happymaster23 | skóre: 9
Rozbalit Rozbalit vše Re: smartctl -t short vyhazuje disk z RAIDu
Druhý disk je naprosto identický včetně firmware a ničím takovým netrpí...
2.11.2009 23:46 R
Rozbalit Rozbalit vše Re: smartctl -t short vyhazuje disk z RAIDu
Tak ten zly vymen. Akurat sa obavam, ze s reklamaciou bude problem.
3.11.2009 00:57 happymaster23 | skóre: 9
Rozbalit Rozbalit vše Re: smartctl -t short vyhazuje disk z RAIDu
No to je právě to - je to nereklamovatelné a dle mého názoru zbytečné. Jak jsem říkal - mám monitoring a o problémech RAIDu se dozvím okamžitě, nikdy předtím s tím nebyl problém (a není to mechanického původu), nehrozí poškození integrity dat (jak sám RAID demonstroval - při jedné jediné chybě disk vykopne), v tom stroji mám navíc další disk, který můžu během pěti minut připojit do pole, takže i kdyby ten divně chovající se selhal, pole nepoběží dlouho degradované, navíc chyba nastala výhradně při offline SMART testu, kterýžto vždycky skončil bez chyb (výjimkou byl zrušený test - to když jsem se ho pokusil spustit při synchronizaci pole a jádro mě s tím poslalo k šípku :-D). A konečně - všechna data se pravidelně každý den zálohují...

Jinými slovy - nechce se mi nic měnit, protože sahání do funkčního stroje by ve výsledku mohlo přinést víc škody než užitku. Moje otázka teda směřuje spíš tím směrem, jestli jsem nějaké riziko s tímto spojené neopomenul a tudíž jestli data nejsou v menším bezpečí. Můj názor je ten, že míra nebezpečí je stejná, jako kdyby tam byl jakýkoliv jiný disk...
3.11.2009 01:00 happymaster23 | skóre: 9
Rozbalit Rozbalit vše Re: smartctl -t short vyhazuje disk z RAIDu
...a tudíž jestli data nejsou ve větším nebezpečí...

Za chybu se omlouvám.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.