Portál AbcLinuxu, 1. května 2025 04:50
Dnes jsem četl slashdotovaný článek o spolehlivosti disků od Google (Failure Trends in a Large Disk Drive Population).
Narazil jsem na to včera a nemohl jsem se dočkat, až to přelouskám. Ze tří důvodů:
Tak tedy, sledovali sto tisíc disků po dobu několika let. Shromažďovali provozní data: teplota, zatížení, rozličné údaje ze SMARTu. Pobavilo mě, jak měli zadefinovánu poruchu disku: prostě když ho museli při opravě serveru vyměnit, tak byl porouchaný.
Jestli jsem správně pochopil ten graf, tak poruchy jsou celkem rovnoměrně rozprostřeny do pěti let, ze kterých měli data. První rok je trochu lepší.
56% disků zkolabovalo aniž SMARTí diagnostika naznačila nějaký problém.
Pokud SMART nahlásil problém (přemapování sektoru/scan error), pak stoupla pravděpodobnost, že se disk porouchá v následujících dvou měsících dvacetkrát až čtyřicetkrát. Nějakou chybovou SMART událost nahlásila až pětina disků.
Nebyla prokázána souvislost mezi zatížením/teplotou a poruchami. Některé hodně zatížené disky měly tendenci odejít v prvních třech měsících, ale pokud to přežily, fungovaly spolehlivě několik let. Teprve teplota nad 45 °C se do poruchovosti promítla (nedramaticky).
Nepopírají, že poruchovost značně závisí na konkrétním modelu, nicméně tato data neposkytují.
Můj závěr je ten, že disky můžete pustit z hlavy. Je to loterie. Snad jen pokud SMART něco hlásí, tak trochu zpozornět.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.