Portál AbcLinuxu, 1. května 2025 19:01
191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 6001To s tím hraješ tenis? 8-O
Nic alarmujícího tam nevidím.
3 metriky majú prefailure flag
Oprava: tři metriky mají typ pre-fail, tj. pokud by hodnoty byly problémové, signalizovalo by to blížící se selhání.
SMART Error Log Version: 1
No Errors Logged
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 49
Toto nevyzerá veľmi zdravo.
Rozmýšlaj radšej nad výmenou a zálohou. Takto nie je možné určiť či disk vydrží ešte nejaký čas alebo nie. Cena nového disku je v porovnaní s následnou obnovou po havárii disku malá.
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 118 099 006 Pre-fail Always - 194916960 3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 099 099 020 Old_age Always - 1225 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 082 060 030 Pre-fail Always - 199544018 9 Power_On_Hours 0x0032 091 091 000 Old_age Always - 8461 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 099 099 020 Old_age Always - 1225 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 099 000 Old_age Always - 0 0 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 062 058 045 Old_age Always - 38 (Min/Max 23/38) 191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 49 193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 1564 194 Temperature_Celsius 0x0022 038 042 000 Old_age Always - 38 (0 15 0 0 0) 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 8516h+46m+05.475s 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 35648480512 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 20959920791to asi neni dobry, co?
Mnoo, tak jsem právě zjistil že je něco šeredně špatně. Mám celkem tři disky:
1. disk kde mám systém a /home, prokazatelně ztrácí data (s časem se množí soubory co nejdou přečíst) a výpis vypadá následovně:
SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 3 2 Throughput_Performance 0x0026 056 056 000 Old_age Always - 4289 3 Spin_Up_Time 0x0023 082 082 025 Pre-fail Always - 5480 4 Start_Stop_Count 0x0032 097 097 000 Old_age Always - 3844 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 15586 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 252 252 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 3946 191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 1 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 055 000 Old_age Always - 30 (Min/Max 15/45) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 1 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 0 223 Load_Retry_Count 0x0032 252 252 000 Old_age Always - 0 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 3947 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 8640 - # 2 Short offline Completed without error 00% 6446 - # 3 Extended offline Completed without error 00% 6445 - SMART Selective self-test log data structure revision number 0 Note: revision number not 1 implies that no selective self-test has ever been run SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Completed [00% left] (0-65535) 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing
2. disk používám jen jako úložiště kam nehrabu, prakticky jsem na něj zapomněl. Občas tam hodím třeba film aby mi nezabíral místo na /home.
SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 1525 2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0 3 Spin_Up_Time 0x0023 082 081 025 Pre-fail Always - 5459 4 Start_Stop_Count 0x0032 097 097 000 Old_age Always - 3821 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 15457 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 252 252 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 3926 191 G-Sense_Error_Rate 0x0022 252 252 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 054 000 Old_age Always - 32 (Min/Max 17/46) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 097 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 097 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 3 223 Load_Retry_Count 0x0032 252 252 000 Old_age Always - 0 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 3927 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed: read failure 80% 8517 254340464 # 2 Short offline Completed: read failure 90% 8517 254826341 # 3 Short offline Completed: read failure 90% 6445 254826341 # 4 Extended offline Completed: read failure 80% 6444 254826341 # 5 Short offline Completed: read failure 90% 6443 255099456 SMART Selective self-test log data structure revision number 0 Note: revision number not 1 implies that no selective self-test has ever been run SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Completed_read_failure [80% left] (0-65535) 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing
A nakonec 3. disk kam teď ukládám důležitější data, měl roky vypnutý parkování hlaviček a sloužil u RPi jako systémovej disk než jsem ho dal do PCčka. Za ty roky se na něj moc nezapsalo, s jeho 1TB kapacitou může mít zapsáno...pff, tak 2TB dat max?
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 113 099 006 Pre-fail Always - 56436312 3 Spin_Up_Time 0x0003 098 097 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 494 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 071 060 030 Pre-fail Always - 13266800 9 Power_On_Hours 0x0032 057 057 000 Old_age Always - 38477 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 494 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 098 000 Old_age Always - 0 1 5 189 High_Fly_Writes 0x003a 099 099 000 Old_age Always - 1 190 Airflow_Temperature_Cel 0x0022 068 052 045 Old_age Always - 32 (Min/Max 21/33) 191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 143 193 Load_Cycle_Count 0x0032 092 092 000 Old_age Always - 16392 194 Temperature_Celsius 0x0022 032 048 000 Old_age Always - 32 (0 18 0 0 0) 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 36624h+54m+23.484s 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 2191882080 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1810169540 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 17 - # 2 Short offline Completed without error 00% 14 - # 3 Short offline Interrupted (host reset) 00% 14 - SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing
Takže si dovolím tvrdit že Raw_Read_Error_Rate nebude mít takovou váhu jak tu někdo psal, protože na ostatních discích co uložím, to přečtu i po roce. Na tom co ukazuje trojku mi data mizí fakt i po měsíci. Neřeknu kdyby to nakoplo soubor o velikosti několika GB, ale ono se to trefí třeba do třech 2MB souborů.
Kdyby to náhodou někoho zajímalo, první dva disky jsou SAMSUNG SpinPoint F3 HD502HJ (výrobní čísla se liší o jedničku) a ten třetí je Seagate Barracuda 7200.14 (AF) ST1000DM003-1CH162.
Heej, já chci taky rozbalovací výpisy na tlačítko jako vy o.o
Použil si značku pre ?
Divne. Iným to funguje normálne. Zrejme ti to prenieslo aj značky br. Toto zrejme vie vyriešiť len správca alebo osoba ktorá pozná tento portál.
Díky! A ano, používal jsem značku pre, schválně jsem se kvůli tomu podíval jak to mají ostatní.
ext4, dříve ext3, nic dalšího jsem nikdy pořádně nezkoušel.
Nahodil jsem zrovna koupený nový ST1000LM048 a Raw_Read_Error_Rate = 130997.
Raw Read Error Rate - Otázka firmware; co vyhodnocuje? Nuly se mi nelíbí.
RAW_VALUE = 0000000000-0000 - starý externí WD7500
RAW_VALUE = 0000000000-0000 - starý externí TOSHIBA MQ01ABD100
RAW_VALUE = 0000000123-1BBC - nový v kompu ST1000
stroj :~# btrfs device stats / [/dev/sda1].write_io_errs 0 [/dev/sda1].read_io_errs 0 [/dev/sda1].flush_io_errs 0 [/dev/sda1].corruption_errs 9 [/dev/sda1].generation_errs 0 [/dev/sdb1].write_io_errs 0 [/dev/sdb1].read_io_errs 0 [/dev/sdb1].flush_io_errs 0 [/dev/sdb1].corruption_errs 8 [/dev/sdb1].generation_errs 0Kdybych měl pouze jeden disk, tak bych za stávající situace už dávno vyměnil disk za jiný, ale protože je na něm Btrfs v raid1, peču na to jelikož pro každý blok existuje kopie. Pravděpodobnost že by se podělal zrovna jeden a ten samý blok na obou discích sice existuje, ale je velmi malá. A mimo to tam nejsou žádná data, u kterých by to znamenalo pohromu.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.