Portál AbcLinuxu, 23. dubna 2024 15:00

Čas na nový disk?

20.10.2018 12:24 | Přečteno: 2836× | Iné | poslední úprava: 20.10.2018 14:08

Začínam pozorovať divne zaseknutia a spomalenia systemu ( arch ), niekedy uplne zamrznutie - nasleduje tvrdý reset. Občas je počuť disk ako šrotuje.

Disk viď nižsie:
Model Family:     Seagate Samsung SpinPoint M9T
Device Model:     ST2000LM003 HN-M201RAD
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
SMART info ( 3 metriky majú pre-prefailure typ ):
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       16
  2 Throughput_Performance  0x0026   055   055   000    Old_age   Always       -       21357
  3 Spin_Up_Time            0x0023   092   091   025    Pre-fail  Always       -       2719
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2938
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       6067
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   000    Old_age   Always       -       2948
191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       6001
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   053   000    Old_age   Always       -       32 (Min/Max 8/47)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   252   252   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       2255
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       49
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       4308
241 Total_LBAs_Written      0x0032   097   089   000    Old_age   Always       -       4362658
242 Total_LBAs_Read         0x0032   098   088   000    Old_age   Always       -       3454414
       

Hodnocení: 100 %

        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Vložit další komentář

20.10.2018 13:26 Radovan
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovědět | Sbalit | Link | Blokovat | Admin
191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 6001
To s tím hraješ tenis? 8-O
tralala avatar 20.10.2018 14:00 tralala | skóre: 9 | blog: tralala
Rozbalit Rozbalit vše Re: Čas na nový disk?
laptop par krat padol z postele, par krat letel v batozine...nemam pocit, ze sa k nemu spravam nasilne :)
20.10.2018 14:03 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovědět | Sbalit | Link | Blokovat | Admin

Nic alarmujícího tam nevidím.

3 metriky majú prefailure flag

Oprava: tři metriky mají typ pre-fail, tj. pokud by hodnoty byly problémové, signalizovalo by to blížící se selhání.

tralala avatar 20.10.2018 14:08 tralala | skóre: 9 | blog: tralala
Rozbalit Rozbalit vše Re: Čas na nový disk?
vdaka za nazor, chyba opravena :)
Max avatar 20.10.2018 17:13 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovědět | Sbalit | Link | Blokovat | Admin
Disk vypadá celkem ok, nevidím tam nic moc kritického. Každopádně čistě SMART atributy nejsou nic stoprocentního. Disk má ještě error log, který ty jsi sem nehodil. V error logu mohou být věci, co se do SMART atributů nedostanou. Postni jsem tedy ještě error log. Případně ještě spusť přes noc long SMART test.
Jinak pokud ti systém z ničeho nic začne šíleně hrabat na disk, začne vytuhávat atd. a přitom máš ještě dost volné ramky, tak toto jsem řešil relativně nedávno na archu také. Zjistil jsem, že mi to dělá integrovaná GPU. V Biosu jsem měl pro GPU přiděleno málo ram a pokud jsem začal více pracovat s grafikou (= otevřel gimp a začal upravovat nějaký větší obrázek, nebo to dokázal v určitou chvíli i chromium s hodně taby), tak PC se choval :
- disk 100% šrocení
- totálně nepoužitelné UI
- nešlo se ani dostat do konzole, ani přes ssh
- poslední stav widgetu, který ukazoval volnou ram, hlásil asi přes 2GiB volné ram

Po zvýšení ram pro GPU v biosu se ten problém už nevrátil. Divný je, že jsem tam měl nastavených 32MiB a neuvědomuji si, že bych s tím hýbal. Nastavil jsem 256, nebo 512 a od té doby klid.
Zdar Max
Měl jsem sen ... :(
tralala avatar 21.10.2018 10:49 tralala | skóre: 9 | blog: tralala
Rozbalit Rozbalit vše Re: Čas na nový disk?
Mal som v biose 64MB, dal som na 256MB - budem to sledovat. Samzorejme najdolezistejsie vec ( dokumenty, foto, etc ) zalohujem online.

V error logu nie je nic zaujimave.

SMART Error Log Version: 1 No Errors Logged
20.10.2018 19:37 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovědět | Sbalit | Link | Blokovat | Admin

223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 49

Toto nevyzerá veľmi zdravo.

Rozmýšlaj radšej nad výmenou a zálohou. Takto nie je možné určiť či disk vydrží ešte nejaký čas alebo nie. Cena nového disku je v porovnaní s následnou obnovou po havárii disku malá.

Root v linuxe : "Root povedal, linux vykona."
20.10.2018 22:14 snajpa | skóre: 20 | blog: snajpuv_blocek | Brno
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovědět | Sbalit | Link | Blokovat | Admin
Osobne bych disk s takovymi hodnotami uz davno, davno rozdupal a vymenil za jiny... Jakmile na tom jsou data, o ktera mi jde, je nenulovy Raw_Read_Error_Rate znamenim k vymene disku. Obzvlast pokud to cislo vzroste aspon o par jednotek behem par tydnu, leti smykem. Radsi vymenim, nez si pak rikat, ze jsem vymenit mel.
--- vpsFree.cz --- Virtuální servery svobodně
20.10.2018 22:46 muhehe
Rozbalit Rozbalit vše Re: Čas na nový disk?
mam disk s takovymadle hodnotama:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   118   099   006    Pre-fail  Always       -       194916960
  3 Spin_Up_Time            0x0003   097   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   020    Old_age   Always       -       1225
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   082   060   030    Pre-fail  Always       -       199544018
  9 Power_On_Hours          0x0032   091   091   000    Old_age   Always       -       8461
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   020    Old_age   Always       -       1225
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       0 0 1
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   062   058   045    Old_age   Always       -       38 (Min/Max 23/38)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       49
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       1564
194 Temperature_Celsius     0x0022   038   042   000    Old_age   Always       -       38 (0 15 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       8516h+46m+05.475s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       35648480512
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       20959920791
to asi neni dobry, co?
20.10.2018 23:39 snajpa | skóre: 20 | blog: snajpuv_blocek | Brno
Rozbalit Rozbalit vše Re: Čas na nový disk?
Tak jako, nektery z tech menenych disku mi ve workstation fungujou dal, nektery jsme proste rozebrali, magnety se hodi :D Asi je to casto predcasna panika, Raw_Read_Error_Rate casto narusta i kdyz disk bude zit jeste dlouho. Ale tim, ze pouzivame prosumer disky (wd black), nechci riskovat, ze posahany disk bude brzdit cele pole miliardou pokusu o precteni neceho, co se da precist z dalsiho disku. (Je jinac push v ZFS dodelat nastavitelny timeouty a dalsi ukazatele, aby ani neRAIDovy disky nebylo potreba takhle hrotit).
--- vpsFree.cz --- Virtuální servery svobodně
21.10.2018 08:44 pavele
Rozbalit Rozbalit vše Re: Čas na nový disk?
Před půl rokem jsem konečně vyřešil občasné zamrzání starého PC. Měnil jsem graficku kartu, RAM, zdroj, kabely... a teprve výměnou disku se to vyřešilo.

Smart čistý, long SMART test čistý...

Takže bych se vykašlal na testy a strčil tam nový disk, starý si nech na hraní. Jistota je jistota.

A jako obvykle se zeptám: Určitě pravidelně zálohuješ a data máš na serveru, že? :-)
21.10.2018 10:56 futurolog
Rozbalit Rozbalit vše Re: Čas na nový disk?
mne to robil raz SATA kabel... tiez som skusal vsetko mozne aj nemozne menit...
21.10.2018 12:46 snajpa | skóre: 20 | blog: snajpuv_blocek | Brno
Rozbalit Rozbalit vše Re: Čas na nový disk?
No, vsechno dulezity je na tech serverech s denni zalohou, co se tyce uzitecnych dat, jsou pracovni stanice vicemene jen terminaly. Ale stejne aspon s RAID1, komu se to chce setupovat znova, i kdyz mam configuration.nix toho stroje odzalohovane...
--- vpsFree.cz --- Virtuální servery svobodně
cezz avatar 22.10.2018 10:47 cezz | skóre: 24 | blog: dm6
Rozbalit Rozbalit vše Re: Čas na nový disk?
Pozor lebo Seagate pod Raw_Read_Error_Rate reportuje niekolko hodnot, cize sa nejedna o jedno 48bit cislo, ale niekolko roznych statistik. Skus si to prepocitat, ale s najvacsou pravdepodobnostou bude ten disk v poriadku, inak by hlasil pre-fail.

Computers are not intelligent. They only think they are.
Bedňa avatar 22.10.2018 20:17 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovědět | Sbalit | Link | Blokovat | Admin
Tak keď si dáta zálohuješ, je to jedno.

Ja mám S.M.A:R.T plný hovadín už roky a idem na ňom už v ďalšom NTB. Proste disk môže zhebnúť hocikedy aj tem nový čo si kúpiš. Zhebol mi aj drahý HW v ktorom bol disk ktorý sa chválil výdržou. Používal som to len na zálohy, zapol, pripojil, zazálohoval a vypol, mno a skápol. Zásadne riešim zálohy double, tak sa nič moc nestalo.
KERNEL ULTRAS video channel >>>
Dreit avatar 23.10.2018 23:28 Dreit | skóre: 15 | blog: Dreit a jeho dračí postřehy | Královehradecký kraj
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovědět | Sbalit | Link | Blokovat | Admin

Mnoo, tak jsem právě zjistil že je něco šeredně špatně. Mám celkem tři disky:

1. disk kde mám systém a /home, prokazatelně ztrácí data (s časem se množí soubory co nejdou přečíst) a výpis vypadá následovně:

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
 1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       3
 2 Throughput_Performance  0x0026   056   056   000    Old_age   Always       -       4289
 3 Spin_Up_Time            0x0023   082   082   025    Pre-fail  Always       -       5480
 4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3844
 5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
 7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
 8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
 9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       15586
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   252   252   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3946
191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       1
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   055   000    Old_age   Always       -       30 (Min/Max 15/45)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   252   252   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       0
223 Load_Retry_Count        0x0032   252   252   000    Old_age   Always       -       0
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       3947

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      8640         -
# 2  Short offline       Completed without error       00%      6446         -
# 3  Extended offline    Completed without error       00%      6445         -

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
 1        0        0  Completed [00% left] (0-65535)
 2        0        0  Not_testing
 3        0        0  Not_testing
 4        0        0  Not_testing
 5        0        0  Not_testing

2. disk používám jen jako úložiště kam nehrabu, prakticky jsem na něj zapomněl. Občas tam hodím třeba film aby mi nezabíral místo na /home.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
 1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       1525
 2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
 3 Spin_Up_Time            0x0023   082   081   025    Pre-fail  Always       -       5459
 4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3821
 5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
 7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
 8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
 9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       15457
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   252   252   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3926
191 G-Sense_Error_Rate      0x0022   252   252   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   054   000    Old_age   Always       -       32 (Min/Max 17/46)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   252   097   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   252   097   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       3
223 Load_Retry_Count        0x0032   252   252   000    Old_age   Always       -       0
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       3927

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       80%      8517         254340464
# 2  Short offline       Completed: read failure       90%      8517         254826341
# 3  Short offline       Completed: read failure       90%      6445         254826341
# 4  Extended offline    Completed: read failure       80%      6444         254826341
# 5  Short offline       Completed: read failure       90%      6443         255099456

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
 1        0        0  Completed_read_failure [80% left] (0-65535)
 2        0        0  Not_testing
 3        0        0  Not_testing
 4        0        0  Not_testing
 5        0        0  Not_testing

A nakonec 3. disk kam teď ukládám důležitější data, měl roky vypnutý parkování hlaviček a sloužil u RPi jako systémovej disk než jsem ho dal do PCčka. Za ty roky se na něj moc nezapsalo, s jeho 1TB kapacitou může mít zapsáno...pff, tak 2TB dat max?

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
 1 Raw_Read_Error_Rate     0x000f   113   099   006    Pre-fail  Always       -       56436312
 3 Spin_Up_Time            0x0003   098   097   000    Pre-fail  Always       -       0
 4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       494
 5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
 7 Seek_Error_Rate         0x000f   071   060   030    Pre-fail  Always       -       13266800
 9 Power_On_Hours          0x0032   057   057   000    Old_age   Always       -       38477
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       494
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   098   000    Old_age   Always       -       0 1 5
189 High_Fly_Writes         0x003a   099   099   000    Old_age   Always       -       1
190 Airflow_Temperature_Cel 0x0022   068   052   045    Old_age   Always       -       32 (Min/Max 21/33)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       143
193 Load_Cycle_Count        0x0032   092   092   000    Old_age   Always       -       16392
194 Temperature_Celsius     0x0022   032   048   000    Old_age   Always       -       32 (0 18 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       36624h+54m+23.484s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       2191882080
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       1810169540

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%        17         -
# 2  Short offline       Completed without error       00%        14         -
# 3  Short offline       Interrupted (host reset)      00%        14         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
 1        0        0  Not_testing
 2        0        0  Not_testing
 3        0        0  Not_testing
 4        0        0  Not_testing
 5        0        0  Not_testing

Takže si dovolím tvrdit že Raw_Read_Error_Rate nebude mít takovou váhu jak tu někdo psal, protože na ostatních discích co uložím, to přečtu i po roce. Na tom co ukazuje trojku mi data mizí fakt i po měsíci. Neřeknu kdyby to nakoplo soubor o velikosti několika GB, ale ono se to trefí třeba do třech 2MB souborů.

Kdyby to náhodou někoho zajímalo, první dva disky jsou SAMSUNG SpinPoint F3 HD502HJ (výrobní čísla se liší o jedničku) a ten třetí je Seagate Barracuda 7200.14 (AF) ST1000DM003-1CH162.

Nope
Dreit avatar 23.10.2018 23:37 Dreit | skóre: 15 | blog: Dreit a jeho dračí postřehy | Královehradecký kraj
Rozbalit Rozbalit vše Re: Čas na nový disk?

Heej, já chci taky rozbalovací výpisy na tlačítko jako vy o.o

Nope
24.10.2018 00:04 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Čas na nový disk?

Použil si značku pre ?

Root v linuxe : "Root povedal, linux vykona."
24.10.2018 00:10 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Čas na nový disk?

Divne. Iným to funguje normálne. Zrejme ti to prenieslo aj značky br. Toto zrejme vie vyriešiť len správca alebo osoba ktorá pozná tento portál.

Root v linuxe : "Root povedal, linux vykona."
Max avatar 24.10.2018 07:50 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Čas na nový disk?
Opraveno.
Zdar Max
Měl jsem sen ... :(
Dreit avatar 24.10.2018 19:56 Dreit | skóre: 15 | blog: Dreit a jeho dračí postřehy | Královehradecký kraj
Rozbalit Rozbalit vše Re: Čas na nový disk?

Díky! :-)  A ano, používal jsem značku pre, schválně jsem se kvůli tomu podíval jak to mají ostatní.

Nope
24.10.2018 00:54 snajpa | skóre: 20 | blog: snajpuv_blocek | Brno
Rozbalit Rozbalit vše Re: Čas na nový disk?
Co na tom mas za filesystem? Raw cteci chyby znamenaji, ze se nekde na tom disku trvale spolejhas, ze to vychytava nejaky error-correcting kod, ktery ma buh-vi-kolika bitovou rezervu. Uncomfy feeling, aspon pro mne.
--- vpsFree.cz --- Virtuální servery svobodně
Dreit avatar 24.10.2018 20:14 Dreit | skóre: 15 | blog: Dreit a jeho dračí postřehy | Královehradecký kraj
Rozbalit Rozbalit vše Re: Čas na nový disk?

ext4, dříve ext3, nic dalšího jsem nikdy pořádně nezkoušel.

Nope
24.10.2018 20:50 snajpa | skóre: 20 | blog: snajpuv_blocek | Brno
Rozbalit Rozbalit vše Re: Čas na nový disk?
Nj, takze ani vlastne nevis, jestli je to realne v pohode, nebo jestli ti kvuli tomu vadnymu fleku nekde neposkakuje mp3, kdyz ji tam ulozis, nebo nezakostickuje video, protoze kodek dostane data, co jsou invalid. Ja se obcas divim, ze ZFS najde chyby na nejakym disku, kterej jinak podle IO statistik vypada a reaguje zdrave. Pak se kouknu na raw read error rate a vetsinou se divit prestanu.
--- vpsFree.cz --- Virtuální servery svobodně
cezz avatar 24.10.2018 11:02 cezz | skóre: 24 | blog: dm6
Rozbalit Rozbalit vše Re: Čas na nový disk?
Ten Seagate ma pravdepodobne Raw_Read_Error_Rate na nule, takze tam by som ocakaval ze bude OK. Kukni moj comment vyssie.

Vseobecne Raw_Read_Error_Rate je problem skor ked dlhodobo rastie, nie ze je nenulovy.

Inak ten prvy disk nereportuje ziadne pending alebo Reallocated sektory a hlasi jeden UDMA_CRC_Error_Count, tak mi napada, ze ci to nebude problem s radicom, pamatou alebo sata kablom?

Samozrejme tieto smart statistiky nie su zas az take smart a chybne disky odchadzaju roznymi sposobmi. :-D Kedysi davno som robil pre jedneho cloud providera a tych vadnych diskov som videl tony (aj doslova, naukladane na palete) a je proste fakt, ze smart data treba brat velmi orientacne.
Computers are not intelligent. They only think they are.
regine avatar 25.10.2018 12:23 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše novy disk

Nahodil jsem zrovna koupený nový ST1000LM048 a Raw_Read_Error_Rate = 130997.

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
25.10.2018 12:31 snajpa | skóre: 20 | blog: snajpuv_blocek | Brno
Rozbalit Rozbalit vše Re: novy disk
Tak budto WD s tim raw cislem keca, nebo Seagate produkuje zmetky, ktere prodavaji jako produkcni. Coz by sedelo s moji dosavadni zkusenosti, ze pokud to neni urcene do enterprise, je to dobre maximalne tak na docasne ulozeni dat, ktera mam i jinde... U WD jsou na tom takhle bidne jenom RED edice z tech, co mi jdou rukama - a to tak na jednom z peti. A jakmile ukazou chyby, jdou z kola ven; cili standardne u REDu pocitam s 20% priplatkem za zmetkovost. Z nejakych 100 disku v provozu uz to potkalo dobrych 20 kousku.
--- vpsFree.cz --- Virtuální servery svobodně
regine avatar 25.10.2018 13:11 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše jiné disky

Raw Read Error Rate - Otázka firmware; co vyhodnocuje? Nuly se mi nelíbí. :-(

RAW_VALUE = 0000000000-0000 - starý externí WD7500
RAW_VALUE = 0000000000-0000 - starý externí TOSHIBA MQ01ABD100
RAW_VALUE = 0000000123-1BBC - nový v kompu ST1000

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
cezz avatar 26.10.2018 11:17 cezz | skóre: 24 | blog: dm6
Rozbalit Rozbalit vše Re: novy disk
Kukni si ten link co som zdielal, to cislo je trochu komplikovane a nemozes ho interpretovat ako jednoduchy counter.
Computers are not intelligent. They only think they are.
Grunt avatar 28.10.2018 10:16 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: Čas na nový disk?
Hele a nedají se prostě jako u starého ScanDisku zkontrolovat sektor po sektoru jestli sedí CRC? Moje nedávná zkušenost s disketama je ta že i když souborový systém hlásí chyby, sektory z diskety jdou přečíst naprosto bez nejmenšího problému, protože nějaký debil jiný než souborový systém přistupuje a čmárá po disku (a nebo je ten debil přímo souborový systém).
Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!
Grunt avatar 28.10.2018 15:18 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: Čas na nový disk?
Odpovím si sám pro případ že by to někoho zajímalo:
Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!
28.10.2018 09:09 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Ty máš na tom prvom disku naozaj silent data corruprion, teda niečo čo podľa miestnych odborníkov neexistuje? Tak vitaj do klubu.
29.10.2018 11:47 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Ne že to neexistuje, ale ti co používají kupř. Btrfs se o tom dozví dřív, než je definitivně pozdě.

Jinak já osobně měním disk okamžitě jakmile se na něm vyskytne taková chyba – chyby, co souvisí s napájením, nebo vadným datovým kabelem vypadají jinak.

První co spouštím je longtest. Pokud ten projde, odsypávám data pryč. Pokud ne, putuje k likvidaci. Kdo i nadále používá disk na kterém se mu rojí chyby podobného typu je podle mě hazardér.

Vlastně vůbec nechápu, jak se tu může někdo "chlubit" tím, že stále používá umírající disk.
29.10.2018 11:56 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Abych byl konkrétní, uvádím výpis jednoho stroje co používám na různé experimenty:
stroj :~# btrfs device stats /
[/dev/sda1].write_io_errs    0
[/dev/sda1].read_io_errs     0
[/dev/sda1].flush_io_errs    0
[/dev/sda1].corruption_errs  9
[/dev/sda1].generation_errs  0
[/dev/sdb1].write_io_errs    0
[/dev/sdb1].read_io_errs     0
[/dev/sdb1].flush_io_errs    0
[/dev/sdb1].corruption_errs  8
[/dev/sdb1].generation_errs  0
Kdybych měl pouze jeden disk, tak bych za stávající situace už dávno vyměnil disk za jiný, ale protože je na něm Btrfs v raid1, peču na to jelikož pro každý blok existuje kopie. Pravděpodobnost že by se podělal zrovna jeden a ten samý blok na obou discích sice existuje, ale je velmi malá. A mimo to tam nejsou žádná data, u kterých by to znamenalo pohromu.
29.10.2018 15:00 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Nuž, pamätám si ako mi tu rôzni ľudia tvrdili že disky predsa zapisujú checksum daného sektora, a tak informujú pri chybe. Viac krát som zažil keď mi disk bez hanby vrátil namiesto chyby len binárne nuly, a ja som prišiel o pôvodný obsah. Ale to sa podľa nich nestalo.

PS: Ja pri prvej chybe na disku tento disk nemením. Niekedy majú dáta na disku menšiu hodnotu ako je zostatková hodnota toho disku. Pichnutú gumu na bicykli tiež nevyhadzujem, ale jednoducho ju zalepím. Nevidím dôvod generovať odpad ak sa stará vec dá ešte využiť, aj keď bez opravy nefunguje na 100%.
29.10.2018 17:55 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Nejsem si jist, jestli jsi pochopil co ten výpis říká. Našel chybu, opravil (protože měl odkud vzít data) a zalogoval. Takže všechny bloky jsou v pořádku, jenom tímto způsobem Btrfs oznamuje, že se na tom zařízení začaly nějaké chyby objevovat a za určitých okolností může problém nastat – tj. kdybys měl toho peška a skutečně by odešly oba bloky.

Na pováženou je, když se objeví chyby v těch ostatních položkách.

Jinak pokud jde o checksumy na straně HDD. Tak s tím jsem se setkal u starých SCSI disků. Kolega mi nevěřil, že je víc jak polovina z nich zralá do koše, protože Btrfs řvalo jak pominuté. Musel se zkrátka sám poučit hromadou zbytečně zabitého času.
29.10.2018 19:39 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Myslím si že som hlavne pochopil "A mimo to tam nejsou žádná data, u kterých by to znamenalo pohromu". Už som viac krát spomínal, že ak je cena za dáta nižšia ako za médium ktoré okupujú, tak výmena média je len plytvaním. A či ti to opravil mirror, alebo dup je jedno. A asi aj keby to neopravil keďže cena ...
29.10.2018 20:23 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Ten stroj je už odepsaný a určený k likvidaci. Má za sebou téměř 9 let nepřetržitého provozu. Využívám ho pro virtuál na kterém kompiluji software. Ten má virtuální disk z cephu. Lokální disky toho stroje slouží jen k tomu aby ten fyzický stroj najel. Chápeš? Až umře, budu místo něj používat jiný.
29.10.2018 20:57 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Čas na nový disk?
Ako som spomínal, chápem. Cena za inštaláciu a konfiguráciu hypervízora je nižšia ako ...

Nie všetky dáta majú cenu média na ktorých sú uložené.

Založit nové vláknoNahoru

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.