Portál AbcLinuxu, 28. dubna 2024 14:14


Dotaz: Chyby čtení u déle dobu ležícího SSD

Petr Tomášek avatar 19.9.2018 13:17 Petr Tomášek | skóre: 39 | blog: Vejšplechty
Chyby čtení u déle dobu ležícího SSD
Přečteno: 724×
Odpovědět | Admin
Zdravím!

Delší dobu mám rozdělaný počítač a nebyl čas, abych ho dodělal (bastlím 19" case do racku). Takže teď tady ležel cca. půl roku bez proudu. Chtěl jsem do něj teď přidat další disky, ale po nastartování hlásil spoustu chyb čtení.

Pokud ovšem na SSD zapisuji (reálnými soubory), pak vše bezproblému přečte. Taky jsem přepsal partišnu, které zabírá 100 ze 120 GB na SSD nulami a i když se předtím na ní vyskytovaly chyby, teď ji přečte bez problému.

Smartctl hlásí tohle:
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-6-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     Intenso SSD Sata III
Serial Number:    HYC201**********
LU WWN Device Id: 5 000000 000000000
Firmware Version: O1225J
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   9
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Wed Sep 19 01:01:02 2018 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x71) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0002)	Does not save SMART data before
					entering power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 (   1) minutes.
Conveyance self-test routine
recommended polling time: 	 (   1) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0000   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0000   100   100   000    Old_age   Offline      -       249
  9 Power_On_Hours          0x0000   100   100   000    Old_age   Offline      -       54
 12 Power_Cycle_Count       0x0000   100   100   000    Old_age   Offline      -       133
160 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       207
161 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       34
163 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       24
164 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       1192
165 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       16
166 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       0
167 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       1
168 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       3000
169 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       100
175 Program_Fail_Count_Chip 0x0000   100   100   000    Old_age   Offline      -       0
176 Erase_Fail_Count_Chip   0x0000   100   100   000    Old_age   Offline      -       0
177 Wear_Leveling_Count     0x0000   100   100   050    Old_age   Offline      -       0
178 Used_Rsvd_Blk_Cnt_Chip  0x0000   100   100   000    Old_age   Offline      -       23
181 Program_Fail_Cnt_Total  0x0000   100   100   000    Old_age   Offline      -       0
182 Erase_Fail_Count_Total  0x0000   100   100   000    Old_age   Offline      -       0
192 Power-Off_Retract_Count 0x0000   100   100   000    Old_age   Offline      -       13
194 Temperature_Celsius     0x0000   100   100   000    Old_age   Offline      -       18
195 Hardware_ECC_Recovered  0x0000   100   100   000    Old_age   Offline      -       19989
196 Reallocated_Event_Count 0x0000   100   100   016    Old_age   Offline      -       1288
197 Current_Pending_Sector  0x0000   100   100   000    Old_age   Offline      -       0
198 Offline_Uncorrectable   0x0000   100   100   000    Old_age   Offline      -       1281
199 UDMA_CRC_Error_Count    0x0000   100   100   050    Old_age   Offline      -       1
232 Available_Reservd_Space 0x0000   100   100   000    Old_age   Offline      -       59
241 Total_LBAs_Written      0x0000   100   100   000    Old_age   Offline      -       1497
242 Total_LBAs_Read         0x0000   100   100   000    Old_age   Offline      -       73514
245 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       4768

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
    6        0    65535  Read_scanning was never started
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Otázky:
  1. Je pravděpodobnou příčinou to, že SSD stálo bez proudu, nebo je to něco jiného (mohl tam být ještě nějaký krátkodobý problém s napájením - špičky, či tak něco). Je první varianta běžná/pravděpodobná?
  2. Pokud bych SSD dále použil, pomůže předejít podobnému výpadku, pokud bude neustále napájeno (má se jednat o server/NAS)?
  3. Doporučili byste SSD dále použít, nebo raději nahradit novým?
multicult.fm | monokultura je zlo | welcome refugees!
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

19.9.2018 13:45 SpaceExplo | skóre: 15
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Odpovědět | | Sbalit | Link | Blokovat | Admin
Odpovedi:
1. ano, je to tim, ze bylo dloooouhooo bez proudu. Furt to jsou "jenom" pameti a obcas potrebuji "ozivit"
2. jasne
3. klidne pouzit toto - SMART hlasi vse v poradku a to SSD je temer nepouzivane

Udelal bych par zapis/cteni testu, trocha toho testovani rychlosti a pokud i po tom bude SMART status ok, tak bych ho klidne pouzil.
Petr Tomášek avatar 19.9.2018 19:33 Petr Tomášek | skóre: 39 | blog: Vejšplechty
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
dloooouhooo bez proudu
No, půl roku mě právěže zas tak dlooooouhoooo nepřipadalo, kdyby to bylo 5 let, neřeknu... (Ono navíc tam bude určitě nějaka ECC korekce, takže záleží jen a jen na tom, jak si to výrobce nastaví).

BTW, existuje někde srovnání, jak s tímto zapomínáním jsou např.MLC vs. TLC vs různé "3D" technologie?
multicult.fm | monokultura je zlo | welcome refugees!
19.9.2018 21:53 SpaceExplo | skóre: 15
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Tak to vypada, ze jsem opet nemel pravdu :-( https://www.anandtech.com/show/9248/the-truth-about-ssd-data-retention

Takze dobou power-off ty chyby cteni nebudou. Sorry.
Blaazen avatar 19.9.2018 23:35 Blaazen | skóre: 24 | blog: BL
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Třeba to možný je, horký léto + TLC chipy.
Petr Tomášek avatar 20.9.2018 07:28 Petr Tomášek | skóre: 39 | blog: Vejšplechty
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Tady se ale jedná o MLC.
multicult.fm | monokultura je zlo | welcome refugees!
20.9.2018 16:07 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Podívej možné to je.

Starší flash čip měl v datashetu že udrží data minimálně 100let bez napájení.

U novějších už je to kolem 10let.

A ty do SSD se pořád zmenšují atd.... i když jsou to MLC takže bych to nevylučoval.

Taktéž různá statická napětí co při různém přerovnávání atd mohly udělat své.

Na dlouhodobé skladování je lepší klasický HDD a i ten by se měl semtam zapnout a přečíst a zapsat data.
Petr Tomášek avatar 22.9.2018 13:55 Petr Tomášek | skóre: 39 | blog: Vejšplechty
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Kdyby sis ten příspěvek přečetl pořádně, tak zjistíš, že to nebylo na delší skladování, ale na systémový disk. Akorát, že jsem se nedostal k tomu ten počítač zavčas zprovoznit :-).

No, teď už je to stejně jedno, protože disk po noci probděné s ddrescue a potom snahou přepsat celý disk nulama, to SSDčko zřejmě odešlo do věčných lovišť natrvalo :-/.

Přemýšlím, jestli je jako náhrada lepší stejný typ (mají stále ještě v computeruniverse.de za vcelku dobrou cenu), nebo nějaký novější s TLC, ale s 3letou zárukou...
multicult.fm | monokultura je zlo | welcome refugees!
k3dAR avatar 22.9.2018 14:24 k3dAR | skóre: 62
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
a neni lepsi MLC s 3letou zarukou? ;-)
porad nemam telo, ale uz mam hlavu... nobody
Max avatar 22.9.2018 18:38 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Na každý normální SSD se dává záruka 5 let. A je jedno, zda jde o MLC, nebo TLC.
Každopádně Transcend 370S jsem koupil také dost, nicméně 128GB je dnes málo a poměrem cena kapacita nerentabilní.
v práci jedeme nonstop Crucialy a zatím spokojenost. Přesná čísla vycucnu asi do blogu.
Zdar Max
Měl jsem sen ... :(
k3dAR avatar 22.9.2018 18:45 k3dAR | skóre: 62
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
velikost jasna, ja dal link na 128GB protoze tazatel mel 128GB... jinak sem sobe kupoval Transcend SSD370(BezS) v 512GB :-) i kdyz jeden SSD720S taky v 32GB :-) a dalsi 512GB pro zmenu WD 3D Blue... vse 2.5"... m.2 NVME uvazuju o Transcend MTE850
porad nemam telo, ale uz mam hlavu... nobody
Blaazen avatar 22.9.2018 21:25 Blaazen | skóre: 24 | blog: BL
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Transcend MTE850 jsou už v doprodeji. V czc už nemají 256GB verzi a Transcend už je ani nemá na webu.
Petr Tomášek avatar 23.9.2018 21:17 Petr Tomášek | skóre: 39 | blog: Vejšplechty
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Skoro 2x tak drahý, děkuji nechci. (Ono by tam stačil bohatě i 32GB SSD, možná dokonce i 16GB, a větší určitě nemá cenu plýtvat penězi, je to jen na systém).
multicult.fm | monokultura je zlo | welcome refugees!
k3dAR avatar 23.9.2018 21:36 k3dAR | skóre: 62
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
mozna 2x tak drahy, ale zaroven 10x tak kvalitnejsi ;-)
ano 32GB take delaji, mam ho ;-)
porad nemam telo, ale uz mam hlavu... nobody
22.9.2018 23:19 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Ono použití bezmyšlenkovité ddrescue a přepisování disku nulami, je pro SSD v zásadě nesmyslné. ddrescue je založen na fyzikální představě procesů, které probíhají na rotačním magnetickém disku, jako například dálkový obskok místa z chybou a vracení se pak po sektorech zpět a tak hledání, kde chyba končí. Takové chování předpokládá mechanickou chybu v zápise a zvyšenou pravděpodobnost seskupování chyb do větších celků. Podobně pokusy ddrescue o násobné čtení sektoru odpovídají představě v zásadě analogového čtení informace, které je základě nějakých mezí převáděna na digitální a očekává se, že v případě, kdy se hodnoty pohybují blízko hranic, tak násobné čtení může někdy dát správný výsledek. V případě SSD s jejím přemapováním, Wear Levelingem, MLC/TLC buňkami je situace naprosto odlišná. Mnohem častěji je porucha v radiči a než ve vlastním záznamovém médiu.
Petr Tomášek avatar 23.9.2018 21:15 Petr Tomášek | skóre: 39 | blog: Vejšplechty
Rozbalit Rozbalit vše Re: Chyby čtení u déle dobu ležícího SSD
Jestli máš lepší nástroj než ddrescue, sem s ním. Ddrescue mi pomohl zachránit velkou část dat, což bych pomocí prostého kopírovaní nedal, bo by to skončilo s chybou dřív než by to rozumně začalo.

Navíc, SSD přežil ddrescue poměrně v pohodě, chcípnul na "pv < /dev/zero > /dev/sdX" někde po 38.1 GB.
multicult.fm | monokultura je zlo | welcome refugees!

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.