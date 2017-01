×

Kdo nemá SSD disk je masochista a srab

Spousta lidí má ohledně SSD disků značné obavy, nemusí, protože nejsou ničím podložené.

Já vím, s nadpisem jsem to trochu přehnal, ale spousta lidí má neoprávněné obavy. Když se jich člověk zeptá, proč nemá SSD, tak začne mluvit něco o ceně, o tom, že je těžké sehnat SLC, jak je MLC k ničemu a TLC slouží ke ztrátě dat. A takový člověk samozřejmě rozjímá jen nad SSD pro své domácí PC. Je absolutně na hlavu přemýšlet o SLC pro desktop.

Slovníček pojmů / jak to fachčí

Programování buňky



Mazání buňky



PE cyklus



Wear Leveling



Dynamický Wear Leveling



Statický Wear Leveling



TRIM



Garbage Collection (GC)



FTL (Flash Translation Layer)



Write Amplification



Over Provisioning

Druhy SSD

SLC (Single Level Cell)



MLC (Multi Level Cell)



eMLC (enterprise Multi Level Cell)



SLC-Lite



SuperMLC



TLC (Triple Level Cell)



QLC (Quad Level Cell)



SSD - Jak to tedy přesně funguje

Výrobní technologie

2D Planar nand



v-nand / 3D v-nand (Vertical NAND)



3D nand



3D XPoint



Z-NAND



PCM (Phase-Change Memory)



3D TSV (3D Through Silicon Via)

Bacha na "mezipaměť" u SSD

Čím větší kapacita, tím rychlejší

Obavy jsou bezpředmětné

Mé reálné zkušenosti

Závěr

Zdroj (doporučená četba)

Slovníček pojmů / jak to fachčí

Kdo chce trochu podrobněji vědět, jak funguje paměť ssd disku a z čeho se skládá, tak hrubé nastínění může získat zde :

Understanding Flash: Blocks, Pages and Program / Erases.

Programování buňky

Tím se rozumí zápis hodnot do buňky. Buňku lze programovat jen když je prázdná. To je jedna z velkých nevýhod současné technologie.

Mazání buňky

Jelikož programování buňky lze dělat jen v případě, že je buňka prázdná, tak před samotným programováním neprázdné buňky se musí provést mazání (erease) buňky. To je poněkud časově náročná operace.

PE cyklus

Program/Erase cykl, tato hodnota se udává u životnosti buňky ssd disku. Je to tedy maximální počet cyklů přepisu jedné buňky udávaným výrobcem.

Wear Leveling

Je ochrana proti opotřebení ssd disku vlivem zápisu do stejné oblasti / buněk. Na toto trpí převážně levná hloupá uložiště jako např. sd karty apod. Nicméně toto asi už není vhodný příklad, protože i sd karty mívají toto pořešené. Ve specifikaci SD 2.0 (SDHC) údajně wear leveling řešen není, ale i tak jej výrobci implementují, viz např. Sandisk (nejen průmyslové verze, ale i třeba Sandisk Extreme má wear leveling), Panasonic. Touto ochranou se docílí rovnoměrného opotřebení disku. Kdyby tato fce nebyla, tak bychom třeba neustálým zápisem 10GiB dat do jednoho místa mohli toto místo zcela zničit a část disku by byla KO a disk by se stal nepoužitelným.

Dynamický Wear Leveling

Počítá počty zápisů jen u neobsazených buněk a zajišťuje tak rovnoměrné opotřebení jen v rámci nich.

Statický Wear Leveling

Počítá počty zápisů i u obsazených buněk a zajišťuje tak rovnoměrné opotřebení i v rámci nich. Pokud tedy máme nějaká hodně trvalá data a disk usoudí, že buňky, na nichž jsou ty data uložený, mají velmi velký nepoměr počtu zápisů, tak data na nich přesune na více opotřebené buňky. Tím se zajistí opravdu rovnoměrného opotřebení. Samozřejmě to má své režie.

Trim

Jak už jsme si řekli, buňka se může naprogramovat jen v případě, že je prázdná, když je plná, tak se musí nejdříve smazat, což je časově náročná operace. Funkce TRIM řekne SSD disku, které bloky dat jsou již "nepoužívané/smazané" a SSD disk je na pozadí smaže v době, kdy není zaneprázdněn. Díky této fci si tedy SSD disk v tichosti a na pozadí předpřipravuje prázdné buňky pro případný zápis, který je v případě potřeby rychlý, jelikož buňky jsou už smazané a nemusí se tak dělat erease. Příkladem je třeba mazání souboru. V systému to funguje tak, že dojde ke smazání metadat souboru (jen odkazu na data), ale data jsou na ssd stále uložená. Mazání je tedy z pohledu systému / uživatele rychlá operace. Systém pak řekne pomocí TRIM disku, které bloky se k tomu souboru vztahují a ssd je pak na pozadí pěkně v tichosti vyčistí / smaže / provede erase. Podpora je od Windows 7 a od kernelu 2.6.33 a FreeBSD 8.2.

Garbage Collection (GC)

GC je backend v SSD, řeší předpřipravování smazaných bloků pro případný zápis. Částečně sám umí i řešit to, co jsme si popsali v případě TRIM. Funguje to tak, že když OS smaže soubor (metadata), tak dojde ke smazání jen těch buněk na SSD, kde ty metadata jsou uložená. Pokud se OS pokusí zapsat nějaká data do původních bloků již smazaného souboru, tak GC pozná, že ty bloky byly použitý, provede zápis do prázdných buněk a ty původní označí jako již nepoužívaná data a na pozadí pak provede jejich erease. Už z principu nemůže GC plně nahradit TRIM, nicméně dokáže v dnešní době spoustu věcí řešit bez pomoci OS/TRIM. Z tohoto pohledu se tedy zdá, že Trim není úplná nutnost a člověk si dokáže bez této fce dost dobře vystačit. Každopádně nejefektivnější práce s SSD docílíme jen s fcí TRIM, čímž se docílí efektivnější práce GC.

FTL (Flash Translation Layer)

Vrstva ve firmware SSD disku, která se stará o správu paměti, má pod sebou GC a všechny nutné věci ke správné alokaci a využití pamětí SSD disku. Součástí je samozřejmě i mapování LBA (Logical Block Addresses) na PBA (Physical Block Addresses). Reálným příkladem budiž třeba TrueFFS od firmy M-Systems, nebo nástupce ExtremeFFS od firmy Sandisk.

Write Amplification

WA je rozdíl/poměr mezi objemem dat, který systém poslal k zápisu a objemem, který byl skutečně zapsán. V ideálním případě by WA mělo být 0, ale reálně je zapsáno více dat, než systém posílá (v dnešní době je to reálně kolem 0,5). Už jen samotné automatické přeskládávání dat v rámci SSD (Wear Leveling) si bere nějaké režie. Podle zápisku Fun With 4K Sectors má vliv na WA správné zarovnání partition, totéž je možné se dočíst na stránkách Kingstone : Transaction sizes aligned to page size (4K aligned = lower WA). Naopak třeba taková interní komprese dat zase WA minimalizuje. Pěkné shrnutí je v této tabulce : Factors affecting the value. Další příklad viz : Write Amplification as seen in Solid State Drives.

Over Provisioning

Velikost paměti, která je alokovaná čistě pro interní potřeby disku. Těmito interními potřebami jsou třeba paměťové čipy navíc určené pro realokaci vadných sektorů. Pak to můžou být čipy pro GC. Tato paměť navíc se operačnímu systému nereprezentuje. V některých případech jde pomocí nástrojů od výrobců tuto velikost upravit (ukousnout z velikosti, která je reprezentovaná operačnímu systému a přidat jí do OP). Např. Kingstone udává, že velikost OP má u spotřebitelských disků 7% a 28% u Enterprise. Některé kvalitnější / dražší disky mívají OP i vyšší.

Druhy SSD

Dnes máme na trhu převážně tyto typy disků :

SLC (Single Level Cell)

Tyto disky jsou poskládány z buněk, které uchovají jen 1bit / dva stavy (0 nebo 1). Těmito typy éra SSD začala. Díky tomu, že buňka může mít jen jeden stav, je potřeba i hodně čipů pro dosažení větší kapacity, tím i narůstá cena. Na druhou stranu díky takto malému využití buňky by měly být SLC SSD i rychlejší jak následující varianty a jejich výdrž by měla být větší (udává se výdrž 60 000 - 100 000 PE cyklů)

MLC (Multi Level Cell)

Jedna buňka uchová 2bity / čtyři stavy. Výhodou je možnost dosáhnout vyšší kapacity na stejně velkých čipech, čímž člověk získá větší kapacitu za menší cenu oproti SLC (udává se až třetinová cena). Rychlost čtení by měla být plus mínus stejná, zápis je pomalejší. Funguje to tak, že když se mění jeden ze stavů na čipu, tak se musí přepsat všechny stavy, programování a celá logika je složitější, tím se zvyšují i latence (programování trvá delší dobu, 3x a víckrát než u SLC). Životnost buněk se udává cca 3000PE Cyklů.

eMLC (enterprise Multi Level Cell)

Jedná se o MLC čipy určené pro enterprise sféru (do serverů apod.), vyznačují se větší rezervou pro realokaci vadných bloků a možností většího zatížení (udává se i 3x více, jak u MLC), životnost buněk díky kvalitnějším čipům bývá udávána kolem 10 000 PE cyklů.

SLC-Lite

Za touto technologií stojí firma Apacer a je založena na MLC čipech, jen je firmware omezen pouze na dva stavy 10 a 11 (největší rozdíl prahového napětí Vt). Mělo by se jednat o výkonový a cenový střed mezi SLC a MLC technologií (poloviční kapacita oproti MLC, poloviční cena oproti SLC a větší výkon než MLC). Počet PE cyklů by měl být víc, jak 15 000. Pěkně rozebráno je to např. zde : Apacer SLC-Lite, spoľahlivejšie ako MLC, lacnejšie ako SLC

SuperMLC

Tento druh pamětí vyvíjí Transcend a chvástá se až 30 000 P/E Cykli, nižšíma latencema a dvojnásobně rychlejším zápisem oproti MLC. Dle popisu a všeho kolem to vypadá na stejnou technologii, jakou má Apacer, jen se to nejmenuje SLC-Lite, ale SuperMLC.

TLC (Triple Level Cell):

Oproti MLC zvládá buňka uchovat 3bity/osm stavů (2^3). Tím se ušetří spousta čipů, čímž se cena dostává opět o něco níže. Tyto disky jsou kvůli ceně a rozumnému výkonu vhodné do desktopů / notebooků apod. Životnost buněk se udává kolem 1000 P/E cyklů.

Tento druh SSD se hodně rozšířil a nabídka je široká.

QLC (Quad Level Cell) :

Buňka má 4bit hodnotu, má tedy 16 stavů (2^4). Za tímto druhem SSD stojí Toschiba s plánem vysokokapacitních SSD (100TB a více) pomocí TSV výrobní technologie, ale zatím na trhu nic není. Životnosti buněk by se měla pohybovat kolem 100 P/E cyklech. Nějaké obrázky, vysvětlení a prezentace viz : Facebook Asks For QLC NAND, Toshiba Answers with 100TB QLC SSDs With TSV. QLC část disku bude sloužit hlavně pro ukládání dlouhodobých dat / archivních - infrequently-accessed WORM (Write Once Read Many). Nicméně u použití v desktopech nevidí Toschiba problém.

SSD - Jak to tedy přesně funguje

V případě SLC se u buňky rozlišují dvě napěťové hladiny, což je asociováno hodnotami 0 a 1 (jedním bitem).

V případě MLC se rozlišují 4 napěťové hladiny. Ty se asociují čtyřmi hodnotami 00,01,10,11 (dvěma bity). Jedna napěťová hladina tedy znázorňuje dva bity. Podobně je to u TLC (jedna hladina = 3bit hodnotu) a QLC(jedna hladina = 4bit hodnotu). Tomuto se říká kvantování. Dobré příklady lze najít na EN Wiki : Quantization (signal processing).

Tabulkové shrnutí viz :



Pokud pracujeme s menšími rozdíly napětí (TLC, QLC apod.), tak musíme počítat i s tím, že u takové buňky přijdeme dříve o rozlišovací schopnosti, než u buňky s většími rozdíly napětí. Prostě máme menší tolerance. To je tedy jeden z důvodů, proč mají TLC apod. typy buněk menší životnost, než SLC buňky. Dalším problémem je miniaturizace, kdy menším výrobním procesem sice dosáhneme menší spotřeby, větší kapacity na plochu a ve většině případů menších výrobních nákladů. Problém ale je, že takové buňky mohou být více náchylné na poškození. Před delší dobou to byla např. kauza OCZ.

Dalším problémem MLC/TLC/QLC je složitost algoritmů pro analýzu a následné lovení dat. Tato narůstající složitost má za následek zvyšování latencí u takových SSD. Orientační / často udávaný přehled viz :



Výrobní technologie

Kromě druhů čipů / uchovávání záznamu zde máme různé výrobní technologie. Takto aktuální dění chápu já, pokud se mýlím, tak mně prosím opravte.

2D Planar nand

Umožňuje využít menší výrobní proces než 3D nand (16nm vs 40nm), ale nedosáhne se s tímto procesem takových kapacit. Proto minimálně v consumer sféře všichni přecházejí na 3D NAND čipy.

v-nand / 3D v-nand (Vertical NAND)

Tuto technologii vyvinul Samsung, jedná se o vrstvení buněk na sebe. Aktuálně je v rozběhu výrobní proces, který umožní na sebe navrstvit buňky do 48 vrstev. Tím se zmenšuje výsledná velikost čipu. Dříve vvyráběl čipy s 24 vrstvami a 32 vrstvami pomocí 40nm technologie, teď bude vyrábět 48 vrstev pomocí 30nm technologie (= menší velikost, menší spotřeba).

3D nand

Technologie podobná 3D v-nand, jen s tím rozdílem, že jí používá konkurence.

3D XPoint

Tuto technologii vyvíjí konkurence Samsugu, čímž je Micron ve spolupráci s Intelem. Zatím budou cílit na firemní sféru, ceny tedy nebudou malé, výkon by měl být hodně velký, údajně celkem převratná technologie.

Z-NAND

Je odpovědí Samsungu na 3D XPoint, paměti by měly být levnější a stejně výkonné jak 3D XPoint, nicméně dle dostupných informací jsou o tom značné pochyby. Nějaké info třeba zde : Micron Unveils 3D XPoint Products, Samsung Counters with Z-SSD

PCM (Phase-Change Memory)

Je odpovědí IBM na čipy 3D XPoint od Intelu/Micronu, ale oproti nim se dostaví na trh později. Další info : OSEL

3D TSV (3D Through Silicon Via)

TSV je druh propojení paměťových vrstev, který má zvýšit výkon a snížit spotřebu. Nějaké další info viz třeba : Toshiba má paměti pro 16TB SSD.

Tato technologie se už používá celkem dlouho. Používá se i u výroby DDR4 modulů, viz např. :

Samsung spustil sériovou výrobu vůbec prvních 3D DDR4 s použitím TSV

Závěrem lze říci, že všichni přecházejí na 3D Nand v kombinaci s MLC a TLC, kterou různě vylepšují. Rýsuje se zde pár nových technologií, které vypadají velmi slibně, ale na trhu zatím nejsou.

Bacha na "mezipaměť" u SSD

Spousta dražších SSD dokáže udržet konstantní výkon po dobu jakékoli zátěže, třeba takový Intel S3700 má konstantní výkon a nic ho nezabije. S klasickými SDD pro spotřebitele je ale třeba počítat s tím, že mají většinou SLC buffery. Crucial tomu říká "Dynamic Write Acceleration", Samsung tomu říká Turbo Write, Sandisk zase nCache. Tyto mezipaměti se snaží udržovat konstantní výkon, ale to funguje jen do doby, než se zahltí/než dojde buffer (z odkazů je vidno, že velikost cache bývá dle kapacity SSD, z toho někteří výrobci mají oproti jiným tuto cache o dost menší). S postupem času se tyto techniky vylepšují a už to není tak strašné, jako dříve. Nicméně ten, kdo by chtěl používat podobná SSD v serverech, by si na toto měl dát pozor. V běžném desktopu to je ale většinou plně ok.

Čím větší kapacita, tím rychlejší

Podle mně nemá dnes cenu brát nic menšího, než 240GB SSD. Poměr cena/kapacita je mnohem lepší, jak u 128GB variant a rychlost je větší. Čím větší kapacita, tím větši paralelismus, tzn. i rychlost / výkon.

Obavy jsou bezpředmětné

Obavy ohledně životnosti jsou bezpředmětné, důvodů je několik.

Snížená životnost buněk u MLC/TLC apod. oproti SLC nelze chápat doslovně, protože většinou neděláme jednobitové změny na disku, ale měníme kopici dat. Výsledkem tedy je, že ve velké míře nedochází ke "zbytečnému" přepisu stavů buněk, u kterých jsme změnu nezamýšleli. Pro desktop plně dostatečné.

Dle dostupných statistik je poruchovost SSD disků mnohem menší, jak klasických magnetických disků

Na začátku vývoje byly problémy se systémem/firmware v ssd diskách, doba značně pokročila a zásadních problémů ubývá, nestabilita systému nenastává apod.

SSD disky vydrží opravdu hodně, viz třeba :

Ze světa: kolik reálně zapsaných dat vydrží moderní SSD?



Ze světa: kolik reálně zapsaných dat vydrží moderní SSD? Záruky u lepších SSD bývají 5 let, v případě magnetických disků to je jen u enterprise

I kdyby SSD vydrželo jen 5 let, tak za tu dobu ušetří uživateli spoustu času a nervů

Zálohovat se musí tak jako tak, SSD nemůže za to, že někdo přijde o data. Stejně tak může např. dojít ke ztrátě utržením hlavy u magnetického disku apod.

Používání SSD u databází není hloupost, tato kombinace se nasazuje víc a víc. Životnost kvalitnějších SSD je velká, viz třeba co vydrží relativně levný kousek :

SSD na serveru (Pavel Šnajdr)

Dále tu máme spoustu firem, co už pár let nabízejí VPS nad SSD disky a nepřipadá mi, že by nějak krachovaly.

Mé reálné zkušenosti

První SSD k nám do firmy putovaly s notebooky HP, kde byly RealSSD C300. Během asi 3-5 let odešly 3ks. Odešly ale tak, že ntb byl nestabilní, SMART nehlásil nějaké extra chyby. O data nikdo nepřišel. Nicméně, systém byl nestabilní už dříve (neznámé příčiny BSOD). Nemuselo to tedy souviset přímo s čipy na SSD, ale s firmware v ssd, nebo něčím jiným.

Poté jsme začali nakupovat Crucial SSD disky, které nakupujeme doteď. Začali jsme M4, pokračovali M500, M550, MX100, MX200, BX200 a nyní MX300. Co si tak pamatuji, odešel za tu dobu jeden Crucial, byl to myslím MX200 a byl KO chvilku po připojení. Evidentně vadný ks z výroby. Teď si přesně nevzpomínám, možná ty ks byly dva KO z výroby. Crucial jsem tenkrát vybral proto, protože M4 byla špička. Pak následovala éra, kdy měl Samsung značné problémy s FW, pak následovala kauza s Kingstone a jeho přeznačováním. Vzhledem ke spokojenosti s Crucialem, rozumnýma cenama, nekašláním na zalátávání firmware apod. jsme u něj prostě zůstali.

Všechny nové PC i notebooky nakupujeme s SSD. Většinou teď bereme Thinkpad 13 s fullhd displejem a 256GB SSD + 8GiB ram. Jako desktopy bereme i5 + 8GiB + 256GB SSD by HP + k tomu Dell U2412m (24" FullHD). Pár šéfíků má ve firmě 512GB varianty i 1TB varianty Crucialu.

Pokud se někomu v desktopu posere magnetický disk, tak rovnou měníme za BX200 240GB, resp. teď za MX300 275GB. Aktuálně máme v jobu cca 40PC s SSD z 300PC.

Pro svou potřebu nakupuji bazarová SSD kvůli ceně. Nedávno jsem koupil úplně nový (0 hodin naběháno) Intel 535 240GB za 1800,-Kč, který šel po nainstalování windows k šípku (začal realokovat sektory a nezbyly mu žádné). Evidentně KO od začátku, prodejce dal 60 dní záruku, tak šel na reklamaci. Jako náhradu jsem splašil Intel 540s 240GB za 1700,-Kč. Taktéž úplně nový, nula hodin naběháno, záruka 14dní. Pustil jsem badblocks, abych ho trochu vytížil a přežil, už je to nějaký den, co běží a ok, takže ten už neodejde.

Ve svém PC jsem před rokem koupil taktéž bazarově bez záruky Intel 530 240GB a stále šlape (1651h, NAND_Writes_1GiB 19TB, takže na desktopu jak vidno vytížení nulový). Kdo tedy řeší to, že mu buňka u TLC vydrží jen 1000 PE cyklů, tak by mně fakt zajímalo, jak rychle mu bude trvat uhnat takový disk na počet přepisů (mně i běžnému uživateli by to zjevně trvalo minimálně tak 13 let).

V serveru mi doma šlape KINGSTON SS200S330G (3335h) a taktéž bez známek nějakého zásadního opotřebení.

Pak mám SSD v dalších dvou desktopech a ntb, Crucialy a Transcend 370S.

Pár lidem jsem ještě koupil ssd do starého ntb (10let i více), kde bylo 1-2GiB ram. Naladil Win10 32bit a s SSD to šlape pěkně svižně. Navýšení rychlosti bylo mnohanásobné (kde člověk čekal minutu nemusel s SSD čekat skoro vůbec). Když jsem někomu do privátu kupoval nový SSD, tak to byl vždy Transcend 370S 128GB, nebo 256GB. Cenově byl na tom velmi dobře a recenze mu byly také dost nakloněny. Problémy jsem s ním taktéž nezaznamenal.

Závěr

Za posledních 5 let jsem nikdy nepřišel u SSD disku o data ani nikdo u nás ve firmě. Zato přínos mělo SSD vždy velký (značně urychlilo práci s PC). Aktuálně v práci budu migrovat naší centrální 300GiB Oracle db na SSD pole poskládané ze 400GB SSD (výrobce neznám, dodavatel to má přeznačený, nejspíš to bude eMLC od Sandisku, asi z řady Optimus).

Osobně nemám s SSD špatné zkušenosti a nevidím důvod, proč by se jich někdo měl bát. Na systém a programy je to parádní věc a limitu přepisu při takovém běžném použití nějde dosáhnout (ať jde o Win, nebo Lin).

Kdo se vymlouvá na cenu, může sáhnout po bazaru s nižší kapacitou (na linux 128GB stačí, pro Win je to už horší, ze začátku ne, ale časem to nabobtná).

Zdroj (doporučená četba)

