NetApp FAS2552 - zkušenosti, provoz, monitoring

21.5.2018 09:09 | Přečteno: 3658× | plky | poslední úprava: 21.5.2018 10:53

Důvod nákupu

Co bylo ve hře

HP nevyhrálo, protože bylo dražší jak NetApp, to samé platí o EMC.
Pokud jde o ZFS, tak tam jsem poptával NexentaStor u Thomas-Krenn. Jen samotná cena licence bez hw mi byla řečena 1 mil (ano, 1Milion pro 60TiB výsledné RAID-Zx konfigurace s HA). Fakt se zbláznili. Když mi toto řekli, už jsem se dál nesnažil vyjednávat a doteď nechápu, kam se svojí cenovou politikou mířili. Dokonce i pani na telefonu věděla, že jsou úplně mimo. Z telefonátu jsem měl pocit : "Já vím, že je to šílená suma, asi je to úplně mimo váš rozpočet".

Jaké výhody nám NetApp přinesl

Proč se nešlo do něčeho OSS?

NFS server 4.1 není na FreeBSD ani Solaris like systémech podporováno, a to dokonce ani nyní, natož před dvěma roky (a výkon NFS 4.1 je oproti verzi 3 zase někde jinde). Každá firma, co staví na Solaris like, si řeší svojí implementaci NFS, Nexenta snad měla první implementaci NFS 4.1.

Další důvod byla kompatibilita, protože máme ESXi a šéf by maximálně povolil ještě XEN a třeba Veeam je slušný zálohovací nástroj a umí pracovat přímo se storage, řídit jejich replikace, snapshoty a vše 100% konzistentně vůči běžícím VM (samozřejmě jen v té nejvyšší edici Veeamu - Enterprise Plus).

Další důvod byla nulová zkušenost s nějakým OSS řešením. ZFS teď zvládám na velmi dobré úrovni (mám postavený 60TiB backup storage na ZFS), už vím, co mohu, jak se k němu chovat, mám rozhled, vím, jaký hw použít, za jakých podmínek používat deduplikaci, jak diagnostikovat problémy atd. Toto osahání mi trvalo celkem dlouho, byly problémy, které se objevily jednou za x měsíců a byl problém je diagnostikovat atd. Nakonec to byl problém na všech frontách, za něco mohla hw vada, špatný návrh hw, špatný update OS, nepromyšlené použití deduplikace atd. Dalo by se říci, že jsem první střelou posral, co se dalo :D.
Samotné ZFS neumí jakékoli HA, to jen komerční implementace (na druhou stranu, s async by si člověk vystačil). Pokud bych chtěl storage na CEPH, tak jednak nemám zkušenosti, dále by to vyšlo dráž (minimálně 3 servery v jedné lokalitě, spíše 4), jak ten NetApp a funkcionalita by byla menší. Resp. nejsme tak velký, abychom potřebovali storage cluster s hafec nody, což by fakt vyšlo dráž, jak ten NetApp.

Poslední argument byl v tom, že i kdyby něco jiného šéf povolil, tak bych do toho nešel, protože už teď mám hafec práce a nechtěl bych nést přímou odpovědnost za další věci. Kdybych to postavil na nějakém vlastním/oss řešení, tak v případě problémů bych si mohl hodit provaz. V případě třetí strany je zde support a celkově se na takové řešení dívá vedení jinak. Prostě ani z mé strany nebyla vůle něco rozjíždět. Líbila se mi Nexenta, tak jsem chtěl aspoň to, ale jak už jsem řekl, oni evidentně nechtěli nás.

Jinak tu jsou ještě možnosti, postavit si OSS pole třetí stranou. V době, kdy se toto řešilo, jsem o tom nevěděl, ale např. firma Linuxbox, od které máme centrální mail/proxy gw, nabízí i privátní cloud včetně virtualizačního řešení s vlastním web ksichtem. Zřejmě to bude CEPH + KVM, ale asi by se dal domluvit čistě storage.

NetApp a WAFL vs. ZFS

NetApp vyvíjí souborový systém WAFL (Write Anywhere File Layout), oficiální uvedení bylo ještě před dobou, kdy byl uveden ZFS.
Lze narazit na toto porovnání se ZFS : ONTAP vs ZFS, kde ZFS vede v kontrole dat (má checksummy/kontroly na všechno). Nicméně je to starší zápisek z roku 2011, takže těžko říci, jaký je aktuální stav.

Dřív i proběhla žaloba NetAppu na SUN za ZFS, kterou SUN vyhrál. Nicméně i toto je dnes argument firem, které se snaží vnutit NetApp.

Ohledně NetAppu jsme jednali s jednou firmou a pak jsem si všiml, že se na ní odkazuje i oficiální web Nexenty. Pozvali jsme si je tedy ještě jednou na jednání s tím, že nás zajímá i ZFS a oni mají zkušenosti s oběma řešeními. Chtěli jsme vědět porovnání atd. Sdělili nám, že přizvou ještě jednoho odborníka, který nám řekl :

Můj šéf viděl můj nesouhlas, ale i neochotu se hádat (koneckonců od toho to jednání nebylo, chtěli jsme jen znát zkušenosti, reálné porovnání). Po jednání jsme to probrali a usoudili jsme, že blbce ať si dělají z někoho jiného. Ta firma u nás klesla na nulu a už jsme od nich nikdy nic v budoucnu nepoptávali. Když neumí jednat narovinu a vymýšlí si bludy a umýslně dělají z klientů blbce, tak ať si to zkouší na někoho jiného.
Netapp ale od nich máme, protože v tom je ten fór. První firma, která se dozví o potencionálním zákazníkovi, hodí lock u NetAppu a nikdo jiný ani nesmí nabídnout cenu (prostě žádnou od NetAppu pro nás nedostane, konec), žádná soutěž neexistuje a není tak možnost se dostat níže u konkurence, prostě nulová konkurence. (update : Lze vyřadit konkrétního dodavatele, viz komentář #4)
Tato sviňárna se děje na celém poli. My jsme vyhráli částečně, protože jsme jednali přímo s HP i Veeam a chtěli jsme po nich, aby firmám, které budou pro nás chtít cenové nabídky, nabídnuli férové/stejné ceny. Veeam to přijal, HP nás částečně poslalo do zádele (mají své bronzové, platinium aj. dodavatele a cena musí být jiná). Ale aspoň jsme měli ceny od různých firem, u NetAppu dostane člověk cenu jen od jedné firmy. Ještě jsem slyšel, že to jde obejít tak, že lze poptat zahraniční firmu, která působí v jiném státě, tím se dá ten lock na firmu obejít. Ale potvrdit to nemohu.

Jak NetApp funguje

Samotný storage je řešen tak, že je třeba vytvořit agregátor, který obsahuje disky s určitým typem pole. Vesměs lze u NetAppu mluvit o RAID-DP (dva disky mohou vypadnout, takže něco jako RAID6 bez penality), spare disk je vyžadován, bez aspoň jednoho spare nejde agregátor vytvořit. Takový agregátor lze zrychlit pomocí SSD, což se dělá tak, že se vytvoří ssd pool a z něj se pak může ukrojit část s SSD pro ten SAS agregátor. Problém je, že toto je nevratná operace, která trvá celkem dlouho (nevím, co vše se na ty SSD přesune, nezkoumal jsem to). Není to tedy jako u ZFS, kdy se pro SLOG vyhradí SSD, pro LARC se vyhradí SSD a lze to vždy bez problémů vrátit zpět. To byla věc, která mně zklamala a i důvod, proč toto nemám nasazeno (původně bylo SSD vyhrazeno jen pro OracleDB a kdybych ukrojil moc, měl bych v budoucnu problém s tím hýbat).

Pole má dva řadiče (=prostě servery, hafec jader, hafec ram, každý 2x 10Gbit pro připojení ke storage atd.), kde se definuje, jaký řadič má vlastnit jaký disk. Proto je dobré pole rozdělit do dvou agregátorů, aby disky v jednom agregátoru vlastnil jeden řadič a v druhém agregátoru další řadič a byla tak rozdělena zátěž. Když padne jeden řadič, druhý převezme jeho fci (vlastnictví disků u služeb), to je cajk.
Dále každý řadič má jedno napájení, padne jedna UPS, padne jeden řadič, takže fci převezme druhý řadič a místo 2x 2x10Gbit se jeden 2x 10Gbit. Nicméně to mají i další výrobci u menších polí.

Poté, co máme vytvořený agregátor, je třeba vytvořit SVM (Virtual Server). Je to tak, že pod NetAppem běží SVM, má svojí IP a poskytuje různé služby, které povolíme (NFS/SMB). V rámci SVM pak vytvoříme volume na těch agregátorech, definujeme si jména volume, mountpointy (namespace), povolené verze protokolů, povolené rozsahy IP apod. SVM můžeme mít více. Já jich mám na jednom NetAppu 4.

U SVM lze nastavit DR (Disaster Recovery), lze definovat replikaci konkrétního SVM na vzdálený NetApp, lze nastavit intervaly apod. Na vzdáleném NetAppu pak běží SVM ve standby modu (není spuštěn). Když primární NetApp padne, lze aktivovat v záložní lokalitě SVM a je tam hned stejná konfigurace, stejné volume a data z určité doby.

Výhodou tohoto SVM DR je rychlost překlopení služeb, kdy v záložní lokalitě jedeme hnedle jedle. Nevýhodou je, že tento DR nelze řídit z Veeamu, nejsou pro to web služby a další věci, takže se jedná o data ve stavu crash-consistency (tj. jako když vypadne u serveru proud, což by dnes mělo přežít všechno včetně db).

Dále NetApp nepodporuje async NFS, takže sice se můžeme bavit o nějaké výkonnostní nevýhodě, ale zase máme jistotu konzistence. Nicméně pro někoho to může být nedostatečné.

FAS2552 má 2x10Gbe/controller a podporuje LACP. Šířku pásma si řídí sám, lze jí nastavit a řídit si priority podle sebe, ale týpek, co to u nás nasazoval říkal, že to v žádné firmě neřešil a nikdy nebyl problém. Také jsme asi byli první, co jsme chtěli NFS 4.1 :).

V případě výpadku proudu má NetApp ještě k udržení cache baterii. Životnost je prý 5 let a jde vyměnit jen v offline tak, že se odpojí řadič, odmontuje z pole, vymění se v něm baterie a zase se zapojí zpět. Je to částečně bez výpadku, protože roli offline řadiče převezme ten druhý.

Jinak NetApp je asi BSD like. Lze se dostat do různých úrovní systému. První je cluster (je myšlen cluster v rámci jednoho pole = propojení dvou řadičů), pak se lze dostat na konkrétní řadič a přímo do systému, což je ta nejnižší úroveň přístupu. Svému systému říká ONTAP.

ONTAP Select

Relativně nedávno přišel NetApp se sw řešením, kdy poskytuje jen SW a člověk si to může rozjet na svém HW. Tomuto řešení Netapp říká ONTAP Select (SDS - software defined storage). Je dodáván formou Virtual Appliance a může běžet jak pod ESXi, tak pod KVM.

Licence

Člověk se jako nováček začne v těch licencích pěkně ztrácet. Jednak se licencuje na kapacitu, dále se licencují fce. Chcete smb, potřebujete licenci, chcete nfs, potřebujete licenci, chcete FC potřebujete licenci, chcete iSCSI, potřebujete licenci atd.
Dále existují např. fce

Poté existují licenční balíčky, které obsahují některé výše zmíněné licence a vycházejí levněji. Takže bacha na to, co chcete a co vám kde řeknou. Oni vám třeba řeknou, že NetApp umí snapshoty, ale pak když je chcete z Veeamu/nástroje třetí strany použít, tak zjistíte, že nemůžete atd. Už přesně ty ceny nevím, ale myslím, že se v našem konkrétním případě bavíme o 200kkč / snapmirror apod. to je asi s jinými feature.
Když tedy dostane nabídku na NetApp za nějakou cenu, tak vězte, že to může být holá verze třeba jen s podporou FC a konec. Je třeba od začátku vědět, co chci, což je v případě nového, neznámého řešení většinou problém. My jsme věděli, co chceme, i jsme to řekli, ale nakonec nám byl prodán málem NetApp bez snapmirroru a snaprestore nemáme, což jsem právě zjistit v době, kdy jsem v rámci testování chtěl obnovit/spustit VM ze snapshotu ve Veeamu. Prostě v době, kdy všechny nabídky byly odsouhlaseny vedením a nákup byl vlastně už uskutečněn. Tj. v době, kdy už bych si dalších x tisíc neobhájil (předpokládám, že dalších 200kkč).

Monitoring a notifikace

NetApp má k dispozici monitorovací nástroj jménem OnCommand Performance Manager. Tento nástroj dodává jak v podobě VM Appliance, tak formou app pro RHEL like systémy. Ze začátku jsem používal VM Appliance, ale byla pomalá, tuhla a byl s ní problém (mám snad pocit, že to bylo na RHEL 4 like systému, už nevím). Tak jsem naladil CentOS 7, nainstaloval OnCommand ručně a od té doby to běží svižně a stabilně.
Toto rozhraní disponuje přehlednými statistikami o datovém toku, iOPS apod. Zároveň dokáže notifikovat, zobrazovat grafy s historií apod. Je to velmi užitečný nástroj.

Migrace, upgrade apod.

Migrace na jiný NetApp, upgrade, případně migrace na jiný NetApp a další věci by měly procházet online, bez výpadku. Zatím jsem nic z toho nezkoušel, ONTAP je stále ve verzi 8.3.2 a na devítku jsme ještě nešli. Každopádně známý dělal upgrade na svém FAS2552 a prý online a bez problémů.

Závěr

NetApp umí nejen async mezi dvěma poli, ale i plný cluster (MetroCluster). Veeam v případě dobře nastaveného SnapMirroru umí udělat zálohu VM tak, že nejdříve vytvoří konzistentní Snapmirror (= snapshot + replikace do vzdálené lokality) a následně může udělat backup z onoho záložního NetAppu. Tj. lze takto silně minimalizovat režie primárního storage a zároveň mít aktuální a 100% konzistentní zálohu.

Dalo by se říci, že 90% našich serverů má jako storage backend NetApp připojený přes NFS. NetApp má jeden shelf, který je plný SAS disků (2x "11x RAID-DP + 1xspare", celkem tedy 24x SAS). Dále má druhý shelf z půlky plný SSD disky. Špičky na SAS poli jdou k 5000 iOPS a odezvy všech služeb jsou zatím plně ok.

Zatím jsem tedy s NetAppem spokojen, jak s výkonem, tak s monitoringem. Jen by to chtělo mít i možnost ovládání toho DR z nástrojů třetích stran a pak možnost lépe šachovat s SSD.

A jak jste na tom vy? Co používáte? Jak jste spokojeni? Máte někdo Nexentu?

Komentáře

Diky za post Maxi, toho dodavatele bych asi nevybral, kdyz lze u obchodniho jednani, ocekavam ze to same bude v pripade problemu. Diskovych poli mame xx v datacentrech po svete, historicky ibm. Jinak v dalsich firmach mame zfs at uz na solarisu nebo na freebsd, kapacitne od par TB do snad neceleho PB.

21.5.2018 13:04 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

A co používáte za hw? Jestli se mohu otázati.
Resp. byla by hw spec nějakého většího pole?
Zdar Max

Měl jsem sen ... :(

21.5.2018 16:54 Petr______ | blog: Petruv_blog
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

u toho zfs?

21.5.2018 16:58 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Ano.
Díky.
Zdar Max

Měl jsem sen ... :(

24.5.2018 13:17 Petr______ | blog: Petruv_blog
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

U toho naseho zfs nasazeni jsou disky sasy od wdc, radice jsou od lsi/adaptecu, cpu xeony, ram ecc vsude, desky obvykle supermicro, obcas ssd dle potreby. Obvykle je to kombinace radic, cpu, 64gb a vice ram, k tomu disky dle konkretniho nasazeni (to same i pooly). Ty kombinace jsou opravdu ruzne. Treba E5-2630 v2 @ 2.60GHz, k tomu 64gb ram, k tomu 12x4tb sas wdc povesenych na Adaptec 2274500-R 71605E, dalsi 4 ssdcka povesene na nejaky onboard sata radic v tom stroji. Tohle je ale zrovna ne moc kriticky stroj jak vidis. Bezi nad tim freebsd, sdili se sambou, iscsi.

ení to tedy jako u ZFS, kdy se pro SLOG vyhradí SSD, pro LARC se vyhradí SSD a lze to vždy bez problémů vrátit zpět.

NetApp používá pro transakční logy NVRAM, proto není potřeba používat SSD.

První je cluster (je myšlen cluster v rámci jednoho pole = propojení dvou řadičů), pak se lze dostat na konkrétní řadič a přímo do systému, což je ta nejnižší úroveň přístupu. Svému systému říká ONTAP.

Ještě je tam Unix shell :-)

Relativně nedávno přišel NetApp se sw řešením, kdy poskytuje jen SW a člověk si to může rozjet na svém HW. Tomuto řešení Netapp říká ONTAP Select (SDS - software defined storage). Je dodáván formou Virtual Appliance a může běžet jak pod ESXi, tak pod KVM.

Pokud nedávno myslíš půlku roku 2015 :-)

SnapVault, slouží k zálohování, záložní lokalita není 1:1, ale je tam historie záloh SnapVault a lze dělat zálohy na jiné místo. Rozdíl oproti SnapMirror viz Comparison between qtree SnapMirror and SnapVault

Tvůj odkazovaný článek pojednává o 7-mode; v cDOT je to už jinak.

SnapRestore - přístup ke snapshotům v rámci produktů třetích stran. Kdo má licenci na SnapRestore, tak může třeba z Veeamu spustit VM přímo ze Snapshotu, kdo ne, má smůlu, nedostane se z Veeamu k datům, musí ručně vykopírovat obsah snapshotu

Hlavně SnapRestore umožňuje atomický roll-back k nějaké verzi snapshotu...

Migrace na jiný NetApp, upgrade, případně migrace na jiný NetApp a další věci by měly procházet online, bez výpadku. Zatím jsem nic z toho nezkoušel, ONTAP je stále ve verzi 8.3.2 a na devítku jsme ještě nešli. Každopádně známý dělal upgrade na svém FAS2552 a prý online a bez problémů.

Jen pokud budeš provádět migraci připojením do existujícího clusteru; já osobně bych to v mission-critical nasazení takhle rozhodně nedělal.

Cena? Podpora sifrovani? Uz jsi na tom zazil poskozene VM obrazy?

21.5.2018 14:57 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Configuring NetApp Volume Encryption.
Je to rok a půl, co to provozujeme, zatím jsem neměl problém s ničím. Zkoušel jsem pár věcí, jako třeba i přiřadit stejnou IP jako má SVM něčemu jinému. VM připojená na toto SVM se pak chovala tak, že šla, ale byla nestabilní, občas padla atd. Ale nikdy se neporušily data. Možná je to právě tím, že Netapp jede NFS jen v sync.
Cena, teď přesně nevím, myslím, že to bylo asi něco kolem 1,8m s tím, že v záložní lokalitě chybělo to ssd pole. Do záložní lokality se pak jeden shelf s 12x SSD ještě dokupoval.
Bylo to tedy asi těch 1,8m za :

2x FAS2552
2x 24xSAS 1,8TB 10k
1x extra Shelf s 12x SSD 400GB
kabely
instalace / konfigurace
školení
licence

Zdar Max

Měl jsem sen ... :(

21.5.2018 15:13 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Nemáte ve smlouvě náhodou napsáno, že nesmíte zveřejnit cenu, za kterou jste to koupili? ;-)

Quando omni flunkus moritati

21.5.2018 15:34 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Nevím, smlouvu jsem nepodepisoval já a finální cenu také nevím. Ale v prvních nástřelech se mluvilo orientačně takto.
Vím, že se tam šachovalo s tím SnapMirrorem, takže je dost možné, že to nakonec bylo 2,1m
Zdar Max

Měl jsem sen ... :(

21.5.2018 15:43 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Jinak to byla cena včetně maintenance na asi 3r, teď nevím, zda 4h replacement, nebo něco takového.
Zdar Max

Měl jsem sen ... :(

22.5.2018 11:01 MP
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Tak to se mas, ja pouzivam taky nfs4.1 (zatim) proti deb9 serveru, vsude sync apod., plus upravene velikosti cache, a na poskozeni raw obrazu jsem jiz narazil. A duvod neznamy.

22.5.2018 11:18 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Tzn. máš nfs4.1 server na debianu a mountuješ z ESXi? A jak jsi došel k tomu poškození dat? VM vytuhla a už nenaběhla, nebo jak se to celé chovalo?
A co máš jako FS pod tím NFS4.1 ?
Zdar Max

Měl jsem sen ... :(

23.5.2018 09:56 MP
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Mountuju z proxmoxu, takze vse je deb9. Pod fs je ext4/drbd/mdraid - ted se bude predelavat na ext4/drbd/lvm/hwraid. No treba jsem na ty vm delal aktualizace z repa, vse ok a najednou pri dalsi instalaci read-only system a po rebootu vm poskozeny fs...a nikde zadna stopa...

23.5.2018 12:33 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Já bych se té nekonzistence dat tak bál, že bych vše stavěl nad maximální kontrolou dat, tzn. dnes asi Linux + ZFS + ZFS Send to backup + SSD na SLOG. Odpadl by mi hw/mdmadm raid, drbd a ext4.
A jen ECC ram a žádný swap.
Zdar Max

Měl jsem sen ... :(

23.5.2018 15:29 MP
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Jo to chapu, ale zfs se zde z urcitych duvodu jeste chvili neuchyti. Kazdopadne ted jsem na ten problem narazil znova - presouval jsem VM z nfs storage do lokalniho lvm storage a ...poskozeny VM na lvm. Kdyz udelam obycejny cat nfs > lvm, tak je to OK...

Pekne napisane.

> agregátor

si zabil :). S netapmi robim nejaky cas ale takto napisane som to este nevidel.

> Problém je, že toto je nevratná operace, která trvá celkem dlouho (nevím, co vše se na ty SSD přesune, nezkoumal jsem to).

nic nepresuva. Zaplna sa pri pouzivani.

> Dále NetApp nepodporuje async NFS, takže sice se můžeme bavit o nějaké výkonnostní nevýhodě, ale zase máme jistotu konzistence.

no toto asi nechapem. Async IO ma zmysel pri write operacii. Ta v ontape prebieha tak ze sa zapise do RAM, nasledne skopiruje do NVRAM a posle do NVRAM partnera. Vsetko su to zapisy do pamate. Na disky sa to pise v ramci Consistency Pointu neskor. Zapisy su teda rychle a async IO by nemalo zmysel. Malo by to zmysel ak su kontrollery daleko(napriklad MCC alebo 7mode FMC) a s obmedzenou linkou. Ak by si chcel vyskusat aky by bol vykon bez kopirovania do NVRAM partnera, vypni si cluster. Potom zapisuje len do lokalnej RAM/NVRAM.

> SnapMirror vs. SnapVault

su 2 druhy SnapMirror: - Volume SnapMirror - snapmirror na volume je block by block copy. Nevie vela o filesysteme. Mozes si to predstavit ako dd. - Qtree SnapMirror - tento vie o filesysteme a je pomalsi(musi preliezat filesystem).

uvadzas linku na tento ale typicky sa snapmirror mysli ten na volume urovni. Hlavne preto ze je to block by block. Existuje aj version flexible snapmirror v cmode. Ten ja na volume urovni ale tiez na urovni suborov.

> Monitoring a notifikace

Velmi pekne to spolupracuje s grafanou. Ak sa ti s tym nechche hrat, daj si nabox: https://nabox.org/

> Migrace, upgrade apod.

mate 8.3.2, patch release neviem. To je dost stara verzia. Odporucam ist na posledny p-release 9.1.

22.5.2018 07:37 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Díky za upřesnění. Nabox znám, ale nějak mi ten Performance manager stačí.
Myslím, že tady na abc byl i člověk, co opustil Netapp kvůli absenci async nfs, aby se dostal na lepší latence. Nijak extra jsem výkonnostní rozdíly nezkoumal, resp. netuším, do jaké míry má vliv async na síťovou komunikaci, zda to částečně neřeší i úzké hrdlo tam.
8.3.2P2, nenarazil jsem zatím na žádný problém, s vmware zatím také visím na verzi 6. Možná pak provedu upgrade, až skočím s vmware výše.
V době nasazení NetAppu byla venku verze 9, ale to byla myslím první stable, možná už tam byl i nějaký patch, ale technik nedoporučoval nasazovat. Teď už je to zase někde jinde, ale jak říkám, zatím toto stačí a není to úplně na pořadu dne.
Zdar Max

Měl jsem sen ... :(

22.5.2018 08:25 Aliquis
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

> Myslím, že tady na abc byl i člověk, co opustil Netapp kvůli absenci async nfs, aby se dostal na lepší latence. Nijak extra jsem výkonnostní rozdíly nezkoumal, resp. netuším, do jaké míry má vliv async na síťovou komunikaci, zda to částečně neřeší i úzké hrdlo tam.

Ano videl som pripevok, ak sa pamatam, mal 20ms latencie merane v packet trace. To je samo o sebe vela pre write. Ale aj keby mal metrocluster, linka prida len 1-2ms. Tam bol IMHO problem inde.

22.5.2018 08:13 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Ta v ontape prebieha tak ze sa zapise do RAM, nasledne skopiruje do NVRAM a posle do NVRAM partnera. Vsetko su to zapisy do pamate.

NVRAM je namapovaní jako blok pamětového prostoru s přímým přístupem, k zápisu do klasické RAM nedochází; replikace do NVRAM partnera dochází atomicky a transakce se necommitne, dokud není záznam i v transakčním logu partnera; za předpokladu, že je zapojený MPHA pár samozřejmě...

Zapisy su teda rychle a async IO by nemalo zmysel.

I NVRAM se dá zaplnit :)

Zapisy su teda rychle a async IO by nemalo zmysel. Malo by to zmysel ak su kontrollery daleko(napriklad MCC alebo 7mode FMC) a s obmedzenou linkou

MetroCluster "s pomalou linkou" ale není podporovaná konfigurace :)

Qtree SnapMirror - tento vie o filesysteme a je pomalsi(musi preliezat filesystem.

To platilo u 7-mode.

22.5.2018 08:50 Aliquis
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

> NVRAM je namapovaní jako blok pamětového prostoru s přímým přístupem, k zápisu do klasické RAM nedochází; replikace do NVRAM partnera dochází atomicky a transakce se necommitne, dokud není záznam i v transakčním logu partnera; za předpokladu, že je zapojený MPHA pár samozřejmě...

NVRAM je karta s vlastnou baterkou. Zapis ide vzdy do RAM. Zapis na disky sa deje z RAM. NVRAM by sa pouzila len ak sa controller rebootne a NVRAM obsahuje nezapisane data.

> I NVRAM se dá zaplnit :)

da :) Ale problem nie je samotna NVRAM ale pomaly nasledny zapis na disk.

> MetroCluster "s pomalou linkou" ale není podporovaná konfigurace :)

Pomala linka: kazda vzdialenost navyse prida nejaku tu latenciu. Pekne je to popisane v TR: https://www.netapp.com/us/media/tr-3548.pdf Storage response time increases by the link latency. For example, if storage has a response time of 1.5ms for local access, then over 100km the response time increases by 1ms to 2.5ms.

Ale ano, linka ma byt nasizeovana spravne :)

> To platilo u 7-mode.

Stale plati. Ale interny engine sa zmenil. Ale stale su 2. Mno a potom je tu Unified replication relationships co sa da pouzit aj na SnapMirror volume ale je to logical replication pod kapotou.

V prvom rade gratulujem k netappu a prajem vela stastnych rokov bez problemov a vypadkov.

Par poznamok z mojich skusenosti (prevadzkovany velky FAS3250, 3x NexentaStor 4.x, 3x NexentaStor 5.x):
NetApp, the good:
- NetApp ma dobre odladene systemy na konkretne use-casey (oracle DBs, VMs atd), tak isto aj featury funguju paradne, ak su pouzivane 100% podla manualu.
- NetApp v MetroClustri v pripade dodrzania dizajnu funguje, ak by som znova potreboval tuto funkcionalitu tak idem do full flash NetApp-u
- Lokalny partner-i

NetApp, the bad:
- WAFL sa vie pokazit do stavu, ze sa chcel cely aggregate opravovat. V nasom pripade bol zratany cas repairu po reboote na 30 dni v offline mode. Nastastie nejakym zazrakom isiel poskodeny FS zmazat, nahrat z backupu a ostranit poskodeny blok na WAFL.
- NetApp support je OK ak mas dobreho partnera. Ziskat takmer akykolvek support z L3 z Netappu je bez sialenych licencii za support takmer nerealne... (moja skusenost)
- Performance NetAppu na male subory je totalne katastrofalny
- Akekolvek rozsirenie supportu alebo HW je vyrazne drahsie ako pri prvom nakupe

NexentaStor, the good:
- NexentaStor licencie sa daju v pohode zjednat. Tak isto nasledny HW s napr 4hr supportom + licky by ta vysli menej ako cely NetApp. Celkovo total cena NexentaStor vs NetApp vyjde v prospech Nexenty, teda asi zalezi jak si to vie clovek vydealovat. Dokonca by som vobec neriesil SMC ale napr Dell alebo Lenovo.
- NexentaStor support - dostat sa k L3 engineerovy, ktory vie priamo riesit bugy v systeme alebo ho tunit je vyrazne lepsi (moja skusenost).
- Full root access
- Pri spravnom dizajne je cena/vykon exceletna

NexentaStor, the bad:
- Znalost ZFS a design guidu je nutnost. Resp Ak ma clovek partnera tak to zanho zastresi. Riesil som si sam + konzultoval so snajpom.
- Shitty UI v pripade 4.x verzie
- Zrusenie root shellu v pripade 5.x verzie, teda treba si pytat root heslo cez support portal
- Zo zaciatku kopec bugov v 4.x verzii, pri 1k datasetoch + 14 snapshtoch per dataset sa rozbijala random async replika.
- Dobugovany cinder openstack driver od nexenty, vela casu s ich engineermi nakoniec fixed k spokojnosti
- Neexistuje poriadna alternativa metro-clustru. Teda existuje High Performance Replication, ale nemal som odvahu ju nasadit do vmware prostredia (vsan vyhral, ale to je na inu debatu).

Five words: "WHY ARE WE DOING THIS?!?!?!?!?" | vpsFree.cz

23.5.2018 09:36 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Pěkný shrnutí, díky.
Jak jedeš pooly na té Nexentě? Jedeš RAID-Zx? Používáš ssd na slog? Je možné sem hodit nějakou hw spec. jednoho z těch ZFS polí?
Díky
Zdar Max
PS: snajpa je ohledně ZFS dobrej vyšlapávač pěšinky pro ostatní ...

Měl jsem sen ... :(

24.5.2018 09:17 Tomáš Srnka | skóre: 7 | Bratislava/Praha
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Ahoj,

Pouzivam 3x raidz2 po 8 diskoch. Nepouzivam SLOG, je to full-flash pole. Mame zapnutu lz4 kompresiu s pomerom 1.72x. Na netappe sme ledva mali 1.1x + nam to zabijalo CPU...

# zpool status -v
  pool: data
 state: ONLINE
  scan: scrub repaired 0 in 4186h16m with 0 errors on Sat Feb  3 07:00:13 2018
config:
        NAME                       STATE     READ WRITE CKSUM
        data                       ONLINE       0     0     0
          raidz2-0                 ONLINE       0     0     0
            c0t50000396DC8B773Dd0  ONLINE       0     0     0
            c0t50000396DC8B6F3Dd0  ONLINE       0     0     0
            c0t50000396DC8B76F9d0  ONLINE       0     0     0
            c0t50000396DC8B7701d0  ONLINE       0     0     0
            c0t50000396DC8B76E9d0  ONLINE       0     0     0
            c0t50000396DC8B76FDd0  ONLINE       0     0     0
            c0t50000396DC8B7739d0  ONLINE       0     0     0
            c0t50000396DC8B7705d0  ONLINE       0     0     0
          raidz2-1                 ONLINE       0     0     0
            c0t50000396DC8B6F4Dd0  ONLINE       0     0     0
            c0t50000396DC8B6F39d0  ONLINE       0     0     0
            c0t50000396DC8B76F5d0  ONLINE       0     0     0
            c0t50000396DC8B7715d0  ONLINE       0     0     0
            c0t50000396DC8B75BDd0  ONLINE       0     0     0
            c0t50000396DC8B7721d0  ONLINE       0     0     0
            c0t50000396DC8B770Dd0  ONLINE       0     0     0
            c0t50000396DC8B7725d0  ONLINE       0     0     0
          raidz2-2                 ONLINE       0     0     0
            c0t50000396DC8B6F49d0  ONLINE       0     0     0
            c0t50000396DC8B6F55d0  ONLINE       0     0     0
            c0t50000396DC8B7711d0  ONLINE       0     0     0
            c0t50000396DC8B76EDd0  ONLINE       0     0     0
            c0t50000396DC8B75C5d0  ONLINE       0     0     0
            c0t50000396DC8B7719d0  ONLINE       0     0     0
            c0t50000396DC8B7729d0  ONLINE       0     0     0
            c0t50000396DC8B6F51d0  ONLINE       0     0     0

Config je cca:

2x Dell R730xd (controller)

- 2x Intel 10GE DP x520 - 256 GB RAM

- 2x 12 core XEON v4 high freq (neviem presny model z hlavy)

- 2x SAS3 radic v passthru mode

- 24x Toshiba SX04SR? 1,92TB SSD v JBODe (myslim, ze MD1420)

NexentaStor + HA plugin.

K tomu existuje este dalsia nexenta pre DR backupy, kde su rotacne disky a SLOG na SSD. Ta je ulozena v druhom DC a priamy L2 tunel. Tam sa primarne pole replikuje pre pripad, ze by sa nieco katastrofalne stalo. Replika bezi par krat do dna. Este zaujimavostou je, ze na primarnom poli drzime 3 dni snapshoty (okrem teda zakaznickych) a na sekundarnom 21 dni, cim sa zaujimavo setri miesto a v pripade potreby starsieho snapshotu sa proste posle snapshot spat cez zfs send/receive na primarne pole.

Five words: "WHY ARE WE DOING THIS?!?!?!?!?" | vpsFree.cz

24.5.2018 09:31 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Pěkný, ještě by mně zajímal ten SAS3 řadič, to je nějaké LSI HBA, ne?
Zdar Max

Měl jsem sen ... :(

Este priatelska rada:

"Pole má dva řadiče (=prostě servery, hafec jader, hafec ram, každý 2x 10Gbit pro připojení ke storage atd.), kde se definuje, jaký řadič má vlastnit jaký disk. Proto je dobré pole rozdělit do dvou agregátorů, aby disky v jednom agregátoru vlastnil jeden řadič a v druhém agregátoru další řadič a byla tak rozdělena zátěž. Když padne jeden řadič, druhý převezme jeho fci (vlastnictví disků u služeb), to je cajk."

Vyskusaj si to pri plnej produkcii. Z mojej skusenosti su casto oba agregaty az moc zatazene a v pripade padu jedneho z nich ide cele pole do ... v lepsom pripade su jeho odozvy v sekundach. Idealne by sa v peaku teda nemala CPU / Net utilizacia dostat nad 35-40%. Zataz nestupa uplne linearne, ale horsie.

Five words: "WHY ARE WE DOING THIS?!?!?!?!?" | vpsFree.cz

27.5.2018 19:31 systemak
Rozbalit Rozbalit vše Re: NetApp FAS2552 - zkušenosti, provoz, monitoring

Vyskusaj si to pri plnej produkcii. Z mojej skusenosti su casto oba agregaty az moc zatazene a v pripade padu jedneho z nich ide cele pole do ... v lepsom pripade su jeho odozvy v sekundach. Idealne by sa v peaku teda nemala CPU / Net utilizacia dostat nad 35-40%. Zataz nestupa uplne linearne, ale horsie.

presne tak ziadne prevzatie funkcii druhym radicom, sekundove lagy az pad na drzku...