Portál AbcLinuxu, 2. května 2025 07:19
Před nějakým časem nám začal padat Oracle RAC (2x DL380G7 + 1x P2000 G3 připojené pomocí FC). Vše se zdálo býti dobré, až na jednu věc. V logách bylo celkem často info, že nějaký disk má chybu, ale po scrubu vše ok, viz :
Bohužel evidentně ne, Oracle prostě 1x týdně padnul při procesu kompletní zálohy. S dodavatelem jsem domluvil postupnou výměnu disků, které se v logách opakovaly a provedl jsem jejich výměnu. Od té doby klid. To bylo pro mně velkým zklamáním, protože vše se tvářilo, že je 100% ok a nebylo, navíc tyto hlášky padaly do prostých info a kdo by si je nechal posílat, warn a err přeci stačí...
Do záložní lokality jsme pořídili SAS verzi tohoto pole pro standalone zálohy. Vytvořil jsem na něm pro větší spolehlivost RAID50 ze 3x4 disků + 2x spare. Celkem tedy 14x 2TB SATA disky. Nedávno to ovšem pole lehce nerozdejchalo. Po výpadku proudu nenaběhlo 5x HDD, pole je nevidělo. Po rescanu disků je pole uvidělo, ale měly na sobě Global SP. Prostě se z 5 disků staly Spare disky. Na podpoře HP nám sdělili, že pole je po HW stránce plně ok, ale toto se prý prostě stává a máme po datech. Poradili ještě upgrade FW, který vyšel asi před cca 14 dny, než se pole rozbilo. Lze tedy říci, že pole mělo aktuální fw.
Ve finále jsem dohledal tento dokument : HP P2000 G3 MSA Systems - Disk Drive Failure During Reconstruct Scenarios, kde radí v případě jakýchkoli problémů neupgradovat fw ani nemazat unwritable cache. Škoda, že jsem to nenašel dřív, ale obávám se, že by to stejně nepomohlo. Zkoušel jsem zmíněný trust, ale bohužel, ten na pole v takovém stavu nemá.
Nějak nevím, co si o tom všem myslet, ale moje důvěra v taková pole značně klesla :-/. Nj., čekat na koupi dalšího pole pro zálohy záloh se zjevně nevyplácí :-/. Apropo, má někdo podobnou zkušenost?
Zdar Max
Tiskni
Sdílej:
Pole je v záruce, ale support nás poslal tak nějak do hájeJo, poslední dobou se HP support RAPIDNĚ ZHORŠUJE!
nevyjadrim sa k msackam tie u nas idu (klop klop) celkom stabilne...ale asi 3 tyzdne dozadu sme boli svedkami ked sa zburala P9500vka ....HP supp to riesil a odpoved prisla taka ze toto je 2hy krat co sa to stalo na svete s tym, ze sa zda, ze sa to deje vtedy ked su splnene tieto 3 podmienky
- port je v host mode
- vo fabriku je logout event
- bezi upgrade mikrokodu kontrolera
Major outage bola na svete
Dnes crashol bez dovodu Netapp E-series....jedna vec je ze sme o data neprisli..cize tak zle ako u teba to nebolo. ....aj vyssie ako u MSA sa deju zle veci...
D.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.