abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 20:22 | Nová verze

    Byla vydána (𝕏) květnová aktualizace aneb nová verze 1.101 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.101 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    včera 10:00 | Komunita

    V Brně na FIT VUT probíhá třídenní open source komunitní konference DevConf.CZ 2025. Vstup je zdarma, nutná je ale registrace. Na programu je celá řada zajímavých přednášek, lightning talků, meetupů a workshopů. Přednášky lze sledovat i online na YouTube kanálu konference. Aktuální dění lze sledovat na Matrixu, 𝕏 nebo Mastodonu.

    Ladislav Hagara | Komentářů: 0
    včera 09:44 | IT novinky

    Vyloučení technologií, které by mohly představovat bezpečnostní riziko pro stát, má umožnit zákon o kybernetické bezpečnosti, který včera Senát schválil spolu s novelami navazujících právních předpisů. Norma, kterou nyní dostane k podpisu prezident, počítá rovněž s prověřováním dodavatelů technologií pro stát. Normy mají nabýt účinnosti od třetího měsíce po jejich vyhlášení ve Sbírce zákonů.

    Ladislav Hagara | Komentářů: 4
    včera 01:11 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.6.

    Ladislav Hagara | Komentářů: 0
    včera 00:55 | Nová verze

    Po Red Hat Enterprise Linuxu a AlmaLinuxu byl v nové stabilní verzi 10.0 vydán také Rocky Linux. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    11.6. 22:55 | Nová verze

    Bylo vydáno Eclipse IDE 2025-06 aneb Eclipse 4.36. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.

    Ladislav Hagara | Komentářů: 0
    11.6. 22:33 | IT novinky

    Americká filmová studia Walt Disney a Universal Pictures podala žalobu na provozovatele populárního generátoru obrázků pomocí umělé inteligence (AI) Midjourney. Zdůvodňují to údajným porušováním autorských práv. V žalobě podané u federálního soudu v Los Angeles označují firmu za „bezednou jámu plagiátorství“, neboť podle nich bez povolení bezostyšně kopíruje a šíří postavy z filmů jako Star Wars, Ledové království nebo Já, padouch, aniž by do nich investovala jediný cent.

    Ladislav Hagara | Komentářů: 1
    11.6. 18:33 | IT novinky

    Ultra Ethernet Consortium (UEC), jehož cílem je optimalizace a další vývoj Ethernetu s důrazem na rostoucí síťové požadavky AI a HPC, vydalo specifikaci Ultra Ethernet 1.0 (pdf, YouTube).

    Ladislav Hagara | Komentářů: 0
    11.6. 13:00 | IT novinky

    Francouzský prezident Emmanuel Macron chce zakázat přístup na sociální sítě pro děti do 15 let. Francie podle něj tento krok udělá sama do několika měsíců, i pokud se na něm neshodnou další státy Evropské unie. Reaguje tak na úterní vraždu vychovatelky, kterou ve východofrancouzském městě Nogent pobodal 14letý mladík. Jednotlivé sociální sítě podle něj mají možnost věk ověřit a vymáhat zákaz pomocí systémů na rozpoznávání tváří.

    Ladislav Hagara | Komentářů: 12
    11.6. 05:11 | IT novinky

    Byl aktualizován seznam 500 nejvýkonnějších superpočítačů na světě TOP500. Nejvýkonnějším superpočítačem zůstává El Capitan od HPE (Cray) s výkonem 1,742 exaFLOPS. Druhý Frontier má výkon 1,353 exaFLOPS. Třetí Aurora má výkon 1,012 exaFLOPS. Nejvýkonnější český počítač C24 klesl na 165 místo. Karolina, GPU partition klesla na 195. místo a Karolina, CPU partition na 421. místo. Další přehledy a statistiky na stránkách projektu.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (55%)
     (31%)
     (7%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 255 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    Nekonečně spolehlivé diskové pole

    28.4.2006 15:35 | Přečteno: 1637×

    Byl jsem tázán, proč nemám důvěru k RAID řadičům, jaké se strkají do běžných počítačů. Váže se k nim následující historka. Před pár lety jsem si vymyslel, že si jako koupíme diskové pole, které bude tak spolehlivé, že nebude nutné ho zálohovat. Ono zálohování stovek GB a víc bývá pracné. Ještě i dnes si myslím, že to byla správná myšlenka. Můžeme přece mít dvě stejná pole jedno pracovní, druhé záložní obsahující mirror, a jednu paní, která v případě poruchy toho pracovního ho vypne, připojí to záložní a zase to spustí. To je velmi stabilní mechanismus. Při tom stačí paní nahradit robotem a máme co jsme chtěli, vlastně takový SAN. Jenže peníze na skutečný SAN nebyly.

    Jedna seriózní firma od toho dala ruce pryč, druhá dobrodružnější to ale docela hezky vymyslela. Linuxový server, v něm ADAPTEC 2100S nakonfigurovaný tak, aby mirroroval, a k tomu dvě stejná políčka EasyStor SB-2803T s vnějším vývodem SCSI, obě připojená do SCSI chainu k tomu Adaptecu. Více než dva roky to běželo bez nejmenšího problému.

    Na každém tom poli byly vytvořeny tři oddíly jakoby virtuální disky. Ten typ pole to umožňuje tak, že každý virtuální disk má stejné SCSI id ale různý LUN. Každý ten virtuální disk byl v mirroru se stejným na druhém poli. Jak říkám, dlouho to běželo pěkně a ti tři odvážlivci, kteří nám to navrhli a jaksi garantovali, mezitím vzali kramle.

    Potom se mirror rozpadnul, běželo to na polovině a tedy bez zálohy a Adaptec ošklivě pištěl (nedivím se mu). To odpojené pole podle všech testů dál fungovalo, dalo se i připojit jinam a data tam byla. V logu polí nic, v logu linuxu taky nic. V logu Adaptecu velmi stručná hláška, že ten a ten disk chybuje a byl odpojen. Pokus o rebuild mirror obvykle během pár minut zhavaroval. Někdy taky doběhl, ale potom v provozu se to znovu rozpojilo. Přivolaný technik od té dodavatelské firmy se nás zdvořile zeptal, kdo nám takovou pitomou architekturu navrhnul. Nevěděl, co je na tom špatně, ale pořád říkal, že to přece nemůže fungovat.

    Nazdařbůh jsme vyměnili ten Adaptec, ale ne za stejný, ten nebyl k mání. Za nějaký novější. Mělo by to být jedno. Raid řadič si píše služební údaje přímo na připojené disky, a to nejpíš na úplný začátek, kam souborové systémy nikdy nelezou. (Někdo jiný tam může lézt, např. Informix.) Dáte tam nový raid řadič, zapnete a má to hned zase běžet... skutečně bez nehod to naběhlo pro LUN=0 a hned se spustil rebuild správným směrem z dobrého na špatný. Ale pro vyšší LUNy to psalo, že mu chybějí obě poloviny mirroru, zato ale viděl pár nových disků, které tam ve skutečnosti nebyly. Po ručním zrušení mirrorů a jejich znovu vytvoření se to podařilo správně rozjet včetně toho správného směru buildu z dobrého na špatný. Jenže po pár dnech provozu se to znovu odpojilo, jak správně tušíte. Mezitím nám snaživý servisák na našem starém Adaptecu upgradoval firmware a při další výměně nazpátek se to už ani nenabootovalo. Vrátili jsme tam zase ten dočasný Adaptec a na něm to běží už skoro rok bez mirrorování. Mirror si děláme sami pomocí rsync.

    Pominu určité emoční prožitky, které s naznačenými operacemi byly spojeny. Můžu pominout i to, že při jedné z manipulací nám data z jednoho oddílu zmizela, asi se spustil rebuild nesprávným směrem. Data jsme obnovili ze zálohy, protože v té době jsme na absolutní spolehlivost už tolik nevěřili. Ale stejně, co se vlastně stalo?

    Něco očividně hnije v jednom z těch polí nebo v serveru. Ještě to nevyhnilo a tedy se to nedá poznat. Trapné selhání Adaptecu je vázáno na vyšší LUNy a to mu třeba můžeme odpustit. Možná má Adaptec milion instalací podobných destiček, ale nejspíš jednu jedinou s LUN != 0, takže to není odladěné.

    No a ti tři mládenci, co nám to navrhli, škoda že vymizeli. Jeden z nich byl opravdu šikovný, možná by nám to spravil. Pořád nevím, že by na té jejich konstrukci bylo něco špatně. Až na to že nefunguje.

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    28.4.2006 15:45 xxxxxxxx | skóre: 16 | blog: mrtvy blog | v nebi
    Rozbalit Rozbalit vše Re: Nekonečně spolehlivé diskové pole

    V logu Adaptecu velmi stručná hláška, že ten a ten disk chybuje a byl odpojen.

    Hm, mozna ze mam divny myslenkovy pochody, ale IMHO bych nejdriv vymenil ten a ten disk

    28.4.2006 16:31 Jiří Veselský | skóre: 30 | blog: Jirkovo | Ostrava
    Rozbalit Rozbalit vše Re: Nekonečně spolehlivé diskové pole

    Obávám se, že neexistuje způsob, jak se vyhnout plnohodnotnému zálohování. I když bych vzal dvě velmi kvalitní disková pole, připojil je každé k jinému počítači a zajistil jejich mirrorování, dostávám pouze systém, který mě s vysokou mírou spolehlivosti chrání před jakoukoliv myslitelnou hardwarovou závadou nebo jejich různými kombinacemi. (Nechrání samozřejmě úplně dokonale, protože se může stát, že odejde najednou 2xN disků ve dvou polích, ale to je natolik nepravděpodobné, že to můžeme vyloučit.)

    V této fázi je značně eliminováno riziko hardwarového selhání a na povrch vystupuje nezanedbatelné riziko chyby lidského faktoru / softwarového selhání.

    Pokud "master" té dvojice polí usoudí, že mají být obě smazána, jste prostě v háji. Přičemž k tomu může dojít z naprosto prozaické příčiny, například příkazem delete from xxx, kde člověk zapomněl dopsat where yyy - to se mi skutečně podařilo :-(.

    Pokud máte celé zálohovací řešení online, k takovéto situaci dříve či později dojde. Proto by tam měl být vždycky nějaký offline prvek, který vaši chybu ihned slepě nezreplikuje, a vy budete mít šanci odněkud data získat zpět...

    28.4.2006 16:51 krnoha | skóre: 10 | blog: prizpevy
    Rozbalit Rozbalit vše Re: Nekonečně spolehlivé diskové pole

    V této fázi je značně eliminováno riziko hardwarového selhání a na povrch vystupuje nezanedbatelné riziko chyby lidského faktoru / softwarového selhání.


    Pokud máte celé zálohovací řešení online, k takovéto situaci dříve či později dojde. Proto by tam měl být vždycky nějaký offline prvek, který vaši chybu ihned slepě nezreplikuje, a vy budete mít šanci odněkud data získat zpět...

    Samozřejmě. Tím není řečeno, že to nemůže být chytřejší robot. V našem řešení to dořešeno nebylo, to uznávám.

    28.4.2006 18:08 coques | skóre: 21 | blog: FailSystem
    Rozbalit Rozbalit vše Re: Nekonečně spolehlivé diskové pole
    Problem pri online zalohovani este moze vzniknut ak sa ti ktokolvek nepovolany dostane na server :)
    Polívčička byla..
    28.4.2006 19:42 miho | skóre: 24 | blog: Mihovy_sochory | Orlová
    Rozbalit Rozbalit vše Re: Nekonečně spolehlivé diskové pole
    Znamy ITik z male firmy si taktez myslel, ze si podobnym zpusobem usnadni praci se zalohovanim. Nebudu zde popisovat celou historku, to je myslim zbytecne. Postaci myslim posledni veta pribehu se spatnym koncem: "A pak jednoho krasneho dne vyhorela serverovna."

    Alternativni a nemene humorna zakonceni teto pohadky pro zlobive deticky: "... se tam naboural cracker a vsechno smazal." "... udelal root preklep v prikazu." "... se zblaznil ovladac radice a zacal zapisovat na disk na pozici pozadovana_pozice modulo 128GiB" (toto jsem BTW skutecne jednou zazil) ...

    Povinne cist vsem detem inklinujicim k pocitacum u kterych hrozi, ze se stanou spravci serveru protoze pak jim nocni mura z detstvi mozna pripomene, ze, jak napsal klasik: Tudy ne, pratele! :-)
    28.4.2006 20:29 Jiří (BoodOk) Kadeřávek | skóre: 19 | blog: BoodOk | Brno
    Rozbalit Rozbalit vše Re: Nekonečně spolehlivé diskové pole
    Neni levnejsi RAID-5 na SCSI a normalni pulnocni zalohy na pole s IDE disky (nejlepe ve vedlejsi budove)? Takhle jste to meli IMO zbytecne nakladne, protoze vysokokapacitni SCSI RAID neni nic levneho.
    Věda má v sobě určitou zpupnost, že čím dokonalejší techniku vyvineme, čím více se dozvíme, tím lepší budou naše životy.
    28.4.2006 22:06 vagojan | skóre: 16
    Rozbalit Rozbalit vše Proč to zlobí?
    V práci se nám vyskytl nestabilní raid... podezření padlo na řadič, disky.. OS.. na všechno. Nakonec se zjistilo že za to mohl vadý hotswap backplane. Náhodou v té době ležely vedle nové servery, ještě nenainstalované, tak se z nich jeden autobus i s backplanem vypůjčil a bylo to tu.. řešení.

    Server běží dodnes, třebaže je mu 6 let, má v sobě 3 generaci disků a autobus diskového pole je z intel case o 4 generace novější.. tj připevněno jak se dá.

    Někdy fakt stačí trivialita jako nestabilní oddělovače v backplane. Zkoušeli jste zaměnit ty pole? Tj jejich disky?

    Jinak projev chyb... z počátku klesání výkonu raid, pak timeouty, pak divné hlášky.. pak občasné zamrznutí systému.. na závěr totální výtuh co se už neprobral (nějakou dobu pomáhalo k částečnému obnovení funkčnosti i delší vypnutí serveru (jen fyzické odpojení od veškerého napájení).
    29.4.2006 02:35 Radek Hladik | skóre: 20
    Rozbalit Rozbalit vše Re: Proč to zlobí?
    No, to my tady ted delame diskove pole s Highpointem 2220 a SATA Seagaty. Cele to fungovalo, dokud se nezacalo hodne kopirovat, pak to nahlasilo "hpt_reset" a konec, cely pocitac mrtvy, pomohl jedine restart. Castecne pomahalo nepouzivat backplane, ale problem byl porad...

    Jen tak namatkou jsme zkusili vymenit SATA kabely a ehjle... Originalni od highpointu (takove pekne, modre) zlobi a obycejne noname cervene (zatim) fungujou jako po masle...

    Ted jeste zkusim zapatrat, zda do toho nejak nevstupuje SATA1/SATA2. Treba ze by to zlobilo pri SATA2 a na tech obycejnych kabelech by si to troufalo maximalne SATA1...

    Ale co se tyce online zaloh, tak uz jsem zazil nekolik padu filesystemu, takze vzdycky k RAIDu doporucuju nejaky zpusob zalohy na jiny filesystem a u dulezitych dat i nekolik dni zpatky.

    Radek
    29.4.2006 10:09 Jiri Bajer | skóre: 34 | blog: Sarimuv koutek | Praha
    Rozbalit Rozbalit vše Re: Nekonečně spolehlivé diskové pole
    Taky bych se pripojil k nazoru, ze bez offline zaloh nepomuze sebechytrejsi online mirrorovani mezi vice poli. Ztratu dat typicky zpusobuji dve varianty prusvihu: korektni pozadavek na odstraneni/prepsani dat (chyba administratora/sw) a hw chyba controlleru. U automagickych policek, kde clovek nema sanci dostatecne videt do vnitrni architektury a nenedokaze externe zazalohovat rozlozeni LUNu a RAID levely se dost casto stava, ze pri vypadku controlleru se v poslednim zachvevu zivota pokusi umirajici controller vnutit svemu protejsku to, ze spravnou kopii konfigurace ma on a nestesti je na svete...

    To, ze obcas umre disk, by si melo kazde rozumne pole ohlidat a tady vetsinou nebyvaji problemy, nejvetsi prusvihy byvaji s firmware v controlleru a prave automagickou architekturou pole. Rozhodne bych se tedy nespolehal na to, ze kdyz je ridici logika (controller) zdvojena, ze se nemuze nic stat.

    Jen mala perlicka na okraj: uz jsem videl ztracena data jen proto, ze administrator pri odstavce nespravnym zpusobem vypnul pole. Pole melo nekolik shelfu, jeden mel na sobe controllery i disky, zbyle byly jen JBODy (just a bunch of disks - tj. sbernice bez ridici logiky) - a jemu se podarilo povypinat nejprve JBODy a az nakonec controller. Obnova nekolika TB dat z Ultrium pasek pak trvala minimalne cely vikend. Nemit ty offline zalohy, mohli se rozloucit s datama...

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.