abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:22 | Nová verze

    Byla vydána nová verze 18 integrovaného vývojového prostředí (IDE) Qt Creator. S podporou Development Containers. Podrobný přehled novinek v changelogu.

    Ladislav Hagara | Komentářů: 0
    dnes 12:55 | Nová verze

    Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 2.0. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).

    Ladislav Hagara | Komentářů: 1
    dnes 02:55 | Nová verze

    Google Chrome 142 byl prohlášen za stabilní. Nejnovější stabilní verze 142.0.7444.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 20 bezpečnostních chyb. Za nejvážnější z nich bylo vyplaceno 50 000 dolarů. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    dnes 01:22 | IT novinky Ladislav Hagara | Komentářů: 0
    včera 17:00 | Upozornění

    Národní identitní autorita, tedy NIA ID, MeG a eOP jsou nedostupné. Na nápravě se pracuje [𝕏].

    Ladislav Hagara | Komentářů: 8
    včera 16:44 | IT novinky

    Americký výrobce čipů Nvidia se stal první firmou na světě, jejíž tržní hodnota dosáhla pěti bilionů USD (104,5 bilionu Kč). Nvidia stojí v čele světového trhu s čipy pro umělou inteligenci (AI) a výrazně těží z prudkého růstu zájmu o tuto technologii. Nvidia již byla první firmou, která překonala hranici čtyř bilionů USD, a to letos v červenci.

    Ladislav Hagara | Komentářů: 6
    včera 14:11 | Komunita

    Po Canonicalu a SUSE oznámil také Red Hat, že bude podporovat a distribuovat toolkit NVIDIA CUDA (Wikipedie).

    Ladislav Hagara | Komentářů: 2
    včera 13:55 | Nová verze

    TrueNAS (Wikipedie), tj. open source storage platforma postavená na Linuxu, byl vydán ve verzi 25.10 Goldeye. Přináší NVMe over Fabric (NVMe-oF) nebo OpenZFS 2.3.4.

    Ladislav Hagara | Komentářů: 0
    včera 13:33 | Nová verze

    Byla vydána OpenIndiana 2025.10. Unixový operační systém OpenIndiana (Wikipedie) vychází z OpenSolarisu (Wikipedie).

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Zajímavý článek

    České základní a střední školy čelí alarmujícímu stavu kybernetické bezpečnosti. Až 89 % identifikovaných zranitelností v IT infrastruktuře vzdělávacích institucí dosahuje kritické úrovně, což znamená, že útočníci mohou vzdáleně převzít kontrolu nad klíčovými systémy. Školy navíc často provozují zastaralé technologie, i roky nechávají zařízení bez potřebných aktualizací softwaru a používají k nim pouze výchozí, všeobecně známá

    … více »
    Ladislav Hagara | Komentářů: 16
    Jaké řešení používáte k vývoji / práci?
     (36%)
     (48%)
     (19%)
     (19%)
     (22%)
     (17%)
     (21%)
     (16%)
     (17%)
    Celkem 285 hlasů
     Komentářů: 14, poslední 14.10. 09:04
    Rozcestník

    Dotaz: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe

    17.4.2012 10:52 Peter
    Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    Přečteno: 397×
    Prajem pekný deň osadenstvu.

    Nedávno sa mi stala taká nepríjemná vec, že v jednom serveri (md0 = sda1 + sdb1 && md1 = sda2 + sdb2) mi sdb zahlásil (mám taký malý skript, ktorý každú minútu kontroluje teplotu disku a v prípade prekročenia hranice mi pošle mail a vypne server) 224 stupňov (evidentne blbosť, lebo to by asi v tom serveri musel byť otvorený oheň) a po štarte už nenabehol (vôbec sa neroztočil). Ja že OK, vymením a bude všetko v poriadku. O to väčšie ale bolo moje prekvapenie, keď som zistil, že aj sda je vadný (vadné bloky).

    Preto si chcem teraz vytvoriť nejaký komplexný skript, ktorý bude vyhodnocovať všetky možné údaje aby som mohol byť vopred varovaný (ja viem, že katastrofa môže prísť aj ako blesk z jasného neba, to je jasné, že to je bohužiaľ - vyššia moc, ale ak sa dá niečomu vopred zabrániť, tak je to predsa lepšie), ale neviem, že kde začať.

    Moja idea je skript, ktorý bude napríklad automaticky vyhodnocovať pomocou smartctl, ale aj napriek prečítaniu niekoľkých článkov som stále tupý z "-t long", "-t short", čo na čo je kedy potrebné použiť a čo mi to vlastne "-a /dev/sda..." vypisuje, ... Proste potrebujem pomôcť s tým, že napríklad: urob každý týždeň "-t long", potom každý deň "-t short" a každú minútu si urob smartctl výpis a kontroluj tieto hodnoty a ak sú zlé, tak je to v prdeli :-D, ... Potom, ďalšia otázka, je vhodné robiť napríklad každý týždeň badblocks? Nemôže niečomu uškodiť? A vôbec, čo ešte ďalšie a ako pri diskoch kontrolovať? Naskriptujem si to už sám, ja len potrebujem poradiť s "urob toto, skontroluj hento, vypíš tamto, ..."

    Dúfam, že som sa vykoktal zrozumiteľne.

    P.S.: bežím na CentOS, takže mi tam bežia služby mdmonitor a smartd, tak či by sa pri tom skriptovaní nevedeli voľajako využiť.

    Vopred veľmi pekne ďakujem za pomoc.

    Odpovědi

    rADOn avatar 17.4.2012 12:44 rADOn | skóre: 44 | blog: bloK | Praha
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    Na nějaké parsovaní dat ze smartu se vybodni. Stejne každý výrobce používá jiná měřítka a co u jednoho je běžná věc může být jinde příznak katastrofy. Pokud velice dobře neznáš vlastnosti daného modelu, snadno něco přehlédneš (příklad - teplota jako příznak selhání stojí jak vidno za prd).

    Periodické testy můžou chybu zrovna tak snadno urychlit jako najít. Pokud ty disky nejsou "archivní" a je na nich nějaký provoz, chyba se většinou předem prozradí nárůstem relokací, chybami čtení etc. a nemušíš po něm pořád honit autotesty. Firmware beztak dělá interní testy sám. IMO autotesty jsou spíš pomůcka jak takové podezřelé chování ověřit.

    Long story short – nevynalézej kolo. Spusť smart démona, nastav mu poslání emailu při chybě a je to. Firmware disků sám vyhodnotí blížící se průser nejlíp, smart je jen poslíček.
    "2^24 comments ought to be enough for anyone" -- CmdrTaco
    17.4.2012 12:55 Peter
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    OK, chápem, len teraz ako automaticky napríklad zistiť (keďže na serveri nie som zavesený celý deň), že narastá realokovanie a chyby čítania (sorry, za verím tomu, že sprostú otázku, ale aký nástroj mi to povie, respektíve, tuším, že smartctl, ale kde to vyčítam). A čo sa týka smartd, tak v smartd.conf mám (samozrejme vyčítané niekde z netu, takže netuším, že či to je ok a či tam niečo nechýba)

    /dev/sda -a -I 194 -W 5,45,55 -R 5 -m (samozrejme, že tam je aj riadok pre sdb).
    17.4.2012 12:58 Peter
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    Pardon, za to "-m" samozrejme ide mojaadresa@domena.sk
    rADOn avatar 17.4.2012 18:17 rADOn | skóre: 44 | blog: bloK | Praha
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    Já asi mluvím do zdi. Relokace jsou u některých disků běžné a nic neznamenají, jinde signalizují průser který čeká až se stane. Pokud nevíš co je tvůj disk zač, prostě se do toho neser. Přestaň řešit tu či onu chybu a prostě nastav přeposílání error logu. Firmware ví evidentně lépe než ty co je závažná chyba, pokud máš třeba seagatku tak tě s relokacemi otravovat nebude. Už jsem to dlouho neměl v ruce, ale co si pamatuji výchozí nastavení smartu je pro běžné ATA disky rozumné a není potřeba nic víc než to -m. Jestě tak nejvíc užitečný je tam nějaký parametr na odesílání testovacího emailu, aby se nestalo že disk bude volat o pomoc a mail skončí někde v díře :-)

    A vybodni se na maniakální sledování teploty, na disku to nemá moc smysl. Pokud bude mít disk mechanickou poruchu, zjistíš to ze čtecích chyb (read nebo seek errory) lépe, a pravděpodobně daleko dříve. Navíc teplotní senzor má stejně jako ostatní svůj limit a když se přehřeje, je to chyba jako každá jiná – dostaneš email. Pokud se ti přehřívají jiné části mašiny, pak máš samozřejmě senzory přímo na nich, že ano? :-)
    "2^24 comments ought to be enough for anyone" -- CmdrTaco
    17.4.2012 13:21 Peter
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    A ešte jedna otázka: čo vlastne robí fyzicky disk pri short a long teste a co je to scrubbing raid poľa (niekde som čítal, že je vhodné robiť echo repair > /proc/md/dalej_nepametam_kde a echo check). Ďakujem.
    bambas avatar 17.4.2012 12:46 bambas | skóre: 20 | blog: bambasovo
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    A nebyla by lepsi to rozdelit do vice skriptu a ty spouste cronem? -t long jednou za tyden, short trebas kazdy druhy den. Navic si myslim, ze bude stacit kontolovat disk akorat na vadne sektory a nejakeou defragmentaci, podle pouziteho filesystemu. Nic vic asi nevymyslis...
    17.4.2012 12:50 Peter
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    "-t" je OK, samozrejme, že to bude oddelené, len ma zaujímalo, že napríklad vadné sektory kontrolovať badblocks, alebo je aj niečo iné (samozrejme read-only) a ako často a či to nemôže iba niečo zbytočne poškodiť (ak to budem robiť povedzme každý týždeň), ...
    bambas avatar 17.4.2012 13:34 bambas | skóre: 20 | blog: bambasovo
    Rozbalit Rozbalit vše Re: Zdravie diskov alebo ako sa dozvedieť o blížiacej sa katastrofe
    badblocks myslim je dostacujici i vzhledem k rychlosti...

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.