abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

včera 21:44 | Nová verze

Po půl roce od vydání verze 9.0 byla vydána verze 10.0 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab (Wikipedie). Představení nových vlastností v příspěvku na blogu a na YouTube.

Ladislav Hagara | Komentářů: 0
22.9. 18:11 | Nová verze

Společnost Oracle oficiálně oznámila vydání Java SE 9 (JDK 9), Java Platform Enterprise Edition 8 (Java EE 8) a Java EE 8 Software Development Kit (SDK). Java SE 9 přináší více než 150 nových vlastností.

Ladislav Hagara | Komentářů: 0
22.9. 12:11 | Komunita

Na Humble Bundle lze získat hororovou počítačovou hru Outlast (Wikipedie) běžící také v Linuxu zdarma. Speciální akce končí v sobotu v 19:00.

Ladislav Hagara | Komentářů: 2
22.9. 10:33 | Humor

Mozilla.cz upozorňuje na Knihu Mozilly (Wikipedie), tj. velikonoční vajíčko ve Firefoxu. Zobrazit jej lze zadáním about:mozilla do adresního řádku. Aktuální verze Firefoxu obsahuje proroctví 15:1 "Dvojčata Mamonu se rozhádala a jejich souboje uvrhly svět do nové tmy. Zvířeti se ale tma hnusila. A tak se stalo mrštnější a silnější, šlo vpřed a jeho počty rostly. A zvíře přineslo oheň a světlo do tmy". Firefox 57 bude obsahovat proroctví 11:14. To je zatím jenom v angličtině. Pomoci lze s překladem do češtiny.

Ladislav Hagara | Komentářů: 10
22.9. 01:22 | Zajímavý projekt
Před měsícem byla spuštěna kampaň na podporu chytrého telefonu Librem 5, jenž by měl respektovat bezpečnost, svobodu a soukromí uživatelů. Cílem kampaně je vybrat alespoň milion a půl dolarů. Aktuálně je vybráno přes 600 000 dolarů, tj. 40 %. Kampaň poběží ještě další měsíc. Podporu projektu oznámilo KDE i GNOME.
Ladislav Hagara | Komentářů: 33
22.9. 00:55 | Komunita

Agentura DISA (Defense Information Systems Agency) publikovala (pdf) Ubuntu 16.04 Security Technical Implementation Guide (STIG) (zip), tj. doporučené bezpečnostní nastavení Ubuntu 16.04. Ubuntu se tak dostalo mezi unixové operační systémy a linuxové distribuce AIX, HP-UX, Oracle Linux, Red Hat a Solaris [reddit].

Ladislav Hagara | Komentářů: 2
21.9. 22:55 | Bezpečnostní upozornění

CSIRT.CZ informuje, že byly vydány nové bezpečnostní aktualizace, které opravují několik zranitelných míst v Sambě. Útočník může využít zranitelnosti s cílem získání přístupu k potenciálně citlivých informací. Uživatelům a správcům je doporučeno, aby zkontrolovali bezpečnostní opatření pro CVE-2017-12150, CVE-2017-12151 a CVE-2017-12163 a provedli potřebné aktualizace.

Ladislav Hagara | Komentářů: 0
21.9. 21:44 | Komunita

Společnost Red Hat aktualizovala svůj slib ohledně softwarových patentů. Slib nově zahrnuje i open source software pod permisivními licencemi.

Ladislav Hagara | Komentářů: 0
21.9. 08:55 | Komunita

Do 22. září probíhá v Mountain View konference XDC2017 (X.Org Developer's Conference). Na programu je řada zajímavých přednášek. Sledovat je lze online. K dispozici je záznam přednášek ze včerejšího dne.

Ladislav Hagara | Komentářů: 0
20.9. 17:33 | Nová verze

Byla vydána nová stabilní verze 1.12 (1.12.955.36) webového prohlížeče Vivaldi (Wikipedie). Z novinek vývojáři zdůrazňují možnost zobrazení metadat u digitálních fotografií, vylepšený panel stahování a omezení sytosti barvy zdůraznění (YouTube). Nejnovější Vivaldi je postaveno na Chromiu 61.0.3163.91.

Ladislav Hagara | Komentářů: 40
Těžíte nějakou kryptoměnu?
 (5%)
 (3%)
 (17%)
 (75%)
Celkem 560 hlasů
 Komentářů: 22, poslední 29.8. 11:23
    Rozcestník

    Dotaz: SW RAID 1 - kontrola disků a opětnovné připojení

    Michnzee avatar 26.2.2014 12:43 Michnzee | skóre: 10 | Praha
    SW RAID 1 - kontrola disků a opětnovné připojení
    Přečteno: 963×
    Dobrý den, potřeboval bych poradit ohledně softwarového raidu 1 na distibuci ubuntu skrze mdadm. Měl jsem v poli dva stejné disky (sda a sdb) ale obávám se že jeden umřel nebo se pole rozpojilo a momentálně je v degradovaném stavu. Viz:
    root@server:~# mdadm -D /dev/md0
    /dev/md0:
            Version : 1.2
      Creation Time : Wed Dec 12 22:38:19 2012
         Raid Level : raid1
         Array Size : 976598848 (931.36 GiB 1000.04 GB)
      Used Dev Size : 976598848 (931.36 GiB 1000.04 GB)
       Raid Devices : 2
      Total Devices : 1
        Persistence : Superblock is persistent
    
        Update Time : Wed Feb 26 12:31:48 2014
              State : clean, degraded
     Active Devices : 1
    Working Devices : 1
     Failed Devices : 0
      Spare Devices : 0
    
               Name : server:0  (local to host server)
               UUID : 9bc23f7a:5c4b7602:77035a09:bc5f86ec
             Events : 1022720
    
        Number   Major   Minor   RaidDevice State
           0       8        2        0      active sync   /dev/sda2
           1       0        0        1      removed
    
    
    Teď jsem trochu zmatený, jestli ten disk opravdu umřel nebo ne, protože když si vypíšu aktivní disky připojené v systému:
    root@server:~# mdadm --query --examine /dev/sda
    /dev/sda:
       MBR Magic : aa55
    Partition[0] :        61440 sectors at         2048 (type 82)
    Partition[1] :   1953460224 sectors at        63488 (type fd)
    root@server:~# mdadm --query --examine /dev/sdb
    /dev/sdb:
       MBR Magic : aa55
    Partition[0] :        61440 sectors at         2048 (type 82)
    Partition[1] :   1953460224 sectors at        63488 (type fd)
    
    
    ...tak se zdá že oba disky jsou v pořádku. Mohl bych se zeptat, jestli by mi někdo poradil nebo spíš vysvětlil co se stalo, popřípadě nenavedl jak vrátit oba disky do pole md0? Předem moc děkuji :)

    Řešení dotazu:


    Odpovědi

    26.2.2014 12:58 Sten
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Co vypíše cat /proc/mdstat?
    Michnzee avatar 26.2.2014 13:00 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Vypíše přesně toto:
    root@server:~# cat /proc/mdstat
    Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
    md0 : active raid1 sda2[0]
          976598848 blocks super 1.2 [2/1] [U_]
    
    unused devices: < none>
    
    
    Voty avatar 26.2.2014 14:23 Voty | skóre: 12 | blog: gemini
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Z výpisů to vypadá, že sda2 je OK a sdb2 se odpojilo. Dobré je teď zjistit důvod, proč se tak stalo. Asi bych začal tím, že bych se podíval do logu SMARTu (pro jistotu do obou disků), jestli tam není nějaká hláška.

    smartctl --all /dev/sda

    smartctl --all /dev/sdb
    Jednu rozbil a tu druhou ztratil.
    Michnzee avatar 26.2.2014 14:29 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Dobře, provedl jsem test obou disků viz:

    Disk sda
    root@server:~# smartctl --all /dev/sda
    smartctl 5.41 2011-06-09 r3365 [i686-linux-3.2.0-29-generic-pae] (local build)
    Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
    
    === START OF INFORMATION SECTION ===
    Device Model:     WDC WD10JPVT-75A1YT0
    Serial Number:    WXC1E32DKAW3
    LU WWN Device Id: 5 0014ee 65828493f
    Firmware Version: 01.01A01
    User Capacity:    1,000,204,886,016 bytes [1.00 TB]
    Sector Sizes:     512 bytes logical, 4096 bytes physical
    Device is:        Not in smartctl database [for details use: -P showall]
    ATA Version is:   8
    ATA Standard is:  Exact ATA specification draft version not indicated
    Local Time is:    Wed Feb 26 14:24:54 2014 CET
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    
    General SMART Values:
    Offline data collection status:  (0x00) Offline data collection activity
                                            was never started.
                                            Auto Offline Data Collection: Disabled.
    Self-test execution status:      (   0) The previous self-test routine completed
                                            without error or no self-test has ever
                                            been run.
    Total time to complete Offline
    data collection:                (16980) seconds.
    Offline data collection
    capabilities:                    (0x7b) SMART execute Offline immediate.
                                            Auto Offline data collection on/off support.
                                            Suspend Offline collection upon new
                                            command.
                                            Offline surface scan supported.
                                            Self-test supported.
                                            Conveyance Self-test supported.
                                            Selective Self-test supported.
    SMART capabilities:            (0x0003) Saves SMART data before entering
                                            power-saving mode.
                                            Supports SMART auto save timer.
    Error logging capability:        (0x01) Error logging supported.
                                            General Purpose Logging supported.
    Short self-test routine
    recommended polling time:        (   2) minutes.
    Extended self-test routine
    recommended polling time:        ( 185) minutes.
    Conveyance self-test routine
    recommended polling time:        (   5) minutes.
    SCT capabilities:              (0x70b5) SCT Status supported.
                                            SCT Feature Control supported.
                                            SCT Data Table supported.
    
    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
      3 Spin_Up_Time            0x0027   179   177   021    Pre-fail  Always       -       2041
      4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       315
      5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
      7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       4522
     10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
     11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
     12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       315
    191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       23265
    192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       3
    193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       683
    194 Temperature_Celsius     0x0022   109   099   000    Old_age   Always       -       38
    196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
    197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
    198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
    199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
    200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
    240 Head_Flying_Hours       0x0032   094   094   000    Old_age   Always       -       4507
    241 Total_LBAs_Written      0x0032   200   200   000    Old_age   Always       -       3373451363
    242 Total_LBAs_Read         0x0032   200   200   000    Old_age   Always       -       5252457189
    254 Free_Fall_Sensor        0x0032   200   200   000    Old_age   Always       -       0
    
    SMART Error Log Version: 1
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    No self-tests have been logged.  [To run self-tests, use: smartctl -t]
    
    
    SMART Selective self-test log data structure revision number 1
     SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
        1        0        0  Not_testing
        2        0        0  Not_testing
        3        0        0  Not_testing
        4        0        0  Not_testing
        5        0        0  Not_testing
    Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
    If Selective self-test is pending on power-up, resume after 0 minute delay.
    
    
    
    A nyní disk sdb
    root@server:~# smartctl --all /dev/sdb
    smartctl 5.41 2011-06-09 r3365 [i686-linux-3.2.0-29-generic-pae] (local build)
    Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
    
    === START OF INFORMATION SECTION ===
    Device Model:     WDC WD10JPVT-00A1YT0
    Serial Number:    WD-WX21E42DN573
    LU WWN Device Id: 5 0014ee 658413399
    Firmware Version: 01.01A01
    User Capacity:    1,000,204,886,016 bytes [1.00 TB]
    Sector Sizes:     512 bytes logical, 4096 bytes physical
    Device is:        Not in smartctl database [for details use: -P showall]
    ATA Version is:   8
    ATA Standard is:  Exact ATA specification draft version not indicated
    Local Time is:    Wed Feb 26 14:25:10 2014 CET
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    
    General SMART Values:
    Offline data collection status:  (0x00) Offline data collection activity
                                            was never started.
                                            Auto Offline Data Collection: Disabled.
    Self-test execution status:      (   0) The previous self-test routine completed
                                            without error or no self-test has ever
                                            been run.
    Total time to complete Offline
    data collection:                (17880) seconds.
    Offline data collection
    capabilities:                    (0x7b) SMART execute Offline immediate.
                                            Auto Offline data collection on/off support.
                                            Suspend Offline collection upon new
                                            command.
                                            Offline surface scan supported.
                                            Self-test supported.
                                            Conveyance Self-test supported.
                                            Selective Self-test supported.
    SMART capabilities:            (0x0003) Saves SMART data before entering
                                            power-saving mode.
                                            Supports SMART auto save timer.
    Error logging capability:        (0x01) Error logging supported.
                                            General Purpose Logging supported.
    Short self-test routine
    recommended polling time:        (   2) minutes.
    Extended self-test routine
    recommended polling time:        ( 195) minutes.
    Conveyance self-test routine
    recommended polling time:        (   5) minutes.
    SCT capabilities:              (0x70b5) SCT Status supported.
                                            SCT Feature Control supported.
                                            SCT Data Table supported.
    
    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
      3 Spin_Up_Time            0x0027   177   175   021    Pre-fail  Always       -       2133
      4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       317
      5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
      7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       4522
     10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
     11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
     12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       317
    192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       5
    193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       752
    194 Temperature_Celsius     0x0022   107   096   000    Old_age   Always       -       40
    196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
    197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
    198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
    199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
    200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
    
    SMART Error Log Version: 1
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    No self-tests have been logged.  [To run self-tests, use: smartctl -t]
    
    
    SMART Selective self-test log data structure revision number 1
     SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
        1        0        0  Not_testing
        2        0        0  Not_testing
        3        0        0  Not_testing
        4        0        0  Not_testing
        5        0        0  Not_testing
    Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
    If Selective self-test is pending on power-up, resume after 0 minute delay.
    
    
    Myslím, že oba dva disky vypadají v pořádku pokud se nepletu, žádné chybové hlášky v Error Log.
    26.2.2014 16:33 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Neprovedl jsi test, jen jsi vypsal údaje, test lze provést pomocí.
    smartctl -t short /dev/sdb
    nebo
    smartctl -t long /dev/sdb
    A ž test proběhne, vypíšeš si to znovu (průběh testu možná uvidíš ve výpisu, ale možná taky ne, nebo ti nepůjde výpis v průběhu testu udělat - je to dle daného disku).

    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    Řešení 1× (Michnzee (tazatel))
    26.2.2014 14:50 dustin | skóre: 61 | blog: dustin
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Nejdřív bych to sdb2 zkusil zpět do pole přidat
    mdadm /dev/md0 --add /dev/sdb2
    V tom /proc/mdstat uvidíš, co to udělalo.

    Máš aktuální /etc/mdadm/mdadm.conf a následně přegenerovaný initramfs, aby se do něj dostal ten aktuální mdadm.conf?
    Michnzee avatar 26.2.2014 14:58 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Tak jsem disk vrátil do pole a provedl opět výpis aktuálních informací, viz níže:
    root@server:~# mdadm /dev/md0 --add /dev/sdb2
    mdadm: added /dev/sdb2
    
    - disk úspěšně přidán, nyní kontrola pole:
    root@server:~# cat /proc/mdstat
    Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
    md0 : active raid1 sdb2[2] sda2[0]
          976598848 blocks super 1.2 [2/1] [U_]
          [>....................]  recovery =  0.6% (6702976/976598848) finish=173.5min speed=93163K/sec
    
    unused devices: < none>
    
    - po připojení začala obnova a ještě jeden detailní pohled:
    
    root@server:~# mdadm -D /dev/md0
    /dev/md0:
            Version : 1.2
      Creation Time : Wed Dec 12 22:38:19 2012
         Raid Level : raid1
         Array Size : 976598848 (931.36 GiB 1000.04 GB)
      Used Dev Size : 976598848 (931.36 GiB 1000.04 GB)
       Raid Devices : 2
      Total Devices : 2
        Persistence : Superblock is persistent
    
        Update Time : Wed Feb 26 14:53:12 2014
              State : clean, degraded, recovering
     Active Devices : 1
    Working Devices : 2
     Failed Devices : 0
      Spare Devices : 1
    
     Rebuild Status : 0% complete
    
               Name : royalrk:0  (local to host royalrk)
               UUID : 9bc23f7a:5c4b7602:77035a09:bc5f86ec
             Events : 1024924
    
        Number   Major   Minor   RaidDevice State
           0       8        2        0      active sync   /dev/sda2
           2       8       18        1      spare rebuilding   /dev/sdb2
    
    Takže vypadá to, že se zadařilo. Ale absolutně nechápu proč se tomu tak stalo, že se jeden disk odpojil a vypadl z pole. Dalo by se to nějak zpětně zjistit? ještě že jsem si toho všiml, občas tu kontrolu udělám - proto mě to zarazilo že je v poli defacto jen jeden disk. V každém případě bych chtěl poděkovat všem zainteresovaným za pomoc.
    AraxoN avatar 26.2.2014 15:32 AraxoN | skóre: 45 | blog: slon_v_porcelane | Košice
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Do mdadm.conf si daj svoju mailovú adresu a spusti mdadm démon /etc/init.d/mdadm - po výpadku disku z poľa Ti hneď príde mail.

    Ako bolo povedané nižšie, SMART testy môžu tiež odhaliť chybu. To sa dá zase zadať do smartd.conf a spustiť smartd démon /etc/init.d/smartd
    A fine is a tax for doing wrong. A tax is a fine for doing well.
    Jendа avatar 26.2.2014 16:18 Jendа | skóre: 74 | blog: Výlevníček | JO70FB
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Dalo by se to nějak zpětně zjistit?
    Kernel nejspíš vypíše něco jako „media error“, „timeout“ nebo něco jiného. grepni syslog, messages a další (podle distribuce a nastavení rsyslogu) na název toho disku.
    ještě že jsem si toho všiml, občas tu kontrolu udělám
    Já dávám do cronu grep na "_" v /proc/mdstat s tím, že mi přijde e-mail, když tam je :-)
    Much eRecept, very security, so DH-1024, many TLS1.0, very java, wow.
    Michnzee avatar 26.2.2014 15:02 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Jinak jsem kontroloval v /etc/mdadm konfigurační soubor a přijde mi původní (s původními údaji) když jsem to pole vytvářel poprvé, někdy před rokem a něco...
    Řešení 1× (Michnzee (tazatel))
    26.2.2014 15:14 trubicoid2
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    puvodni jako neaktualni? aktualni udelas takto: mdadm --detail --scan >> /etc/mdadm.conf a pak v editoru vyhodis stary radky

    ze smartu je videt, ze disky jsou ok, ale zatim jsi nikdy jest nepoustel ani jeden smart test, tedy treba jendou mesicne je dobre udelat smartctl -t long /dev/sda, kontrola vysledku pomoci smartctl -a /dev/sda

    no a pole se muze kontrolovat treba jednou tydne pomoci echo check >> /sys/block/md0/md/sync_action, az to dobehne, tak kouknes do cat /sys/block/md?/md/mismatch_cnt a mely by tam byt nuly

    nejlip si obe kontroly dej do cronu
    26.2.2014 15:26 dustin | skóre: 61 | blog: dustin
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Např. v debianu si ty checky pole hlídá balík mdadm sám (přidá si je do cronu).

    Je potřeba nezapomenout na ten initramfs, aby bylo pole správně sestavené po restartu. Tipuji si, že restart se starým mdadm v initramfs byl důvod, proč tam to sdb není.
    Michnzee avatar 26.2.2014 20:03 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Ten původní konfigurační soubor byl vytvořený během instalace (když jsem nastavoval sw raid) a od té doby se na to nesáhlo, ale typy disků jsem nemělnil, takže po vygenerování mdadm --detail --scan >> /etc/mdadm.conf konfigu se UUID shodovaly s tím původně vytvořeným.

    Když se všechna data opět sesypala dohromady tak jsem stroj ještě jednou přezkoušel, restartoval a všechno najelo v pořádku - takže skvělá práce a mnohé díky za pomoc. Pro kontrolu přidávám aktuální stav pole:
    root@server:~# mdadm -D /dev/md0
    /dev/md0:
            Version : 1.2
      Creation Time : Wed Dec 12 22:38:19 2012
         Raid Level : raid1
         Array Size : 976598848 (931.36 GiB 1000.04 GB)
      Used Dev Size : 976598848 (931.36 GiB 1000.04 GB)
       Raid Devices : 2
      Total Devices : 2
        Persistence : Superblock is persistent
    
        Update Time : Wed Feb 26 19:53:34 2014
              State : clean
     Active Devices : 2
    Working Devices : 2
     Failed Devices : 0
      Spare Devices : 0
    
               Name : server:0  (local to host server)
               UUID : 9bc23f7a:5c4b7602:77035a09:bc5f86ec
             Events : 1027647
    
        Number   Major   Minor   RaidDevice State
           0       8        2        0      active sync   /dev/sda2
           2       8       18        1      active sync   /dev/sdb2
    
    
    ...a také...
    root@server:~# cat /proc/mdstat
    Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
    md0 : active raid1 sdb2[2] sda2[0]
          976598848 blocks super 1.2 [2/2] [UU]
    
    unused devices: < none>
    
    

    Jinak jsem si dle vašich rad poupravil kontrolovací soubory a rozesílání emailů s notifikací, včetně automatického scanu přes cron - parádní záležitosti, ještě jednou moc díky!

    Lukáš

    26.2.2014 21:44 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Testnul si si i jestli ti ty e-maily chodí ?;)
    Když by mi vypadl disk z pole, tak bych se nespokojil jen s opětovným přidáním a resync-em, ale aspoň bych si provedl test disků (+ prohledání logů).
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    Michnzee avatar 4.3.2014 13:10 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Kontrolu jsem samozřejmě provedl, výpis pro první disk zde:
    root@server:~# smartctl -a /dev/sda
    smartctl 5.41 2011-06-09 r3365 [i686-linux-3.2.0-29-generic-pae] (local build)
    Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
    
    === START OF INFORMATION SECTION ===
    Device Model:     WDC WD10JPVT-75A1YT0
    Serial Number:    WXC1E32DKAW3
    LU WWN Device Id: 5 0014ee 65828493f
    Firmware Version: 01.01A01
    User Capacity:    1,000,204,886,016 bytes [1.00 TB]
    Sector Sizes:     512 bytes logical, 4096 bytes physical
    Device is:        Not in smartctl database [for details use: -P showall]
    ATA Version is:   8
    ATA Standard is:  Exact ATA specification draft version not indicated
    Local Time is:    Tue Mar  4 11:00:14 2014 CET
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    
    General SMART Values:
    Offline data collection status:  (0x00) Offline data collection activity
                                            was never started.
                                            Auto Offline Data Collection: Disabled.
    Self-test execution status:      (   0) The previous self-test routine completed
                                            without error or no self-test has ever
                                            been run.
    Total time to complete Offline
    data collection:                (16980) seconds.
    Offline data collection
    capabilities:                    (0x7b) SMART execute Offline immediate.
                                            Auto Offline data collection on/off support.
                                            Suspend Offline collection upon new
                                            command.
                                            Offline surface scan supported.
                                            Self-test supported.
                                            Conveyance Self-test supported.
                                            Selective Self-test supported.
    SMART capabilities:            (0x0003) Saves SMART data before entering
                                            power-saving mode.
                                            Supports SMART auto save timer.
    Error logging capability:        (0x01) Error logging supported.
                                            General Purpose Logging supported.
    Short self-test routine
    recommended polling time:        (   2) minutes.
    Extended self-test routine
    recommended polling time:        ( 185) minutes.
    Conveyance self-test routine
    recommended polling time:        (   5) minutes.
    SCT capabilities:              (0x70b5) SCT Status supported.
                                            SCT Feature Control supported.
                                            SCT Data Table supported.
    
    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
      3 Spin_Up_Time            0x0027   180   177   021    Pre-fail  Always       -       1983
      4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       319
      5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
      7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       4579
     10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
     11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
     12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       319
    191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       23273
    192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       3
    193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       691
    194 Temperature_Celsius     0x0022   109   099   000    Old_age   Always       -       38
    196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
    197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
    198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
    199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
    200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0
    240 Head_Flying_Hours       0x0032   094   094   000    Old_age   Always       -       4564
    241 Total_LBAs_Written      0x0032   200   200   000    Old_age   Always       -       3481264238
    242 Total_LBAs_Read         0x0032   200   200   000    Old_age   Always       -       7280405995
    254 Free_Fall_Sensor        0x0032   200   200   000    Old_age   Always       -       0
    
    SMART Error Log Version: 1
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
    # 1  Extended offline    Completed without error       00%      4531         -
    
    SMART Selective self-test log data structure revision number 1
     SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
        1        0        0  Not_testing
        2        0        0  Not_testing
        3        0        0  Not_testing
        4        0        0  Not_testing
        5        0        0  Not_testing
    Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
    If Selective self-test is pending on power-up, resume after 0 minute delay.
    
    
    ... a pro druhý disk - ten který jsme pak připojili zde:
    root@server:~# smartctl -a /dev/sdb
    smartctl 5.41 2011-06-09 r3365 [i686-linux-3.2.0-29-generic-pae] (local build)
    Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
    
    === START OF INFORMATION SECTION ===
    Device Model:     WDC WD10JPVT-00A1YT0
    Serial Number:    WD-WX21E42DN573
    LU WWN Device Id: 5 0014ee 658413399
    Firmware Version: 01.01A01
    User Capacity:    1,000,204,886,016 bytes [1.00 TB]
    Sector Sizes:     512 bytes logical, 4096 bytes physical
    Device is:        Not in smartctl database [for details use: -P showall]
    ATA Version is:   8
    ATA Standard is:  Exact ATA specification draft version not indicated
    Local Time is:    Tue Mar  4 13:08:30 2014 CET
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    
    General SMART Values:
    Offline data collection status:  (0x00) Offline data collection activity
                                            was never started.
                                            Auto Offline Data Collection: Disabled.
    Self-test execution status:      ( 243) Self-test routine in progress...
                                            30% of test remaining.
    Total time to complete Offline
    data collection:                (17880) seconds.
    Offline data collection
    capabilities:                    (0x7b) SMART execute Offline immediate.
                                            Auto Offline data collection on/off support.
                                            Suspend Offline collection upon new
                                            command.
                                            Offline surface scan supported.
                                            Self-test supported.
                                            Conveyance Self-test supported.
                                            Selective Self-test supported.
    SMART capabilities:            (0x0003) Saves SMART data before entering
                                            power-saving mode.
                                            Supports SMART auto save timer.
    Error logging capability:        (0x01) Error logging supported.
                                            General Purpose Logging supported.
    Short self-test routine
    recommended polling time:        (   2) minutes.
    Extended self-test routine
    recommended polling time:        ( 195) minutes.
    Conveyance self-test routine
    recommended polling time:        (   5) minutes.
    SCT capabilities:              (0x70b5) SCT Status supported.
                                            SCT Feature Control supported.
                                            SCT Data Table supported.
    
    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
      3 Spin_Up_Time            0x0027   177   175   021    Pre-fail  Always       -       2116
      4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       321
      5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
      7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       4581
     10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
     11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
     12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       321
    192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       5
    193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       761
    194 Temperature_Celsius     0x0022   105   096   000    Old_age   Always       -       42
    196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
    197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
    198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
    199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
    200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
    
    SMART Error Log Version: 1
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    No self-tests have been logged.  [To run self-tests, use: smartctl -t]
    
    
    SMART Selective self-test log data structure revision number 1
     SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
        1        0        0  Not_testing
        2        0        0  Not_testing
        3        0        0  Not_testing
        4        0        0  Not_testing
        5        0        0  Not_testing
    Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
    If Selective self-test is pending on power-up, resume after 0 minute delay.
    
    
    Jinak natifikace nastavená :)

    4.3.2014 14:52 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Evidentně test na /dev/sdb neproběhl žádný, tedy nad /dev/sdb neprovedl ;).
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    4.3.2014 23:41 Trubicoid
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    30% remaining...

    Zeptal se moc brzo no, co to rika ted?
    5.3.2014 07:26 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Pravda, přehlídl jsem to (lepší je to u Seagate, které to píšou přímo v tabulce výsledků).
    A přidám sem: „jak to vypadá fčul?“
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    Michnzee avatar 6.3.2014 19:09 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    A jéje, omlouvám se, zde je aktuální:
    root@server:~# smartctl -a /dev/sdb
    smartctl 5.41 2011-06-09 r3365 [i686-linux-3.2.0-29-generic-pae] (local build)
    Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
    
    === START OF INFORMATION SECTION ===
    Device Model:     WDC WD10JPVT-00A1YT0
    Serial Number:    WD-WX21E42DN573
    LU WWN Device Id: 5 0014ee 658413399
    Firmware Version: 01.01A01
    User Capacity:    1,000,204,886,016 bytes [1.00 TB]
    Sector Sizes:     512 bytes logical, 4096 bytes physical
    Device is:        Not in smartctl database [for details use: -P showall]
    ATA Version is:   8
    ATA Standard is:  Exact ATA specification draft version not indicated
    Local Time is:    Thu Mar  6 19:07:23 2014 CET
    SMART support is: Available - device has SMART capability.
    SMART support is: Enabled
    
    === START OF READ SMART DATA SECTION ===
    SMART overall-health self-assessment test result: PASSED
    
    General SMART Values:
    Offline data collection status:  (0x00) Offline data collection activity
                                            was never started.
                                            Auto Offline Data Collection: Disabled.
    Self-test execution status:      (   0) The previous self-test routine completed
                                            without error or no self-test has ever
                                            been run.
    Total time to complete Offline
    data collection:                (17880) seconds.
    Offline data collection
    capabilities:                    (0x7b) SMART execute Offline immediate.
                                            Auto Offline data collection on/off support.
                                            Suspend Offline collection upon new
                                            command.
                                            Offline surface scan supported.
                                            Self-test supported.
                                            Conveyance Self-test supported.
                                            Selective Self-test supported.
    SMART capabilities:            (0x0003) Saves SMART data before entering
                                            power-saving mode.
                                            Supports SMART auto save timer.
    Error logging capability:        (0x01) Error logging supported.
                                            General Purpose Logging supported.
    Short self-test routine
    recommended polling time:        (   2) minutes.
    Extended self-test routine
    recommended polling time:        ( 195) minutes.
    Conveyance self-test routine
    recommended polling time:        (   5) minutes.
    SCT capabilities:              (0x70b5) SCT Status supported.
                                            SCT Feature Control supported.
                                            SCT Data Table supported.
    
    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
      3 Spin_Up_Time            0x0027   177   175   021    Pre-fail  Always       -       2116
      4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       323
      5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
      7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       4618
     10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
     11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
     12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       323
    192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       5
    193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       765
    194 Temperature_Celsius     0x0022   109   096   000    Old_age   Always       -       38
    196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
    197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
    198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
    199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
    200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0
    
    SMART Error Log Version: 1
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
    # 1  Extended offline    Completed without error       00%      4583         -
    
    SMART Selective self-test log data structure revision number 1
     SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
        1        0        0  Not_testing
        2        0        0  Not_testing
        3        0        0  Not_testing
        4        0        0  Not_testing
        5        0        0  Not_testing
    Selective self-test flags (0x0):
      After scanning selected spans, do NOT read-scan remainder of disk.
    If Selective self-test is pending on power-up, resume after 0 minute delay.
    
    
    6.3.2014 19:25 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    To už je lepší ;), pro fčul ten disk vypadá OK (tedy podle SMART).
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    Michnzee avatar 6.3.2014 19:36 Michnzee | skóre: 10 | Praha
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Perfektní! :) díky za kontrolu
    26.2.2014 23:13 lertimir | skóre: 60 | blog: Par_slov
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    Jak píše Šangala. Bez SMART testů bych si připojení neriskoval. Sám na většině disků provádím short testy v týdenních až 14 denních intervalech a long test v mesíčních až dvoumesíčních intervalech.
    26.2.2014 21:38 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: SW RAID 1 - kontrola disků a opětnovné připojení
    mismatch_cnt a mely by tam byt nuly
    Pro zmatení nepřítele, pokud je na tom i swap (nebo možná i aktivně používaný soubor mapovaný do paměti) a bude se s ním aktivně pracovat v momentě check-u, tak tam ty nuly někdy/někde být nemusí.
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.