Portál AbcLinuxu, 13. května 2025 20:01

Dotaz: HW raid a kontrola disků

1.11.2012 15:23 nun
HW raid a kontrola disků
Přečteno: 1083×
Odpovědět | Admin
Zdravím,

máme server s HW raidem, jakým způsobem mám kontrolovat, že oba disky jsou ok? U sw raidu to je jasné, tam jsou vidět oba disky, v případě hw raidu právě ne.

(fujitsu rx100)

Díky.
Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

1.11.2012 15:45 NN
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
Vetsinou existuje utilita pro ten radic a v lepsim pripade bezi i pod linuxem a idealne ma vlastni CLI..
1.11.2012 15:49 kyytaM | skóre: 35 | blog: kyytaM | Bratislava
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
smartctl vie pracovat s diskami aj za HW radicom - priklad pre pre radic LSI MegaRAID SAS 1078

- vypis informacii o fyzickom disku v RAID aj s prehladom vysledkov SMART testov (Enclosure position: 0, Slot Number: 5 - informacie ziskane z MegaCLI (nastroj na ovladanie LSI radicov)
smartctl -d sat+megaraid,5 -a /dev/sda
1.11.2012 15:53 drunkezz | skóre: 34 | blog: kadeco
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Odpovědět | | Sbalit | Link | Blokovat | Admin

ty vole tak sa zda ze v pripade fujitsu bezi na stroji len nejaky daemon ktory komunikuje s appkou ktora moze bezat len na winoch

FUJ:(

 

http://www.fujitsu.com/downloads/PRMRGY/onboard_scsi_raid_user_guide_rx200s2.pdf

D.

3.11.2012 14:07 nun
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
No, jako smartem by to bylo idealni, ale o tom si asi muzu nechat zdat, ze? (hw raid pro sata)
3.11.2012 20:15 kyytaM | skóre: 35 | blog: kyytaM | Bratislava
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Aky je to radic? Pozri s lspci.
4.11.2012 15:23 nun
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
05:00.0 SCSI storage controller: LSI Logic / Symbios Logic SAS1064ET PCI-Express Fusion-MPT SAS (rev 08)

diky.
4.11.2012 15:36 nun
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Tady ještě snad pomůže:

~# mpt-status -v ioc0 vol_id 0 type IM, 2 phy, 930 GB, state OPTIMAL, flags ENABLED ioc0 phy 2 scsi_id 1 ATA WDC WD1002FBYS-5 0C09, 931 GB, state ONLINE, flags NONE ioc0 phy 0 scsi_id 2 ATA WDC WD1002FBYS-5 0C09, 931 GB, state ONLINE, flags NONE
AraxoN avatar 5.11.2012 00:35 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
ioc0 vol_id 0 type IM, 2 phy, 930 GB, state OPTIMAL, flags ENABLED
ioc0 phy 2 scsi_id 1 ATA      WDC WD1002FBYS-5 0C09, 931 GB, state ONLINE, flags NONE
ioc0 phy 0 scsi_id 2 ATA      WDC WD1002FBYS-5 0C09, 931 GB, state ONLINE, flags NONE
Pole je OPTIMAL, oba disky sú ONLINE. Čo by si viac potreboval vedieť?

Podľa manuálu utilita vracia nenulový kód v prípade chyby. Na automatizovanú detekciu chybového stavu by to malo stačiť.

Ak napriek tomu potrebuješ ďalšie údaje a cez SMART sa Ti to nepodarí, tak by Ti ešte mohol pomôcť IPMI - príkaz:
ipmitool sdr list
6.11.2012 20:44 nun
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Takže myslíte, že mpt-status je schopný zastát smartctl? Tzn. pokud je OPTIMAL a 2x ONLINE, není co řešit?

Díky.
7.11.2012 00:19 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
no například mě smartctl za HW raidem píše
# smartctl -a --device megaraid,0 /dev/sda
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)                                                                                                                       
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net                                                                                                                    
                                                                                                                                                                                              
Device: SEAGATE  ST3450856SS      Version: HS0A                                                                                                                                               
Serial number: 3QQ1PFA1                                                                                                                                                                       
Device type: disk                                                                                                                                                                             
Transport protocol: SAS                                                                                                                                                                       
Local Time is: Wed Nov  7 00:11:20 2012 CET                                                                                                                                                   
Device supports SMART and is Enabled                                                                                                                                                          
Temperature Warning Disabled or Not Supported                                                                                                                                                 
SMART Health Status: OK                                                                                                                                                                       
                                                                                                                                                                                              
Current Drive Temperature:     36 C                                                                                                                                                           
Drive Trip Temperature:        68 C                                                                                                                                                           
Elements in grown defect list: 1051                                                                                                                                                           
Vendor (Seagate) cache information                                                                                                                                                            
  Blocks sent to initiator = 587491191                                                                                                                                                        
  Blocks received from initiator = 4133514416                                                                                                                                                 
  Blocks read from cache and sent to initiator = 1613786535                                                                                                                                   
  Number of read and write commands whose size <= segment size = 656912871                                                                                                                    
  Number of read and write commands whose size > segment size = 35842214                                                                                                                      
Vendor (Seagate/Hitachi) factory information                                                                                                                                                  
  number of hours powered up = 28078.03
  number of minutes until next internal SMART test = 29

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:   138323056       98         0  138323154   138323173      46950.352          19
write:         0        0         0         0          2      10973.178           2
verify: 99227574      133         0  99227707   99227769      58600.507          62

Non-medium error count:       24

SMART Self-test log
Num  Test              Status                 segment  LifeTime  LBA_first_err [SK ASC ASQ]
     Description                              number   (hours)
# 1  Background long   Completed                  16       2                 - [-   -    -]
# 2  Background short  Completed                  16       1                 - [-   -    -]

Long (extended) Self Test duration: 3780 seconds [63.0 minutes]
A jakmile začne narůstat položka v neopravených chybách budu velmi pozorný. I když jinak může hlásit stav OK.
4.11.2012 13:29 pedro
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
semtam zajdi do serverovny a jukni jestli ti u hdd sviti vsecky ledky zelene ;-)
4.11.2012 15:17 asdfg
Rozbalit Rozbalit vše Re: HW raid a kontrola disků
Ako vtip dobre :).

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.