Portál AbcLinuxu, 27. července 2025 13:16


Dotaz: Obnova RAID 5

7.6.2009 20:04 ja_kral_ll | skóre: 17
Obnova RAID 5
Přečteno: 1002×
Odpovědět | Admin

Ahoj,

měl jsem RAID5 sestavený ze 3 disků přičemž jeden chcípnul takže jsem ho včera vyměnil, ale resync se asi na 66% zasekne že jeden z přeživších disků je mrtev.  A v logu se ukáže ve zkratce toto :

Jun  7 04:13:03 daysi ata1: EH complete
Jun  7 04:13:03 daysi ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jun  7 04:13:03 daysi ata1.00: (BMDMA stat 0x60)
Jun  7 04:13:03 daysi ata1.00: tag 0 cmd 0x25 Emask 0x9 stat 0x51 err 0x40 (media error)
Jun  7 04:13:03 daysi sd 0:0:0:0: SCSI error: return code = 0x08000002
Jun  7 04:13:03 daysi sda: Current: sense key: Medium Error
Jun  7 04:13:03 daysi Additional sense: Unrecovered read error - auto reallocate failed
Jun  7 04:13:03 daysi end_request: I/O error, dev sda, sector 1603978827
Jun  7 04:13:03 daysi raid5:md1: read error not correctable (sector 1561004952 on sda3).
Jun  7 04:13:03 daysi raid5: Disk failure on sda3, disabling device. Operation continuing on 1 devices
Jun  7 04:13:03 daysi raid5:md1: read error not correctable (sector 1561004960 on sda3).
Jun  7 04:13:03 daysi raid5:md1: read error not correctable (sector 1561004968 on sda3).
.....

.....

Vadných sektorů ukazuje asi 100. I Disk se zdá podle smartctl v pořádku.

Sestavil jsem tedy pole tak aby jelo na dvou discích na kterých to jelo před tim naž jsem se pokusil o výměnu takže se pole nesyncuje a tudíž nepřijde na vadné sektory které se doposud nevyužívají.

Co dál ?

Lze nějak říct mdadm aby kašlal na chyby a syncnul co jde na nově připojenej disk ? (--force nefunguje)

Lze nějak oživit disk který je zaplněn asi ze 3% tak aby zkontroloval vandé sektory a nepoužíval je ?

Díky všem kteří znají jaké to je když data visí na vlásku...

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

7.6.2009 20:23 NN
Rozbalit Rozbalit vše Re: Obnova RAID 5
Odpovědět | | Sbalit | Link | Blokovat | Admin

Je to ten samej co si vymenoval?

NN

7.6.2009 21:12 ja_kral_ll | skóre: 17
Rozbalit Rozbalit vše Re: Obnova RAID 5

Ano, to co jsem tam dával je stejná velikost, jen jinej výrobce.

the.max avatar 7.6.2009 22:01 the.max | skóre: 46 | blog: Smetiště
Rozbalit Rozbalit vše Re: Obnova RAID 5
Odpovědět | | Sbalit | Link | Blokovat | Admin
pokud sitoace dovoli, data presun na ZDRAVY disk, pole smazni, na disky pak zkus zapsat same 00 nebo FF. pokud budou OK tak zase sestav pole a presun data.
KERNEL ULTRAS Fan Team || Sabaton - nejlepší učitel dějepisu || Gentoo - dokud nás systemd nerozdělí.
7.6.2009 22:48 ja_kral_ll | skóre: 17
Rozbalit Rozbalit vše Re: Obnova RAID 5

Díky za odpověď

To přepsání by jsi doporučil udělat pomocí badblocks nebo cat /dev/null | /dev/sda ?

H0ax avatar 8.6.2009 06:50 H0ax | skóre: 36 | blog: Odnikud_nikam
Rozbalit Rozbalit vše Re: Obnova RAID 5
dd if=/dev/zero of=/dev/sda
uid=0(root) gid=0(root) skupiny=0(root)
8.6.2009 08:55 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: Obnova RAID 5
Spíš badblocks, protože v tom je i ten OK-krok.
In Ada the typical infinite loop would normally be terminated by detonation.
8.6.2009 11:13 mysiak
Rozbalit Rozbalit vše Re: Obnova RAID 5
Odpovědět | | Sbalit | Link | Blokovat | Admin

ahoj skus pozriet sem http://blackhole.sk/topicm-vychytavky-linux-raid-5-recovery mozno ti tam aspon nieco usefull padne do oka

8.6.2009 15:45 ja_kral_ll | skóre: 17
Rozbalit Rozbalit vše Re: Obnova RAID 5

Díky za super odkaz, už putuje do záložek.

Takže když to shrnu :

Mám 3 disky

sda - vadné sektory - umírá - v POLI

sdb - zdravý - v POLI

sdc - nový disk - VOLNÝ

1) Dát si desetkrát otčenáš

2) Zastavit pole mdadm --stop /dev/md1

3) překopírovat data z umírajícího na nový dd conv=noerror,sync if=/dev/sda3 of=/dev/sdc3 bs=512

4) setavit znovu pole mdadm --assemble /dev/md1 /dev/sdb3 /dev/sdc3 missing

5) prohnat sda smartem a badblocks a popř ho připojit do pole

 

Zapoměl jsem na něco ?

 

9.6.2009 00:09 ja_kral_ll | skóre: 17
Rozbalit Rozbalit vše Re: Obnova RAID 5
Odpovědět | | Sbalit | Link | Blokovat | Admin

data jsem přesunul na nový několikrát testovaný disk, pole rozebral a oba disky (i ten chcípající i ten doposud zdravý) ted proháním badblocks. Tak uvidíme...

9.6.2009 18:47 ja_kral_ll | skóre: 17
Rozbalit Rozbalit vše Re: Obnova RAID 5

Díky pánové !

Nechápu jak to, ale disk asi v průběhu badblocks realokoval všechny vadné sektory a pole se nyní podařilo kompletně sestavit a drží !

9.6.2009 20:16 Mti. | skóre: 31 | blog: Mti
Rozbalit Rozbalit vše Re: Obnova RAID 5
Pokud disk najde vadny blok pri cteni, musi ho priznat, protoze neumi vydat data, co tam mely byt. V okamziku, kdy se ho pokusite prepsat (coz badblocks na vyzadani dela), muze sw disku prislusny sektor spokojene zahodit a pouzit neco z rezervni oblasti. Pokud disk najde vadny sektor pri zapisu (kdy vi, co kdo chtel zapsat), realokuje tise bez toho, aby dal vedet.

<bububu>Nicmene jestli se ty vadne sektory objevily po nejake dobe provozu, neveril bych tomu disku ani klep a poridil bych si za nej nahradu. Riskujete totiz, ze do pristiho rebuildu (nechci strasit do pristiho zapisu dat) si pro Vas mily disk nachysta zase neco.... <\bububu>
Vidim harddisk mrzuty, jehoz hlava plotny se dotyka...
10.6.2009 07:41 ja_kral_ll | skóre: 17
Rozbalit Rozbalit vše Re: Obnova RAID 5

badblocks jsem pustil s možností zápisu, takže je to tak jak říkáte. Taky jsem na disk pustil smart a dal mu long test, před započetim záchrany mi dvakrát vyhodil chybu a teď se zdá být zdravý:

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      5328         -
# 2  Extended offline    Completed: read failure       90%      5310         1603979005
# 3  Extended offline    Completed: read failure       90%      5200         1603979005

A zde je kompletní výpis

smartctl version 5.38 [x86_64-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG HD103UJ
Serial Number:    S13PJ9BQ915603
Firmware Version: 1AA01113
User Capacity:    1,000,204,886,016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 3b
Local Time is:    Wed Jun 10 08:36:57 2009 CEST

==> WARNING: May need -F samsung or -F samsung2 enabled; see manual for details.

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 (11850) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 198) minutes.
Conveyance self-test routine
recommended polling time:        (  21) minutes.
SCT capabilities:              (0x003f) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   099   051    Pre-fail  Always       -       8
  3 Spin_Up_Time            0x0007   075   075   011    Pre-fail  Always       -       8430
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       50
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   253   253   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       9967
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       5344
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       50
 13 Read_Soft_Error_Rate    0x000e   100   099   000    Old_age   Always       -       8
183 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
184 Unknown_Attribute       0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       50
188 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   080   075   000    Old_age   Always       -       20 (Lifetime Min/Max 19/21)
194 Temperature_Celsius     0x0022   079   075   000    Old_age   Always       -       21 (Lifetime Min/Max 19/23)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       119262816
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   099   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      5328         -
# 2  Extended offline    Completed: read failure       90%      5310         1603979005
# 3  Extended offline    Completed: read failure       90%      5200         1603979005

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Každopádně máš pravdu že při nejbližší možné příležitosti ho pošlu k šípku, ale těžko mi přijmou reklamaci funkčního disku... Ta hodnota u Hardware_ECC_Recovered mě celkem děsí...

10.6.2009 08:04 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: Obnova RAID 5

Disky reklamujeme ihned, jakmile se v dmesg objeví chyba zápisu a ještě se nám nestalo, aby ho prodejce nevyměnil za nový. Ten tvůj načnutý už by byl dávno pryč.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.