Portál AbcLinuxu, 7. května 2025 07:33

Dotaz: SW Raid zasekává systém

20.7.2007 01:39 utahanec
SW Raid zasekává systém
Přečteno: 1207×
Odpovědět | Admin
Nainstaloval jsem si slackware 12. Disky mám rozděleny takto: z dvou disků /dev/sda a /dev/sdb jsem vytvořil tři raid pole a 2 swapy:
/dev/md/0 /boot
/dev/md/1 /
/dev/md/2 /backup
/dev/sda4 swap
/dev/sdb4 swap

raidy jsem vytvořil příkazem mdadm --create parametry(chunk size je defaultní)
Problém je, že systém ač běží, čas od času se po pár minutách prostě zasekne třeba na 40 vteřin a veškerá snaha o zápis na raid pole je marná, na další disk /dev/sdc1, který není v raidu to jde v pohodě. Kde je problém?
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

20.7.2007 08:13 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Odpovědět | | Sbalit | Link | Blokovat | Admin
A nejsou v dmesg nějaké chybové výpisy komunikace s disky?
20.7.2007 08:18 utahanec
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Ne, ale někdy se to zasekne i při bootu a moduly pro ata pak píšou waiting for device, error... něž si disky v raidu hezky dlouho zachčej a zablikaj a pak se to vzpamatuje a jede to dál. Zajímavý je, že se to stává jenom pod slackwarem. Dřív jsem tam měl debian s jedním oddílem v raidu s xfs.
20.7.2007 08:55 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
To bude asi stejná příčina. Myslím, že ata driver měl v poslední době řadu fixů, možná by to chtělo novější jádro. Debian mívá v distribučním jádře spoustu patchů.
20.7.2007 09:39 utahanec
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Jádro 2.6.21.5 je dost nový. Taky se po každým bootu synchronizují všechny raidy a po dobu jejich synchonizce se systém neseká, až potom. Zde jsou zajímavé části z dmesg(v raidu jsou teď disky sda a sdc, protože jsem zkoušel jsetli nějakej není poškozenej a není):
...

kobject_add failed for uhci_hcd with -EEXIST, don't try to register things with the same name in the same directory.
 [<c03e86f7>] kobject_shadow_add+0x117/0x1a0
 [<c013fba4>] mod_sysfs_setup+0x24/0xb0
 [<c0141458>] sys_init_module+0x1648/0x1940
 [<c0102ae8>] syscall_call+0x7/0xb
 [<c0710000>] __mutex_lock_slowpath+0x40/0x90
 =======================
kobject_add failed for uhci_hcd with -EEXIST, don't try to register things with the same name in the same directory.
 [<c03e86f7>] kobject_shadow_add+0x117/0x1a0
 [<c013fba4>] mod_sysfs_setup+0x24/0xb0
 [<c0141458>] sys_init_module+0x1648/0x1940
 [<c0102ae8>] syscall_call+0x7/0xb
 [<c0710000>] __mutex_lock_slowpath+0x40/0x90
 =======================
shpchp: Standard Hot Plug PCI Controller Driver version: 0.4
kobject_add failed for uhci_hcd with -EEXIST, don't try to register things with the same name in the same directory.
 [<c03e86f7>] kobject_shadow_add+0x117/0x1a0
 [<c013fba4>] mod_sysfs_setup+0x24/0xb0
 [<c0141458>] sys_init_module+0x1648/0x1940
 [<c0102ae8>] syscall_call+0x7/0xb
 [<c0710000>] __mutex_lock_slowpath+0x40/0x90
 =======================
kobject_add failed for uhci_hcd with -EEXIST, don't try to register things with the same name in the same directory.
 [<c03e86f7>] kobject_shadow_add+0x117/0x1a0
 [<c013fba4>] mod_sysfs_setup+0x24/0xb0
 [<c0141458>] sys_init_module+0x1648/0x1940
 [<c0102ae8>] syscall_call+0x7/0xb
 [<c0710000>] __mutex_lock_slowpath+0x40/0x90
 =======================
kobject_add failed for ehci_hcd with -EEXIST, don't try to register things with the same name in the same directory.
 [<c03e86f7>] kobject_shadow_add+0x117/0x1a0
 [<c013fba4>] mod_sysfs_setup+0x24/0xb0
 [<c0141458>] sys_init_module+0x1648/0x1940
 [<c0102ae8>] syscall_call+0x7/0xb
 =======================
i2c_core: exports duplicate symbol i2c_smbus_write_i2c_block_data (owned by kernel)
intel_rng: FWH not detected
ACPI: PCI Interrupt 0000:00:1f.3[B] -> GSI 19 (level, low) -> IRQ 19
sd 2:0:0:0: Attached scsi generic sg0 type 0
sd 3:0:0:0: Attached scsi generic sg1 type 0
sd 4:0:0:0: Attached scsi generic sg2 type 0
iTCO_vendor_support: vendor-support=0
iTCO_wdt: Intel TCO WatchDog Timer Driver v1.01 (21-Jan-2007)
iTCO_wdt: Found a ICH6 or ICH6R TCO device (Version=2, TCOBASE=0x7060)
iTCO_wdt: heartbeat value must be 2<heartbeat<39 (TCO v1) or 613 (TCO v2), using 30
iTCO_wdt: initialized. heartbeat=30 sec (nowayout=0)

....

ata3.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x2 frozen
ata3.00: cmd 61/08:00:bf:31:0f/00:00:00:00:00/40 tag 0 cdb 0x0 data 4096 out
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata3: soft resetting port
ata3: softreset failed (port busy but CLO unavailable)
ata3: softreset failed, retrying in 5 secs
ata3: hard resetting port
ata3: port is slow to respond, please be patient (Status 0x80)
ata3: port failed to respond (30 secs, Status 0x80)
ata3: COMRESET failed (device not ready)
ata3: hardreset failed, retrying in 5 secs
ata3: hard resetting port
ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
ata3.00: configured for UDMA/133
ata3: EH complete
SCSI device sdc: 312581808 512-byte hdwr sectors (160042 MB)
sdc: Write Protect is off
sdc: Mode Sense: 00 3a 00 00
SCSI device sdc: write cache: enabled, read cache: enabled, doesn't support DPO or FUA
kjournald starting.  Commit interval 5 seconds
EXT3 FS on md0, internal journal

...
20.7.2007 10:03 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Zajímavá je asi až ta část s ata3. Také nám to na jednom serveru se sata SW raidem píše, při bootování. Možná někdo poradí, co s tím, ale myslím, že to dělá ovladač.
20.7.2007 10:21 utahanec
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
No každopádně si na jiným serveru už připravuju jádro 2.6.19.7 se sata piix, to mě nikdy zatím nezradilo.
20.7.2007 12:03 Semo | skóre: 45 | blog: Semo
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
ata3: soft resetting port
ata3: softreset failed (port busy but CLO unavailable)
ata3: softreset failed, retrying in 5 secs
ata3: hard resetting port
ata3: port is slow to respond, please be patient (Status 0x80)
Presne toto mi robilo na doske s AHCI SATA ovladacom v jadre 2.6.18.x. Od upgradu na 2.6.20.x to prestalo. Stavalo sa mi to na disku, na ktory sa pristupovalo iba obcas, takze ak ubehla prilis dlha doba od posledneho pristupu, tak sa nieco cestou uspalo a driver to nevedel korektne zobudit. Takze reset a potom to slo. Aky mas radic a driver na neho? Vela driverov cez libata su este iba EXPERIMENTAL a obcas aj v stych stabilnych sa najde chyba. Pripadne mozes skusit stare IDE (prip. SATA) drivery a nie cez libata.
If you hold a Unix shell up to your ear, you can you hear the C.
20.7.2007 16:57 utahanec
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Tak jsem si zkompiloval jádro 2.6.19.7 a už to krásně funguje. Zkompiloval jsem ovladač z položky serial ata and experimental ata drivers pro ata_piix4, alespoň myslím, že se to tak jmenuje.
Luboš Doležel (Doli) avatar 21.7.2007 00:42 Luboš Doležel (Doli) | skóre: 98 | blog: Doliho blog | Kladensko
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Odpovědět | | Sbalit | Link | Blokovat | Admin
Tímto vás vítám v klubu lidí s rozbitou podporou SATA v Linuxu.
michich avatar 21.7.2007 06:36 michich | skóre: 51 | blog: ohrivane_parky
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
To je fajn, že máte klub. Už některý člen klubu poslal detailní popis problému do LKML s CC: do linux-ide a Jeffovi Garzikovi?
David Watzke avatar 21.7.2007 07:39 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Patrně jo, heh.
“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
21.7.2007 12:07 utahanec
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Odpovědět | | Sbalit | Link | Blokovat | Admin
Jestli ten čí ten ovladač nefunguje už mi je teď jedno, hlavně že funguje jinej, kterej jeho funkci zastoupí. .. Obávám se, že takhle asi uvažují i vývojáři.
31.12.2007 10:11 ####
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Odpovědět | | Sbalit | Link | Blokovat | Admin
dalsi zbugovany jadra - 2.6.23.11 a 2.6.23.12 s modulem sata_via

A nevim. jeden disk slysitelne pozdeji roztaci a na jinym hardware kdyz to bios roztacel, tak mu to trvalo dyl nez napsal co ze je tam pripojeny.

Tedkom koukam, jednou to udelal disk sdb a nyni sdd a sdb se povedlo resnout tak mam jeho seriovy cislo ktery se lisi od sdd ktery se nepovedlo resnout a vypadnul z raidu a je na jinym radici nez sdb, takze bych to videl, ze diskama to neni.

jeste uvazuju, jestli to neni tim ze se delal downgrade a ty radice jsou na ubohe PCI, ktera ma propustnost mensi nez je propustnost tech raidu a to na ni visi jeste par dalsich karet.

a ke vsemu se mi jeste nainstaloval perl pro amd64 po tom downgrade na procesor bez cmov, takze to je nejlepsi zaver roku.

Jinak si udelejte vlastni obrazek...
31.12.2007 10:17 ####
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
zapomel jsem - radic: nejaka via vt6421

zato fungovala puvodni sestavicka s nforce 4 ultra - 2.6.20.6, 2.6.20.1, 2.6.17.6 - starsi historii uz bohuzel nemam
31.12.2007 10:36 ####
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
http://img.photobucket.com/albums/v242/Saphirex/seagatelock.jpg

tak na viaarene nekdo napsal nejaky obrazek ze stranky seagate, ze nektery sata1 karty maji problem s dohadovanim s sata2 disky, tak je potreba prejumprovat seagate disky na sata1 rezim i kdyz ty disky od seagate co mam jsou sata 1,5... umi par volitelnych ficur co nejsou soucasti 1 standardu a neumi par povinnych ficur co jsou soucasti 2 standardu, takze je to takovy...
31.12.2007 11:06 ####
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
tak ten jumber block nemam. mam jen factory use konektor s dvema piny. chmmm.

tak premyslim, jestli si patchnout jadro a vynasobit timeout nejakou konstantou treba milion nebo prepsat libata ;-)
31.12.2007 11:08 ####
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
jeste jedna varianta - je tam neco s jiffies. nemohlo by to cely souviset se nejakym hpet timerem (mam) v jadre a pri dmesg to vypada, ze se povolil na cpu0 a nebo treba s tickless (nemam)
23.1.2008 21:46 ####
Rozbalit Rozbalit vše Re: SW Raid zasekává systém
Problem byl ATA prikaz, ktery selhal protoze se nepodarilo ziskat DMA kanal vcas. Protoze na PCI sbernici jsou dva radice, 100mbit sitofka a zvukovka a propustnost PCI sbernice vycerpaji uz 3 samostatne disky ze ctyr soucasne.

./include/linux/libata.h ATA_TMOUT_BOOT = 300 * HZ, /* heuristic */ ATA_TMOUT_BOOT_QUICK = 70 * HZ, /* heuristic */ ATA_TMOUT_INTERNAL = 300 * HZ, ATA_TMOUT_INTERNAL_QUICK = 50 * HZ,

puvodni hodnoty jsou delene deseti.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.