Portál AbcLinuxu, 27. května 2024 07:56


Dotaz: odpojování disků

12.3.2021 00:15 lertimir | skóre: 64 | blog: Par_slov
odpojování disků
Přečteno: 624×
Odpovědět | Admin
Mám v počítači 4 portovou kartu na PCIe a v posledí době si mi nekolikrát stalo že mi se odpojily disky. V journalctl mám z dnešní noci: Pokud se ptám na kartu:
bře 11 01:07:15 dnopytle kernel: ata7.15: Port Multiplier 1.2, 0x1b21:0x1092 r0, 3 ports, feat 0x5/0xf
bře 11 01:07:21 dnopytle kernel: ata7.15: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
bře 11 01:09:34 dnopytle kernel: ata7.15: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
bře 11 01:10:21 dnopytle kernel: ata7.15: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
bře 11 01:11:04 dnopytle kernel: ata7.15: limiting SATA link speed to 3.0 Gbps
bře 11 01:11:06 dnopytle kernel: ata7.15: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
bře 11 02:11:24 dnopytle kernel: ata7.15: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
bře 11 03:35:20 dnopytle kernel: ata7.15: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
bře 11 04:15:07 dnopytle kernel: ata7.15: softreset failed (1st FIS failed)
bře 11 04:15:17 dnopytle kernel: ata7.15: softreset failed (1st FIS failed)
bře 11 04:15:52 dnopytle kernel: ata7.15: softreset failed (1st FIS failed)
bře 11 04:15:52 dnopytle kernel: ata7.15: limiting SATA link speed to 1.5 Gbps
bře 11 04:15:57 dnopytle kernel: ata7.15: softreset failed (1st FIS failed)
bře 11 04:15:57 dnopytle kernel: ata7.15: failed to reset PMP, giving up
bře 11 04:15:57 dnopytle kernel: ata7.15: Port Multiplier detaching
bře 11 23:51:10 dnopytle kernel: ata7.15: Port Multiplier 1.2, 0x1b21:0x1092 r0, 3 ports, feat 0x5/0xf
Bootoval jsem v 1:07:15 finálně disky spadly v 4:15:57 a před chvíli jsem znovu je načetl pomocí příkazu echo "- - -" > /sys/class/scsi_host/host6/scan

Pokud se ptám na rozhraní na journalctl tak disky prostě se odpojí
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#25 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=60s
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#25 Sense Key : Not Ready [current] 
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#25 Add. Sense: Logical unit not ready, hard reset required
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#25 CDB: Read(16) 88 00 00 00 00 00 a6 7f 2c 00 00 00 05 00 00 00
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: rejecting I/O to offline device
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#26 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=60s
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#26 Sense Key : Not Ready [current] 
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#26 Add. Sense: Logical unit not ready, hard reset required
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#26 CDB: Read(16) 88 00 00 00 00 00 a6 7f 31 00 00 00 05 00 00 00
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#27 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=60s
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#27 Sense Key : Not Ready [current] 
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#27 Add. Sense: Logical unit not ready, hard reset required
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#27 CDB: Read(16) 88 00 00 00 00 00 a6 7f 36 00 00 00 03 00 00 00
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#28 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=60s
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#28 Sense Key : Not Ready [current] 
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#28 Add. Sense: Logical unit not ready, hard reset required
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] tag#28 CDB: Read(16) 88 00 00 00 00 00 a6 7f 39 00 00 00 01 00 00 00
bře 11 04:15:57 dnopytle kernel: sd 6:2:0:0: rejecting I/O to offline device
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] Synchronizing SCSI cache
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] Stopping disk
bře 11 04:15:57 dnopytle kernel: sd 6:0:0:0: [sdf] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
bře 11 04:15:57 dnopytle kernel: sd 6:1:0:0: [sdg] Synchronizing SCSI cache
bře 11 04:15:57 dnopytle kernel: sd 6:1:0:0: [sdg] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
bře 11 04:15:57 dnopytle kernel: sd 6:1:0:0: [sdg] Stopping disk
bře 11 04:15:57 dnopytle kernel: sd 6:1:0:0: [sdg] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
bře 11 04:15:57 dnopytle kernel: sd 6:2:0:0: [sdh] Synchronizing SCSI cache
bře 11 04:15:57 dnopytle kernel: sd 6:2:0:0: [sdh] Synchronize Cache(10) failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
bře 11 04:15:57 dnopytle kernel: sd 6:2:0:0: [sdh] Stopping disk
bře 11 04:15:57 dnopytle kernel: sd 6:2:0:0: [sdh] Start/Stop Unit failed: Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
jak mohu hledat co se děje a proč? Asi to vypadá na nový řadič, že.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

12.3.2021 00:59 d.c. | skóre: 30
Rozbalit Rozbalit vše Re: odpojování disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
Jen jestli to spis nebude na novy disk...
13.3.2021 23:06 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: odpojování disků
Odpojí to současně 3 disky včetně noveho HGST ulatrastaru.
12.3.2021 08:28 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: odpojování disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zdroj stíha takú záťaž? Či to nie je odpájané v čase nejakej výpočtovej špičky pre CPU (nejaký cron.daily). Výpočtovú špičku pre GPU by si asi v tom čase spoznal.
13.3.2021 23:39 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: odpojování disků
Zdroj je dostatečně výkonný Enermax, ten neudělá vlnu na nápájení disků při zátěži CPU. Navíc v stanici se točí další 4 disky zapojené do portů motherboardu. s těmi není nic. Spadnou disky jen s 4 portového extwrního řadiče. Navíc uvedené echo připojí znovu všechny 3 disky. Zřejmě provede restart řadiče a následně připojení.
14.3.2021 10:27 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: odpojování disků
To echo s mínuskami resetne zbernicu radiča, a načíta čerstvo resetnuté disky.

Tu by som odporučil skontrolovať firmware radiča, a poprípade aj sa pokúsil vytiahnuť logy priamo z toho radiča (ak to podporuje).
18.3.2021 16:13 lertimir | skóre: 64 | blog: Par_slov
Rozbalit Rozbalit vše Re: odpojování disků
Přesně tak, echo resetne řadič a načtou se znovu disky. Je zajímavé že reset se provede jen když echo pošlu na první disk odpovídající zařízení 6:0 , echo na jiné asi neproveden nic. je to asi proto, že vlastně 4 porty vytváří jen SATA multiplierem. Jinak ten řadič nic neumí. Je to tuším tenhle. Pokud se něco dalšího stane, začnu se zabývat novou koupí. A tohle vezmu jako nepříliš drahý pokus. Zatím se nic dalšího nestalo a data jsou v pořádku, dva s těch disků jsou součástí BTRFS RAID 1 a třetí se samostatné btrfs, všechny scruby OK.
Josef Kufner avatar 18.3.2021 17:08 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: odpojování disků
To bych opravdu podezříval ty kabely.
Hello world ! Segmentation fault (core dumped)
12.3.2021 08:56 j
Rozbalit Rozbalit vše Re: odpojování disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
Rozeber to, kartu dej do jinyho slotu (nejdriv vem jeste gumu na gumovani a pretahni ten konektor na karte), pokud mas, tak vymen kabely.

Podle toho ze ti odpojuje vsechny disky to muze byt ten radic nebo problem s MB/slotem. Zkoukni na tom taky kondiky, pokud by byl nekterej nafouklej muzes ho zkusit vymenit.

---

Dete s tim guuglem dopice!
Josef Kufner avatar 14.3.2021 11:57 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: odpojování disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
Začal bych výměnou SATA kabelů a doufal, že na výměnu disků už nedojde. Mohly třeba jen zoxidovat kontakty.

Rozhodně však zkontroluj zálohy, že je vše odzálohované, neboť ti může umírat disk. Ale to by dělal bordel spíš jen jeden z nich a nikoliv všechny. Toto by spíš naznačovalo problémy s řadičem – asi bych mu také preventivně očistil kontakty. Je však možné, že by jeden disk způsobil reset celého řadiče.

Pokud máš možnost použít jiný řadič (i kabely), udělej to a zkontroluj disky samostatně. Pokud budou v pořádku a po přepojení zpět se to bude dít i nadále, vyměň řadič.
Hello world ! Segmentation fault (core dumped)
18.3.2021 19:45 xxl | skóre: 25
Rozbalit Rozbalit vše Re: odpojování disků
Odpovědět | | Sbalit | Link | Blokovat | Admin
Něco podobného se mi dělo taky. Bylo to tedy s řadičem na motherboardu a jenom jedním diskem.

Disk se zatvrzele tvářil, že mu nic není, smartctl nenašel nikdy ani jednu chybu. Ale disk se občas na chvilku odpojil a zase připojil, chyba v logu, jinak vše v pořádku. Jednou za dlouhý čas to rozhodilo raid. Po následné kontrole se zase nic nenašlo. Přepojování disku do jiného portu, výměna datového kabelu, výměna napájecího kabelu... vždycky to nějakou dobu fungovalo a pak zase chyby. Výměna disku a ejhle, od té doby se nic neděje.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.