Portál AbcLinuxu, 14. května 2025 02:54
Zdravim,
mam linux ( Mandriva 2007, 2.6.17-5mdv, 32bit ) na serveru, linux pres 2 roky bezel naprosto bez problemu. Ale v poslednich 14dnech stroj z naprosto neznameho duvodu vytuhne, pomuze jen restart nasledne nekolik dni bezi stroj opet v poradku.
V logu vidim, ze se normalne provadeji sluzby, ktere to dela a pak zde je dira az do rebootu a ani tuk.
Zkousel jsme delat memtest86+, ten rika, ze pamet je OK. Nainstaloval jsem balik stress a trochu to potrapil, ale stroj to bez problemu prezil.
HW:
Intel(R) Pentium(R) 4 CPU 3.00GHz, 1GB RAM, a polo-hw nic moc radic raidu FastTrak TX2300, 4portova sitovka D-Link
Neporadil by nekdo co s tim nebo kde hledat dale? Myslite, ze je to HW(desce)?
badblocks -nvv /dev/XXX -o badblocks.logJinak vytuhne, že ho musíš natvrdo restartartovat? Nereaguje klávesnice, prostě nic? Ani třeba ssh aj. služby?
Graficke prostredi ne, jen textova konsole 80x25.
Server stuhne, klavesnice reague, ale to je tak vsechno, umrou vsechny sluzby, je nutny fyzicky pristup k serveru, pritom k konzoli jen blika cursor login a prompt(lognout vsak se nelze, nic to nedela) a zadny vypis kernelu ani dalsi info...
Badblocks zkusim...
Nejspis problem s radicem disku. Muzes tam zkusit dat treba jen jeden disk bez raidu (nebo 2 v SW raidu)? S Fastrak radici byly casto takovehle zahadne problemy.
Bez tohoto popisu bych tipoval uschlé kondíky okolo VRM, ale pokud fakt reaguje klávesnice aspoň na NumLock, tak je to možná opravdu vytuhlé v čekání na disky. Možná by něco zajímavého zjevil "magic SysRq key", možná taky ne.
Ten FastTrak používá jaký ovladač? Originál od Promise (binary blob), nebo open-source (včetně OpenSource ovladače pro Promise RAID), nebo open-source a ten RAID je linuxový nativní soft-RAID?
Asi bych ty disky zkusil připojit na normální IDE řadič, nabootovat z nějakého live CD a trochu je proklepnout přes smartctl, "dd if´=/dev/hda of=/dev/null bs=4096" apod. I pokud se nic nenajde, tak jako trochu systematické opatření bych navrhl nabootovat server ještě z Promisu, zazálohovat data, předělat ten RAID na linuxový nativní a nahrát data zpátky ze zálohy.
Hmm... pro zajímavost, co je to za filesystém? Jednu dobu jsem dokázal reprodukovatelně dostat Ext3 do tohoto stavu benchmarkem "bonnie++2", konkrétně ten zátuh generovala fáze "vytváření a rušení adresářů"
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.