Portál AbcLinuxu, 19. července 2025 20:06


Dotaz: Debian Lenny - zamrznutí serveru, určení příčiny

10.12.2009 21:10 lenny user
Debian Lenny - zamrznutí serveru, určení příčiny
Přečteno: 450×
Odpovědět | Admin
Mám stroj s Debian 2.6.26-19lenny2, Gb síťovky Intel, CPU Intel Quad Core, Nvidia GeForce 8400, dobře větraný.
Dnes zamrzl, nebyla možnost podívat se na výstup na monitoru, po síti nedostupný. V logovacích souborech nic neobvyklého, prostě v okamžiku vytuhnutí konec logu. Po tvrdém vypnutí a zapnutí proběhla synchronizace raidu a teď to jede normálně. Disky jsou v pořádku.
Prosím o tipy na nějaké diagnostické postupy, které by mohly vést k určení příčiny zamrznutí, případně prosím uživatele s podobnou zkušeností a tipy, jak tohle řešili.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Max avatar 10.12.2009 23:08 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
Odpovědět | | Sbalit | Link | Blokovat | Admin
Když logy mlčí, tak ti asi nic jiného, nežli otestovat HW, nezbyde ;-)
Pár hodin memtestu na paměti a budeš mít 98,9% jistotu, že máš paměti ok.
Na disky pustit "badblocks -nvv /dev/xxx -o badblocks.log" a sledovat výpisy v konzoli, zda se nedostaví i nějaký I/O errory
Pokud test disku proběhne ok, tak máš 99,8% jistotu, že disk je ok. Kdyby jsi chtěl mít 100% jistotu, musel by jsi provést "badblocks -wvv /dev/xxx -o badblocks.log", ale to ti zase vymaže všechny data na diskách, takže asi tak. Badblock trvá většinou přes noc, tak 6-10h podle velikosti disku.

Proč jsi se nemohl podívat na výstup z monitoru? To by myslím hodně řeklo ;-)

Jinak pokud na nic nepřijdeš, tak začíná být zábava :-/. Pak už to může být čímkoli a těžko nato přijdeš.
Neřekl jsi, zda na serveru provozuješ grafické prostředí?
Další tip bych měl pak na grafiku.

Pokud ne, tak bych možná vsadil na zdroj (pokud máš nějaký Eurocase apod., tak je to dosti pravděpodobné).

Pokud máš dlouhý kabel k síťovce, mohl to být nějaký naindukovaný proud v kabelu a jenom mohl donutit síťovku k vytuhuní
Nebo si na tebe Mohl někdo vyzkoušet DDos, ale to bych neviděl asi jako moc pravděpodobnou věc.

Zdar Max
Měl jsem sen ... :(
10.12.2009 23:30 lenny user
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
dík za tipy, memtest zkusím. Ten server spadl za 2 hodiny znovu, už jsem měl připravený monitor:
Kernel Panic - not syncing: Aiee, killing interrupt handler
k tomu už je nějaké info i tady v poradně, jinak USB rozhrani jsou vypnuté.
DDos mně taky napadl, ale to by asi něco bylo v logu.
Ty kabely k síťovkám - jsou dlouhé, ale s nimi jsou i kabely k dalšímu serveru a ten jede. Ale s těmi kabely jsem dnes trochu zahýbal na straně switche.
No, ten stroj jsem odstavil a místo něj dal starší. Zdá se, že lenny bude mít nějaký problém s těmi síťovkami, tyhle konkrétní jsou v jádře nově, divné je, že to dva týdny jelo. Nebo ta manipulace s kabely...?
10.12.2009 23:47 lenny user
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
grafické prostředí žádné, skříň je 4U, eurocase ne.
13.12.2009 14:37 lenny user
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
tak memtest běží třetí den, žádná chyba :-( Zítra pustím badblocks.
13.12.2009 18:26 0
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
Měl jsem podobný problém a po dlouhém hledání jsem objevil vadné disky seagate cheetah. Zkus postupně spouštět smartctl --all /dev/disk1-n a zároveň se koukat na výpis raidu mdadm -D /dev/mdX a zároveň s diskem hodně pracovat(já použil bonnie). Je to sice hodně neobvyklá závada, ale u mě projevila vždy, když jsem měl spuštěné tyto 3 procesy tak do druhého dne server ležel. Pokud můžeš, zkus jiné jádro, mě až tehdy poslední 2.6.29 jádro zobrazilo IOerror problémy na diskách, jinak to vždy jen "spadlo".
14.12.2009 12:59 Čech Antonín | skóre: 17 | blog: CzechTony
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
Muj komp vytuhl vzdy v noci, takrka bez zateze, jen zalohy. Tak jsem zkontroloval pameti, disky pak vymenil sitovky. V logu nikdy nic a na monitoru jen tma :-). Zastavil jsem zalohovani a vsechny ulohy. pres noc se jen flakal. Rano jsem prisel do prace a zase byl KO...... za vse mohl MB - lehounce nafoukane kondiky, ani se neotevreli.
14.12.2009 13:29 creon | skóre: 18 | blog: creonsnotes
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
Odpovědět | | Sbalit | Link | Blokovat | Admin
zkuste vyměnit zdroj.
16.12.2009 18:18 lenny user
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
Odpovědět | | Sbalit | Link | Blokovat | Admin
ten stroj je nový, teď běžel nekolik dní a nic nedělal. Nezamrzl. Takže dnes jsem konečně pustil badblocks a současně bonnie a stress, zatížení CPU kole 80% a zatím to jede asi hodinu. Začínam podezřívat síťovky, kterou jsou teď down a používám jen integrovanou.
12.1.2010 18:15 lenny user
Rozbalit Rozbalit vše Re: Debian Lenny - zamrznutí serveru, určení příčiny
Konečně jsem asi určil původce zamrznutí. Pustili jsem na server duplikovaný ostrý provoz při 100% zatížení CPU, běželo to normálně. Ale potom co jsme spustili traffic shaper (lartc.org), tak server do hodiny zamrzl. Na netu jsem zatím nenašel zmínku o tom, že by tc způsobil zamrznutí stroje. Divné, třeba má někdo podobnou zkušenost nebo nápad, proč to tuhne? Může tohle způsobit vadná síťovka?

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.