Portál AbcLinuxu, 17. května 2024 07:48


Dotaz: BUG: soft lockup detected on CPU#1!

27.8.2008 11:55 Milan Dobeš | skóre: 22
BUG: soft lockup detected on CPU#1!
Přečteno: 262×
Odpovědět | Admin
Příloha:
Ahoj,

spravuji tři HB clustery jeden s CentOS 4 a dva s 5 a čas od času se vyskytne tato chyba která vede k zaseknutí serveru a je nutný jeho restart. Data se propisují pomocí DRBD, HB synchronizuje služby SMB, DHCP, DNS, HTTP, CUPS, DOVECOT prostě to co je třeba. Na CentOS 4 mám kompilované kernely 2.6.18, na CentOS 5 přímo distribuční kernel. Zajímavé je že na jednom z těchto clusterů se tato chyba neprojevuje, jede na strojích IBM. Ty co padají jednou na HP. Konfigurace je obdobná, stroje mají 4GB paměti, dva Intel xeony. Na samostatných serverech bez clusteru se to nevyskytuje, faktem je že jsou většinou poskládané z "normálního" HW, nejsou to značkové servery.

Díval jsem se po světě a zjistil jsem jen že se to vyskytuje v celé řadě kernelů 2.6.* a rady jsou různé (např. překompilování nového kernelu a pod.) ale nikde jsem nenašel nic co by skutečně pomohlo.

Zákazníky jsem si navykl na uptime od výpadku proudu do dalšího výpadku proudu a nějak nechtějí chápat když jim volám že mají server vypnout a zapnout :-)

Takže prosím kdyby Vás někoho napadlo co by se s tím dalo dělat, buďte tak laskaví a napište. V příloze je kus logu s touto chybou a následným startem systému.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

27.8.2008 16:46 fixinko | skóre: 15 | Bratislava
Rozbalit Rozbalit vše Re: BUG: soft lockup detected on CPU#1!
Odpovědět | | Sbalit | Link | Blokovat | Admin
skus pozret na lkml, tam posielal Ingo Molnar ci kto nejake patche do jadra ktore by to mali fixnut.
27.8.2008 18:40 Milan Dobeš | skóre: 22
Rozbalit Rozbalit vše Re: BUG: soft lockup detected on CPU#1!
Díky za info ale raději bych zachoval distribuční kernel...
michich avatar 27.8.2008 17:19 michich | skóre: 51 | blog: ohrivane_parky
Rozbalit Rozbalit vše Re: BUG: soft lockup detected on CPU#1!
Odpovědět | | Sbalit | Link | Blokovat | Admin
Moc jako distribuční kernel mi to nepřipadá. Nebo aspoň ty moduly binfmt_coff a abi_lcall jsou odjinud, že?
27.8.2008 18:38 Milan Dobeš | skóre: 22
Rozbalit Rozbalit vše Re: BUG: soft lockup detected on CPU#1!
Ano, ty jsou skutečně odjinud. Zavádějí se samostatně.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.