Portál AbcLinuxu, 7. května 2025 20:08

Dotaz: kill -9 nezabije proces

7.9.2009 09:25 tlamik | skóre: 21 | Karvina
kill -9 nezabije proces
Přečteno: 1296×
Odpovědět | Admin

v poslední době to vídávám poměrně často, kill -9 nezabije proces ... jeden případ je, když mám namapovaný nějaký disk přes cifs a na něm otevřené soubory pro zápis a widlí server někdo zrestartuje, tak mi nejde ani odmountit adresář a ani zabít ty procesy s devítkou. druhý případ řeším aktuálně, např. cat malého txt souboru (4kB) zabírá 99% CPU a nejde zabít. První případ asi nevyřeším, ale co druhý ? Tipuju na vadnou paměť. Je pravda, že před aktualizací jádra a OS si nepamatuju, že by to dělalo. Zkusím to ještě se starým jádrem ale štve mě proces co nejde zabít a musím trapně linux server resetovat .... nějaký tip ? Dík

Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

7.9.2009 09:55 Ash | skóre: 53
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Odpovědět | | Sbalit | Link | Blokovat | Admin
proces čekající na io opravdu (trapně) nejde zabít, umount můžete zkusit -f, což by mohlo pomoct, nebo někdy -l (lazy), i když s tím lazy nemám úplně nejlepší zkušenosti a nejsem si jist že by to pomohlo zabití těch procesů.
7.9.2009 09:57 Ash | skóre: 53
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Jo a na ten 99% proces nefunguje nic? Ani STOP? A v syslogu v tu chvíli něco o io není?
Heron avatar 7.9.2009 10:59 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Ten proces bude ve stavu Dead.
7.9.2009 13:19 Ash | skóre: 53
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Ve stavu Dead asi nebude zabírat 99% CPU... ;)
7.9.2009 19:49 Michal2
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

A tech 99% travi v userlandu nebo v jadru?

 

Kazdopadne ten prvni pripad je proces ve stavu neprerusitelneho cekani (to je mimochodem dobry argument pro kampan microsoftu misto tech volovin co tam maji ted. tuhle zalezitost ma windows naprosto nesrovnatelne lepe resenou). A to druhe bude zase sprajcnuti se v nejakem spinlocku toto jsem ovsem popravde jeste nevidel :-)

 

Heron avatar 8.9.2009 09:03 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
99% času procesoru může trávit v IO Wait. (Čimž jinými slovy říkám totéž co kolega výše.)
15.9.2009 12:33 Ash | skóre: 53
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Jistě, ale jak jsem řekl, nikoliv ve stavu Dead.
houska avatar 7.9.2009 20:05 houska | skóre: 41 | blog: HW
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Odpovědět | | Sbalit | Link | Blokovat | Admin
druhý případ řeším aktuálně, např. cat malého txt souboru (4kB) zabírá 99% CPU a nejde zabít.
co zkusit strace co to dela?
8.9.2009 07:22 tlamik | skóre: 21 | Karvina
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

[root@node2 ~]# strace -p 10388
Process 10388 attached - interrupt to quit
 

a nic víc nebo mám pustit strace s dalšími parametry ? Tak nějak to pořád vidím na chybný HW, ale popravdě tohle je jiný stroj (už druhý) se stejnou chybou ve stejném kernelu.

8.9.2009 08:11 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

Nepravděpodobné, ale zkuste -f nebo -F.

Pokud ale strace nic nenašel, tak cat žádné nové služby systému nevolá. Takže se zacyklil.

Takže v jakém je stavu podle ps? Jestli S nebo D, tak zůstal viset v jádře. Pokud R, tak v uživatelském prostoru. Pak je dobré zkusit odtrasovat běh samotných instrukcí procesu. Třeba pustit gdb -p $(pidof cat) a podívat pomocí backtrace, v jaké funkci se točí.

8.9.2009 08:28 tlamik | skóre: 21 | Karvina
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

no tak momentálně mi tam nevisí ani cat ani grep , ale zjištění statusu databáze (nějaký proprietalní closedsource sw) a visí ve stavu R. kill -9 samozřejmě nic neudělá

8.9.2009 08:07 JF | skóre: 23
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Odpovědět | | Sbalit | Link | Blokovat | Admin

Pokud je vadna pamet, tak nema smysl vubec nic dalsiho resit! Pro jistotu to chce otestovat pamet treba pres noc. V pripade zajmu bych vyhrabal memcheck.

Kazdopadne jednim z dobrych testu pameti je kompilace kernelu nebo wine. Pokud se zkompiluji dobre, tak je pamet versinou v poradku.

8.9.2009 08:18 tlamik | skóre: 21 | Karvina
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

to vím, jde však o servery v clusteru a není možné si s nima moc hrát. Navíc třeba s takovým memtestem na značkových serverech nemívám moc dobrou zkušenost (sám nevím proč), na běžných PC mi běží memtest dobře, ale na některých servech detekuje buď neexistující chyby nebo jede moc zdechle. Do odbou serverů se přidávala paměť, aktualizoval jsem OS, vanillu kernel a oba mají podobné potíže.

8.9.2009 08:22 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Pokud padá cat, tak je rozhodně lepší si hrát, než se těšit na skrytá vadná data (nebo vám stroje v clusteru o výsledku hlasují?).
8.9.2009 08:31 tlamik | skóre: 21 | Karvina
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

chápu,ale dělá to od doby, co jsem přidal paměť a aktualizoval OS a kernel. Nechce se mi věřit, že by byla vadná paměť na obou, tak to momentálně vidím nejvíc na kernel. Než testovat paměť celou noc, tak je pro mě jednodušší zkusit staré jádro. Ona se ta chyba projeví do dvou dnů spolehlivě... Navíc ty značkové RAMky made in HP byly drsně drahé a údajně testované :D

8.9.2009 09:00 Radovan Garabík
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Raz sme kupovali cluster 12 počítačov, a všetky mali zlú pamäť... (jedna séria). Dodávateľ nechcel reklamáciu uznať, trvalo to pol roka, než sme to vybavili (osobná návšteva u dodávateľa s počítačom, pustenie memtestu pred technikom). Problém bol v tom, že chyba sa prejavovala, len ak mal počítač zaplnené všetky 4 sloty. Pamäť samostatne bola dobrá.
15.9.2009 19:20 merlin111 | skóre: 15
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Nevím jestli to nebude mimo. Když jsem navyšoval paměť do svého PC, už nebyl k sehnání původní typ paměti (obě 400 Mhz, nová měla snad dokonce lepší CAS). Pro stabilní chod systému jsem musel mírně slevit z mého původního agresivnějšího nastavení časování.
Každá ulice je slepá jen do té doby, než si opatříš buldozer.
Max avatar 8.9.2009 08:47 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Také jsem to jednou zkoušel a s memtestem na server ee. Buď má problémy s ECC, nebo spíš s různými paměťovými featurkami, co servery mají :-/.
Takže na server používám testovací CD od HP postavené na linuxu :).
Zdar Max
Měl jsem sen ... :(
14.9.2009 14:52 tlamik | skóre: 21 | Karvina
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

To testovaci CD od HP je volne ke stazeni ? je to klasika, nabootuje se a testuje ? jde to udelat pres iLO, aniz bych to CD dal fyzicky do mechaniky ?

8.9.2009 09:55 JF | skóre: 23
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

Prave naopak. Pokud je vadna pamet, tak dochazi k naprosto nekontrolovatelnym havariim a muze dojit i ke zdrate dat s disku.

8.9.2009 08:52 Atom321 | skóre: 20
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Odpovědět | | Sbalit | Link | Blokovat | Admin
Chová se to, jako by u cifs mountu byl použitý option "hard", tj. při nedostupnosti serveru zůstane zablokovaný. Zkuste použít mount option "soft", viz manuál:

http://www.samba.org/samba/docs/man/manpages/mount.cifs.8.html

Ve druhém případě cat zřejmě uvízl na nějakém cyklu v jádře. (Kdyby cyklil v userspace, šel by zabít.) Může to být (jak píšete) chyba paměti, disku, slabý zdroj (projevuje se jako náhodné HW chyby všeho možného) nebo i chyba v kernelu. Z jakého filesystému berete ten "malý txt soubor"? Jakou verzi jádra máte? Je dost volné paměti? Používáte swap?

Jako dočasnou pomoc mu můžete snížit prioritu (renice), nebo ho zkusit pozastavit (kill -SIGSTOP). Bude tam viset dál, ale nebude tolik blokovat procesor.
15.9.2009 12:17 tlamik | skóre: 21 | Karvina
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Odpovědět | | Sbalit | Link | Blokovat | Admin

tak se starším jádrem mi to sice nedělá, ale zase se mi objevuje kernel panic. Zkoušel jsem přes noc memtest a bez chyby. Tak jsem celkem v koncích

 

15.9.2009 12:32 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: kill -9 nezabije proces
Zkoušel jste 2.6.30.6 nebo 2.6.31? Jsou tam opravené nějaké souběhy při práci s vlákny.
15.9.2009 16:17 tlamik | skóre: 21 | Karvina
Rozbalit Rozbalit vše Re: kill -9 nezabije proces

as far as I know : server bezel bez potizi na 2.6.24.3, pak jsem do nej pridal RAM, sitovou kartu a dva SAS disky. Nejsem si jist, jestli to zlobi presne od te doby, skoro bych rekl, ze ne. Moje posledni akce byla yum update a pak build 2.6.31 vanilly + drbd. Pak zacly problemy s procesy, co nesly zabit. V puvodnim kernelu 2.6.24.3 se sice tyto procesy nevyskytuji, nicmene se mi objevuje kernel panic, pravda ne tak casto jako ty nezabijitelne procesy ve 2.6.31

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.