Portál AbcLinuxu, 10. května 2025 19:29

Dotaz: Vysoký load a 0% CPU

14.7.2015 14:22 Welite
Vysoký load a 0% CPU
Přečteno: 640×
Odpovědět | Admin
Zdravím,

Poslední dobou se mi začalo stávat na serveru s debianem že tak 3-5x za den se stane, že vytížení CPU spadne k 0% a v tu chvíli začne extrémně stoupat load avg, na stroji je E3-1246 v3 a load stoupne většinou až k 16 a pak load začne klesat a vytížení CPU zase stoupat. Celý tento proces trvá zhruba 2-3 minuty. Bohužel když se tohle stane většina softwaru na stroji crashne.

Na stroji běží MySQL server a několik java aplikací. Normální vytížení CPU je kolem 50% a load 7.

Zajímalo by mě, jestli tohle jsou příznaky umírajícího HW (Disk, RAM ?), nebo se jedná o software chybu ?

Děkuji.
Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

14.7.2015 14:41 1john2 | skóre: 35 | blog: jo12hn | zlín, brno
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin
Co rika iotop/iftop?

Je neco v logach sql?

Jedna se o stejne casy?(scheduled task)
14.7.2015 15:40 Welite
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Časy jsou vždy náhodné nezávisle na provozu, na serveru neběží žádné schedulery ani zálohy nic podobného, dělal jsem test harddisků pomocí SMART a disky jsou zdravé jako řípa. MySQL nikdy necrashla a jako jediná jede v pohodě i v době kdy všechny ostatní aplikace jsou v "lagu".
Max avatar 14.7.2015 15:45 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Jak už napsal 1john2, monitoroval bych IO, zda něco nezabije na chvíli pole.
Zdar Max
Měl jsem sen ... :(
14.7.2015 16:09 Welite
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Logy systémů (syslog, msg, kernel) neobsahují žádné chyby v časech kdy k popisovanému jevu došlo, ani při startu systému či v průběhu. Na stroji je relativně nový HW starý půl roku.

Xeon 1246 v3 32 GB RAM DDR3 2x SSD Intel DataCenter 240 GB (RAID 1)
14.7.2015 15:54 alkoholik | skóre: 40 | blog: Alkoholik
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pekny prikaz je i perf top.
Kolik tam mas v danou chvili zombie procesu?
14.7.2015 16:01 Sten
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin
Většina software spadne? Software normálně při vysokém loadu nepadá. Nedošla tam paměť?
14.7.2015 16:13 Welite
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Takhle, provozuju na tom stroji herní servery, ve chvíli kdy se tohle stane všichni připojení hráči dostanou disconect. Omlouvám se za nepřesnost slova "padne".

Před hodinou jsem na stroj nainstaloval monitorix jediné co mi přijde podezdřelé je "Devices interupt activity", u kterého je vysoké číslo u eth0 - primární ethernetový port, tak nevím jestli nemůže být problém se sítovkou (CPU spadne na 0 protože čeká na informace ze sítovky ?).
14.7.2015 21:28 Andy | skóre: 18 | NMnMet
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
ve vypisu ifconfig nejsou nejake dropy?
Válka je vůl ... a já taky ;) | Chaotic state of my influence.
14.7.2015 21:41 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Když už, tak spíš "ip -s -s link show". Ale místo toho střílení naslepo bych spíš doporučil už zmíněný perf.
Jendа avatar 14.7.2015 22:18 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Já jsem v podobné situaci většinou udělal ps axu|grep D a bylo jasno.
14.7.2015 22:45 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
nemůže být problém se sítovkou (CPU spadne na 0 protože čeká na informace ze sítovky ?)

Ne, takhle to nefunguje. Síťová karta naplní buffery a vyvolá přerušení. Driver si pak převezme a zpracuje takto připravená data. Rozhodně se na ně ale nečeká v uninterruptible sleepu.

14.7.2015 16:11 sewi | skóre: 21 | blog: Bunker Hill | Prostějov
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin

Ja zazival neco podobneho pri chybe SAS/FC pole. Jakykoliv proces snazici se k nemu pristupovat se zakousnul a cekal na odpoved. Situaci vubec nepomahalo kdyz skript pravidelne poustel df -h

And they thought they were free
14.7.2015 16:17 Welite
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Příloha:
Přikládám screen z iotopu:
Punny avatar 14.7.2015 17:07 Punny | skóre: 28 | Praha
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin
E3-1246 v3 je jen 4 core - 8 HT, a load 7 uz nejspis neni uplne zdrave, nicmene bych se zameril na IO a to disku a treba i site
Chtelo by to nicmene lepsi monitoring, jinak to bude pokus omyl bez realtime dat co se deje
14.7.2015 17:24 Welite
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Tak load 7 je naprosto v pohodě HT dokáže zvládat 8 operací v jednu chvíli, problém řekl bych nastává až v případě loadu 9+. Každopádně co je myšleno realtime monitoringem dat ? Nějaké tipy na soft ?
14.7.2015 18:45 Welite
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Nikdo žádný nápad ?
14.7.2015 18:55 Ivan
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Kdysi jsem videl bug kdy ovladac Veritasu spatne nastavolal nejaky status flag u sveho kernel threadu. Diky tomu se zvedal load i kdyz kernel vlastne nic nedelal. To asi ale nebude tvuj pripad. Ale je docela dobre mozne ze userspace je OK, ale ale nejaky kernel thread je aktivni. Zkus pouzit Sysrq, bud si vypis vsechny kernl thready(t) anebo nekolikrat po sobe vypis stav cpu(myslim, ze je to c). To druhy ti rekne ktery kernel thread zrovna zabira CPU. Pokud mas vysoky load tak je dost pravdepodobne ze nekolikrat po sobe uvidis ten samy thread, ktery na napriklad snazi ovolnit nejakou stranku s pameti.
14.7.2015 19:02 nobody
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Punny avatar 15.7.2015 10:28 Punny | skóre: 28 | Praha
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
To ale neni pravda, HT != core, v tvem pripade je cokoliv > 4 uz spatne
ja osobne HT na urcitych serverech vypinam. Monitoring jsem mel na mysli cokoliv ti bude sbirat data z cpu, disku, eth, etc. treba den dva a potom to vyhodnotit, ukazka grafu, kde je zaznamenan beh bez spicky bez vsech komponent a to pouze asi hodinu, je popravde k hovnu.
Rikas, ze se jedna o herni server, nemam zadne zkusenosti jak se herni server chova, ale asi bych hledal problem v tvem pripade v sitove karte, nepouzivas snad nejaky integrovany realtek?
Jendа avatar 14.7.2015 19:42 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin
Tohle dělá zaseknuté I/O, typicky disk. Podívej se jaké jsou procesy ve stavu "D".
14.7.2015 20:20 Welite
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Příloha:
I/O to možná bude ale disk spíš ne, dělal jsem SMART test disk je v naprostém pořádku, to samé tvrdí i statistiky z monitorixu, kde I/O wait na disk je 0.0 ms. Přikládám obrázek z monitorixu.
15.7.2015 04:35 hydrandt | skóre: 35 | blog: Kanál | Herzogenburg
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin
Doporucuji nainstalovat atop, jednak co deset minut (v defultu) loguje, takze se pak da vracet v case, a ukazuje hezky pohromade skoro vse, co clovek potrebuje videt. Jednickou se prepnes na per second udaje (jinak to ukazuje podle zvoleneho refresh intervalu), t obnovi, i nastavuje interval. h napoveda.

Jinak bych to taky videl na IO, mozna dojde pamet, zacne se swapovat, tim se zacne prodluzovat reakcni doba toho co tam bezi, a pokud v te chvili ke sluzbe pristupuje hodne lidi, zacne se to kupit a zbytek uz znas :-)
I am Jack's wasted life.
16.7.2015 00:38 Hypo
Rozbalit Rozbalit vše Re: Vysoký load a 0% CPU
Odpovědět | | Sbalit | Link | Blokovat | Admin
Je to příznak umírajícího tebe.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.