OOM killer - MOCKUP (diskuse)

kde je málo paměti(256 MB RAM + 256 MB Swapu na CF kartě)

LOL, taky dobrý.

Prozatím co je mi známo, tak když začne docházet paměť, tak OOM killer ukončí podle nějakého algoritmu určitou aplikaci.

On neukončí podle nějakého algoritmu určitou aplikaci, ale snaží se nalézt aplikaci, která najednou sežrala co nejvíc paměti (např. aplikace které se ve smyčce zaseklo alokování paměti a tak bude alokovat do nekonečna – taková aplikace si ani nic jiného než smrt nezaslouží). A ještě takové aplikaci dopřávat více místa? Mně to teda přijde pěkně padlé na hlavu. Jinak kvůli tomu není potřeba vymýšlet znova kolo:

dd if=/dev/zero of=/lokalni/swap/v/souboru.img bs=1M count=100
losetup /dev/loop0 /lokalni/swap/v/souboru.img
mkswap /dev/loop0
swapon /dev/loop0

A po použití:

swapoff /dev/loop0
losetup -d /dev/loop0
rm /lokalni/swap/v/souboru.img

Akorát mě teda opravdu nenapadá rozumný příklad použití něčeho takového. Něco podobného dělá Windows.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 16:12 Luk | skóre: 47 | blog: Kacířské myšlenky | Kutná Hora
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

A ještě takové aplikaci dopřávat více místa? Mně to teda přijde pěkně padlé na hlavu.

Padlé na hlavu to není. Někdy se stává, že nějaká aplikace potřebuje dočasně opravdu hodně místa, protože se s ní prostě pracuje tak, že má velké paměťové požadavky (stačí se třeba otevřít nějakou webovou stránku, na kterou někdo naházel hromady fotek přímo z 12Mpx foťáku nebo tam narval extrémně prasácký Flash). Standardně by nastalo to, že by se spustil OOM killer a pravděpodobně by sestřelil právě tuto aplikaci (není to ovšem úplně jisté, algoritmus může dojít k jinému soudu). Jenže ještě před spuštěním killera by se jádro snažilo usilovně získat jakoukoli paměť, která je získatelná, což může zabetonovat systém na desítky sekud až minuty. V souvislosti s někdejší interakcí mezi Operou a X serverem (kdy X server kvůli Opeře zběsile alokoval paměť - lze to najít v mém blogu několik let zpátky) jsem ohledně tohoto načerpal docela slušné praktické zkušenosti.

Šifrování je absolutní nutnost a pomáhá chránit před nekalými živly

7.1.2010 16:35 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Padlé na hlavu to není. Někdy se stává, že nějaká aplikace potřebuje dočasně opravdu hodně místa, protože se s ní prostě pracuje tak, že má velké paměťové požadavky

Padlé na hlavu to je. Pokud se tak aplikace chová, tak to jen značí to, že je aplikace špatně navrhuntá a pak si nezaslouží nic jiného než přepis a nebo výmaz z disku. V 99% případů jde jakýkoliv algoritmus přepsat tak aby nepotřeboval sežrat veškerou paměť počítače.

Příklad ze včerejška: Potřeboval jsem zprůměrovat přibližně 400 obrázků pomocí ImageMagicku, tak prostě z pohodlnosti jsem napsal: convert *.png -average avg.png. Dostal jsem se k něčemu podobnému. Všech 400 obrázků o rozlišení 640x480 se načetlo a rozbalilo do paměti a zbobroval jsem na něčem podobném. Ale ani za boha by mě nenapadlo navyšovat dočasně velikost swapu nebo obviňovat autory ImageMagicku z diletantství. Ten diletant jsem byl já, protože správně to mělo být mv 0000001.png avg.png && for a in 0000*.png; do convert avg.png $a -average avg.png;done. Toť vše co se snažím říct.

stačí se třeba otevřít nějakou webovou stránku, na kterou někdo naházel hromady fotek přímo z 12Mpx foťáku nebo tam narval extrémně prasácký Flash)

O webech s 12Mpix fotkami nebo prasáckým flashem si myslím své a takové si IMHO rozšiřování swapu rozhodně nezaslouží.

Jenže ještě před spuštěním killera by se jádro snažilo usilovně získat jakoukoli paměť, která je získatelná, což může zabetonovat systém na desítky sekud až minuty.

Pravda. Tady je chyba. Taková aplikace si zaslouží byt zabita ještě mnohem dříve.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 16:51 default | skóre: 22 | Madrid
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Pokud se tak aplikace chová, tak to jen značí to, že je aplikace špatně navrhuntá

Eclipse a jeho úžasné SWT mi naleakovalo denně 400 MB v X-Serveru.

a pak si nezaslouží nic jiného než přepis

Já budu přepisovat Eclipse a X-Server. Jasněéé! Hurá do toho. :-D

a nebo výmaz z disku.

Přesně tohle jsem udělal. :-D

7.1.2010 17:04 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Já budu přepisovat Eclipse a X-Server. Jasněéé! Hurá do toho.

Pokud to byla chyba X-Serveru, tak místo kvíkání aspoň bug report by vhodný byl. Eclipse neznám, takže se k němu vyjadřovat nebudu. Ale určit která aplikace si to zaslouží a která ne není tak jednoduché jak tady popisuju. SIGSTOP a nech si uživatel rozhodne jestli si to zaslouží nebo ne.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 16:53 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

No dobře, možná jsem to trochu přehnal. Je dost možné, že aspoň zazipovaný core dump by si zasloužil.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 16:59 Václav HFechs Švirga | skóre: 26 | blog: HF | Kopřivnice
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Vrahuuuu!

Baník pyčo!

7.1.2010 17:06 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

No?

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 17:08 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

V 99% případů jde jakýkoliv algoritmus přepsat tak aby nepotřeboval sežrat veškerou paměť počítače.

To je ovšem klasické dilema. Rychlost/paměť. I pro ten tvůj případ by mělo být rychlejší těch 400 fotek natlačit do paměti a tam je naráz zpracovat, než 400x ukládat nějaký dočasný soubor a 400x pouštět nový proces.

Heron

7.1.2010 17:20 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Nemluvě o tom, že je otázka, jestli zprůměrovat 400 souborů je to samé jako zprůměrovat dva, do něj třetí, do výsledku čtvrtej atd.

Quando omni flunkus moritati

7.1.2010 17:30 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Vždyť to jsem dělal. I s pamětí je to vyřešené, protože avg.png je nakešovaný a stačí pouhý mmap. A kdyby to nestačilo, tak stačilo umístnit avg.png do nějakého tmpfs. A to je také to co jsem se snažil říct.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 17:35 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

A úplně nejlíp bych to vyřešil s avg.miff.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 18:14 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Ne, není. Jestli se jich všech čtyři-sta natlačí do paměti a pak zpracuje a nebo se načítají postupně jedna za druhou a přidávají se postupně k průměru je úplně jedno. Vlastně není. Druhý algoritmus je mnohem lepší, protože sežere paměť o velikosti dvou obrázků a bude úplně stejně rychlý (možná jen o zanedbatelnou kapičku pomalejší). Proto jsou algoritmy jako JPEG nebo MP3 tak populární. Doporučuji se podívat na jejich referenční implementace. Je to opravdu jen pár statických proměnných (určitě by se dali spočítat na prstech dvou ruk) a malinkatý statický buffer (v případě JPEGu je obraz rozdělen na dále nedělitelné bloky o 64 pixelech, které se sekvenčně zpracovávají a v případě MP3 je to frame o 1152 vzorcích). A ještě se to dá zpracovat v reálném čase s malou prodlevou.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 18:48 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

určitě by se dali spočítat na prstech dvou ruk

K 1023 se to snad nepřibližuje.

7.1.2010 18:58 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

A MPEG na tom není o moc jinak. A FFTW dokonce dovede transformaci spočítat na tom poli vstupních dat.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

8.1.2010 09:08 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Jestli se jich všech čtyři-sta natlačí do paměti a pak zpracuje a nebo se načítají postupně jedna za druhou a přidávají se postupně k průměru je úplně jedno.

Tak to samozřejmě není. Jestliže se opravdu jedná o průměr, pak se při osmi bitech na barevný kanál a postupném přidávání nemusíš vůbec obtěžovat s importem prvních cca 390 fotek.

Quando omni flunkus moritati

8.1.2010 16:14 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

No, to je fakt. Byla to dramatizace. Lepší příklad mě hned nenapadnul.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 17:27 quik
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Teda nevim, co ma to "convert -average" presne delat, ale pokud by to byla analogie pocitani aritmetickemu prumeru, pak

(((((a_1 + a_2) / 2) + a_3) + ...) + a_n) / 2 != (a_1 + a_2 + ... + a_n) / n

7.1.2010 19:33 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

No, už jsem si všiml(platilo to u operace -compose Plus, jsem to opsal a jen to zaměnil za -avg a víc nad tím nepřemýšlel) . Ale určitě by to šlo vyřešit nějakým chytrým algoritmem u kterého by nebylo nutné jich všech 400 cpát do paměti. Už mi jen zbývá přijít na to jakým.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

8.1.2010 06:56 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Přemýšlel jsem ještě nad jiným problémem. Aby toto "iterováni" fungovalo, musel by se mezivýsledek ukládat do formátu s mnohem vyšší bitovou bloubkou na kanál než požadovaný výstup. A to k vůli zaokrouhlovací chybě.

Pokud mi to po probuzení nagiosem správně myslí, tak mezivýsledek operace průměr (nějaké iterovatelné verze) je obecně reálné číslo a je nutné je zaokrouhlit na celé. Tj. zde se vnáší chyba 0.5. Pokud by se to ukládalo do 8b na kanál, je zde 256 různých hodnot a pro 400 iterací by velikost možné chyby narostla na 200. A výsledek Red=80(+- 200) by ti byl asi k ničemu (statisticky přesně to počítat nebudu).

Šlo by to vyřešit tak, že by se jednotlivé vstupní obrázky sečetli do něčeho s 32b na kanál a pak se to podělilo a zaokrouhlilo na konci.

Heron

8.1.2010 16:10 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Přemýšlel jsem ještě nad jiným problémem. Aby toto "iterováni" fungovalo, musel by se mezivýsledek ukládat do formátu s mnohem vyšší bitovou bloubkou na kanál než požadovaný výstup. A to k vůli zaokrouhlovací chybě.

Mám zkompilovaný ImageMagick se parametrem --enable-hdri, který funguje ve floating-point a dovede zpracovávat až 96-bitové TIFFy. Mezivýsledky ukládám do interního formátu ImageMagicku s koncovkou miff, který většinou stačí jen namapovat. Ale stejně je rozptyl tak veliký, že nějaký kvantizační šum od 8-bitů je jen pakatel.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

8.1.2010 10:26 stativ | skóre: 54 | blog: SlaNé roury
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Jak jsem psal níže, jde použít tzv. provisional means (OT: používá se v ČJ dočasné průměry nebo něco jiného?). Průměr se pak počítá m_{k+1} = m_k + (x_{k+1} - m_k) / (k+1), kde m_k je průměr prvních k-čísel

Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk

8.1.2010 16:12 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Jo, díky. Určitě se to někdy bude hodit.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 19:45 stativ | skóre: 54 | blog: SlaNé roury
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

To je fakt, pak by se na to musel použít algoritmus "Provisional means".

Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk

7.1.2010 16:35 Mrkva | skóre: 22 | blog: urandom
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Jenže ještě před spuštěním killera by se jádro snažilo usilovně získat jakoukoli paměť, která je získatelná, což může zabetonovat systém na desítky sekud až minuty.

Když má člověk vypnutý swap, tak je vzpamatování se systému z nedostatku paměti záležitost pár vteřin.

We lived, we danced, we raced, we run, from the oblivion to come, Dressed for the last dance of a hundred thousand suns.

7.1.2010 17:11 Ondrej 'SanTiago' Zajicek
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

To neni uplne pravda, pokud nemas swap, tak je situace paradoxne horsi. Pokud mas swap a dojde pamet, tak system zacne odkladat nepouzivane stranky na disk, coz system trochu zpomali, ale zas uvolni dost pameti, takze se se systemem jeste da pracovat. Pokud ale swap neni, tak system zacne uvolnovat pamet zahazovanim stranek, ktere je mozne znova nacist z disku - tedy napriklad stranek, ve kterych je ulozen spustitelny kod bezicich programu. A protoze tech zas tolik neni, tak to postihne a dost zpomali cely system.

Striktne vzato, vzpamatovane se systemu z nedostatku pameti pote, co OOM killer vinika zabije, rychle bude. Ale nez k tomu dojde, tak tam je prave ta zabetonovaci faze. A jak dlouho v ni system zustane zavisi v podstate akorat na tempu dalsi alokace.

Mozna by bylo dobre, kdyby kernel poustel OOM killera uz v okamziku, kdyz by detekoval signifikantni trashing, nikoliv az v pripade, kdy uz opravdu nejde dal alokovat pamet.

7.1.2010 17:28 Mrkva | skóre: 22 | blog: urandom
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

No, ve chvíli kdy pustím klasickou Cčkovou hračku for(;;) malloc(1024**2); tak se systém paradoxně chová líp bez swapu - pokud to spustím bez swapu, OOM killer proces odstřelí a po pár vteřinách je klid. Ale se swapem (ok, 5400RPM notebook disk) bude systém zaseknutý během doby, kdy se to bude snažit odswapovat (řádově minuty) a pak (protože to ten proces stejně zabije) bude systém stát znovu kvůli tahání dat zpět do RAM.

We lived, we danced, we raced, we run, from the oblivion to come, Dressed for the last dance of a hundred thousand suns.

7.1.2010 17:34 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Dřív se dokonce systém snažil defragmentovat paměť. To teprv bývalo něco.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 22:47 Ondrej 'SanTiago' Zajicek
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

No, ve chvíli kdy pustím klasickou Cčkovou hračku for(;;) malloc(1024**2); tak se systém paradoxně chová líp bez swapu

To je kod ktery pravdepodobne alokuje dalsi pamet prilis rychle, takze ona faze mezi tim, kdy prakticky dojde pamet, a nez se spusti OOM killer, je prilis kratka (i kdyz je otazka, jakou rychlosti ten kod tu pamet vlastne alokuje - samotny malloc 1 MB by toho moc realne alokovat nemusel, pokud se na ty stranky nepristupuje. Doporucil bych tam pridat jeste smycku, co na kazde 4 kB zapise nejakou hodnotu).

U realnych programu, ktere alokuji pamet pomalu a nejak s ni opravdu pracuji, je ten prubeh jiny. Sam na svem pocitaci swap nemam, tak s tim mam par zkusenosti. :–)

7.1.2010 23:46 Luk | skóre: 47 | blog: Kacířské myšlenky | Kutná Hora
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

samotny malloc 1 MB by toho moc realne alokovat nemusel, pokud se na ty stranky nepristupuje. Doporucil bych tam pridat jeste smycku, co na kazde 4 kB zapise nejakou hodnotu

Ano, pouhý malloc() u typického systému (výchozí nastavení, tj. s memory overcommittingem) nezpůsobí alokaci paměti, protože příslušné volání brk() jen přidá položky do tabulky stránek. K vlastní alokaci dojde až při přístupu do té paměti.

Šifrování je absolutní nutnost a pomáhá chránit před nekalými živly

7.1.2010 16:14 Mrkva | skóre: 22 | blog: urandom
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Pokud se nepletu, není ani nutné spouštět losetup - myslím, že akceptují i běžný soubor.

We lived, we danced, we raced, we run, from the oblivion to come, Dressed for the last dance of a hundred thousand suns.

7.1.2010 16:41 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

No jo, to jsem ani netušil.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

7.1.2010 16:46 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Ale zas tak růžové to také není:

Note that a swap file must not contain any holes.

Ale přiznávám, že překládat pozici na disku pomocí loop zařízení je ještě debilnější než vůbec mu takový soubor přidělovat. (Nemam tolik spojitého volného prostoru na disku)

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

8.1.2010 17:19 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Ehm... nejde o spojitý soubor, ale o neděravý. dd bez parametru skip a swapon bohatě stačí.

Hello world ! Segmentation fault (core dumped)

7.1.2010 16:31 Kvakor
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Ano, losetup není nutný, swaponu stačí i soubor.

A na ovlivnění OOM killera tu v novýějších jádrech existuje parametr oom_adj, který ovlivnuje, a oom_scrore, který ukazuje aktuální stav. Viz dokumentace:

2.12 /proc/<pid>/oom_adj - Adjust the oom-killer score
This file can be used to adjust the score used to select which processes shall be killed in an out-of-memory situation. Giving it a high score, increase the likelihood of this process being killed by the oom-killer. Valid values are in the range [-16:15], plus the special value '-17', which defeat the oom-killer altogether.
2.13 /proc/<pid>/oom_score - Display current oom-killer score
This file can be used to check what the current score used by the oom-killer is for any given <pid>. Use it together with /proc/<pid>/oom_adj to tune which process will be killed in an out-of-memory situation.

Takže není problém OOM killera ukecat pomocí velkého záporného oom_adj, případně ho zcela zažehnat hodnouou -17.

7.1.2010 16:34 Mrkva | skóre: 22 | blog: urandom
Rozbalit Rozbalit vše Re: OOM killer - MOCKUP

Takže chápu dobře, že stačí dát mému procesu oom_adj=-17 a nechat ho leakovat a OOM killer pozabíjí celý systém, aby můj leakující proces mohl v klidu běžet? Nádhera!

We lived, we danced, we raced, we run, from the oblivion to come, Dressed for the last dance of a hundred thousand suns.