Přihlášení | Registrace

napište » Zprávičky

včera 13:55 | Komunita

V Amsterdamu probíhá Open Source Summit Europe. Organizace Linux Foundation představuje novinky. Pod svá křídla převzala open source dokumentovou databázi DocumentDB.

Ladislav Hagara | Komentářů: 0

Linux slaví 34 let

včera 02:22 | Komunita

Přesně před 34 lety, 25. srpna 1991, oznámil Linus Benedict Torvalds v diskusní skupině comp.os.minix, že vyvíjí (svobodný) operační systém (jako koníček, nebude tak velký a profesionální jako GNU) pro klony 386 (486), že začal v dubnu a během několika měsíců by mohl mít něco použitelného.

Ladislav Hagara | Komentářů: 18

86Box 5.0

včera 01:55 | Nová verze

86Box, tj. emulátor retro počítačů založených na x86, byl vydán ve verzi 5.0. S integrovaným správcem VM. Na GitHubu jsou vedle zdrojových kódů ke stažení také připravené balíčky ve formátu AppImage.

Ladislav Hagara | Komentářů: 0

Americká vláda získala 10% podíl v Intelu

23.8. 17:44 | IT novinky

Vláda Spojených států získala desetiprocentní podíl v americkém výrobci čipů Intel. Oznámili to podle agentur americký prezident Donald Trump a ministr obchodu Howard Lutnick. Společnost Intel uvedla, že výměnou za desetiprocentní podíl obdrží státní dotace v hodnotě 8,9 miliardy dolarů (zhruba 186 miliard Kč). Částka podle Intelu zahrnuje dříve přislíbené subvence 5,7 miliardy dolarů z programu CHIPS na podporu výroby čipů v USA,

… více »

Ladislav Hagara | Komentářů: 22

Apache NetBeans 27

23.8. 17:33 | Nová verze

Organizace Apache Software Foundation (ASF) vydala verzi 27 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

Ladislav Hagara | Komentářů: 0

FFmpeg 8.0 „Huffman“

23.8. 04:22 | Nová verze

Knihovna FFmpeg byla vydána ve verzi 8.0 „Huffman“. Přibyla mj. podpora hardwarově akcelerovaného kódování s využitím API Vulcan, viz seznam změn.

Fluttershy, yay! | Komentářů: 0

Zpráva o stavu kybernetické bezpečnosti České republiky za rok 2024

22.8. 17:44 | IT novinky

Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) vydal Zprávu o stavu kybernetické bezpečnosti ČR za rok 2024 (pdf). V loňském roce NÚKIB evidoval dosud nejvíce kybernetických bezpečnostních incidentů s celkovým počtem 268. Oproti roku 2023 se však jedná pouze o drobný nárůst a závažnost dopadů evidovaných incidentů klesá již třetím rokem v řadě. V minulém roce NÚKIB evidoval pouze jeden velmi významný incident a významných incidentů bylo zaznamenáno 18, což oproti roku 2023 představuje pokles o více než polovinu.

Ladislav Hagara | Komentářů: 4

Vývoj renderovacího jádra Servo (08/2025)

22.8. 13:55 | Komunita

Byl publikován aktuální přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie). Servo mimo jiné nově zvládne animované obrázky APNG a WebP.

Ladislav Hagara | Komentářů: 0

V Rusku bude povinné předinstalovávat na telefony komunikační aplikaci MAX

22.8. 13:11 | IT novinky

Na chytré telefony a počítačové tablety v Rusku bude od začátku příštího měsíce povinné předinstalovávat státem podporovanou komunikační aplikaci MAX, která konkuruje aplikaci WhatsApp americké společnosti Meta Platforms. Oznámila to dnes ruská vláda. Ta by podle kritiků mohla aplikaci MAX používat ke sledování uživatelů. Ruská státní média obvinění ze špehování pomocí aplikace MAX popírají. Tvrdí, že MAX má méně oprávnění k přístupu k údajům o uživatelích než konkurenční aplikace WhatsApp a Telegram.

Ladislav Hagara | Komentářů: 56

Novinky od PINE64 - 08/2025

22.8. 04:22 | IT novinky

Společnost PINE64 stojící za telefony PinePhone nebo notebooky Pinebook publikovala na svém blogu srpnový souhrn novinek. Kvůli nedostatečnému zájmu byla ukončena výroba telefonů PinePhone Pro.

Ladislav Hagara | Komentářů: 2

Centrum | Napsat | Starší

navrhněte » Anketa

Pro otevření více webových stránek ve webovém prohlížečí používám

Taby (78%)

Panely (7%)

Záložky (4%)

Listy (5%)

Něco jiného (5%)

Nic (1%)

Celkem 76 hlasů

Komentářů: 7, poslední včera 22:32

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Články / Jaderné noviny – 5. 12. 2013: Zákeřné mutexy

Štítky: alternativa, Btrfs, cache, Canonical, citace, CPU, data, databáze, chyby, jádro, Linux, mutex, odstranit, opravit, pátek, podpora, pohled, PostgreSQL, práce, problém, psaní, vlákna, výkon

Jaderné noviny – 5. 12. 2013: Zákeřné mutexy

23. 12. 2013 | Luboš Doležel | Jaderné noviny | 6497×

Aktuální verze jádra: 3.13-rc2. Citáty týdne: Tejun Heo, Ingo Molnar. Citus Data: Správce paměti Linuxu a vaše big data. Překvapení s mutexy a čítači referencí.

Obsah

Aktuální verze jádra: 3.13-rc2
Citáty týdne: Tejun Heo, Ingo Molnar
Citus Data: Správce paměti Linuxu a vaše big data
Překvapení s mutexy a čítači referencí

Aktuální verze jádra: 3.13-rc2

link

Aktuální vývojová verze jádra je 3.13-rc2 vydaná 29. listopadu. Linus k ní řekl: Vracíme se k obvyklému týdennímu cyklu, i když mám v plánu se nakonec vrátit k vydávání v neděli. Do té doby bude každý pátek jako Vánoce! I když by se vzhledem k datu hodilo říct spíš chanuka.

Stabilní aktualizace: verze 3.12.2, 3.11.10, 3.10.21 a 3.4.71 vyšly 29. listopadu; byly následovány (velkými) vydáními 3.12.3, 3.10.22 a 3.4.72 4. prosince. Ačkoliv podpora řady 3.11.x skončila vydáním 3.11.10, Canonical bude udržovat svou verzi 3.11 až do srpna 2014.

Citáty týdne: Tejun Heo, Ingo Molnar

link

Přístup „Cokoliv, co nepadá, je v pořádku“ tady nefunguje, jelikož nemůžeme měnit chování, na kterém závisí uživatelský prostor. Pokud nebude aktivně řízeno to, co vystavujeme z jádra, tak se pak budeme muset držet nezamýšlených vlastností současné implementace. To škodí jádru i uživatelskému prostoru. Nakonec bychom v budoucnu museli obcházet hloupá omezení a uživatelský prostor by se pak divil, kdyby v krajních případech takové hacky nevyhnutelně přestaly fungovat.

-- Tejun Heo

V jádře máme různé druhy velmi komplexního kódu a zvládáme to. Zahodit užitečné nápady jen kvůli tomu, že vypadají na první pohled příliš složitě, je téměř vždy špatně.

-- Ingo Molnar

Citus Data: Správce paměti Linuxu a vaše big data

link

Blogový zápisek od Citus Data popisuje problémy, které se objeví, jakmile pracovní sada [working set] databáze překročí maximální velikost aktivního seznamu jádra. Ukazuje se, že LRU má dva nedostatky při používání jako algoritmus pro nahrazování stránek. Zaprvé je přesná implementace LRU v tomto kontextu příliš náročná. Zadruhé musí správce paměti zohledňovat i frekvenci, aby čtení velkého souboru nevyprázdnilo celou cache. Proto Linux používá sofistikovanější algoritmus než LRU; a tento algoritmus nefunguje dobře při zátěži, co jsme zrovna popsali.

Na opravě tohoto problému se pracuje od roku 2012; práce na ní se před časem oživila a v brzké budoucnosti může být začleněna. Mezitím tento problém vyvolal na mailing listu PostgreSQL debatu o tom, jestli je linuxové jádro spolehlivou platformou pro databázové aplikace.

Překvapení s mutexy a čítači referencí

link

Pád jádra nahlášený poprvé v červenci ve verzi 3.10 se konečně podařilo diagnostikovat. Současně s tím bylo opraveno nějaké to pochybné zamykání v kódu pro roury, ale má to ještě i zajímavější výsledek: vypadá to, že „zjevně správný“ kód čítače referencí není nakonec tak správně. Pro pochopení důvodů je nutné se podívat na podrobnosti toho, jak jsou mutexy v linuxovém jádře implementovány.

Z návrhového hlediska je jaderný mutex jednoduchým zámkem pro spaní. Jakmile je zámek převzat pomocí mutex_lock(), pak má jeho držitel výhradní přístup ke chráněným prostředkům. Jakékoliv jiné vlákno při snaze získat ten samý zámek bude blokováno, dokud nebude zámek uvolněn. V praxi je implementace o něco složitější. Jak bylo poprvé předvedeno v kódu Btrfs, výkon je možné zlepšit, pokud vlákno, které narazilo na uzamčený zámek, bude krátce aktivně čekat (a doufat, že zámek bude brzy uvolněn), než přejde do spánku. Běžící vlákno, které může takto rychle získat zámek, bude ještě v cache, takže tento typ optimistického čekání má tendenci zlepšovat celkovou propustnost systému. Není ani třeba dodávat, že doba aktivního čekání by měla být relativně krátká; navíc k němu nedojde, pokud už nějaké jiné vlákno aktivně čeká nebo pokud vlastník mutexu neběží.

Teď, když jsme si vysvětlili teorii, se podívejme na kus kódu, který pracuje se strukturou nazvanou "s"; tato struktura je chráněna mutexem, který je v ní obsažen:

int free = 0;

mutex_lock(&s->lock);
if (--s->refcount == 0)
	free = 1;
mutex_unlock(&s->lock);
if (free)
	kfree(s);

Tento kód vypadá, že by měl fungovat dobře; struktura je uvolněna pouze tehdy, když už na ní nejsou žádné reference. Linus ale přišel na to, že tento kód není při současné implementaci mutexů vůbec správně.

Hlavní součástí struktury mutexu je atomický čítač (count) a spinlock (wait_lock). Když je zámek odemčený, pak má count hodnotu jedna. Zavolání mutex_lock() na odemčeném zámku jednoduše dekrementuje count na nulu a bude pokračovat; toto je nejrychlejší cesta, která při troše štěstí bude spouštěna nejčastěji. Pokud je ale zámek zabraný, pak bude count nastaven na záporné číslo (což značí, že zámek chce někdo jiný) a frustrovaný volající bude možná aktivně čekat a doufat, že count bude opět nastaveno na jedničku.

Jakmile dojde na volání mutex_unlock(), rychlá cesta (spuštěná, pokud je count nula) je opět jednoduchá: count je inkrementován zpátky na jedničku. Pokud ale count bylo záporné, pak se musí spustit pomalá cesta, aby čekající vlákna věděla, že zámek už je dostupný. Ve zjednodušené podobě dělá tento kód následující:

spin_lock(&lock->wait_lock);
atomic_set(&lock->count, 1);
wake_up_process(/* první čekající vlákno */);
spin_unlock(&lock->wait_lock);

Problém je teď vidět: vlákno, které aktivně čeká na odemčení zámku, se ze své smyčky dostane, jakmile uvidí výsledek volání atomic_set(). Takže zatímco původní držitel zámku volá wake_up_process(), aby probudil někoho, kdo čeká na zámek, vlákno na jiném CPU už pracuje s předpokladem, že ten samý zámek drží. Pokud toto vlákno rychle uvolní datovou strukturu se zámkem, pak konečné volání spin_unlock() bude měnit paměť, která už byla uvolněna a možná zase přidělena někomu jinému. Je to dosti nepravděpodobná situace, ale původní hlášení chyby ukazuje, že se to někdy může stát.

Toto vedlo Linuse k závěru:

Jinými slovy, není bezpečné chránit čítače referencí uvnitř objektů čímkoliv jiným než spinlocky nebo atomickými čitači referencí. Nebo musíte mít zámek *mimo* objekt, který chráníte (což je často to, co z jiných důvodů tak či tak potřebujete, hlavně při vyhledávání).

Tento závěr hned vede k jiné otázce: kolik dalších míst v jádře může být postiženo takovouto chybou? Mutexy a čítače referencí se v jádře používají velmi aktivně; jistě se najdou i další místa, která je kombinují nebezpečným způsobem (i když Linus má pochyby, že to tak je). Bylo by ale stejně vhodné takový kód opravit; otázkou je, jak to udělat. První možností je provést audit všeho kódu, který používá mutexy, aby se podařilo najít problematická místa, ale to by byla dlouhá a nepříjemná práce – nikdy by se ji asi nepodařilo kompletně udělat.

Alternativa – tedy opravit mutexy, aby se odstranila nebezpečná situace popsaná výše – se zdá být snazší a dlouhodobě robustnější. Ingo Molnar navrhl dva způsoby, jak by se to dalo udělat, oba jsou postavené na tom, že současné používání count a wait_lock k ochraně částí zámku představuje jádro problému. Prvním návrhem bylo odstranit count a předělat wait_lock na speciální spinlock o třech stavech; druhým návrhem je používání count pro řízení přístupu k zámku. Oba způsoby mají potenciál zmenšit velikost struktury mutexu a zmenšit objem kódu specifického pro platformy při současném opravení problému.

V době psaní tohoto textu nebyly zaslány žádné patche. Bylo by ale překvapivé, kdyby se nějaká oprava tohoto konkrétního problému neobjevila do otevření začleňovacího okna verze 3.14. Problémy se zámky se těžko řeší i když mají synchronizační primitiva jednoduché a srozumitelné chování; mít v této vrstvě jádra schované drobné pasti je receptem na spoustu nepříjemností v budoucnosti.

Hodnocení: 100 %

špatné • dobré

Nástroje: Tisk bez diskuse

Tiskni Sdílej:

Komentáře

Nástroje: Začni sledovat (1) ? , Tisk

Vložit další komentář

23.12.2013 17:02 Juraj
Rozbalit Rozbalit vše Big data...?

Odpovědět | Sbalit | Link | Blokovat | Admin

Na toto predsa mame volania madvise aby OS nemusel hadat z kristovej gule....

23.12.2013 17:03 Juraj
Rozbalit Rozbalit vše Re: Big data...?

* z kristalovej gule :)

8.1.2014 00:17 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Big data...?

SPD vůbec není proruská

23.12.2013 17:38 Jardík | skóre: 40 | blog: jarda_bloguje
Rozbalit Rozbalit vše Re: Jaderné noviny – 5. 12. 2013: Zákeřné mutexy

Odpovědět | Sbalit | Link | Blokovat | Admin

Běžící blákno, které může takto rychle získat zámek ...

Věřím v jednoho Boha.

27.12.2013 10:34 frr | skóre: 34
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Odpovědět | Sbalit | Link | Blokovat | Admin

Přečetl jsem si Linusův popis. Měl jsem maličko problém se v tom zorientovat, protože se bavíme o dvou patrech: A) o "uživatelsky viditelném" mutexu a jím chráněném reference countu, to vše v nějakém uživatelském objektu, a pak B) o patro níž o "struct mutex", kterýžto struct vlastně vypadá dost podobně:

struct mutex {
        atomic_t		count;
        spinlock_t		wait_lock;
        struct list_head	wait_list;
    };

Jádro pudla je v tomto nižším patře = v kernelovém mutexu. Všimněte si položky "struct list_head wait_list" - to je nějaký spojový seznam "čekatelů na zámek".

Uvnitř páru volání mutex_lock()/mutex_unlock() existují dvě cesty: rychlá a pomalá.

Pomalá cesta bere spinlock a hraje si s wait_listem (seznam čekajících procesů) = při mutex_lock() se vlákno do seznamu zapíše, při mutex_unlock() se vyškrtne.

Naproti tomu rychlá cesta uvnitř mutex_lock() za příznivých okolností jenom "proletí", nepřidává se do wait_listu = nebere spinlock, pouze si atomicky (s podporou CPU) dvakrát sáhne na položku count. Podobně uvnitř mutex_unlock().

Za příznivých okolností, konkrétně když o mutex soupeří dvě vlákna, a to ještě na konci delší "dávky" soupeřících vláken:

první vlákno si zabralo mutex, tehdy ještě v pomalé cestě. Nyní v rámci mutex_unlock() už upravilo atomický "count" mutexu do podoby "nikdo další už nečeká"
druhé vlákno rychlou cestou proletí mutexem ve chvíli, kdy první vlákno uvnitř mutex_unlock() dosud drží spinlock a ještě fidlá s wait_listem, což může být zdlouhavá paměťová operace (pointery vs. CPU cache apod.)

Což by nebyl problém v případě, že se na daném místě v programu nejedná o okamžité dealokaci předmětného structu mutex. Pokud ale druhé vlákno (rychlá cesta) dealokuje mutex okamžitě po návratu z mutex_unlock, "máme tu problém, přátelé".

To by mě zajímalo, jestli nějakou podobnou "rychlou cestu" obsahuje i user-space pthread_mutex_t, konkrétně v Glibc + NPTL nad jádrem 2.6.x/3.x, protože uživatelský reference counter chráněný mutexem uvnitř svých structů (objektů) občas používám...

Mimochodem ladit moje vlastní bugy v automatické dealokaci podle reference countingu (+strong pointery) ve vícevláknovém zaobjektěném prostředí je pro mě veliká zábava :-)

i v případě, že posixová synchronizační primitiva fungují, jak bych čekal. To je tak, když znovu vynalézám kolo, protože si ho chci maličko přitesat pro svoje potřeby...

[:wq]

27.12.2013 12:08 Ondrej 'SanTiago' Zajicek
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Jádro pudla je v tomto nižším patře = v kernelovém mutexu.

Strucne receno, mutex_lock() v jednom threadu uspeje drive nez skonci mutex_unlock() v druhem a ten druhy stale pristupuje k interni mutexove strukture.

Pokud se na takove chovani podivam z hlediska konvencni semantiky posixovych mutexu (tedy pokud by se tak chovali userspace mutexy), tak mi to jako zavadne neprijde (primarni cil - vzajemne vylouceni kodu *uvnitr* mutexove sekce - je zajisten), akorat mutex_destroy() by musel vzit spinlock a tim se ujistit, ze paralelni mutex_unlock() uz skoncil. To by mohlo byt i adekvatni reseni pro kernelove mutexy.

2.1.2014 20:42 Ray
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

No, já nevím, ale přijde mi to jako úplně *běžná* race condition v multithreadingu... Kdo někdy vícero v tomto dělal, musel narazit na identické situace s "free" nebo "delete" (případně v rámci destruktorů). Tyhle chyby se vyloženě hnusně hledaj, to zase jo :) Celkově, obecně, uvolňovací "kaskády" maji vždy se debugovací kouzlo :-D

3.1.2014 03:06 Sten
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

V C++ ani ne. Používat delete kdekoliv mimo destruktor smart pointerů pokládám za velmi špatný kód* a race conditions dealokací opět dobře řeší smart pointery používající atomický reference counter. Zde je to zesložitěné tím, že se tam snaží aktivně spouštět jiné vlákno, ale s něčím takovým se v user space setkáte jen výjimečně.

* Schválně za jak dlouho přijdete na to, že tohle leakuje?

class Socket
{
public: 
	Socket()
	{
		if (!connect())
			throw std::exception();
	}

	bool connect()
	{
		return false;
	}
};

class Test
{
public: 
	constexpr size_t BUF_SIZE = 4096;

	char *buf;
	Socket sock;

	Test()  
		: buf(new char[BUF_SIZE]())
	{}

	~Test()
	{
		delete[] buf;
	}
}

4.1.2014 15:43 frr | skóre: 34
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Pro mne jako hobby kutila je to zajímavý dotaz - odhaduji, že konstruktor Socket::Socket() hodí výjimku, takže když je volán v rámci konstruktoru Test::Test() jako druhý v pořadí (implicitně, po alokaci "char* buf = new char[BUF_SIZE]", pořadí volání konstruktorů podle pořadí deklarace memberů ve třídě Test) tak běh programu skončí právě tou výjimkou, která neodchycena propadne až na nejvyšší úroveň a program skončí, aniž by dealokoval ten char[BUF_SIZE]...

Resp. pokud tu výjimku chytí někdo o kus výš, např. už ten kdo volá new Test(), a "ošetří" ji (v tom smyslu, že program běží dál), tak se mu ty alokované buffery mohou hromadit, pokud toto bude zkoušet opakovaně.

A proto jakožto nedouk nemám rád výjimky :-D

Chápu, že to omezení na destruktor strong pointerů je součást nějakého programátorského postupu, jak dosáhnout "vzájemně zaručeného zničení". Nicméně mi to i tak přijde trochu nekompletní, pokud do věci vstupují výjimky...

[:wq]

5.1.2014 15:32 Sten
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Pokud program spadne, tak by to nevadilo, protože operační systém po něm uklidí. Problém nastane ve chvíli, kdy někdo ty výjimky bude zachytávat. Že se nepodaří otevřít socket, je nakonec celkem normální situace, která se běžně řeší výjimkou zachycenou na vhodném synchronizačním místě a případně dalším pokusem.

Ten problém zde je, že C++ standard říká, že dokud neskončí tělo konstruktoru (které v tomto případě ani nezačalo, protože výjimka vyletěla v implicitním inicializátoru člena sock), tak se nezavolá tělo destruktoru; nakonec to je logické, objekt se ještě nevytvořil, a tak není co ničit. C++ v takovém případě volá destruktory všech již zkonstruovaných členů a předků (pokud by Test měl předka, tak jeho destruktor se zavolá), zde tedy program zavolá destruktor buf, jenže to je char *, který se sám nedealokuje. Pokud by buf byl smart pointer, tak jeho destruktor tu paměť uklidí.

S výjimkami není problém, pokud dodržujete RAII, tedy že každý zabraný zdroj má vlastní „hlídací“ objekt, který jej v destruktoru uvolní. A tohle pravidlo právě vede k tomu, aby delete používaly akorát smart pointery (a výrazně zjednodušuje hlídání zdrojů oproti C :-)

Ještě bych dodal, že existuje druhé pravidlo, a to že destruktor nemá vyhazovat výjimky, pokud je volán při zpracovávání výjimky (na rozdíl od toho, co méně zkušení programátoři často tvrdí, tak jinak může a dokonce by i měl, pokud třeba selže flush bufferu, tak se asi nepodařilo zapsat data, což by se program měl dozvědět, ale pokud je objekt ničen při zpracování výjimky, pak se stalo něco, co rozhodilo vyšší vrstvu a vzniklé problémy jsou velmi pravděpodobně zavlečené). To jde ale naštěstí vyřešit celkem snadno takto:

~Test()
try {
	⋮ // Volání funkcí, které mohou vyhodit výjimku, kromě destruktorů — tam by si to měl řešit ničené objekty
} catch (...) {
	if (std::uncaught_exception())
		// Případně nějaké logování, pokud vás to zajímá
		return;
	// catch blok, kterým končí konstruktor či destruktor, má implicitní rethrow
}

5.1.2014 19:57 frr | skóre: 34
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Díky za dovysvětlení a doplnění mého vzdělání :-)

[:wq]

8.1.2014 16:08 Sten
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Ještě jeden detail. V C++11 jsou destruktory ve výchozím stavu noexcept, je potřeba to zrušit:

~Test noexcept(false)

8.1.2014 21:05 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

To je syntaxe ve stylu: „Půjdu na nákup ne.“ To snad museli vymyslet Francouzi.

Já už tu vlastně ani nejsem. Abclinuxu umřelo.

8.1.2014 22:37 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

To je syntaxe ve stylu: „Půjdu na nákup ne.“ To snad museli vymyslet Francouzi.

Spíš lidi z Cisca :-D

(no shutdown)

Ale ono zrovna v tomhle případě to je namístě, u drtivé většina destruktoru je noexcept vhodný.

SPD vůbec není proruská

8.1.2014 23:42 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Nikoliv. Jde o to, že noexcept plní formu věty či vyjádření a za ním je napsáno false, které obrací význam. Jenže ani francouzi takto neobrací význam něčeho, už má samo obrácený význam, nebo ano?

Já už tu vlastně ani nejsem. Abclinuxu umřelo.

5.1.2014 22:47 Ray
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Proto neni jadro v C++ :) Pro tyhle a radu jinych veci, nekdy ne zcela determinstickych, osobne C++ nemam moc lasce. Prijde mi to nekdy az neprehledne, skoro jako jine write only jazyky. Ale nic proti tomu, ze kdyz jsou veci delat jednoduse, proc je nedelat slozite (:

Nemuzu rict, ze bych se tim v userspace nesetkaval. Minimalne u server side rozhodne. Kdysi jsem si musel napsat vlastni implementaci "theadu" a hlavne sync objektu, aby se mi pod WIN a Linuxem chovali opravdu *uplne* stejne (portabilni app). Protoze to co (pred tema par rokama, ted nevim) bylo v pthreads, to bylo spise na bliti, nez na cokoliv jineho.

Dalsi, kde mne podobne veci mockrat vyskolili je cokoliv 'sdileneho' s counterama, nedej bozxe kruhovejma vazbama (nejvic memory management). To je nemlich to same... Kupodivu na to dobre fungvoala HT technologie. Na realnym 2 procesorovy masine, co jsem tenkrat mel na vyvoj to bezelo, na signel taky, ale na HT to padalo a padalo :) Nikdy jsem neprisle na to proc konkretne.

Je fakt, ze nekdy clovek cumi na ocividnou blbost, ale nejak to nevidi, protoze to funguje. A bohuzel z 99.99999% :) Blahoreceny budiz chyby, ktere proste spolehlive vzdy spadnou na hubu...

6.1.2014 15:47 Sten
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

C++ je téměř zcela deterministické (všechny nedeterministcké věci má převzané z C, např. chybějící inicializaci základních typů), akorát je to deterministické chování někdy trochu jiné, než by programátor čekal. Na druhou stranu, když se člověk nad tím případem zamyslí, tak je logické, že se to tak chová: objekt ještě nebyl vytvořen, tak přeci není co ničit (ostatně jakýkoliv jiný objektový jazyk to udělá stejně, akorát ty ostatní jazyky většinou vynucují RAII). Ale jak jsem vysvětloval výše, pokud dodržíte RAII, tak nebudete mít problém.

S takovými problémy, jako je zde, se setkávám výjimečně. Ano, race condition, kdy někdo zapomene něco zamknout nebo místo deep copy provede shallow copy, s tím se setkávám běžně, ale race condition u delete jsem od té doby, co delete u kódu, který spravuji, smí používat jen smart pointery, neviděl.

Jádro není v C++ hlavně proto, že v roce 1991 byla podpora C++ dost mizerná. A taky proto, že v jádře bývá problém s implementací výjimek a RTTI, tak se to tam nepoužívá, čímž se C++ snižuje na C with classes. A to už pak rovnou jde psát v C.

4.1.2014 17:22 frr | skóre: 34
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Nojo, ale mě se tohle běžně stávalo tím stylem, že jsem si naběhl na své vlastní zapomenuté hrábě - že jsem něco nedomyslel a dealokoval dřív, než jsem s tím doopravdy přestal pracovat (protože více vláken a sdílená kritická sekce obalená zámkem uvnitř objektu předávaného referencí atd.) Jako že se vlákna probudí z blokujícího volání v jiném pořadí, než usnula, to je jasné. Ale ještě se mi nestalo, že bych objevil nějakou pastičku uvedeného kalibru v posixových zámcích. Možná jsem toho jenom málo napsal... Nebo jsou moje vlastní zamykací finty při "ukončování práce" natolik defenzivní, že pokryjí i tenhle netušený zádrhel.

Třeba i pro poměrně prosté problémy typu producent-konzument, kde se učebnicově má používat semafor a fronta, já používám frontu opentlenou mutexem a podmínkovou proměnnou plus nějaké pomocné proměnné. Umožňuje mi to definovaně probudit konzumenta ve chvíli, kdy ho už nemám čím nakrmit, jenom se s ním chci slušně rozloučit... A protože tato dvě vlákna plus třeba několik dalších cyklí v blokujících smyčkách nad sdílenou instancí nějakého objektu, je tam ještě pro košer dealokaci reference counter vláken (nebo "bitmapa" nebo tak něco, prostě "píchačky") se zamykáním a přesně definovaný postup, jak se ten cirkus má ukázněně evakuovat.

V zásadě pro danou instanci objektu "poslední zhasne", ale ten poslední je vždycky jedno konkrétní vlákno, které má koncovku v popisu práce - ostatní mají pouze povinnost se s ním při odchodu "slušně rozloučit". Přitom konec může nastat z několika důvodů v různých vláknech - ale všechna pracovní vlákna nad sdíleným objektem mají definovaný postup, jak zasignalizovat "balíme" zmíněnému předem určenému "poslednímu" a kolegům (a pak se ještě musí jednotlivě definitivně rozloučit u píchaček, aby mohla proběhnout dealokace). Jako když dělník na vrátnici píchne kartičku a vrátí ji do "kartotéky", a teprve potom mávne na vrátného "já už jdu". Vrátného to probere z klimbání, zkontroluje jestli už jsou všichni pryč, a pokud ano, zavře svou kukaň a při odchodu zhasne. Pokud byl vrátný zrovna na WC nebo se nestačil vrátit ze svačiny, tak po návratu mrkne, jestli už jsou všichni pryč, a pokud ne, tak si ještě klimbne... Všimněte si, že tohle chce opět posixovou podmínkovou proměnnou, nebo musí mít vrátný kuchyňského budíka nastaveného "na chvilku" - aby se s posledním "neminul" a nechrápal v kukani navždy (resp. až do rána).

Hmm... tak mě napadá, že zrovna tady je potřeba, aby ten "poslední dělník" už byl zaručeně pryč ve chvíli, kdy vrátný dojde k závěru, že je na čase zhasnout. Aby nemohlo dojít k tomu, že vrátný zhasne, ještě než poslední stačil vytáhnout kartu z píchaček. Což pokud by posixový mutex nebyl "sám o sobě bezpečný vůči dealokaci", měli bychom oheň na střeše... a nepomohla by proti tomu ani podmínková proměnná. Třeba pokud by se vrátný vrátil z WC těsně po příchodu "posledního", nebo by přišli poslední dva, jeden by vrátného probudil z klimbání a ten by se při probuzení z podmínkové proměnné zavěsil těsně za "posledního" (a opustil by pthread_mutex_unlock() rychleji než on). Napadlo mě, že by "vrátný" mohl na závěr pro sichr ještě jednou "vzít a pustit mutex", ale teoreticky ani to by situaci bezezbytku neřešilo. Jedině udělat tam pro "posledního dělníka" ještě pro sichr další flag, který už by nebyl chráněný mutexem, ale "poslední dělník" by ho nastavil až ve chvíli, kdy by opustil pthread_mutex_unlock(). Takže by vrátný před zhasnutím musel tenhle flag ještě zkontrolovat, a pokud by nebyl shozený, udělal by ve smyčce schedule()/sleep(0) nebo pár těsných cyklů, dokud by ten flag nespadl.

Nebo by se ten objekt (resp. pointer na něj) dal hodit do fronty "objektů čekajících na uvolnění", kterou by čistilo extra globální vlákno. Vlastně by ten flag "delete je bezpečný" mohl hlídat vlastní destruktor objektu, jehož je mutex memberem. Ale to by zas destruktor musel spát... což možná není úplně čistá konstrukce. Spíš by ten flag "delete je bezpečný" měl být k dispozici jako veřejná proměnná nebo metoda, a volající ať se zařídí po svém.

Hmm... ještě přemejšlím... pokud by posixový mutex byl nad NPTL tímto způsobem děravý, tak by to např. mohlo znamenat, že pthread_cond_wait() není bezpečná vůči "minutí se" s pthread_mutex_lock() + pthread_cond_signal(). Protože pthread_cond_wait() má dělat implicitně atomicky pthread_mutex_unlock().

Já se snad do té glibc podívám...

[:wq]

5.1.2014 08:08 frr | skóre: 34
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Tak jsem se podíval na NPTL v rámci glibc a nakonec bych skoro řekl, že user-space posixové mutexy jsou bezpečné vůči dealokaci.

Tady jsou zdrojáky user-space NPTL:

https://sourceware.org/git/?p=glibc.git;a=tree;f=nptl;h=af234acffb2fbacb622cfb4649dea20059719b4c;hb=HEAD

Konkrétně jsem napřed koukal do zdrojáků pthread_mutex_lock.c, pthread_mutex_unlock.c, pthread_mutex_init.c, pthread_cond_wait.c. Přiznám se, že to pro mne není úplně přehledné čtení, protože každá z těch funkcí se interně dál rozpadá na množství větví podle atributů mutexu (z větší části interních a nedokumentovaných), podle jednoho či dvou #ifdefů a taky podle toho, zda o mutex soupeří víc vláken či nikoli (to už je v souladu s drby ohledně NTPL).

Pár zajímavých střípků:

Low-level zamykání se děje buď přímo v user space pomocí cmpxchg (resp. je tam nějaké makro, které na x86 zřejmě vede na tuto instrukci), nebo vede na syscall futex(). Toto je zmiňováno i v různých "abstraktech" ohledně NTPL a její posixové synchronizace - údajně "řešení čistě v user space" znamená rychlou cestu (jak jinak), která se použije, pokud o mutex zrovna nesoupeří více vláken (je to možná reálně nepatrně složitější). Kernelový futex dále používá wait_queue a spinlocky - tzn. není založen na kernelovém mutexu, o kterém teď už víme, že má svoje háčky.

http://en.wikipedia.org/wiki/Native_POSIX_Thread_Library

http://en.wikipedia.org/wiki/Futex

http://man7.org/linux/man-pages/man2/futex.2.html

Je tedy zřejmé, že NPTL si posixové mutexy implementuje "po svém", nezávisle na linuxovém kernelovém mutexu. Z toho plyne otázka, zda je tato implementace bezpečná vůči dealokaci. Bohužel jsem to ze zdrojáků nedokázal pochopit (viz výše). V jedné konkrétní větvi, pokud má mutex interní atribut "robust", lze pozorovat posloupnost "nejdřív vyhákni vlákno ze seznamu uživatelů (linked list)" a "teprve poté odemkni mutex". Což zní slibně, ale týká se to pouze jedné z asi šesti variant, kterými se funkce pthread_mutex_unlock() může ubírat.

Ani v rámci pthread_cond_wait() jsem nedosáhl jednoznačného pochopení, jak je zajištěna atomicita odemčení mutexu a zavěšení na podmínku. Nicméně se zdá, že tato funkce napřed zamkne jakýsi low-level zámek na podmínkové proměnné, pak odemkne "uživatelem spřažený" posixový mutex, pak nainstaluje "wakeup handler" pro podmínku, pak odemkne zámek na podmínce - a na závěr se uloží ke spánku do futexu, kterým je podložena podmínková proměnná. Patrně je tím zajištěno, že se "neztratí" pthread_cond_signal(), který by se případně někdo pokusil doručit vzápětí po odemčení mutexu.

V rámci pthread_cond_wait() je zajímavý způsob, jak tato funkce odemkne "uživatelem spřažený mutex": zavolá si interní funkci __pthread_mutex_unlock_usercnt(mutex,decr), která je jinak i na pozadí veřejné pthread_mutex_unlock(), a zajistí si odemčení mutexu, aniž by se snížil jeho "user count" :-)

takže je mutex odemčený, a přitom o sobě ví, že je používán :-)

Odhaduji, že je to dobré spíš pro kontrolu chyb (pthread_mutex_destroy() vrátí v tomto stavu chybu) než k nějaké optimalizaci rychlosti.

Nakonec asi nejvíc optimismu mi vlévá do žil jedna poznámka v linuxové manuálové stránce pthread_mutex_init():

http://linux.die.net/man/3/pthread_mutex_init

Hledejte kapitolu Destroying Mutexes. Je tam kus zdrojáku, který přesně odpovídá našemu problému "poslední zhasne". A tvrdí se tam, že posixové mutexy jsou vůči tomuto stylu zrušení a dealokace odolné. Ještě mě napadlo, mkrnout se do zdrojáku pthread_mutex_destroy(), jestli je tam nějaký extra low-level zámek nebo kontrola - není, prostě se jenom zkontroluje user_count mutexu, bez zamykání. Takže je asi jinde zajištěno, že hodnotě user_count se dá věřit ve vztahu k bezpečné dealokaci. Popravdě řečeno pthread_mutex_destroy() tuto kontrolu provede pouze jednou, a pokud není splněna, vrátí chybu - ale vzorový zdroják v manuálové stránce ani nehlídá návratovou hodnotu pthread_mutex_destroy(), takže teoreticky předpokládá jistotu, že po návratu pthread_mutex_unlock() už žádný opozdilec s mutexem nefidlá (pokud jsme k tomuto závěru došli na základě našeho externího uživatelského reference countu).

[:wq]

5.1.2014 23:00 Ray
Rozbalit Rozbalit vše Re: jaderné mutexy vs. reference counting

Nekoukal jsem na zdrojak, ale principielne, to neni problem 'ptheadu' ale volajiciho, takze jak muze pthread ovlivnit identickou chybu ?

Pokud je sync objekt reprezentovan jako kus pameti - pak muze nastat situace jako u linuse. Pokud je to nejake cislo do nejakeho pole, potom pro zmenu muze ovlinovat jinej (coz je mozna jeste asi horsi).

Principielne to neni problem pthreadu ne ? Pokus by sync objekt byl staticky, podobny problem by neexistoval.

Založit nové vlákno • Nahoru

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje

Jaderné noviny – 5. 12. 2013: Zákeřné mutexy

Obsah

Aktuální verze jádra: 3.13-rc2

Citáty týdne: Tejun Heo, Ingo Molnar

Citus Data: Správce paměti Linuxu a vaše big data

Překvapení s mutexy a čítači referencí

Nejčtenější články posledního měsíce

Nejkomentovanější články posledního měsíce

Odkazy a zdroje

Další články z této rubriky

Hodnocení: 100 %

Komentáře