Přihlášení | Registrace

napište » Zprávičky

Node.js 22

dnes 04:55 | Nová verze

OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

Ladislav Hagara | Komentářů: 0

Proxmox Virtual Environment 8.2

dnes 04:22 | Nová verze

Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

Ladislav Hagara | Komentářů: 0

R 4.4.0 (Puppy Cup)

dnes 04:11 | Nová verze

R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

Ladislav Hagara | Komentářů: 0

IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů

včera 22:44 | IT novinky

IBM kupuje společnost HashiCorp (Terraform, Packer, Vault, Boundary, Consul, Nomad, Waypoint, Vagrant, …) za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

Ladislav Hagara | Komentářů: 9

TrueNAS SCALE 24.04 “Dragonfish”

včera 15:55 | Nová verze

Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Raspberry Pi Compute Module 4S s 2 GB, 4 GB a 8 GB paměti

včera 13:44 | IT novinky

Oznámeny byly nové Raspberry Pi Compute Module 4S. Vedle původní 1 GB varianty jsou nově k dispozici také varianty s 2 GB, 4 GB a 8 GB paměti. Compute Modules 4S mají na rozdíl od Compute Module 4 tvar a velikost Compute Module 3+ a předchozích. Lze tak provést snadný upgrade.

Ladislav Hagara | Komentářů: 0

nginx 1.26.0

včera 04:44 | Nová verze

Po roce vývoje od vydání verze 1.24.0 byla vydána nová stabilní verze 1.26.0 webového serveru a reverzní proxy nginx (Wikipedie). Nová verze přináší řadu novinek. Podrobný přehled v souboru CHANGES-1.26.

Ladislav Hagara | Komentářů: 0

Tails 6.2

včera 04:33 | Nová verze

Byla vydána nová verze 6.2 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.14.

Ladislav Hagara | Komentářů: 0

Electron 30.0.0

včera 04:22 | Nová verze

Byla vydána nová verze 30.0.0 frameworku pro vývoj multiplatformních desktopových aplikací pomocí JavaScriptu, HTML a CSS Electron (Wikipedie, GitHub). Chromium bylo aktualizováno na verzi 124.0.6367.49, V8 na verzi 12.4 a Node.js na verzi 20.11.1. Electron byl původně vyvíjen pro editor Atom pod názvem Atom Shell. Dnes je na Electronu postavena celá řada dalších aplikací.

Ladislav Hagara | Komentářů: 2

QEMU 9.0.0

včera 04:11 | Nová verze

Byla vydána nová verze 9.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 220 vývojářů. Provedeno bylo více než 2 700 commitů. Přehled úprav a nových vlastností v seznamu změn.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (72%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (17%)

Celkem 743 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Články / Jaderné noviny – 12. 1. 2010

Štítky: AbcLinuxu, audio, bezpečnost, databáze, Debian, distribuce, Gentoo, GNOME, grafika, hardware, IDE, instalace, Internet, KDE, kernel, Linux, multimédia, ovladače, problém, programování, prohlížeče, server, sítě, software, SUSE, textové editory, Ubuntu, USB, Vim, web, Windows

Jaderné noviny – 12. 1. 2010

5. 2. 2010 | Jirka Bourek | Jaderné noviny | 3055×

Aktuální verze jádra: 2.6.33-rc4. Citáty týdne: Casey Schaufler, Greg Wettstein. Časovače s volností. Konec nastavování režimu z uživatelského prostoru? sys_membarrier() a RCU v uživatelském prostoru. FBAC-LSM: Omezování aplikací založené na funkcionalitě. Spekulace o výpadcích stránek.

Obsah

Aktuální verze jádra: 2.6.33-rc4
Citáty týdne: Casey Schaufler, Greg Wettstein
Časovače s volností
Konec nastavování režimu z uživatelského prostoru?
sys_membarrier() a RCU v uživatelském prostoru
FBAC-LSM: Omezování aplikací založené na funkcionalitě
Spekulace o výpadcích stránek

Aktuální verze jádra: 2.6.33-rc4

link

Současné vývojové jádro je 2.6.33-rc4 vydané 12. ledna. Hmm. Podivné vydání. Kolem 40 % patchů je v DRM (většinou nouveau a radeon, oba jsou ve staging, takže je to o něco méně děsivé, než se zdá. Také je tam ale významná část týkající se i915.) To je všechno poměrně neobvyklé. Také je zde pár nových nízkoúrovňových ovladačů, podpora pro jádra komprimovaná LZO a nová obecná funkce pro řazení list_sort(). Všechny detaily lze nalézt v kompletním changelogu.

Stabilní aktualizace: Jediná aktualizace stabilních jader byla tento týden 2.6.31.11 vydaná 7. ledna, která opravovala chybu při překladu zavedenou v 2.6.31.10.

Citáty týdne: Casey Schaufler, Greg Wettstein

link

Dnešní uživatelé počítačů jsou mnohem méně připraveni na práci s aplikacemi, které se chovají jinak, protože znenadání přestala fungovat síť. To je proto, že jak programátor, tak uživatel očekávají, že síť bude k dispozici, protože vždycky je. Nikdy nevyzkouší situaci, kdy síť nefunguje, a programy, které používají/píší, pravděpodobně situaci nezvládnou. Jsou to lenoši.

-- Casey Schaufler

Doufám, že tohle všechno pomůže, protože ať už se zde ladí jakékoliv chování, na tomto kalibru hardwaru jsou nejnovější jádra problematická. A to nemluvím o důsledcích, které to má na moji zadní část, když moje milovaná nemůže hrát ,Blast the Bubbles‘ tak, jak by chtěla.

-- Greg Wettstein mění definici „kritické pro nasazení“.

Časovače s volností

link

Jedním z nejlepších způsobů, jak snížit spotřebu energie systému, je vyhnout se probouzení CPU, pokud je to možné. Omezení počtu probuzení je zajištěno tak, že časovače vyprší naráz, když má smysl to tak udělat. Probudit procesor jednou, aby obsloužil dva časovače, je mnohem efektivnější, než řešit dvě oddělené obsluhy. Zajistit takovou obsluhu nicméně většinou vyžaduje upravit dobu, za jakou má časovač vypršet. U standardních (ne těch s vysokým rozlišením) jaderných časovačů lze tuto úpravu provést pouze funkcí round_jiffies(), která intervaly vypršení upraví na hrubší časové jednotky s tím, že snad budou časy vypršení častěji stejné. Tato metoda do určitého rozsahu funguje, ale vyžaduje změny kódu všude, kde se používají časovače.

Arjan van de Ven navrhl vylepšení API časovačů – nazvané časovače s volností [timer slack] – které by měly zjednodušit shlukování událostí časovače. Zjednodušeně přidává určitý interval, ve kterém může časovač vypršet, což jádru dává určitou flexibilitu v tom, jak jsou časovače plánovány. Tento interval se nastavuje funkcí:

void set_timer_slack(struct timer_list *timer, int slack_hz);

V podstatě to říká, že vypršení časovače naplánované daným timer je možné zpozdit až o slack_hz jiffies. Ve výchozím nastavení je volnost nastavena na 0,4 % doby vypršení časovače – což je velmi konzervativní hodnota. Když je časovač naplánován, skutečný čas vypršení je určen pomocí jednoduchého algoritmu, který vybere dobře definovaný čas v intervalu volnosti.

Výhodou tohoto přístupu je, že zjednodušuje shlukování událostí časovačů z několika zdrojů bez nutnosti měnit kód na všech místech volání. Další flexibility je možné dosáhnout zvýšením volnosti u specifických často používaných čítačů, ale i bez toho by měly časovače s volností na mnoha systémech zlepšit efektivitu spotřeby energie.

Konec nastavování režimu z uživatelského prostoru?

link

Je to již rok od doby, co se do hlavní řady dostalo jaderné nastavování režimu [kernel mode setting, KMS]. KMS přesouvá řízení nízkoúrovňových režimů grafických procesorů do jádra, pryč od ovladačů v uživatelském prostoru, což s sebou přináší mnoho dalších výhod. KMS zpočátku podporoval pouze ovladač Intelu, ale svou cestu si kód našel i do ovladačů Radeon a Nouveau. Vývojáři nyní mluví o úplném odstranění nastavování režimu z uživatelského prostoru.

Na straně Nouveau Ben Skeggs zaslal patch, který odebírá podporu pro běh bez KMS:

Patche pro běh bez KMS jsou zaneřáděné a, řekněme si to na rovinu, hrozně hnijí. IMO je kód KMS dostatečně stabilní, abychom mohli jít dál bez berličky UMS, navíc kód KMS podporuje mnohem více čipových sad (konkrétně GF8 a vyšší), které kód UMS nikdy podporovat nebude.

Hlavní námitkou proti odstranění tohoto kódu bylo, že systémy založené na BSD nepodporují KMS, ale současný ovladač na těchto systémech beztak nefunguje. Takže i když si tento patch do hlavní řady cestu nenašel, nepřekvapilo by, kdyby se tak stalo před vydáním 2.6.34.

Přibližně ve stejné době se někteří vývojáři z Intelu začali ptát, jestli by bylo možné zahodit podporu pro běh bez KMS. I zde se zdá, že kód pro nastavování režimu z uživatelského prostoru není příliš oblíben a je těžké ho udržovat. Vypadá to nicméně, že tento kód bude nezvaným hostem ještě nějakou dobu; Linus nijak nechvátá s jeho odstraněním a Dave Airlie má ještě větší námitky:

Jsem pro až dva tři roky nejmíň a musí být alespoň jedno jádro bez vážných regresí v KMS Intelu, k čemuž jsme se ani nepřiblížili. Nejsem si ani jistý tím, že lidi od Intelu berou slovo stabilní dostatečně vážně. Zatím si nemyslím, že by existovalo jediné vydání jádra (i stabilní), které by fungovalo se všemi čipovými sadami od Intelu bez backportování patchů.

Odstranění podpory pro běh bez KMS z ovladače Intelu je tedy brzděno obavami o stabilitu kódu KMS. Zde je ale i větší problém: Podpora pro Intel byla v jádře již několik let, takže je spousta systémů, které na nastavování režimu z uživatelského prostoru závisí. To znamená, že tuto podporu je nutné udržovat dost dlouho, aby s jistotou nedošlo k rozbití těchto systémů. Nouveau má naopak výhodu v tom, že v hlavní řadě až doteď nebylo, takže obavy z regresí není třeba řešit. Někdy je výhodné přijít pozdě.

sys_membarrier() a RCU v uživatelském prostoru

link

Mathieu Desnoyers je dlouhou dobu vývojářem sady nástrojů pro sledování LTTng. Jeho současný projekt se zabývá poskytnutím možnosti rychlého sledování vícevláknových aplikací v uživatelském prostoru; to vyžaduje rychlý a vícevláknový sledovací nástroj. Sledování je řízeno sdílenou oblastí v paměti; aby bylo řízení co nejrychlejší, chtěl by Mathieu použít algoritmus čtení-kopírování-aktualizace [read-copy-update, RCU]. Z toho důvodu pracoval na portování RCU – technologie, která je jenom v jádře – do uživatelského prostoru. A přitom narazil na nějaké zajímavé problémy.

Stejně jako u jaderné verze funguje RCU v uživatelském prostoru tak, že odloží úklid objektů v paměti do doby, dokud není jisté, že se na tyto objekty nikdo neodkazuje. Implementaci je nicméně potřeba udělat jinak, protože kód v uživatelském prostoru nemůže běžet v atomickém režimu, který používá RCU v jádře. V uživatelském prostoru tedy volání rcu_read_lock() nastaví proměnnou ve sdílené paměti, která říká, že vlákno je v kritické sekci RCU a tedy že může bezpečně přistupovat k proměnným chráněným RCU.

…tedy alespoň v případě, kdy nikdo nezměnil pořadí operací tak, že přístup k proměnné chráněné pomocí RCU proběhne před tím, než se rcu_read_lock() projeví na všech ostatních CPU. Tato změna pořadí operací se může objevit snadno, a to jak na úrovni překladače, tak na úrovni CPU, takže jde o problém, který je nutné řešit. Změně pořadí operací při překladu se lze vyhnout poměrně snadno, ale změně pořadí v CPU je potřeba zabránit instrukcí pro paměťovou bariéru. Do volání rcu_read_lock() lze tedy vložit paměťové bariéry a tím RCU v uživatelském prostoru zprovoznit.

Problém tohoto řešení spočívá v tom, že paměťové bariéry věci významně zpomalují. A co je horší, zpomalují i rychlou cestu v případě změny proměnné chráněné RCU – což se často nestává. Mathieu by se tedy této bariéry rád zbavil. Za tímto účelem napsal řešení, které vyšle všem vláknům signál, když se má proměnná chráněná RCU měnit, čímž všechna vlákna donutí vykonat paměťovou bariéru. Věřte tomu nebo ne, toto řešení věci zrychlí, ale signály téměř nikdy nejsou optimálním řešením, ať už jde o jakýkoliv problém. Mathieu by radši něco lepšího.

Jako „něco lepšího“ se nakonec ukázalo jednoduché systémové volání:

void membarrier()

Původní implementace jednoduše vyslala meziprocesorové přerušení na všechna CPU v systému; přijímající CPU by vždy zareagovalo vykonáním explicitní instrukce pro paměťovou bariéru. Toto řešení fungovalo, ale během revizí narazilo na několik námitek:

Tím, že by se aplikacím v uživatelském prostoru umožnilo vynutit přerušení na všech procesorech v systému, by membarrier() nabídla snadnou cestu, jak realizovat útok odepření služby.
Systémové volání přerušuje všechny procesory v systému. Přerušení běhu procesoru, na kterém běží jiný program, je malé, ale zbytečné plýtvání. Problém se trochu zhoršuje, pokud na některých z těchto CPU běží úlohy v reálném čase; takové by pravděpodobně neuvítaly vynucené přidání latence. Dokonce by to přerušilo i procesory, které spí – zbytečná rozcvička, která by zvýšila spotřebu energie.

Následovala dlouhá diskuze o tom, jak patch optimalizovat, jestli je explicitní paměťová bariéra zapotřebí i poté, co CPU přijalo meziprocesorové přerušení (bezpečná odpověď je podle všeho „ano“), a tak dál. Shrnuto – optimalizaci malého patche, který ve svém jádře implementuje pomalou cestu, která by se měla vykonávat jenom občas, bylo věnováno obdivuhodné množství práce.

Současný stav je takový, že Mathieu zaslal novou verzi patche s mnoha změnami. První je přidání celočíselného parametru expedited. Jestliže je jeho hodnota nulová, systémové volání jednoduše zavolá synchronize_sched() a vrátí se; to je nejlevnější cesta, kterou lze získat potřebnou funkcionalitu, ale za cenu latence několika milisekund pro volajícího. Je zjevné, že Mathieu očekává, že se režim „expedited“ – urychlený – bude používat ve většině případů.

U urychlené bariéry se systémové volání podívá na každé CPU v systému a vytvoří masku těch, které běží ve stejném adresovém prostoru jako volající; tato CPU poté obdrží meziprocesorové přerušení, které je požádá, aby vykonaly instrukci pro paměťovou bariéru. Je to o něco komplikovanější implementace, ale vzhledem k tomu, že přerušuje jenom procesory, na kterých běží volající aplikace, obavy z odepření služby, výkonnosti a spotřeby energie nejsou nadále relevantní. Lze předpokládat, že patch se blíží své konečné podobě, ale těžko to říct s jistotou: někdy jsou ty nejmenší a nejjednodušší patche zkoumány nejpodrobněji.

FBAC-LSM: Omezování aplikací založené na funkcionalitě

link

Bezpečnostním pískovištím [sandbox] pro procesy se v dnešní době dostává mnoho pozornosti. Existují samostatné nástroje jako isolate a Rainbow, pískoviště integrovaná do aplikací jako pískoviště v Chromium, stejně jako nástroje, které používají existující LSM [Linux Security Module, bezpečnostní modul pro Linux], jako je pískoviště SELinux. Kromě toho okolo poletují návrhy přidat do linuxového jádra vlastnosti podporující pískoviště pro aplikace, jako jsou rozšíření seccomp a omezení sítě. LSM specificky navržený k uzavírání aplikací do pískoviště, který používá nový model nazvaný „Omezování aplikací založené na funkcionalitě“ [Functionality-Based Application Confinement, FBAC] byl na linux-kernel představen v prosinci.

FBAC-LSM vzešel z výzkumné práce při PhD studiu, jejímž autorem je Z. Cliffe Schreuders, a je prototypem implementace modelu FBAC. Používá starší verzi rozhraní LSM s háčky založenými na cestě [pathname] AppArmoru a stále potřebuje poměrně dost práce, než bude připraven pro produkční systémy nebo formální revizi kódu. Schreuders hledá spolupracovníky, kteří by se s ním věnovali dokončení projektu, pravděpodobně s cílem dostat ho do hlavní řady.

Základní myšlenou FBAC je zajistit, aby byly bezpečnostní politiky přístupnější a pochopitelnější pro uživatele, aby bylo šířeji přijímáno omezování aplikací. Hlavní komponentou systému FBAC je správce politik s grafickým uživatelským rozhraním, který uživatele provází nastavením politik pro konkrétní aplikace. Uživatelé specifikují vysokoúrovňové potřeby aplikace podle jejího typu (například prohlížeč webu nebo editor souborů) a správce politiky pomůže vytvořit politiku, která bude řídit chování této aplikace.

Při vývoji správce politiky Schreuders analyzoval přes sto různých aplikací, aby zjistil obvyklá chování, která by bylo možné obalit politikami FBAC. To správci umožňuje zautomatizovat určité aspekty vývoje politik pro nové aplikace, včetně věcí, jako jsou konfigurační soubory, síťové porty a další zdroje, které aplikace potřebuje. Správce politiky také obsahuje „režim učení“, ve kterém pozoruje aplikaci a navrhuje dodatečná oprávnění, která by jí bylo možné přidělit.

FBAC obsahuje koncept „funkcionalit“, což je v podstatě sada oprávnění pro povolené operace se sítí a se soubory. Jedná se o jemně dělené záležitosti jako „file_read“, „file_getattr“, „file_execute“, „dir_mkdir“, „network_incoming“ atd. Oprávnění, která jsou udělena konkrétní funkcionalitě, jsou vyjmenována v její definici.

Funkcionality jsou hierarchické, takže mohou zahrnovat další oprávnění na nižší úrovni do jedné, která následně řídí celou aplikaci nebo celou třídu aplikací. Krom toho jsou parametrizované, takže lze jednu funkcionalitu aplikovat na více různých aplikací, přičemž parametry specifikují konkrétní soubory, adresáře a místa v síti, pro která jsou oprávnění udělena.

FBAC podporuje jak povinné řízení přístupu [mandatory access control, MAC], tak volitelné řízení přístupu [discretionary access control, DAC]. Politiku pro aplikace může nastavit administrátor, takže běžný uživatel nemůže dělat žádné změny, nebo lze FBAC nakonfigurovat tak, že je uživatelům umožněno omezit aplikace více, než určují politiky nastavené administrátorem. Omezení aplikace poté závisí na průniku povinných a volitelných politik.

Tím, že se uživatelům umožní specifikovat omezená privilegia pro libovolnou aplikaci, se objevuje stejné riziko problémů se setuid() programy, na které narazily jiné mechanismy pro uzavření aplikace na pískoviště (například vlastnost pro omezení přístupu k síti zmíněná výše). Je potřeba poskytnout nějaké prostředky, aby se neprivilegovaným uživatelům zabránilo měnit prostředí, které setuid() programy očekávají.

Rozhraním pro konfiguraci FBAC-LSM je souborový systém připojený do /sys/kernel/security/fbac-lsm. Soubory v tomto adresáři umožňují dotazovat se na aktuálně nainstalované politiky a přidávat nové. Zaslání informací o politice má několik kroků, každý kousek se zapisuje do odděleného souboru v adresáři. Následuje zápis „commit“ do /sys/kernel/security/fbac-lsm/commit, což vyvolá zpracování politiky. To je poněkud náchylné k souběhům, ale je to nutné kvůli pravidlu „jedna hodnota na soubor“ platnému pro sysfs. Je dost pravděpodobné, že se rozhraní FBAC-LSM změní na privátní souborový systém podobný těm, které používá Smack a SELinux.

FBAC používá odlišný přístup než jiná řešení zaměřená na bezpečnost, ale některé části jsou dost podobné, takže Schreuders plánuje naprogramovat správce politiky tak, aby četl a zapisoval politiky pro AppArmor a SEEdit. FBAC nicméně vypadá tak, jak se od prototypu dá očekávat – kód je poměrně neorganizovaný a zaneřáděný zakomentovanými sekcemi, kvůli kterým je poměrně těžké ho číst.

Současná inkarnace FBAC-LSM rozhodně vzbuzuje pocit, že byl kód sestaven poměrně ve spěchu kvůli dizertační práci PhD, a ne jako „skutečný“ LSM. Obsahuje ale několik zajímavých nápadů, které si zaslouží další pozornost. Jednou z největších překážek, které čelí různá bezpečnostní řešení (nejlepším příkladem je SELinux), je složitost vývoje a - což je důležitější – pochopení politik, které se používají. Tato složitost je něco, co se Schreuders rozhodl s pomocí FBAC omezit. Ještě se uvidí, jestli uspěje, ale každý takový pokus stojí za pozornost.

Spekulace o výpadcích stránek

link

Zlepšení výkonnosti jádra je obecně dobrá věc; to je důvod, proč mnoho z našich nejlepších vývojářů věnovalo významné množství času práci na optimalizaci. Jedna z oblastí, které se nedávno dostalo pozornosti, je řešení měkkých výpadků stránek. Jak ale tato práce ukázala, problémy s výkonností nejsou vždy tam, kde si člověk myslí, že jsou; někdy je nutné udělat krok zpět a situaci zhodnotit znova a možná přitom vyhodit spoustu kódu.

Výpadky stránek mohou být poměrně drahé, obzvláště pokud se jedná o ty, které je nutné řešit čtením dat z disku. Na typickém systému nicméně bude spousta výpadků stránek, které I/O vyžadovat nebudou. Výpadek stránky typicky nastává, když specifický proces nemá platný záznam v tabulce stránek pro potřebnou stránku, ale tato stránka často bývá v cache stránek; v takovém případě obsluha výpadku spočívá v jednoduché opravě tabulky stránek a zvýšení počtu odkazů na danou stránku; to se často děje u sdílených stránek nebo u těch, které byly načteny při dopředném čtení [readahead]. Výpadky nových anonymních stránek (většinou data a zásobník aplikací) lze řešit alokací stránky vyplněné nulami. V obou případech je výpadek vyřešen rychle a není potřeba se obracet na úložné zařízení.

U mnoha pracovních zátěží tento druh „měkkých“ výpadků nastává mnohem častěji než tvrdé výpadky vyžadující skutečné I/O. Je tedy důležité, aby byly vyřešeny rychle. Různí vývojáři se shodli na tom, že jádro tento druh výpadku neřeší dostatečně rychle, a jako hlavní příčinu problému identifikovali semafor čtenář/zapisovatel [reader/writer] mmap_sem. V tomto případě nebylo problémem soupeření – při obsluze výpadku stránky se zabírá pouze čtecí zámek – ale poskakování řádku v cache způsobené neustálým zabíráním zámku výkonnost zabíjelo. A jak se počet jader v systému zvyšuje, tento problém se může jenom zhoršovat.

V reakci na to Hiroyuki Kamezawa zaslal v listopadu první patch pro spekulativní výpadky stránek. Základní myšlenkou tohoto patche je pokusit se vyřešit obsluhu výpadku stránky úplně bez zabírání mmap_sem. To samozřejmě znamená riziko souběhů; konkrétně se během práce může změnit struktura vm_area_struct (VMA), která řídí mapování paměti. Kód spekulativního řešení výpadku tedy musí výpadek vyřešit, poté zkontrolovat, jestli nedošlo k nějakým souběžným změnám, a v případě potřeby práci zopakovat starším a pomalejším způsobem. To je ta „spekulativní“ část: Odvedení práce bez zámků, přičemž se doufá, že svět se mezitím nezmění a nevynutí tím nutnost tuto práci zopakovat.

Kód pro spekulativní řešení výpadků také musí zajistit, že během řešení výpadku nedojde k žádným změnám, které by způsobily opravdové potíže (jako je například úplné uvolnění VMA). Za tímto účelem různé verze patche zkoušely techniky jako přidání čítání odkazů do struktury VMA nebo používání čtení-kopírování-aktualizace [RCU] s kódem červeno-černých stromů (které se používají k alokaci VMA pokrývající specifickou adresu v adresovém prostoru) – tím se měly změny odložit, dokud spekulativní kód nedokončí svou práci.

Z této práce vzešly skutečné výsledky: Počet výpadků stránek za jednotku času, které systém dokázal zvládnout, když na něm běžel benchmark zaměřený na výpadky stránek, se přibližně zdvojnásobil. Nápad tedy zjevně měl opodstatnění, ale Peter Zijlstra měl pocit, že patche od Kamezawa-san nebyly dostatečně bláznivé. Rozhodl se tento problém napravit svými vlastními patchi pro spekulativní výpadky stránek, které se také dočkaly mnoha revizí. Peterův přístup zahrnoval přidání zámků pro spekulativní tabulky stránek a pro správu struktur VMA použil RCU. Výsledkem byl patch, který „občas nabootoval“ a který, zdálo se, zlepšoval výkonnost.

V tu chvíli se do věci zapojil Linus, poukázal na nějaké problémy Peterova patche a došel k závěru:

Řekl bych, že celá tato série má k začlenění _hodně_ daleko. Peter podle všeho přemýšlel o detailech, zatímco přehlédl všechny jemné vlivy na celkový obraz, které podle všeho mění sémantiku.

Peter s tímto závěrem souhlasil s poznámkou, že si nikdy nemyslel, že by patche byly připraveny.

V další diskuzi si Linus, když se podíval na profil aktivity při řešení výpadků stránky, všiml něčeho zábavného: Skutečnou režii podle všeho tvořily operace se spinlocky, které by se v optimalizované implementaci rwsem pro x86 neměly vůbec objevit. Ukázalo se, že zmíněná optimalizace byla aplikována pouze na 32bitové systémy; na překladech pro 64bitové semafory čtenář/zapisovatel používaly obecné implementace založené na semaforech. To znamená, že byly mnohem pomalejší, než by mohly být.

Linus tedy nadhodil novou implementaci rwsem založenou na x86 instrukci vyměň a sečti (exchange-and-add, xadd) s typickým varováním:

Jinými slovy: NETESTOVÁNO! Může vám to znásilnit domácí mazlíčky a vypít všechno pivo. Varováni jste byli.

Kamezawa-san statečně nový kód vyzkoušel a dospěl k zajímavému výsledku. Jeho domácí mazlíčci a pivo přežili bez úhony – a výkonnost při výpadcích stránky byla lepší než s jeho patchem pro spekulativní řešení výpadků stránek. I Peter zkusil několik testů proti vlastnímu spekulativnímu kódu; tyto testy ukázaly, že změna rwsem výkonnost ztrojnásobila. Jeho patch pro spekulativní řešení výpadků výkonnost zlepšil ještě o něco málo více a oba dohromady ještě o něco více. Patch rwsem je ale malá a jasná oprava, zatímco patch pro spekulativní výpadky je velký, rozsáhlý, děsivý a obsahuje problémy. Nikdo tedy nezpochybnil Peterův závěr:

Takže i když si myslím, že používat tyto spekulativní výpadky je možné, zdá se, že na ně ještě nejsme úplně připraveni.

V době psaní tohoto článku nikdo nezaslal konečnou verzi patche rwsem. Linus poznamenal, že by se na něm dalo pár věcí vylepšit, ale bylo by pro něj typické, kdyby tuto práci nechal na jiných. Dá se ale předpokládat, že nějaká verze tohoto patche bude čekat na otevření začleňovacího okna 2.6.34. Bude to jasnou ukázkou toho, že i v našem vysoce optimalizovaném jádře existuje nízko visící ovoce v podobě zlepšení výkonnosti; stačí se podívat na správné místo.

Hodnocení: 100 %

špatné • dobré

Nástroje: Tisk bez diskuse

Tiskni Sdílej:

Komentáře

Nástroje: Začni sledovat (0) ? , Tisk

Vložit další komentář

5.2.2010 11:24 rastos | skóre: 62 | blog: rastos
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Odpovědět | Sbalit | Link | Blokovat | Admin

Aký bude dopad prechodu z UMS na KMS na nVidia closed source driver, prípadne staršie gr. karty?

5.2.2010 12:32 Roger
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

IMHO zadny, nVidia si to resi sama a nikdo snad nenuti zbyle ovladace, aby pouzivaly modul v jadre (ktery nemaji).

5.2.2010 12:49 rastos | skóre: 62 | blog: rastos
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Ide mi o to, že z jadra bude časom odobraná podpora pre UMS - čo ak sa na ňu nVidia spolieha?

5.2.2010 14:24 Roger
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

nVidia pouziva vlastni jaderne rozhrani, ne?

5.2.2010 16:20 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

tak bude muset svuj ovladac prepracovat ....

USE="-gnome -kde";turris

5.2.2010 17:11 Andrej | skóre: 51 | blog: Republic of Mordor
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Odpovědět | Sbalit | Link | Blokovat | Admin

KMS zpočátku podporoval pouze ovladač Intelu...

1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, ...

A příště si povíme tu o Červené karkulce. :-D

5.2.2010 18:49 Filip Jirsák | skóre: 68 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

První tři chyby se týkají ovladačů od Intelu, další jsem nezkoumal, ale asi to bude stejné – to spíš vypadá jako potvrzení toho, že jiné ovladače, než ty od Intelu, zpočátku KMS nepodporovaly.

6.2.2010 02:14 Andrej | skóre: 51 | blog: Republic of Mordor
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Podle mě tam zatím neexistuje podpora, ale jakýsi pokus o podporu ve stádiu daleko před alfa-verzí. Proto mě nápady ohledně odstranění původního přepínání režimu poněkud děsí.

Bug, který zcela znemožňuje použití většiny grafických chipsetů od Intelu, přesněji řečeno upgrade na verzi Intel driveru novější než 2.3.x, existuje už minimálně rok. To je dost smutné.

Vzhledem k nekompatibilitě ostatních částí systému s prastarým ovladačem chipsetu Intel mi nezbývá než jedovatě poznamenat, že nejspíš právě teď přišel ten správný čas pro OpenSolaris.

6.2.2010 12:00 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Podle mě tam zatím neexistuje podpora, ale jakýsi pokus o podporu ve stádiu daleko před alfa-verzí. Proto mě nápady ohledně odstranění původního přepínání režimu poněkud děsí.

Máš zastaralé informace. V upstreamu X.org podpora pro přepínání režimu z uživatelského prostoru už není. V Nouveau už taky ne. A z článku je vidět, že ve svobodných ovladačích pro ati i nouveau je podpora pro KMS lepší než pro UMS. (Protože na tom druhém nikdo nedělá)

Bug, který zcela znemožňuje použití většiny grafických chipsetů od Intelu, přesněji řečeno upgrade na verzi Intel driveru novější než 2.3.x, existuje už minimálně rok. To je dost smutné.

Co je to za bug? Je tam i když použiješ KMS. A hlavně - nahlásil jsi ho?

Quando omni flunkus moritati

6.2.2010 12:10 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Je tam i když použiješ KMS.

Sem samozřejmě patřil otazník...

Quando omni flunkus moritati

6.2.2010 14:45 Andrej | skóre: 51 | blog: Republic of Mordor
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Veškeré problémy, které se u grafiky Intel objevují, nastávají v souvislosti s KMS.

6.2.2010 14:44 Andrej | skóre: 51 | blog: Republic of Mordor
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Já nepochybuju o tom, že v Nouveau nebo svobodných ovladačích pro ATI to funguje. Nicméně používám a spravuju pár strojů s chipsetem Intel, kde to bohužel nefunguje ani trochu.

A hlavně - nahlásil jsi ho?

Viz odkazy v mém původním příspěvku. Samozřejmě, že jsem to hlásil, případně tu a tam komentoval, podobně jako stovky dalších lidí, které tohle postihlo.

Mám takový neblahý pocit, že tyhle bugy se budou řešit teprve tehdy, až příslušné verze probublají do UltraStableEnterprise distribucí. Prostě proto, že v současném enterprise kernelu 2.6.27 ještě není po KMS ani památky.

Co je to za bug?

Dobrá otázka. :-)

Z pohledu správce je to dost divné. Občas se to projevuje jako segmentation fault X serveru, občas se do logu nestihne zapsat vůbec nic. Ve většině případů se dá do stroje naSSHčkovat a stroj restartovat. Restart bývá nutný. Grafický chipset je totiž v jakémsi divném stavu, který se zabitím a restartováním X serveru do pořádku nedá. Odhadem kolem 10% případů s sebou vezme i kernel, takže stroj už neodpovídá ani na ping a je to na tvrdý reset.

Z pohledu uživatele to má pokaždé prakticky stejné příznaky. Zamrzne celý X server, nefunguje ani klávesnice, ani přepínání do textových konzolí, dokonce ani po Magic+R. Kurzor myši se ale normálně pohybuje. (?!) To je společný znak u prakticky všech hlášení tohoto bugu. Kurzor bývá hardwarově akcelerovaný, takže jeho funkčnost možná není až tolik překvapivá... Magic SysRq většinou funguje, ale už jsem zažil několik případů (a verzí), kde i tato poslední možnost selhala.

Podstatné je, že tenhle bug nemá žádný trigger, který by se dal eliminovat. Neexistuje doporučení typu nespouštěj tohle, nepřehrávej tamto. K zamrznutí dochází v poměrně náhodně. Někdy 10 minut po přihlášení, někdy stroj vydrží funkční třeba hodinu a půl. Zamrzá to na LVDS, na externím LCD (vodorovném i svislém) i na kombinaci obou. Mnoho flashových animací, video ve větším rozlišení a hodně velké obrázky (řekněme 3000x3000 a větší) zvyšují pravděpodobnost zamrznutí. Ale nic z toho ji nezvýší na 100%, aby se dalo říct „jo, tak při tomhle se to sekne“.

Střední hodnota doby do zamrznutí bývá u některých verzí nižší než jedna hodina. Tudíž nelze než suše konstatovat, že počítač je pak pro běžnou práci zcela nepoužitelný.

Jediné řešení je vypnout veškerou podporu pro framebufer, vypnout KMS a používat hodně starou verzi ovladače Intel. Jakákoliv jiná kombinace možností vede k průšvihu.

Cokoliv jiného než Intel funguje normálně. Proto si myslím, že bug se musí týkat výhradně ovladačů pro Intel. Nevím, zda je problém na straně kernelu nebo ovladače pro X.org. Nejspíš se tenhle problém týká především chyb v hardware, protože existují některé modely grafických karet, u kterých se nic podobného neprojevuje.

Na webu se povaluje spousta patchů, které vypínají GEM. Někteří tvrdí, že by to mohlo pomoct, jiní zase říkají, že se tím počet (a pravděpodobnost vzniku) potíží všeho druhu jedině zvýší. Zatím jsem nikde nečetl, že by někdo tak radikální změnu v praxi úspěšně vyzkoušel. Problém tedy zůstává už téměř rok nevyřešený.

7.2.2010 00:37 trekker.dk | skóre: 72
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Tak to uznávám, že tohle je fakt nic moc...

Quando omni flunkus moritati

7.2.2010 23:44 m-a
Rozbalit Rozbalit vše Re: Jaderné noviny – 12. 1. 2010

Ten uzivatelsky pohlad - funguje len mys - sa objavoval tiez v jednom bugu v ATI a starsich intel ovladacoch so zapnutym DRI...

Založit nové vlákno • Nahoru

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje

Jaderné noviny – 12. 1. 2010

Obsah

Aktuální verze jádra: 2.6.33-rc4

Citáty týdne: Casey Schaufler, Greg Wettstein

Časovače s volností

Konec nastavování režimu z uživatelského prostoru?

sys_membarrier() a RCU v uživatelském prostoru

FBAC-LSM: Omezování aplikací založené na funkcionalitě

Spekulace o výpadcích stránek

Nejčtenější články posledního měsíce

Nejkomentovanější články posledního měsíce

Související články

Odkazy a zdroje

Další články z této rubriky

Hodnocení: 100 %

Komentáře