Portál AbcLinuxu, 7. května 2025 11:27
Cíl zvýšit rychlost desktopové aplikace dlouhodobě odolával úsilí programátorů. Dokonce se koketovalo s myšlenkou radikálně přepsat aplikaci, což by ale znamenalo nemožnost v řádném termínu předání provést testování předělané verze a dalších úkonů. Na doporučení mých bývalých klientů jsem byl osloven, abych přinesl jiný pohled a přišel s novými podněty.
Intuice mi napovídala, že cesta vede přes paralelizaci. Něco velmi málo jsem věděl o knihovnách jako MPI a OpenMP, které se zaměřují spíše na numerické úlohy počítané na superpočítačích a problémy jako sdílení operační paměti v clusteru. Nezdály se mi proto úplně vhodné. Kvůli šibeničnímu termínu jsem se rozhodl riskovat znovuobjevování kola. Místo zdlouhavého hledání kvalitního stávajícího řešení jsem zamýšlel vyvinout vlastní primitivní řešení, které by však uspokojovalo z hlediska času potřebného na realizaci vývoje i zvýšení rychlosti v této konkrétním zakázce.
Brzy mě upoutalo, že v důsledku designu algoritmu se během dlouhých intervalů výpočetního času pracuje jen s velmi omezeným počtem proměnných. Zdrojový kód přímo sváděl ke svému rozdělení do souvislých bloků instrukcí, které by respektovali zmíněné "malé množiny relevantních proměnných" a které by nějak umožňovali navrhnout rozklad zátěže mezi jádra. Nedokázal jsem však kvalitně přímo navrhnout jednotlivá vlákna.
Důležité upozornění : Nyní se pro jednoduchost omezme na programy, které jsou posloupností bloků instrukcí. Jak jsem se v praxi vypořádal s bloky instrukcí ve for cyklech, if větvení apod. můžu popsat v některém z následujících postů.
Při další práci jsem vycházel z následujícího banálního pozorování. Nechť proměnná Xč (resp. Xz) je libovolně zvolená proměnná, kterou blok instrukcí I čte (resp. do ní zapisuje). Před vykonáním bloku instrukcí I musí být vykonány předcházející bloky instrukcí:
Programátor by s pomocí této relace (např. s využitím Hasseho diagramů) mohl výkon bloků napevno přidělit jednotlivým vláknům a napsat podmínky vzájemné synchronizace. Bohužel předem neznáme dobu výkonu jednotlivých bloků, která výrazně závisela na hodnotách zpracovávaných proměnných, latenci vstupně-výstupních operací atd., proto kvůli blokovaní "předbíhajících se" vláken "zaostávajícími" vlákny by byl běh více méně sekvenční.
Proto jsem navrhl systém distribuci bloků mezi vlákna až za běhu. Vycházel jsem z notoricky známého hladového algoritmu. Program se spouští ve více vláknech, každé vlákno prochází následující ještě nevykonané bloky instrukcí a začne počítat první blok instrukcí, který je možné začít počítat a který není právě počítán v jiném vlákně. Veškerá práce tak spočívala v:
Především jsme si všimli, že za určitých podmínek souvisejících s výsledky vstupně/výstupních operací nebudou určité bloky již číst určité proměnné. Do kódu jsme implementovali testy těchto podmínek a navazující dynamické měnění informací o množinách proměnných čtených a zapisovaných jednotlivými bloky instrukcí; tím jsme dosáhli překvapivě výrazného pokroku.
Během necelých dvou týdnů se podařilo snížit odezvu na běžných dvoujádrech v průměru o přibližně 40%, což představuje nárůst výkonu o více jak 60%. Podařilo se tak splnit požadavek zadavatele na alespoň padesátiprocentní navýšení výkonu.
K příspěvku jsem připravil kraťoučkou demonstrační ukázku (200 řádků včetně komentářů) v jazyce Java. Demonstrační ukázku jsem narychle napsal pouze za účelem předvedení popisovaného postupu. Kód není nijak otestován. Třída spouští tři vlákna, která vykonávají "maketu" paralelizovaného programu. Čas na vykonání bloků instrukcí simuluji funkcí sleep() s předaným náhodným parametrem.
Protože jsem nedokázal nahrát zdrojový kód jako přílohu příspěvku. Nabízím stažení z mých osobních stránek zde.
Tiskni
Sdílej:
Na to není třeba složité hledání. Český autorský zákon rozděluje práva autorská a majetková. Těch autorských (= já jsem autor) se vzdát nelze.
Předřečník by mohl argumentovat tím, že ta část „licence public domain“, která se týká autorského práva je prostě neplatná, což nemá vliv její na ostatní ustanovení (udělení majetkových práv). Ale jestli by mu to soudce spolkl, to nevím.
Z hlediska majetkových se neliší public domain dílo a dílo, ke kterému je každému udělena bezúplatná licence na libovolné používání.
Efektivně ano, ale z hlediska formulace tu rozdíl je. Podle českého práva musíte v licenci právo na libovolné užití udělit. Podle amerického stačí říct, že se práva vzdáváte (což není udělení licence).
Spor by mohl nastat, když byste na dílo jen přilepil značku „public domain“. Zatímco jedna strana by tvrdila, že dá rozum, co tím básník chtěl říci, druhá strana by mohla tvrdit, že to básník ale neřekl.
Nicméně úvaha je to zřejmě jen teoretická, protože v praxi se autor nebude s příjemcem díla o smysl své public domain „licence“ soudit a nikdo jiný takový proces nemůže zahájit, protože se jedná o občanskoprávní záležitost, kde nikomu jinému než těmto dvěma stranám do věci nic není.
+1
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.