Jak jsem paralelizoval aplikaci?

Cíl zvýšit rychlost desktopové aplikace dlouhodobě odolával úsilí programátorů. Dokonce se koketovalo s myšlenkou radikálně přepsat aplikaci, což by ale znamenalo nemožnost v řádném termínu předání provést testování předělané verze a dalších úkonů. Na doporučení mých bývalých klientů jsem byl osloven, abych přinesl jiný pohled a přišel s novými podněty.

Intuice mi napovídala, že cesta vede přes paralelizaci. Něco velmi málo jsem věděl o knihovnách jako MPI a OpenMP, které se zaměřují spíše na numerické úlohy počítané na superpočítačích a problémy jako sdílení operační paměti v clusteru. Nezdály se mi proto úplně vhodné. Kvůli šibeničnímu termínu jsem se rozhodl riskovat znovuobjevování kola. Místo zdlouhavého hledání kvalitního stávajícího řešení jsem zamýšlel vyvinout vlastní primitivní řešení, které by však uspokojovalo z hlediska času potřebného na realizaci vývoje i zvýšení rychlosti v této konkrétním zakázce.

Brzy mě upoutalo, že v důsledku designu algoritmu se během dlouhých intervalů výpočetního času pracuje jen s velmi omezeným počtem proměnných. Zdrojový kód přímo sváděl ke svému rozdělení do souvislých bloků instrukcí, které by respektovali zmíněné "malé množiny relevantních proměnných" a které by nějak umožňovali navrhnout rozklad zátěže mezi jádra. Nedokázal jsem však kvalitně přímo navrhnout jednotlivá vlákna.

Důležité upozornění : Nyní se pro jednoduchost omezme na programy, které jsou posloupností bloků instrukcí. Jak jsem se v praxi vypořádal s bloky instrukcí ve for cyklech, if větvení apod. můžu popsat v některém z následujících postů.

Při další práci jsem vycházel z následujícího banálního pozorování. Nechť proměnná Xč (resp. Xz) je libovolně zvolená proměnná, kterou blok instrukcí I čte (resp. do ní zapisuje). Před vykonáním bloku instrukcí I musí být vykonány předcházející bloky instrukcí:

Programátor by s pomocí této relace (např. s využitím Hasseho diagramů) mohl výkon bloků napevno přidělit jednotlivým vláknům a napsat podmínky vzájemné synchronizace. Bohužel předem neznáme dobu výkonu jednotlivých bloků, která výrazně závisela na hodnotách zpracovávaných proměnných, latenci vstupně-výstupních operací atd., proto kvůli blokovaní "předbíhajících se" vláken "zaostávajícími" vlákny by byl běh více méně sekvenční.

Proto jsem navrhl systém distribuci bloků mezi vlákna až za běhu. Vycházel jsem z notoricky známého hladového algoritmu. Program se spouští ve více vláknech, každé vlákno prochází následující ještě nevykonané bloky instrukcí a začne počítat první blok instrukcí, který je možné začít počítat a který není právě počítán v jiném vlákně. Veškerá práce tak spočívala v:

Především jsme si všimli, že za určitých podmínek souvisejících s výsledky vstupně/výstupních operací nebudou určité bloky již číst určité proměnné. Do kódu jsme implementovali testy těchto podmínek a navazující dynamické měnění informací o množinách proměnných čtených a zapisovaných jednotlivými bloky instrukcí; tím jsme dosáhli překvapivě výrazného pokroku.

Během necelých dvou týdnů se podařilo snížit odezvu na běžných dvoujádrech v průměru o přibližně 40%, což představuje nárůst výkonu o více jak 60%. Podařilo se tak splnit požadavek zadavatele na alespoň padesátiprocentní navýšení výkonu.

Demonstrační ukázka

K příspěvku jsem připravil kraťoučkou demonstrační ukázku (200 řádků včetně komentářů) v jazyce Java. Demonstrační ukázku jsem narychle napsal pouze za účelem předvedení popisovaného postupu. Kód není nijak otestován. Třída spouští tři vlákna, která vykonávají "maketu" paralelizovaného programu. Čas na vykonání bloků instrukcí simuluji funkcí sleep() s předaným náhodným parametrem.

Protože jsem nedokázal nahrát zdrojový kód jako přílohu příspěvku. Nabízím stažení z mých osobních stránek zde.

Komentáře

Kdyžtak do toho zdrojáku doplň(te) licenci.

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

16.10.2010 17:27 František Bártík | blog: pracovni_zapisnik
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Je to drobný neodzkoušený neefektivní demonstrační kód, takže jej uvolňuji jako public domain. Hodí se jen pro "přečtení".

17.10.2010 21:27 Non_E | skóre: 24 | blog: hic_sunt_leones | Pardubice
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Označení public domain nepatří licenci. Jde o stav, kdy dílo není vůbec chráněno. Pokud rozhodným právem bude právo ČR, pak nejde dílo žádným právním úkonem zbavit autorskoprávní ochrany (majetkové). Ta uplyne za 70 let od prvního dne roku následujícího po vaší smrti.

Nemám žádný zájem na užití demonstračního kódu, jen upozorňuju na rozšířený omyl. Jinak hezký první zápisek blogu. Přeju hodně tvůrčího elánu :-)

Only Sith deals in absolutes.

18.10.2010 09:11 František Bártík | blog: pracovni_zapisnik
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Myslím, že takto lze udělit licenci. Předcházejícím komentářem jsem projevil vůli umožnit komukoli užívat dílo v rozsahu užívání děl v režimu volného díla public domain. Tento srozumitelný projev vůle ustanovil licenci k libovolnému užívání díla a posktl ji bezúplatně každému.

(Z hlediska některých cizích právních řádů jsem se tím vzdal majetkových autorských práv.)

18.10.2010 18:16 Jakub Lucký | skóre: 40 | Praha
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

V česku public domain opravdu nejde... Podle autorského zákona se prostě nejde těch práv vzdát...

Neumím to teď doložit (resp. jsem líný se hrabat v zákoně), ale vysvětlovali nám to na mediálním právu...

If you understand, things are just as they are; if you do not understand, things are just as they are.

18.10.2010 20:01 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Na to není třeba složité hledání. Český autorský zákon rozděluje práva autorská a majetková. Těch autorských (= já jsem autor) se vzdát nelze.

Předřečník by mohl argumentovat tím, že ta část „licence public domain“, která se týká autorského práva je prostě neplatná, což nemá vliv její na ostatní ustanovení (udělení majetkových práv). Ale jestli by mu to soudce spolkl, to nevím.

18.10.2010 22:20 Jakub Lucký | skóre: 40 | Praha
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

No, to je rozepsané to, co jsem psal, já myslel doložení (odkazem na příslušný paragraf třeba)

Co se toho soudu týče, nejsem si moc jistý, jak by to dopadlo...

If you understand, things are just as they are; if you do not understand, things are just as they are.

19.10.2010 09:43 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Odstavec 4 § 11.

19.10.2010 07:49 František Bártík | blog: pracovni_zapisnik
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Pokud tomu správně rozumím (nejsem právník). Autorská práva se dělí na osobnostní a majetková. Z hlediska majetkových se neliší public domain dílo a dílo, ke kterému je každému udělena bezúplatná licence na libovolné používání.

Osobnostní práva jsou nepřenositelná, ale autor může osobnostní práv využít; což jsem učinil:

právo na pseudonym : při zveřejnění jsem jej nevyužil
právo udělit svolení změnit či zásahovat do díla : toto svolení jsem udělil každému
a tak dále

Podle mě ani v osobnostních právech není žádný problém.

19.10.2010 09:55 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Z hlediska majetkových se neliší public domain dílo a dílo, ke kterému je každému udělena bezúplatná licence na libovolné používání.

Efektivně ano, ale z hlediska formulace tu rozdíl je. Podle českého práva musíte v licenci právo na libovolné užití udělit. Podle amerického stačí říct, že se práva vzdáváte (což není udělení licence).

Spor by mohl nastat, když byste na dílo jen přilepil značku „public domain“. Zatímco jedna strana by tvrdila, že dá rozum, co tím básník chtěl říci, druhá strana by mohla tvrdit, že to básník ale neřekl.

Nicméně úvaha je to zřejmě jen teoretická, protože v praxi se autor nebude s příjemcem díla o smysl své public domain „licence“ soudit a nikdo jiný takový proces nemůže zahájit, protože se jedná o občanskoprávní záležitost, kde nikomu jinému než těmto dvěma stranám do věci nic není.

19.10.2010 10:00 Jakub Lucký | skóre: 40 | Praha
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Z hlediska majetkového se pro uživatele/přebiratele nic nemění (mezi public domain dílem a dílem, ke kterému je každému udělena bezúplatná licence na libovolné používání)

Bohužel právo mluví jinak. Pokud prohlásíte, že dílo prohlašujete za public domain, tak se tím (v souladu s public domain) zbavujete všech osobnostních i majetkových práv. Jenže tím vzniká spor s autorským zákonem, který říká, že "výlučná práva osobnostní" jsou nezrušitelná a nepřenositelná... A teoreticky, když něco zveřejníte pod public domain v ČR, tak byste pak mohl někoho žalovat za porušení vašich osobnostních práv...

If you understand, things are just as they are; if you do not understand, things are just as they are.

18.10.2010 20:13 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Tak licenci WTFPL.

Intel meltdown a = arr[x[0]&1]; karma | 帮帮我，我被锁在中国房

...nenene, já už nic spouštět nebudu, ten Kralykův skriptík mi stačil, neparalizoval mi jen aplikaci, ale celej system... :-D

I♥DRX * www.KERNELULTRAS.org

16.10.2010 17:17 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

geniální dvousmysl. Musím někdy vytvořit podmínky na to, abych mohl to slovo taky použít :-D

Intel meltdown a = arr[x[0]&1]; karma | 帮帮我，我被锁在中国房

17.10.2010 00:21 Jardík | skóre: 40 | blog: jarda_bloguje
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Není v tom od slova paralýza tvrdé y?

Věřím v jednoho Boha.

17.10.2010 01:32 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Tak když to bereš jako grammar nazi, tak je to hlavně paralelizovat. Ale jinak dobrý...

Intel meltdown a = arr[x[0]&1]; karma | 帮帮我，我被锁在中国房

17.10.2010 08:17 xsubway | skóre: 13 | blog: litera_scripta_manet
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

to by už ale nebylo tak vtipný ;-)

17.10.2010 12:28 =^..^= AmigaPower® | skóre: 30 | blog: BLB | Praha
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Rozhodně ne, jde o lízání parašutistů! :-D

I♥DRX * www.KERNELULTRAS.org

17.10.2010 12:33 kotyz | skóre: 25 | blog: kotyzblog | Plzeň
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

para-lízace? :-D

Hrdý člen KERNEL ULTRAS. | Furry/Brony/Otaku | Nemám čas ztrácet čas. | In 'pacman -Syu' we trust!

17.10.2010 12:46 =^..^= AmigaPower® | skóre: 30 | blog: BLB | Praha
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Ano, jde o orální styk při volném pádu... :-D

I♥DRX * www.KERNELULTRAS.org

17.10.2010 13:02 kotyz | skóre: 25 | blog: kotyzblog | Plzeň
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

to musí bejt ultra žůžo :-D

Hrdý člen KERNEL ULTRAS. | Furry/Brony/Otaku | Nemám čas ztrácet čas. | In 'pacman -Syu' we trust!

17.10.2010 21:46 belisarivs | skóre: 22 | blog: Psychobláboly
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

Neni na to Rimmerova direktiva?

"Se zubni protezou se neoddavejte oralnimu sexu ve stavu beztize."

IRC is just multiplayer notepad.

18.10.2010 18:18 Jakub Lucký | skóre: 40 | Praha
Rozbalit Rozbalit vše Re: Jak jsem paralelizoval aplikaci?

To nebyla Rimmerova direktiva, ale direktiva Vesmírného sboru #34124...

Ale jinak je to správně :-)

If you understand, things are just as they are; if you do not understand, things are just as they are.