gcc & icc

nedavno jsem resil, ze bysme si mohli poridit prekladac od intelu a jelikoz se pravidelne opakuje, ze gcc je mizerne optimalizuji prekladac, a ze intel je s vyvojem nekde uplne jinde. (prece jen ma tu vyhodu, ze vi naprosto presne, jak ti mravenci v tech procesorech opravdu pobihaji)

a kdyz jsem zjistil, ze icc by mel podporovat automatickou paralelizaci vypoctu, zacalo to pro me byt jeste lakavejsi sousto. udelal jsem si proto par testu na svych ,,obsesivnich'' prikladech s fibonaccihy cisly.

takze vysledky pro me nejsou moc oslnujici, asi by bylo dobre udelat test i na nejakych "real life" prikladech... ale to uz nechavam na ctenych ctenarich...

Komentáře

Rozumiem tomu dobre ze gcc produkuje rychlejsi kod?

12.11.2007 22:26 miro | skóre: 19 | blog: miro
Rozbalit Rozbalit vše Re: gcc & icc

To som z toho jelen, u seba som dostal podobne vysledky. Pred dvoma rokmi som si napisal nejaky benchmark (gaussova eliminacna metoda : par vnorenych cyklov...) Este pred rokom v nom gcc dopadlo mizerne (vyse 2x pomalsie nez icc), dnes je to tesna vyhra gcc.

Inak, na optimalizacie fibonacciho u mna vyhrala java.

Moje vysledky:

gcc -O3: 5.62s
icc -O3: 6.07s
java:    5.34s

Paralelizacia icc u mna bola viacmenej bez vysledkov na vykon (vramci statistickej chyby...)

icc -O3 -parallel -axT -xO          : 5.99s
icc -O3 -parallel -openmp -axT -xO  : 6.03s

12.11.2007 22:35 miro | skóre: 19 | blog: miro
Rozbalit Rozbalit vše Re: gcc & icc

Pardon, miesal som hrusky s jablkami :-O

Java nebola rychlejsia ako gcc, vysledky gcc a icc ktore som uviedol sa tykaju gaussa, vysledky za javu sa tykaju fibonacciho.

Tu je to opravene: (vysledky pre fibonacciho)

gcc -O3: 3.18s
icc -O3: 6.68s
java:    5.34s

12.11.2007 22:37 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

to s tou javou radsi nerikejte nahlas... ;-] nebo to skonci jako obvykle... nehezkym flamem ;-]

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

13.11.2007 11:24 miro | skóre: 19 | blog: miro
Rozbalit Rozbalit vše Re: gcc & icc

No ved som to rychlo opravil, chybicka se vloudila :-)

gcc je v konkretnom pripade fibonacciho o nieco rychlejsie. Ale ze je uz java pekne rychla, to je fakt. Numericku diplomku som pocital v jave, vo velkej miere v nej vyuzivam collections. Nedavno som skusal optimalizovat (uz ajtak celkom svizne beziaci kod), pustil som to so zapnutym Java Hot Spot a to bola parada. Kedze cely vypocet trva radovo hodiny a pusta sa vo velkom cykle jeden kod dookola, nejakych par sekund navyse pocas prveho cyklu sa oplatilo (u mna patnasobne zrychlenie kodu). Jeden chalan pred dvoma rokmi pocital podobne veci ako ja, robil to cele v C++, vypocet mu bezal radovo dni (5-6 dni)
Trosku som upravil algoritmus, pouzil som javu (ta ale asi nemala taky vplyv, akurat sa mi v nej lepsie pise) a dal som to na tri-styri hodiny. A teraz som zistil, ze so zapnutym hot-spot to dam pod hodinu. Parada.

14.11.2007 10:26 jan.xxx
Rozbalit Rozbalit vše Re: gcc & icc

Link na diplomku by nebyl???

14.11.2007 11:27 miro | skóre: 19 | blog: miro
Rozbalit Rozbalit vše Re: gcc & icc

Zdrojaky programu som nedaval nikam, ale casti kodu tykajuce sa prace s riedkou maticou a so sietou sa chystam spristupnit. Robil som nadstavbu nad software ANGENER, v priebehu mesiaca sa mozno po dohode s doc. Dolejsim na jeho stranke objavi odkaz na moju kniznicu. Potom dam vediet.

Samotna diplomka (pdfko) bude na nete, vecer hodim link.

14.11.2007 14:28 miro | skóre: 19 | blog: miro
Rozbalit Rozbalit vše Re: gcc & icc

Diplomka je uz na nete, ak mas stale zaujem.

15.11.2007 14:24 jan.xxx
Rozbalit Rozbalit vše Re: gcc & icc

Díky. No a kdyby nakonec byl i ten program či knihovna, tak se určitě poděl :-)

Ja mam tedy zkusenosti opacne. Prubezne pouzivam na preklad g95 a ifc na ulohy, jako je treba kombinatorika pocitana pres geneticke algoritmy s minimalizaci slozite funkce, vypocty numerickych integralu s minimalizaci a zpracovani velkeho mnozstvi merenych dat a vysledkem je jednoznacne vetsi rychlost ifc. V zavislosti na konstelaci hvezd i treba 5x.

Vsiml jsem si, ze ale vysledky hodne zalezi na procesorove sade. Totiz ifc si sam voli ten procesor na kterem jede, kdezdo g95 (vsechny prekladace od gnu) voli defaultne i386 komaptibilitu. Ale ani kdyz se rucne nastavi g95 konkretni procesor, tak je to porad tak o 20-30% pomalejsi.

Proste tady ma ifc navrh protoze neni multiplatformi jako gcc a navic "lip vi, jak tam ti brouci behaji". U gnu prekladacu je to dan za neuveritelnou prenositelnost.

3.10.2008 19:09 luky
Rozbalit Rozbalit vše Re: gcc & icc

Nevim jestli jste studoval fungovani gcc (a prekladacu obecne) ale ta dan za prenositelnost se tady prakticky nekona. Vynechame vareni z vody ;)

A je tu základní problém:

1) Optimalizace mikroskopického malého kousku programu o kvalitách optimalizátoru moc neřekne - dnešní kompilátory jsou dost dobré na to, aby se to na pár řádkách kódu projevilo. Tudíž právě proto se dne optimalizuje testuje na velkých reálných programech.

2) Intel kompilátory jsou velmi citlivé na parametry překladu, tedy na parametry příkazové řádky - výsledek se brutálně liší i maličkými změnami parametrů. Prostě buď překládáte rychle, nebo optimálně, zvolíte si procesor i řadu optimalizací přímo na příkazové řádce. Pokud chce někdo testovat kompilátory, měl by si s nastavením parametrů kompilace dát přeci jenom trochu práci.

Já už testy několikařádkových programů a jejich rychlost neberu za seriózní test.

http://ponkrac.net

12.11.2007 23:41 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

1) zkousel jsem to i na jinych aplikacich a vysledek nebyl taky zrovna oslnivy, vetsinou gcc a icc podavali velice podobne vysledky...

2) muzete mi ty parametry poradit? zkousel jsem navic -mtune i nektere dalsi volby, ale bez zadneho relevantniho zlepseni.

3) toto se nesnazi byt serioznim testem, jenom poukazuje na to, ze neni vsechno zlato co se trpiti. btw. jaky test povazujete za seriozni...

4) pokud delate test na necem vetsim, je problem oprostit se od vlivu vnejsiho prostredi -- vliv vstupnich dat, vliv beziciho systemu, vliv cekani na jine udalosti (napr. db, filesystem), atp. takze napsat nenapadnutelny test je nerealne. presto budu rad, kdyz nejaky navrhnete a provedete. btw. pokud resite ulohy opravdu narocne na vypocet, je optimalizace i takto malych kodu vysoce relevantni.

5) osobne me slo hlavne o tu paralelizaci... ten zbytek je jenom vedlejsi produkt...

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

13.11.2007 12:37 Miloslav Ponkrác | blog: miloslavponkrac
Rozbalit Rozbalit vše Re: gcc & icc

No když poukazujete, že není všechno zlato, co se třpytí, tak musíte u toho taky trochu přemýšlet. Jinak dojdete k hovadinám, jako se Vám právě povedlo.

Paralelizace, o kterou Vám šlo má dvě stránky - jednak urychlení výpočtu paralelním prováděním a naproti tomu jsou tu náklady - režie na paralelní běh. Je jasné, že čím kratší kód vyzkoušíte, tím více se projeví hlavně ty náklady a ta režie (tedy cena za paralelizaci), tedy paralelizace nemá šanci ukázat co v ní skutečně je.

http://ponkrac.net

13.11.2007 13:06 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

prominte, ale hovadiny (s prominutim) pisete vy nebo mate problemy s interpretaci textu a vysledku, viz:

icc -O3 -ipo fib.c	        14.640s
icc -O3 -ipo -parallel fib.c	8.935s

je zrychleni o cca 40%, coz je na dvoujadrovem procesoru na hranici praktickych moznosti (kvuli rezii hardwaru i softwaru). a proto pisi: ,,ta paralelizace ma docela hezke vysledky''

v dalsim testu jsem se ji pokusil rozhodit side-effecty, aby se ukazalo, jak to zvladne... a s tim uz si nedokazal poradit, ale to neni rezie -- jinak by to nefungovalo ani v prvnim pripade... navic je zrejme, ze icc zvlada jen paralelizaci smycek a ne volani.

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

Moc se nedivte, že paraelizace nepomohla. Protože program, který se snažíte paraelizovat neobsahuje žádný dobrý paraelizovatelný cyklus. Vyzkoušel bych napsat kód který by násobil velké matice. Tam by to při paraelizaci mělo být znát.

13.11.2007 10:58 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

program obsahuje dobre paralelizovatelny cyklus... v prvnim pripade, zvladl zlepsi rychlost o nejakych 40%, coz se velice blizi praktickym limitum. problem je, ze se ta paralelizace da velice snadno rozhodit side-effectama... (coz me potesilo, protoze muj paralelizujici interpreter schemu se s tim vyrovnal bez vetsich ztrat ;-])

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

13.11.2007 12:09 Jirka P
Rozbalit Rozbalit vše Re: gcc & icc

muj paralelizujici interpreter schemu se s tim vyrovnal bez vetsich ztrat

Smím se zeptat jak? Spoolujete ty side-effecty a třídíte podle času, kdy měly nastat? Nebo je jen vykonáte v nějakém pořadí a tím změníte sémantiku programu? Co děláte, když např. čtete hodnotu, která teprve bude zapsána?

13.11.2007 12:50 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

vyuzivam funkcionalniho charakteru schemu, kde jde velice snadno urcit poradi a zavislost jednotlivych operaci na case, takze jde zachovat semantika u side effectu a tim eliminovat spousta patologickych jevu, napr. zminene cteni hodnot pred jejich zapsanim... a paralelizovat jenom potencialne zajimave casti kodu...

o par blogspotu najdete i jednu ze starsich verzi intepretru, bohuzel text kde popisuju jak to funguje, me bylo doporuceno stahnout... :-/

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

13.11.2007 13:25 Jirka P
Rozbalit Rozbalit vše Re: gcc & icc

Našel jsem toto, ale z toho mi vyplývá, že u side-effectů vpodstatě zastavíte vykonávání, což moc paralelní není... to co se píše v tom odkazu už neplatí?

13.11.2007 13:37 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

jj, ten kod je trochu starsi verze a v nekterych vecech jsem dnes o neco chytrejsi ;-]

s tim zastavenim vykonavani je to trochu slozitejsi... jedine operace, ktere je potreba synchronizovat jsou prave ty s vedlejsimi efekty -- ostatni operace jsou na sobe nezavisle a tudiz interpreter muze pokracovat libovolnou casti redukcniho stromu, ktera tim neni ovlivnena... takze i kdyz treba ceka na provedeni I/O operace, muze resit ulohy, ktere budou nasledovat...

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

13.11.2007 13:50 Michal
Rozbalit Rozbalit vše Re: gcc & icc

Nechte me hadat- stejne to je drtive pomalejsi nez C ekvivalent :-)

13.11.2007 14:24 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

jo, jasne, ja to taky nezatajuji... ono to plyne uz z podstaty, ze je to interpreter... ;-] na druhou stranu se s nimi da vyrazne lepe pracovat -- zavadet nove prvky, zkouset ruzne pristupy, atp. a to nemluvim o portabilite....

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

13.11.2007 15:16 kaaja | skóre: 24 | blog: Sem tam něco | Podbořany, Praha
Rozbalit Rozbalit vše Re: gcc & icc

Omlouvám se, máte pravdu. Ještě mě napadla jedna věc. Když jsem naposledy psal něco paraelniho (už je to par let) tak bylo potřeba před spuštění programu nastavit nějakou proměnnou prostředí, která určovala kolik paraelnich thredu použít. Bohužel to bylo na Sunu a SGI a stejně si ji nepamatuji. Ale pro OpenMP jsem našel, že existuje OMP_NUM_THREADS.

13.11.2007 16:40 miro | skóre: 19 | blog: miro
Rozbalit Rozbalit vše Re: gcc & icc

OpenMP: v pripade icc a nenastavenia premennej OMP_NUM_THREADS sa uvazuje pocet procesorov (jadier) v systeme. Trochu som s tym experimentoval, ale asi nepisem pre paralelizaciu spravny kod, pretoze zlepsenie vysledkov sa nedostavilo :-(

Já osobně jsem měl dojem, že je icc lepší hlavně v případě optimalizace C++ kódu . Pro C je gcc šikovné už teď. Ohledně C++ začalo být použitelné teprve od čtyřkové větve.

Možná by to chtělo vzít několik velkých projektů (třeba zaměřených na numerické výpočty) a pustit testy na nich.

When your hammer is C++, everything begins to look like a thumb.

13.11.2007 10:47 miho | skóre: 24 | blog: Mihovy_sochory | Orlová
Rozbalit Rozbalit vše Re: gcc & icc

nbench 2.2.2, kod v C, testuje razeni ciselne a retezcove, operace nad bitovymi poli, FFT, huffman, sifru idea, neutonovou sit...

gcc -march=nocona -O3

MEMORY INDEX        : 27.356
INTEGER INDEX       : 25.623
FLOATING-POINT INDEX: 42.247

icc -O3 -axT -xT

MEMORY INDEX        : 22.976
INTEGER INDEX       : 32.503
FLOATING-POINT INDEX: 78.696

icc -O3 -axT -xT -parallel

MEMORY INDEX        : 23.318
INTEGER INDEX       : 32.532
FLOATING-POINT INDEX: 78.393

-ipo vykon vyrazne snizilo...

Prevaha icc v necelociselnych vypoctech je brutalni.

13.11.2007 11:03 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: gcc & icc

tak i v tomto pripade je gcc velice dustojny souper

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

icc -O3 fib.c	14.787s
icc -O3 -ipo fib.c	14.640s
icc -O3 -ipo parallel fib.c	8.935s
gcc -O3 fib.c	6.646s

icc -O3 -ipo fib.c	14.522s
icc -O3 -ipo -parallel fib.c	14.209s

gcc & icc

Hodnocení: 100 %

Komentáře