Portál AbcLinuxu, 8. května 2025 22:48
Zdravím,
tento dotaz je primárně směřován na ženy/muže orientující se v problematice programovaní a kompilace ve fortranu ale ani ostatní se nemusí cítit odstrčeni.
Popis problému:
Program na řešení soustavy parabolických PDE (trubkový reaktor s axiální disperzí), napsaný ve fortran90
(z důvodu dynamické alokace polí) a FORTRAN77
(rutiny na řešeni PDE), byl zkompilován Intel Fortran Compiler For Linux verze 10.1 20080312. Pokud je program zkompilován v debug modu (s parametry -
g -debug all
) běží vše v pořádku, resp. je dosažen smysluplný výsledek*. Pokud ale je použita při kompilaci optimalizace (-O2
a výše) solver DDASPK
, který má za úkol numerické řešení prostorových derivací, se ukončí z důvodu neschopnosti vypočíst YPRIME
(první derivace funkce y - definované uživatelem).
Nejde zde ani tak o problém fyzikální (věřím že fyzikální podstata problému je naprogramována správně), ale spíše programátorský. Jak může obecně optimalizace zdrojového kódu kompilátorem ovlivnit numerickou stabilitu výpočtu? Dočetl jsem se, že během optimalizace dochází k vektorizaci vybraných smyček-cyklů není zde podstata výše uvedeného problému? Setkali jste se už někdy s rozdílným chováním programu zkompilovaného v debug modu a optimalizovaného (jedno v jakém programovacím jazyku)?
Dík za Vaše zamyšlení nad problémem,
Milan
* Smysluplným výsledkem je myšlen ten, který splňuje zadání úlohy a poskytuje reálné (fyzikální) hodnoty, jako třeba kladné absolutní teploty, respektuje zákon zachování hybnosti, hmoty a energie.
HA! Tak formulace problému zde nafóru mi pomohla najít vhodnou formu dotazu pro google!:
computation result differs with Optimize/Debug versions
A výsledky se začaly hrnout. Třeba hned jeden z prvních odkazů:
http://www.flounder.com/debug_release.htm
se zdá být nanejvýš relevantní.
No budu pokračovat v samomluvě. Našel jsem to co je nejspíše příčinou mého problému. Níže uvedený odkaz obsahuje sice obecnou přednášku, ale na stránce 7 je přesně popsáno, co způsobuje "horlivá" optimalizace za bordel.
www.cs.berkeley.edu/~wkahan/Mind1ess.pdf
Dík za napad s paralelním výpisem z neoptimalizovaného a optimalizovaného programu a sledovat kde dochází ke změně. Jinak optimalizace začne produkovat jiné výsledky když použiju -O2. Když přidám -fltconsitency tak problém zmizí.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.