Různé výsledky výpočtu na různých procesorech? (diskuse)

Právě sem pařil asi dvě hodiny dooma a když jsem viděl ty obrázky tak sem si říkal jestli to náhodou nejsou nějaké bitmapy z něj ;)

12.5.2007 23:39 fakenickname | skóre: 42 | blog: fakeblog
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

btw dik za tip na to metacentrum.. ani sem nevedel ze muzu delat s necim takovym.. uz premyslim cim bych to vyzkousel ;)

12.5.2007 23:43 Michal Fecko | skóre: 31 | blog: Poznámkový blog
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

Tak na to moze mat vplyv IMHO asi cez milion faktorov, od nejakej chyby v programe spracuvavajucom vstupne data cez nastavenia systemovych kernelov (volby jadra, praca s pamatou a pod) az po zle postavenie planet :-D

Fakt, to by clovek za tym musel sediet hodiny (a aj tak by na nic nemusel prist :-)

)

12.5.2007 23:47 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

No postavení planet by se uplatňovalo jen a pouze kdyby se chyby nedaly reprodukovat. Pokud pro stejný vstup dostane stejný výstup na stejném stroji v čase t1 i t2 tak se postavení planet, které je nepochybně závislé i na čase neuplatňuje. (za předpokladu, že t1 není rovno t2) Spíš bych sázel na jinak nastavené systémy. Jiné verze distribucí, kernelů a důležitých knihoven.

13.5.2007 10:25 Věroš | skóre: 24 | blog: Co není v hlavě | 49.29 s.š., 16.54. v.d.
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

Ty obrázky jsou stromy, konkrétně smrky, z nadiru (z kolmého pohledu zezhora).

Školím Ansible

14.5.2007 17:59 mess | skóre: 43 | blog: bordel | Háj ve Slezsku - Smolkov
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

Tak to bych nepoznal :-)

. Ale ten první obrázek se mi líbí víc. To je ten z Xeonu, ne? :-)

Cez párne mesiace zošíváš vaginy, cez neparne montuješ hajzle.

Každý fpu (floating point unit) lze u x86 procesoru nastavit do stovek různých režimů, například jde nastavit přesnost, způsob zaokrouhlování, a řada dalších věcí (k nahlédnutí viz nějaká příručka asm pro x86). Existují na to dokonce řídící registry, kde se to nastavuje.

Takže podle nastavení vám jednou fpu může počítat s přesností na x míst a zaokrouhlovat třeba na nejbližší číslo. Podruhé třeba fpu může počítat s přesností na y míst a zaokrouhlovat usekáváním.

Obvykle operační systém nastaví fpu do nějakého defaultníhoé režimu, ale proces to má pevně v rukou, stačí, aby nějaká knihovna, a nebo třeba vy si na začátku pevně nastavil fpu do stejného režimu.

Kromě toho samozřejmě není vyloučeno a je to dokonce pravděpodobné, že fpu se na obou vámi zmíněnných procesorech liší - floating point je jen o přibližných výpočtech.

http://ponkrac.net

13.5.2007 10:44 andree | skóre: 39 | blog: andreeeeelog
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

to som nevedel, ze sa to da nastavovat :) ale keby som nieco pocital a potreboval exaktny vysledok, asi by som sa nespoliehal na FP unit procesoru - prave kvoli vsetkym moznym "optimalizaciam", ktore mozu byt v procesore... uz len ked si predstavim, ze pri operaciach s floatom v niektorych pripadoch clovek nemusi dostat presne cislo ani na 1 desatinne miesto... kludne ked chce clovek presne cisla, treba pouzit integer (dobry paradox) :-)

13.5.2007 13:18 Kyosuke | skóre: 28 | blog: nalady_v_modre
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

Existují na to dokonce řídící registry, kde se to nastavuje.

A funkce v glibc. ;-)

Co mi ale přijde divné, je, že by ten algoritmus byl takhle citlivý na zaoukrouhlovací chyby. Tohle je, BTW, také výstižné:

Many programmers like to believe that they can understand the semantics of a program and prove that it will work correctly without reference to the compiler that compiles it or the computer that runs it. In many ways, supporting this belief is a worthwhile goal for the designers of computer systems and programming languages. Unfortunately, when it comes to floating-point arithmetic, the goal is virtually impossible to achieve. The authors of the IEEE standards knew that, and they didn't attempt to achieve it. As a result, despite nearly universal conformance to (most of) the IEEE 754 standard throughout the computer industry, programmers of portable software will have to continue to cope with unpredictable floating-point arithmetic for the foreseeable future.

(zdroj)

Jak moc jsou ábíčkáři inteligentní? ;-)

Jestliže do dvou soudobých počítačů pošlu ta stejná data do stejného algoritmu, pak skutečně lehce můžu dostat různé výsledky. Ne ani tak proto, že by se lišil počet významných bitů, či způsoby zaokrouhlování. Od dob přijetí standardu IEEE 754 a IEEE 854 by se počítače zavedených výrobců měly v tomto chovat stejně.

Jednou z příčin, kde se i přes standardizaci může objevit rozdíl, je tzv. FMA (fused multiply add). Čili hardwarová architektura, která dokáže spojit násobení a sčítání a zvyšit tak efektivitu. Skutečně, ona operace

A = B + C*D

je velmi užitečná operace v mnoha numerických úlohách, a tak se vyplatí mít ji "speciálně zadrátovanou". Namátkou, využijete ji velice silně při násobění matic, při řešení jakýchkoliv rekurentních rovnic atd.

A teď, kde je problém? Uvažujte například násobení dvou komplexních čísel (z a z'=z_komplexne_sdruzene) ve floatové aritmetice:

z = x+iy z' = x-iy

Jejich součin je zřejmě: zz' = (x+iy)(x-iy) = x^2+y^2+i(yx-xy) = x^2+y^2

Tedy čistě reálné číslo. Avšak při použití FMA je možné získat velice malinkou komplexní složku. To prostě proto, že procesor s FMA počítá imaginární složku ne jako


temp1 = y*x
temp2 = x*y (ale na pořadí samozřejmě nezáleží)
imag_slozka = temp1-temp2

což by byla skutečně ryzí nula, nýbrž jako


temp1 = y*x
imag_slozka = temp1 - x*y

Z hlediska vnesení zaokrouhlovacích chyb, mezi dvěma výše uvedenými kroky je samozřejmě výrazný rozdíl. V prvním případě jde o tři operace, a tak je zaokrouhlovací chyba vnesena třikrát. Ve druhém (FMA) případě je zaokrouhlování prováděno pouze dvakrát.

Že si nevymýšlím, je možné vidět na následujícím příkladě v Octave


octave:1> A = rand(3,3) + j*rand(3,3)

A =

  0.20974 + 0.43455i  0.50108 + 0.38016i  0.24643 + 0.90169i
  0.33751 + 0.39598i  0.22127 + 0.58548i  0.58724 + 0.88980i
  0.84237 + 0.18959i  0.67795 + 0.99298i  0.33828 + 0.00156i

octave:2> C = rand(3,3) + j*rand(3,3)

C =

  0.213787 + 0.961981i  0.469730 + 0.922373i  0.560915 + 0.462651i
  0.930401 + 0.763539i  0.146290 + 0.423445i  0.015814 + 0.004987i
  0.286520 + 0.579304i  0.581899 + 0.806029i  0.685377 + 0.171148i

octave:3> A = C'*C

A =

  2.83744 - 0.00000i  2.08081 - 0.07856i  0.87902 - 0.79612i
  2.08081 + 0.07856i  2.26041 + 0.00000i  1.23141 - 0.75886i
  0.87902 + 0.79612i  1.23141 + 0.75886i  1.02798 - 0.00000i

octave:4> A - A'

ans =

  0.00000 - 0.00000i  0.00000 + 0.00000i  0.00000 + 0.00000i
  0.00000 + 0.00000i  0.00000 + 0.00000i  0.00000 + 0.00000i
  0.00000 + 0.00000i  0.00000 + 0.00000i  0.00000 - 0.00000i

Na první pohled to možná vypadá, že jsme skutečně dostali nulu, ale nenechte se zmást:


octave:5> format hex

octave:6> A - A'
ans =

 Columns 1 and 2:

  0000000000000000  bc91200000000000i  0000000000000000  3c90000000000000i
  0000000000000000  3c90000000000000i  0000000000000000  3c70800000000000i
  0000000000000000  0000000000000000i  0000000000000000  0000000000000000i

 Column 3:

  0000000000000000  0000000000000000i
  0000000000000000  0000000000000000i
  0000000000000000  bc8a000000000000i

Shrnutí: při srovnávání výsledků numerických výpočtů na různých platformách je nutné dnes brát i v úvahu přítomnost či absenci, povolení či zakázání některých novějších technologií jako například FMA (a možná i jiné, nevím, nejsem expert).

15.5.2007 08:45 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

Díky za uvedení do problematiky. Poslední dobou se mi stávalo, že mi za určitých situací vycházely blbě kontrolní součty velkých souborů.

15.5.2007 09:40 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

Kontrolní součty se ale počítají celočíselně. A tam musí výsledky přesně sedět, ať je spočítáte kdekoliv. Ty samé druhy výpočtů se provádějí např. i u elektronického podepisování (koneckonců i u šifrování), a rozhodně není přípustné, aby elektronický podpis na jednom PC byl ověřen a na jiném by se dokument zdál porušený. Nebo aby na jednom počítači bylo možné dokument rozšifrovat, a na jiném ne.

16.5.2007 11:28 xvasek | skóre: 21 | blog: | Zlín
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

K tomu bych jenom přidal, že aby byly výsledky alespoň porovnatelné, musí být výpočet stabilní - tzn. práce se zaokrouhlovací chybou musí být udělaná pro všechny výpočty (během těch několika hodin) tak, aby byl její vliv vždy zanedbatelný. Zde uvedený případ očividně moc stabilní není.

16.5.2007 11:39 Věroš | skóre: 24 | blog: Co není v hlavě | 49.29 s.š., 16.54. v.d.
Rozbalit Rozbalit vše Re: Různé výsledky výpočtu na různých procesorech?

Ano, to mne taky napadlo, že ten výpočet není numericky stabilní - i když mne to vzhledem k povaze výpočtu překvapuje.

Počkám na novou verzi a budu to reportovat autorům (o důvod víc, proč mám rád open source, tam si to můžu najít a opravit sám, což tady u closed-source nejde :-(

)

Školím Ansible