AbcLinuxu:/ Články / Nová architektura NVIDIA Fermi

Štítky: AbcLinuxu, ATI, audio, C, C++, databáze, Debian, distribuce, Gentoo, GNOME, grafické karty, grafika, hardware, IDE, instalace, Internet, KDE, kernel, kompilace, komunikace, Linux, Microsoft, multimédia, nVidia, ovladače, práva, problém, programování, prohlížeče, sběrnice, server, sítě, software, SUSE, textové editory, Ubuntu, USB, Vim, web, Windows

Nová architektura NVIDIA Fermi

1. 10. 2009 | David Ježek | Hardware | 7897×

Krátce před půlnocí evropského času zahájil president firmy NVIDIA Jen-Hsun Huang letošní ročník GPU Technology Conference. Kromě řady novinek v oboru zde bude kalifornská NVIDIA prezentovat svou nejnovější chystanou architekturu GPU, kterou jste dosud mohli znát pod chybným, ale všeobecným konsenzem tolerovaným označením „GT300“. Skutečnost je jiná, nová architektura nese jméno Fermi a slibuje celou škálu evolučních změn. Přirovnat se dá minimálně ke skoku, který NVIDIA udělala v roce 2006 s GPU G80.

Úvodem

link

Na úvod si řekněme pár slov k historii předcházející architektuře Fermi. Až do roku 2006 měla GPU oddělené pixel a vertex shadery a celkově tak byla velmi neefektivní ve svém konání, bez ohledu na prakticky mizivou (víceméně nulovou) možnost jakýchkoli obecných výpočtů. Změnu přineslo GPU NVIDIA G80 alias GeForce 8800 GTX, která přinesla unifikované shadery a první verzi programovací částí známé jako CUDA (Compute Unified Device Architecture). NVIDIA své rozhraní postupně inovovala, aktuálně jsme na verzi 2.3. Později přišlo též architektonicky inovované GPU GT200 známé z GeForce GTX 280 a jejích kolegyň. Třetím krokem v této řadě směřujícím k téměř finální unifikaci je NVIDIA Fermi.

Fermi není primárně vyvinuto jako grafický procesor pro hraní her. Samozřejmě toto podporuje, ale tím nejdůležitějším pro něj jsou výpočty. Za tímto účelem přináší řadu vylepšení, z nichž se sluší jmenovat implementaci ECC u pamětí, vyrovnávací paměti L1 a L2, zvětšení sdílené paměti, rychlejší přepínání obsahu mezi grafikou a výpočty a rychlejší atomické operace.

Na svět se tak pomalu blíží třetí generace Streaming Multiprocessoru NVIDIA, kde každý ve Fermi nese 32 CUDA jader (4× více než GT200). Výpočetní jednotky Fermi poskytují 8× tolik výkonu v double-precision než GT200, dual war scheduler umí obsluhovat 32 threadů/takt a celkově 64kB paměť je konfigurovatelná jako sdílená paměť a L1 cache, dle přání programátora (buď jako 16+48 kB, nebo jako 48+16 kB).

Druhá generace Parallel Thread Execution ISA nese další hlavní inovaci, a sice unifikovaný adresní prostor s plnou podporou jazyka C++ a s tím související optimalizace pro OpenCL a DirectCompute a plnou podporu IEEE 754-2008 v 32 (single) i 64bit (double) přesnosti (totéž umí ATI Radeon HD 58x0). NVIDIA zapracovala i na predikci v rámci čipu, která též zrychluje. Paměťový subsystém schovává pod označením Parallel DataCache konfigurovatelnou L1 a unifikovanou L2 cache, všechny paměti mají podporu ECC a zlepšený výkon v atomických operacích.

Nová generace GigaThread Engine slibuje 10× rychlejší přepínání aplikačního obsahu, souběžné spouštění kernelů, out of order spouštění bloků výpočetních a dualitu překrývajících se engine paměťových přenosů.

Jak Fermi počítá

link

To hlavní z hlediska programátora úvodem: Připomenu, že CUDA jako architektura umí spouštět na GPU programy psané v C, C++, OpenCL, DirectCompute nebo třeba také ve Fortranu. Hlavní program volá kernely, které jsou vykonávány paralelně. Míru paralelismu může programátor řešit ručně v kódu, nebo to nechá na systému. Thready jsou organizovány do bloků a ty pak do větších celků.

Daný blok je vždy sekvencí několika současně vykonávaných threadů, které mohou spolupracovat přes synchronizační bariéru a sdílenou paměť. Fermi uřídí v jeden okamžik až 1 536 souběžně běžících threadů, opět významný nárůst proti předchozí generaci.

nvidia fermi cuda001

Jak již jsme si řekli, Streaming multiprocessor nese 32 CUDA jader, tudíž vykonává thready ve skupinách po 32. Takováto skupina se nazývá warp. Je na programátorovi, zdali se bude držet při programování jednoho threadu, nebo využije možné paralelizace v rámci CUDA.

Architektura

link

Zatímco GPU Radoenu HD 5870 by se svými 2,15 miliardami tranzistorů a 40nm výrobou mohlo komukoli připadat jako bomba (a nebudu to ani na chvíli popírat), NVIDIA jde s Fermi ještě dále. GPU nese při stejné 40nm výrobě rovné 3 miliardy tranzistorů a to byl (stále je?) patrně také dílčí kámen úrazu v podobě komplikací s výtěžností jeho výroby.

Jader CUDA, volně a archaicky řečeno „shaderů“, obsahuje Fermi rovnou 512, což představuje nárůst o 113 % oproti 240 v GT200. Jsou organizována v 16 streaming multiprocesorech po zmíněných 32. GPU má k dispozici šest 64bitových paměťových částí, celkově tedy 384bitové paměťové rozhraní, které může využívat až 6 GB pamětí GDDR5. To předpokládejme jako hodnotu pro výpočetní karty rodiny Tesla, které se objeví jako první. Základem bude na desktopových kartách GeForce dle mého 1,5 GB, vyšší modely a karty Quadro přinesou i 3GB variantu.

Komunikace čipu se systémem probíhá pochopitelně po sběrnici PCI Express. Modrá část schématu vlevo obsahuje GigaThread Scheduler, rozhraní PCI Express a část paměťového systému, pravá zbytek paměťového subsystému. Zelené bloky jsou výpočetní části, k nim přísluší jim společná L2 cache.

Streaming Multiprocessory

link

Každé CUDA jádro obsahuje jednu Integer ALU – Arithmetic Logic Unit – a jednu FPU. Plná podpora IEEE 754-2008 je novinkou této generace, stejně jako instrukce fused multiply-add (FMA) pro single i double-precision. FMA realizuje multiply-add beze ztráty přesnosti výpočtu při sčítání.

Nová Integer ALU nese optimalizace pro 64bit a extended přesnost a podporuje aritmetické, posuvné, logické, porovnávací, převodní a přesouvací operace. Každý Streaming Multiprocessor (SM) blok nese 16 load/store jednotek pro výpočty 16 zdrojových a cílových adres pro výpočetní vlákna v jediném taktu. Příslušná data se načítají/uchovávají v cache nebo DRAM.

Special Function Units (SFU) jsou celkem čtyři pro každý SM a realizují transcendentní funkce (sin, cos, reciproční a kvadratické). Každá SFU zvládne jednu instrukci pro dané výpočetní vlákno za takt; celý warp je spouštěn každých osm taktů. SFU pipeline je oddělena od dispatch jednotky, což umožňuje této jednotce využívat další výpočetní jednotky zatímco SFU pracuje na něčem jiném.

Dual Warp Scheduler

link

nvidia fermi cuda005

SM ve Fermi obsahuje Dual Warp Scheduler a dvě instruction dispatch unit, což umožňuje zpracovávat dva warpy najednou. DWS vždy vezme dva warpy, jednu instrukci z každého z nich a přiřadí je skupině šestnácti CUDA jader, šestnácti load/store jednotkám nebo čtyřem SFU. Warpy jsou vždy vykonávány okamžitě, což umožňuje dosahovat téměř maximální dosažitelný výkon. Většina instrukcí může být realizována touto duální cestou: Dvě integer instrukce, nebo dvě floating instrukce, nebo mix integer a floating, načítání, uchovávání a SFU instrukce; vše může být zpracováváno současně.

S nově konfigurovatelnou L1 cache resp. sdílenou pamětí může být Fermi až třikrát rychlejší na stejném kódu než předchozí generace. Pokud programátor do aplikace nezabudoval využití sdílené paměti, bude tato nyní automaticky těžit z L1 cache.

Second Generation Parallel Thread Execution ISA

link

Fermi jako první u NVIDIE podporuje Parallel Thread eXecution (PTX) 2.0, což je nízkoúrovňová virtuální mašina a ISA (Instruction Set Architecture) navržená pro paralelní operace. PTX instrukce programů jsou ovladačem GPU překládány na strojové instrukce. PTX jako celek má za úkol nabídnout ISA přeživší několik generací GPU, zajistit maximální využití výkonu GPU, nezávislé ISA pro C, C++, Fortran a další jazyky, code distribution ISA pro vývojáře aplikací a middlewaru, společné ISA pro generátory a překladače kódu, usnadnit psaní knihoven a výkonných kernelů a nabídnout škálovaný programovací model, který se přizpůsobí velikosti GPU od několika jader až po mnoho paralelních jader. PTX 2.0 bylo primárně navrženo vedle jazyků jako OpenCL a DirectCompute pro programovací jazyk C++ a jeho plnou podporu.

S tím souvisí jednotný adresní prostor (pro C++), který sjednocuje tři dosud oddělené adresní prostory (threadový lokální privátní, blokový sdílený a globální) pro načítání a uchovávání operací. Dosud bylo obtížné až nemožné implementovat C a C++ ukazatele, neboť cíle ukazatelů v adresním prostoru nemusely být v momentě kompilace známy a bylo možné je určovat pouze dynamicky za běhu.

Na architektuře Fermi definovaný 40bitový adresní prostor podporuje až 1 TB adresovatelné paměti, ISA pro načítání a ukládání podporuje až 64bitové adresování pro budoucí růst parametrů.

nvidia fermi cuda007

Nechybí ani podpora virtuálních funkcí, ukazatelů na funkci a operátorů „new“ a „delete“ pro dynamickou alokaci objektů a dealokaci. Též jsou podporovány operace pro výjimky „try“ a „catch“.

Optimalizace pro OpenCL a DirectCompute

link

Oba nové GPGPU standardy jsou původní implementaci v CUDA velmi podobné, takže s nimi nebude nejmenší problém. Fermi disponuje i hardwarovou podporou pro OpenCL a DirectCompute surface instrukce s konverzí formátu, což umožňuje grafickým a výpočetním programům jednoduše pracovat s těmi samými daty. PTX 2.0 ISA přidává i další DirectCompute instrukce jako population count, append a bit-reverse.

IEEE 32bit Floating Point

link

Instrukce single-precision floating point nově podporují subnormální čísla a také zaokrouhlovací módy IEEE 754-2008 (nearest, zero, positive infinity a negative infinity). GT200 a dřívější takové subnormální hodnoty vypouštěly a dávaly hodnoty jako nula, což vedlo ke ztrátě přesnosti výpočtů.

nvidia fermi cuda008

Paměťový subsystém

link

Parallel DataCache, konfigurovatelná L1 a unifikovaná L2 cache

link

NVIDIA si v minulosti na mnoha GPGPU aplikacích ověřila, že někde je vhodné použít sdílenou paměť, jinde zase cache. Proto je implementován systém konfigurovatelné 64kB paměti, jak jsem uvedl výše.

nvidia fermi cuda009

Vedle toho Fermi obsahuje sdílenou 768kB L2 cache, ta obstarává požadavky pro načítání, ukládání a texturování.

Fast Atomic Memory Operations

link

nvidia fermi cuda011

Atomické paměťové operace jako add, min, max a compare-and-swap jsou atomickými v tom smyslu, že čtení/modifikace/zápis jsou prováděny bez přerušení jinými thready. Jsou využívány pro třídění, redukční operace, paralelní budování datových struktur atd. Kombinací několika atomických jednotek v hardwaru a přidání L2 cache je vykonávání těchto operací na Fermi výrazně rychlejší. Atomické operace vůči dané adrese vykonává Fermi až 20× rychleji než GT200, operace do kontinuálních paměťových oblastí až 7,5× rychleji.

10x rychlejší přepínání aplikačního obsahu

link

Pipeline ve Fermi nese optimalizace za účelem co nejrychlejšího přepínání výpočtů tak, aby docházelo k co nejmenším ztrátám. Přepnutí obsahu se podařilo srazit na interval 10 až 20µs, díky čemuž mohou programátoři využívat ve větší míře jen s minimální ztrátou výkonu GPU interkernelovou komunikaci jako třeba kooperaci mezi grafickou a PhysX částí aplikace.

Souběžné vykonávání kernelů

link

Fermi umí v jednom daném okamžiku počítat více kernelů současně. Padá tedy vlastnost předchozích generací, kdy byla nemalá část výkonu nevyužita, nyní se vše smrskává pouze na omezení, že dané úlohy musí být shodného obsahu. Rozdílné je nadále možné vykonávat pouze „po sobě“, ale aspoň mohou těžit z již zmíněného rychlejšího přepínání.

NVIDIA Nexus

link

Krátce na závěr doplním, že NVIDIA připravila pro Fermi nástavbu Microsoft Visual Studia, vlastní vývojové prostředí Nexus. V něm je možné psát, ladit, debuggovat a tak vůbec všechny aplikace, ať již jsou psány v CUDA C, OpenCL či třeba DirectCompute. Nechybí ani podpora pro výkonnostní analýzu, možnost zaměřit se při debuggingu na jediný threadový výstup z tisíců paralelně běžících či možnost vizualizovat výsledky počítané všemi paralelními thready. O podpoře pro *nixová IDE se zpráva nezmiňuje.

Závěr

link

Nyní je čas odhlédnout od faktů a podívat se na NVIDIA Fermi trochu subjektivně. Jistě jste si při bedlivém čtení všimli, že nezaznělo byť jediné slovo o reálném výkonu GPU, jeho chování ve hrách, ani slovo o tom, zdali bude na kartě DisplayPort, ani slovo o ničem v souvislosti s hrami, multimédii, spotřebou a tak vůbec. Ano, dnes NVIDIA provedla pouze papírové představení parametrů architektury, na které postaví budoucí generace svých GPU.

Jasně v tom cítím směřování nikoli ke hrám, ale k výpočtům. Ve hrách už se pomalu blížíme k pomyslnému stropu. Stále je sice možno nabídnout řadu skvělých technologií, mnoho takových v čele s tesselací nabízejí Radeony HD 5870, ale rasterizace jako taková možná dle pohledu NVIDIE mele z posledního (vzpomeňme, že její vůbec první grafický čip nepodporoval rasterizaci, nýbrž pracoval hardwarově s vektory) a NVIDIA tak hledá jiné cesty, z nichž jedna může být shodná s intelovským Larrabee: raytracing. Ten se pochopitelně počítá, a to je věc, která Fermi, i s ohledem na firemní zkušenosti a softwarovou podporu, půjde výborně.

Na jakákoli reální měření si však ještě nějakou dobu počkáme. Jak dlouho to bude, toť otázka, minimálně z hlediska herních karet GeForce opravdu netuším. Za jedno ale jistě mohu dát ruku do ohně: Fermi bude mít směrem k Linuxu náruč otevřenou daleko víc, než ji má Radeon HD 5870. A to se na tomto serveru rozhodně počítá.

Nejvýkonnější superpočítač

link

Mimochodem, Jen-Hsun také oznámil, že Oak Ridge National Laboratory postaví s pomocí GPU NVIDIA nejrychlejší superpočítač na světě, který bude 10× výkonnější než dosavadní držitel rekordu.

Hodnocení: 85 %

špatné • dobré

Nástroje: Tisk bez diskuse

Tiskni Sdílej:

Komentáře

Nástroje: Začni sledovat (0) ? , Tisk

Vložit další komentář

1.10.2009 02:48 Zadejte vaše jméno
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Odpovědět | Sbalit | Link | Blokovat | Admin

HW podpora raytracingu i pro mainstream, tj. x86? Pěkně, konečně budou hry vypadat realisticky a nebudou omezeny zaostalým DX 11, na tomto hardware si budou vývojáři moci naprogramovat cokoliv. Nvidia ihned dodá nástroje k tvorbě, na nic se nebude muset čekat.

1.10.2009 06:44 xxxx
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

raytracing za behu hry, to se nedivim, ze se snazi o co nejvykonnejsi GPU.

1.10.2009 10:48 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Intel už představil první demonstrační video herní scény (Quake Wars). Sice to pořád nejede na dedikovaném HW, ale je to počítáno přes hezkou řádku xeonových jader (24), ovšem dalo by se to hrát.

http://www.youtube.com/watch?v=G-FKBMct21g
http://n-joy.cz/video/n-joy/xsj7e9jlssj2th5n

Raytracing je algoritmus jako dělaný na mutlithreading (jestli půjdou GK směrem univerzálních procesorů - zatím jsou dělané hlavně pro rasterizaci - tak se za 4-5 let můžeme dočkat prvních her a o pár let pozdějí i tříáčkových titulů a tradiční výrobci GK to stihnou rychleji než Intel), v podstatě lze každý paprsek trasovat na jednom jádře. Problémem je paměťová propustnost, kterou v návrhu Fermi mají také vyřešenou.

Heron

3.10.2009 14:18 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

To jako, že už konečně bude ve hrách možno potkávat něco jako toto, ale jen v reálném čase?

Pozn. pod čarou: rok výroby, léta páně 97-98.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

3.10.2009 21:36 cezz | skóre: 24 | blog: dm6
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

No myslim, ze zhruba takto vyzeraju hry momentalne :)

Computers are not intelligent. They only think they are.

3.10.2009 21:46 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Hry již nějaký ten rok vypadají lépe než to video.

Heron

3.10.2009 21:52 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Hry

Jako třeba to demonstrační video z QuakeWars?

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

3.10.2009 22:15 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

To demonstrační video vypadá (až na ty zrcadlové koule a podobné dodělávky pro zdůraznění použití raytracingu) úplně stejně jako ta dva roky stará hra. Ani tehdy to nebyla grafická špička.

V tom tvém videu není raytracing potřeba, to se běžně zvládá rasterizací.

Heron

3.10.2009 22:22 Grunt | skóre: 23 | blog: Expresivní zabručení | Lanžhot
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Ano, skutečně to nebyla zrovna narážka na komplexnost vykreslování, ale spíš na vše ostatní. Co třeba takové prostředí nebo pohyby kamery? Které z těch dvou více odpovídá realitě? Já se furt nemůžu zbavit pocitu, že už tak posledních 10 let hraju furt nějak obměňovaný Quake 3 Arena.

Na co 64-bitů když to jde i s jedním? | 80.78.148.5 | Hack (for) free or Die Hard!

3.10.2009 22:40 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Asi hraješ špatné hry, ačkoliv teď jsi tam moc uhnul, že vlastně nevím kam míříš.

Pohyb kamery - ve in engine video sekvencích to dnes najdeš běžně včetně motion bluru a hrou s bloukou ostrosti. Ale to se opět týká vykreslování. Vedení kamery je, stejně jako v tom tvém videu, na režisérovi.

Prostředí - mnoho her má komplexnější. Ať již Fallout 3, Far Cry 2, nebo onlinovky typu LOTR nebo třeba vesmírných EVE Online. Vesmír se simuluje snadno, tam nikdo z hráčů nebyl :-)

. Tam někde bych hledal to tvoje video. Kompletně spálený Far Cry 2 by se tomu hodně blížil zjevem krajiny. :-)

Koridorové 3D střílečky vypadají pořád jako Quake Arena, protože jsou to prostě koridorové střílečky. Nevím, jakou odpověď očekáváš. Dneska jsem si zahrál Batman Arkham Asylum se softwarovým PhysX. Ano, ta hra vypadá úchvatně, ale bez efektní fyziky je to prostě jen jiný Bioshock nebo UT3. A pokud si to koupím, tak to bude jen k vůli zpracování hlavní postavy, stejně jako STALKER mám jen kvůli Černobylu. Jinak má u mě Batman 60% (tuctovka na starém engine) a STALKER 35% (bugovatost).

Heron

4.10.2009 00:11 Drom | skóre: 24 | Kdyne
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

"stejně jako STALKER mám jen kvůli Černobylu"

4.10.2009 21:40 cezz | skóre: 24 | blog: dm6
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Já se furt nemůžu zbavit pocitu, že už tak posledních 10 let hraju furt nějak obměňovaný Quake 3 Arena.

Presne ten isty pocit som mal, nez som kupil PS3.. Ako uz pisal niekto vyssie, uz narazis aj na hry, ktore to tvoje video tromfnu. (Napriklad Mirrors Edge, Motorstorm, Pripadne niektoru z Brothers in Arms serie - teda spon tie som hral/hram)

Computers are not intelligent. They only think they are.

1.10.2009 07:45 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Odpovědět | Sbalit | Link | Blokovat | Admin

To už vyzerá tak že k tomu dorobia pár USB konektorov, vlastný zdroj a je tu ďaľšia rodinka počítačov NVIDIA.

KERNEL ULTRAS video channel >>>

1.10.2009 08:28 radek
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Taky mi to tak pripada... stejne jak nejaka rada notebooku toshiba ma v sobe 4xrisc 1,5GHZ 128bit procesor :) pri prevodu na 1080p video to nevytizi procesor ani na procento... avsak ma to nevyhodu, ze ty aplikace musi byt na to stavene (stejne jak vlaste cuda...), takze tam jde jen prehravat video,vypalovat, neco ve stylu mysi-ze to detekuje pomoci webkamery prst a pak nepouzivate mys, ale vas prst atd atd,...

2.10.2009 00:53 Drom | skóre: 24 | Kdyne
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

...stejne jak nejaka rada notebooku toshiba ma v sobe 4xrisc 1,5GHZ 128bit procesor...

Ktera, sakra, clovece, nenapinejte me!

2.10.2009 10:17 Suchý čert
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

S tím převodem na 1080p video je to ale tak trochu podvod, protože součástí toho procesoru je i hardwarový H.264 enkodér. ;-)

1.10.2009 10:16 vcbhn
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Odpovědět | Sbalit | Link | Blokovat | Admin

Článek dobrej. jen by měl zajímal názor autora jakej že vlastně je pomyslnej strop ve hrách, nějak to nechápu ?

"Ve hrách už se pomalu blížíme k pomyslnému stropu."

1.10.2009 12:02 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Tak že hry sa už podobajú realite a realita je strop :-)

KERNEL ULTRAS video channel >>>

1.10.2009 22:30 TomCat1 | skóre: 10
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

From Futurama:
Leela: Fry, you're wasting your life sitting in front of that TV. You need to get out and see the world.
Fry: But this is HDTV. It's got better resolution than the real world.

Have you tried turning it off and on again?

2.10.2009 06:38 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

KERNEL ULTRAS video channel >>>

6.10.2009 16:23 koudy
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Proc me napadlo uplne to same :o))))

1.10.2009 12:09 juchů
Rozbalit Rozbalit vše realičnost

Odpovědět | Sbalit | Link | Blokovat | Admin

Realičnost her už je fakt dobrá a jsem rád, že se tímto dál zvýší, k reálnosti to má ale pořád propastně daleko ... lámané hrany předmětů, ostré hrany stínů, atd. ... ale odrazy v zrcadlech a ve vodě už hezké ...

1.10.2009 17:09 |🇵🇸 | skóre: 94 | blog:
Rozbalit Rozbalit vše Re: realičnost

...a jsem rád, že se tímto dál zvýší...

Fuj!

🇵🇸 ✊ Touch grass ✊ 🇺🇦 ✊ ani boha, ani pána

2.10.2009 12:29 jurda
Rozbalit Rozbalit vše Re: realičnost

proč fuj?

2.10.2009 15:05 |🇵🇸 | skóre: 94 | blog:
Rozbalit Rozbalit vše Re: realičnost

Představivost dostává na prdel.

🇵🇸 ✊ Touch grass ✊ 🇺🇦 ✊ ani boha, ani pána

2.10.2009 16:14 cezz | skóre: 24 | blog: dm6
Rozbalit Rozbalit vše Re: realičnost

No ked som hral Bioshock, tak moja predstavivost sa roztocila na plne obratky, ked zrazu zhasli svetla a ozvali sa ciesi kroky. ;-)

IMHO to nie je o grafike, skor o pristupe k zabave. Viz napriklad LBP a podobne. Je sice pravda, ze taky MUD vyzaduje predstavivost trosku inej kategorie, ale to uz je trochu ina zalezitost.

Computers are not intelligent. They only think they are.

1.10.2009 13:34 jara
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Odpovědět | Sbalit | Link | Blokovat | Admin

opravte si :-) :

ISA = Instruction Set Architecture, http://en.wikipedia.org/wiki/Instruction_set_architecture

1.10.2009 14:31 David Ježek | skóre: 83 | blog: Mostly_IMDB
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

díky, to je tak když jsi línej psát to ručně a tak copy&pastneš zkratku ze začátku vyhledávání na googlu, aniž bys zkontroloval, jestli je to ta správná :-S.

1.10.2009 14:35 Robert Krátký | skóre: 94 | blog: Robertův bloček
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Fixed.

1.10.2009 15:20 GandY | skóre: 3 | blog: Zo života | Bratislava
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

Odpovědět | Sbalit | Link | Blokovat | Admin

a čo spotreba?

môj fotoblog

1.10.2009 15:39 David Ježek | skóre: 83 | blog: Mostly_IMDB
Rozbalit Rozbalit vše Re: Nová architektura NVIDIA Fermi

toto bylo představení architektury, nikoli konkrétní karty. ale abych ti odpověděl, odhadoval bych to někam k 210 až 240W dle typu karty (počet RAM, takty atd).

Založit nové vlákno • Nahoru

Nová architektura NVIDIA Fermi

Obsah

Úvodem

Jak Fermi počítá

Architektura

Streaming Multiprocessory

Dual Warp Scheduler

Second Generation Parallel Thread Execution ISA

Optimalizace pro OpenCL a DirectCompute

IEEE 32bit Floating Point

Paměťový subsystém

Parallel DataCache, konfigurovatelná L1 a unifikovaná L2 cache

Fast Atomic Memory Operations

10x rychlejší přepínání aplikačního obsahu

Souběžné vykonávání kernelů

NVIDIA Nexus

Závěr

Nejvýkonnější superpočítač

Nejčtenější články posledního měsíce

Nejkomentovanější články posledního měsíce

Seriál Hardwarové novinky (dílů: 440)

Související články

Další články z této rubriky

Hodnocení: 85 %

Komentáře