Portál AbcLinuxu, 6. května 2025 13:40
Dnešní díl, který měl původně vyjít minulý týden, vás seznámí s událostmi týdne, který dal světu GeForce GTX 580. Druhá generace DirectX 11 architekury v podání Nvidie reaguje na nedávné uvedení Radeonů HD 6800 opravdu zostra. Dále si představíme nové produkty společnosti ARM, kam spadá i zcela nové GPU s podporou OpenCL a vše završíme pohledem na budoucnost APU v podání AMD.
Začněme tím prvním, co tak trochu bulvárně až přeháníme v nadpisu. Společnost ARM, kterou živí především licencování intelektuálního vlastnictví v oblasti procesorových technologií pro ultramobilní produkty, představila dvě hodně zajímavé novinky. Tou větší z nich je zcela nové GPU Mali-T604. Vedle obvyklých věcí jako OpenGL ES 1.1 a 2.0, resp. OpenVG 1.1 totiž přináší podporu výpočetního systému OpenCL jak v současné verzi 1.1, tak i v budoucí 1.2. ARM tak dává najevo, že poskládáním výsledného čipu z jeho CPU a jeho GPU propojených jeho logikou tak můžete získat produkt schopnostmi ekvivalentní s chystanou platformou AMD Fusion, resp. tím, co Nvidia nazývá Tegra (kde jako CPU slouží též ARM).
Výkon je pochopitelně něco jiného než schopnosti, takže na reálné srovnání všech „APU platforem“ si počkejme do příštího roku, důležité je zmínit, že ani nemíří přímo na shodný segment trhu, AMD chystá Fusion i pro „větší“ mobilní zařízení formátu netbooků či notebooků.
Mali-T604 není prvním produktem řady, dřívější již tikají v řadě přístrojů; první, kdo má s T604 tu čest, je jihokorejský gigant Samsung. T604 má být celkově až pětkrát rychlejší než předchozí generace a v kombinaci s vícejádrovými CPU se můžeme těšit na daleko rychlejší mobily a podobná zařízení v nadcházejících měsících, resp. letech.
Nové 275MHz GPU podporuje 4×FSAA s minimálním dopadem na výkon, samozřejmě i DirectX (s příchodem Windows Phone 7 o Microsoftu uslyšíme možná ještě častěji) a škálování výkonu skrze 1 až 4 GPU jádra (to asi mělo zaznít už o kousek výše, ale ve srovnání s 1920 stream procesory v Radeonech HD 6900… ).
Doprovodnou částí celku je u ARMu nová verze „propojovacích záležitostí“ zvaná „Corelink 400 System IP“. Tento nový soubor rozhraní a protokolů využívaných pro vzájemnou komunikaci mezi dílčími prvky architektury, jakými jsou právě CPU, GPU a další periferní věci, nabízí vícekanálový paměťový řadič, správu paměti s hardwarovou akcelerací pro virtualizaci, síťové připojení a zejména flexibilní systém sdílených cache, které umožňují rychlé využívání dat u procesoru Cortex-A15 (ten je na trhu od září, běhá až na 2,5 GHz a je připraven pro 32 i 28nm výrobu) v kombinaci právě s GPU Mali-T604.
Z hlediska paměti systém podporuje jak nízkonapěťové DDR2, tak novější DDR3 čipy, je zde pochopitelně připojení video výstupu, resp. hlavního displeje, a další prvky. ARM se nepochybně připravuje na novou generaci „chytrých“ mobilních produktů nadcházejícího desetiletí, nemá smysl pochybovat o tom, že mobily budou stále výkonnější a i jejich rozlišení displeje poroste. Zajímavé se jeví zejména stále rostoucí schopnosti virtualizace a podpora OpenCL, tedy běžných výpočtů pomocí GPU.
Druhou významnou novinkou (před)minulého týdne bylo nepochybně uvedení druhé generace grafik Nvidia na bázi architektury Fermi. Nvidia GeForce GTX 580 je evolucí modelu GTX 480. Zjednodušeně by se dalo říci, že GTX 580 je tím, čím měla být v počátcích sama GTX 480, obohacená však o výkonnější tesselační jednotku a další dílčí novinky, které přineslo posledních 13 měsíců od představení architektury.
Proč se tak nestalo již před rokem? Inu, to bylo probíráno již mnohokrát a pro mě osobně jsou na vině stále dva hlavní faktory:
Geforce GTX 580 je důkazem, že došlo k pokroku v obou aspektech. Zaprvé dokázalo TSMC opět na výrobním procesu zapracovat, ale hlavně Nvidia značně zrevidovala GPU. To nyní nese název GF110, řada jeho tranzistorů není „nenažraného hispeed typu“, nýbrž pomalejší lowpower verze všude tam, kde není extrémní výkon potřeba. To umožnilo oproti GTX 480 srazit poměr spotřeby vůči velikosti GPU. Další optimalizace přineslo již zmíněné TSMC, takže zbyl vedle aktivace plných 512 CUDA jader prostor i pro rozšíření tesselačních jednotek.
Celkově je GeForce GTX 580 o něco výkonnější než předchozí model, přitom baští o trochu méně a také díky použití chladiče s vapor-chamber konstrukcí výrazně tišší. Zapracování v oblasti GPU také stojí za lepší správou spotřeby při běhu karty na různých frekvencích a spolu se startovní cenou 10 990 Kč se tímto stávající GTX 480 stává mrtvou kartou.
Podrobnosti shrnuje prezentace Nvidie, některé slajdy jsou upravené, aby reflektovaly správné proporce v nárůstu výkonu (pocházejí ze serveru Deep in IT ). Karta podporuje stejnou, tedy poslední, generaci hardwarové akcelerace videa včetně Blu-ray 3D skrze HDMI 1.4a výstup. Standardně sice GTX 580 neobsahuje DisplayPort výstup, ale v GPU je přítomen, takže výrobci jej mohou na PCB vyvést. Výkon v double-precision je nadále uměle zaříznut na 1/8 výkonu v single, aby tak GeForce karty „nekradly kšefty“ modelům řad Quadro a Fermi, kde double výkon dosahuje 1/2 výkonu v single.
Touto dobou jsou již dostupné ovladače verze 260.19.21 pro Linux, FreeBSD i Solaris.
S ohledem na ARM se sluší doplnit informace o APU, které zveřejnila společnost AMD na vlastní nedávné akci Analyst Day 2010.
AMD vidí v APU velkou budoucnost, a to dokonce takovou, že hodlá APU, resp. zejména GPU části věnovat hodně prostoru. Zatím to sice může vypadat, že v první generaci dojde „pouze“ k přesunutí GPU do CPU, ale není tomu zcela tak. AMD v prvních APU zapracovala na komunikaci obou hlavních částí křemíku a toto se bude nadále vyvíjet.
Hned v první genreaci je zjevné, že jak CPU, tak GPU a dekodér videa UVD budou navěšeny na daleko rychlejší sběrnici než v dosavadních oddělených řešeních. Propojovací část pak bude zajišťovat spojení s pamětmi i zbytkem systému přes PCI Express sběrnici. Jen tak mezi řečí, ATI již řadu let využívá v návrhu procesorů X-architekturu zkracující signálové části, mnoho let ji také umí vyrábět v TSMC, takže není divu, že i zde, u APU „Zacate“ vyráběném u TSMC, je použita.
V konkrétních číslech zrychluje napojení GPU do systému oproti dosavadnímu způsobu komunikace ze 7 na 27&Nbsp;GB/s. Pokud přidáte další grafickou kartu, tentokrát již klasicky do PCI Express slotu, budou tyto dvě (integrovaná v APU a diskrétní ve slotu) moci kooperovat jak nad grafickou stránkou věci, tak nad výpočetní. Toto jsme viděli již před několika lety v podobě „Hybrid Crossfire“ na čipsetu AMD 780G – tehdy to ale vůbec pořádně nefungovalo. AMD na tomto ale stále pracuje a můžeme očekávat velká zlepšení v budoucnu, avšak za jednoho kritického předpokladu.
Vyšší míra podpory GPU, která se nám definitivně přesouvají do hlavních procesorů i se svými výpočetními schopnostmi, si vyžádá podporu jak v operačních systémech a vývojářských nástrojích, tak zejména v myšlení programátorů, kteří začnou pro GPU psát aplikace. Je třeba naučit se „uvažovat paralelně“ a pokud možnost alespoň OpenCL, které je univerzálním standardem skrze tvůrce GPU i operačních systémů.
AMD se tímto v podstatě dostává na tenký led, neboť ve věci kolem softwarových technologií a podpory určitých prvků architektur má významné slovo Intel. A Intelovy integrované grafiky stojí z hlediska výpočtů „za starou bačkoru“, Larrabee pro běžné uživatele je v nedohlednu, tak uvidíme, jeslit nezvolí spíše taktiku brzdění vývoje. Na druhou stranu z hlediska architektury běžných počítačů je příchod APU skvělou věcí a AMD jakožto lídr vývoje mající k dispozici jak výborné CPU, tak vynikající GPU, naznačuje směr, kterým se trh vše vydá. APU Zacate a jeho sourozenci budou první ukázkou. Již se v posledních (tý)dnech objevily nějaké první testy, nevypadá to vůbec špatně s ohledem na spotřebu tohoto řešení, ale vyčkejme pochopitelně finálních produktů.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.