Portál AbcLinuxu, 7. května 2025 14:50
Dalo by se říci, že nyní již konec světa klidně může nastat. Peklo definitivně zamrzlo, Strýček Heini i Strýček Hermy mají u nosů rampouchy a vy pomalu můžete vykrmovat hodně velké prasátko. Intel Xeon Phi Coprocessor 5110P, výpočetní karta s 60 x86 jádry je hlavním hitem tohoto týdne. Aspoň doufejme…
Více než čtyři roky uběhly od velkolepého (dnes bych řekl spíše „velkohubého“) představení architektury „Larrabee“. Začalo to na AnandTechu 4. srpna 2008 16stránkovým megačlánkem o této architektuře a vrcholí to dnes (na samotné many-core architektuře ale Intel pracuje již více než 8 let). Tedy přesněji 12. listopadu 2012, kdy Intel konečně uvádí svoji x86 many-core architekturu do „běžného“ prodeje.
„Larrabee“ nám za tu dobu mnohokrát změnilo svoji tvář i zaměření. Z původního konceptu výpočetní karty s většinou grafické logiky v ovladačích dávno sešlo (alespoň prozatím?). Za tímto účelem najatý bůh přes grafické programování, Michael Abrash, už dávno pracuje ve Valve a Xeon Phi 5110P rozhodně nenese grafické výstupy. Zato nese obrovský chladič a celá jeho záslepka je určena pouze k vyfukování horkého vzduchu z počítačové skříně: konstrukce je navržena tak, aby šlo štosovat jednu kartu vedle druhé bez toho, aby se časem upekly.
Xeon Phi 5110P totiž obsahuje na svém čipu celkem 62 x86 CPU jader, z nichž 60 je aktivních a taktovaných na frekvenci 1,053 GHz. Je zde použit čtyřnásobný multithreading, karta se tedy tváří jako „240vláknová“. Výkon karty dosahuje 1,011 TFLOPs v double-precision, přičemž TDP je přijatelných 225 W. Čip je vyráběn pochopitelně 22nm procesem a je to aktuálně (minimálně do příchodu architektury „Haswell“) asi nejpokročilejší čip, který Intel ve svých továrnách vyrábí. Cena karty, na níž dále sídlí 8 GB ECC GDDR5 paměti s celkovou propustností 320 GB/s na 16 paměťových kanálech, je stanovena na 2 649 dolarů, tedy v čistém přepočtu 53 000 Kč+. To se bavíme o pasivně chlazené variantě 5110P.
Z dalších parametrů se sluší zmínit 12-bit wide vector engine, 32 kB L1 instrukční/datová cache a 512 kB L2 cache na jádro a pochopitelně to samozřejmé: karty pasují do PCI Express ×16 slotu.
Na bázi tohoto čipu Intel dále představil řadu Xeon Phi 3100, též nabízející 1TFLOPs+ v double precision, avška doprovázenou pouze 6 GB paměti s celkovou propustností 240 GB/s. Tato karta je již aktivně chlazena a její TDP j 300 W – připadá mi to tedy tak, že jde a) o horší čipy a b) výše taktované s některými jednotkami deaktivovanými (možná přímo v poměru odpovídajícím menší šířce paměťové sběrnice).
Mezi subjekty, které měly přednostní přístup ke Xeonům Phi, bylo například Texas Advanced Computing Center, ale tyto karty budeme vídat v produktech řady významných značek, kde vedle spotřebitelských nechybí i Cray, Dell, Fujitsu, Hewlett-Packard, IBM, NEC, SGI, SuperMicro či Tyan.
Pouť „Larrabee“ na trh byla dlouhá, strastiplná a bolestná, ale nakonec se zadařilo. Nejdůležitější roli v uvedení jistě sehrála 22nm TOCK verze intelí výroby, bez ní by nebylo možné čipy dostat do potřebných hodnot TDP (připomenu, že v době 32nm výroby, vykazovaly tehdejší verze karty spotřebu kolem 600&nbps;W). Nyní je již jen potřeba, aby se jí přizpůsobily aplikace i programátoři, neboť psát kód pro x86 Xeony Phi bude přeci jen trochu jiné než třeba pro karty Tesla v OpenCL. Mezi operačními systémy v souvislosti s Xeony Phi zmiňuje Intel dva: Red Hat Enterprise Linux 6.x a SuSE Linux 12+.
Každopádně s jistotou lze říci, že Xeon Phi 5110P je v současné době asi s přehledem nejvýkonější procesor schopný vykonávat x86 instrukce. Intel také již nějakou dobu silně pracuje na jeho podpoře v Linuxu obecně.
Za normálních okolností bych se o „Larrabee“ ještě trochu rozpovídal a udělali bychom si z tohoto dílu speciál, nicméně protože jsme si nedávno povídali o kartách Tesla K20 na bázi GPU GK110 „velký Kepler“ a současně nyní AMD uvedla svoji nejvýkonnější výpočetní kartu, uzavřeme to dnes právě s ní. Perfektně se sem totiž hodí.
Takže tedy, pokud si vzpomenete na léto, kdy Mark Papermaster z AMD pobíhal po pódiu s jistou velkou grafikou se třemi ventilátory a mnozí dumali, jestli to náhodou není chystaný Radeon HD 7990, tak ono v podstatě je. Jenom není určen spotřebitelům, ale to enterprise segmentu. AMD FirePro S10000 je duální výpočetní karta s výkonem 5,91 TFLOPs v single a 1,48 TFLOPs v double-precision. Tím překonává oba „velké Keplery„, Teslu K20 s 1,17 TFLOPs i Teslu K20X s 1,31 TFLOPs, samozřejmě za cenu použití dvou GPU nejvyšší třídy (z Radeonu HD 7970) a TDP na brutálních 375 W.
Karta dostala do vínku také 6 GB paměti ECC GDDR5 taktované na 5,0 GHz (tedy reálně 1,25 GHz; celková propustnost pak 480 GB/s), přičemž nabízí i grafické výstupy: DVI-I a 4× miniDisplayPort. Její udávaný výkon může být ve skutečnosti i vyšší, neboť karta samozřejmě podporuje PowerTune, mechanismus umožňující grafické procesory přetaktovávat, pokud by se i tak karta vešla do hodnoty TDP. Tyto mechanismy a algoritmy má AMD velmi propracované, karta je digitálně monitorována v mnoha svých aspektech a o úpravách provozních taktů se rozhoduje mnohokrát za vteřinu. Nicméně i tak musím dodat, že porovnávat teoretický výkon u karet s tisíci malými výpočetními jádry přístupnými pod OpenCL/DirectCompute a 60jádrový/240vláknový x86 „koprocesor“ je ryze orientační záležitost.
Každopádně pokud si sečteme nejnovější počiny AMD, Intelu i Nvidie, je jasné, že nám právě probíhá mohutný upgrade produktů pro HPC segment a všichni tři výrobci v něm svádějí a svedou mnoho velkých bitev. V Oak Ridge vyhrála Nvidia (ač AMD tam dodala Opterony), v Texasu zase Intel, po nových FirePro jistě také bude sháňka, třeba v Číně, kde na produktech AMD postavili již minimálně jeden GPU-superpočítač.
Mezi operačními systémy v souvislosti s Xeony Phi zmiňuje Intel dva: Red Hat Enterprise Linux 6.x a SuSE Linux 12+.
Není tady nějaká chyba? Poslední "SuSE Linux" byl 10.1, SLE 12 je zatím hudba budoucnosti a přijde mi divné, že by to Intel certifikoval pro OpenSuSE a SLE ignoroval.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.