×

Šestnáctijádro a škálování při kompilaci a OpenSSL

dnes 18:37 | Přečteno: 76× | Hardware | poslední úprava: dnes 18:50

Jsou to skoro čtyři roky, kdy jsem tady zveřejnil zápisek o škálování šestnáctijádra . Tehdy to byla dvouprocesorová stanice s osmijádrovými Xeony za 220 tisíc. Po celou tu dlouhou dobu nebylo co zveřejňovat, neboť Xeony typu W(orkstation) se prakticky nehýbaly kupředu jen rostla jejich cena (částečně vlivem měnových intervencí, částečně monopolem Intelu v tomto segmentu). Teď konečně nastala změna. Šestnáctijádro lze koupit i v HEDT segmentu za pouhých(!!!) 100 tisíc i s 1TB nvme SSD, 64GB 2666GHz RAM, luxusním AiO vodníkem a omáčkou okolo. Tolik tehdy stály jen samotné procesory. Navíc ten procesor má větší IPC i frekvence. Děkujme všichni AMD za to, že si můžeme koupit výkonný Intel za rozumnou cenu :-p A kdo chce, může si pořídit Threadripper s podobným výkonem ještě o 20 tisíc levněji.

Skylake-X mají navíc výhody "neprofi" segmentu- přetaktovatelnost, moderní BIOS, většinou funkční uspávání, kvalitní zvukovka atd. Je tady ovšem drobný, ehm... škraloupek - teplo. Z jednoho procesoru je třeba po přetaktování odvést ještě více tepla než z dvojice Xeonů z minulého článku. Navíc materiál mezi čipem a rozváděčem tepla je volen s ohledem na trvanlivost a nikoliv na tepelné vlastnosti. Ale za to je Intel kritizován dlouhodobě (bohužel i lidmi, kteří o tom vědí starou belu, takže pak kolují bludy. Zdravíme redakci DIIT, která zjevně reálně už pěkně dlouho nedržela v ruce žádný kus nového hardwaru a jen opisují dojmologii z jiných webů a ještě jen tu, která zapadá do jejich světonázoru). A samozřejmě také chybějící ECC. Na Threadripperu teoreticky ECC je. Pokud máte správnou desku. A BIOS. A moduly. A štěstí. BTW bavil jsem se s člověkem z velkého zahraničního datacentra a ten mi tvrdil, že případů, kdy modul, který není vadný (projde memtestem) a zároveň je detekována opravitelná chyba je extrémně málo. Ale to je zase na jiný článek.

Sestava

i9-7960X, 4x16GB 2666GHz DDR4, 2x 500GB 960 EVO nvme SSD, Asus PRIME X299-A, Kraken X62, Corsair RM850x, Corsair 750D, nějaká pasivně chlazená zaprášená grafika z šuplíku.

Tyhle procesory přímo křičí - přetaktuj mě. Proto testuji v přetaktovaném stavu a to tak, aby nethrottloval ani procesor ani VRM. Samozřejmostí je naprostá stabilita (testováno v prime95 ve verzí bez AVX, s AVX i s AVX512). Konkrétně 4,6 GHz do čtyř zatížených jader, 4,5GHz do osmi, 4,4 GHz do dvanácti a výše 4,1 GHz (skutečně si to můžete takto detailně v BIOSu "naklikat"). Výkon je cca +11 % nad implicitní takty v celém spektru zátěží. Zejména si pochvaluji možnost přetaktování při nízké zátěži což zpříjemňuje běžnou každodenní práci. Dříve šlo taktovat jen nastavením "turba" pro všechna jádra což by v případě tohoto procesoru znamenalo nastavit 4,1 GHz a sice výkon při využití všech jader z 3,6 GHz na 4,1 GHz tzn. o 14 % při ideálním škálování ale současně SNÍŽENÍ výkonu při vytížení 1 až 2 jader o 100MHz (při použití režimu turbo 3.0 ve windows ještě více).

Software

Ubuntu 17.10 (iso z 7.10. + updaty z 14.10.)

Metodika

Překládám vanilkové jádro 4.13.5 s implicitním .config (lze získat pomocí make defconfig). Jádra vypínám přes zápis do /sys/devices/system/cpu/cpuN/online. Zajímavá poznámka - v linuxu netvoří HT pár sousední čísla (0 a 1, 2 a 3,... jak by se mohlo zdát logické a jak to je ve windows) ale 0 a 16, 1 a 17 atd. Celý proces kompilace probíhá v ramdisku. Měřím pomocí time make -jN resp. openssl speed rsa2048 -multi N. Všechna měření dělám dvakrát a výsledky průměruji. V případě kompilace dávám do grafu počet kompilací za 10 minut.

Kompilace

openssl RSA

Nyní přeložíme aktuální kernel méně krát než na méně výkonném počítači před necelými 4 roky tehdy aktuální kernel. Tomu se říká pokrok, přáteleVliv HT je 36 %. Jinými slovy 16 jádro s HT je jako 21,7 jádro bez HT. Je tady pozorovatelný určitý jev, který v minulosti nebyl tak patrný. 16 jádro s HT překládá při 16 threadové zátěži o 15 % pomaleji, než 16 jádro bez HT. Podobné to je i pokud v předchozí větě nahradíte všechny 16 za 8 nebo 4. Jinými slovy při zátěži pod nebo na počtu fyzických jader HT zpomaluje. Scheduler Linuxu zřejmě není pro tuhle zátěž optimální. 16 jádro je o 70 % rychlejší než 8 jádro, to je o 70 % rychlejší než čtyřjádro (a je jedno, zda se jedná všude o verzi s HT nebo bez). Kompilace tedy škáluje docela mizerně. Na to jsme ovšem od minula zvyklí. 16 jádro není ani 3x rychlejší než čtyřjádro ale je cca 7,5x dražší.

HT přináší 6 % výkonu. To je slučitelné s minulými výsledky - při této zátěži se virtuální jádra přetahují o tytéž výpočetní jednotky a přínos HT je tedy sporný. 16 jádro je tedy výkonné jako 17 jádro bez HT. HT zpomaluje při méněvláknové zátěži ale pouze zanedbatelě - pod 1 procento. 16 jádro je o 87 % rychlejší než 8 jádro, to je o 98 % rychlejší než čtyřjádro (a je jedno, zda se jedná všude o verzi s HT nebo bez).

7zip

7-Zip [64] 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21 p7zip Version 16.02 (locale=en_US.UTF-8,Utf16=on,HugeFiles=on,64 bits,32 CPUs Intel(R) Core(TM) i9-7960X CPU @ 2.80GHz (50654),ASM,AES-NI) Intel(R) Core(TM) i9-7960X CPU @ 2.80GHz (50654) RAM size: 64091 MB, # CPU hardware threads: 32 RAM usage: 7060 MB, # Benchmark threads: 32 Compressing | Decompressing Dict Speed Usage R/U Rating | Speed Usage R/U Rating KiB/s % MIPS MIPS | KiB/s % MIPS MIPS 22: 98562 2764 3469 95882 | 1154130 3170 3105 98423 23: 95073 2765 3504 96869 | 1111907 3101 3103 96215 24: 93809 2849 3541 100864 | 1101748 3119 3100 96704 25: 90211 2878 3580 103000 | 1107185 3176 3102 98532 ---------------------------------- | ------------------------------ Avr: 2814 3523 99154 | 3142 3103 97468 Tot: 2978 3313 98311

Cinebench

Jako bonus přikládám graf škálování Cinebench R15 ve Windows 10. Jen pro srovnání- počítač z minulého článku dával 2500 bodů, teď je to 3657 bodů. HT přináší 30 % výkonu. HT nijak nezpomaluje při méněvláknové zátěži. 16 jádro je o 83 % rychlejší než 8 jádro, to je o 86 % rychlejší než čtyřjádro (ve verzi s HT; ve verzi bez HT je to 89 %).

Je zajímavé, že výsledek nerovnoměrného přetaktování ve výsledcích docela ztrácí. Tento PC budu mít doma ještě delší dobu. Pokud vás zajímá nějaký test- napište.

Hodnocení: - zatím nehodnoceno špatné • dobré zatím nehodnoceno

Obrázky

Komentáře

Vložit další komentář