David Tschumperlé v obšírném článku se spoustou náhledů shrnuje vývoj multiplatformního svobodného frameworku pro zpracování obrazu G'MIC (GREYC's Magic for Image Computing, Wikipedie) za poslední rok a půl.
Vývojáři postmarketOS vydali verzi 23.06 tohoto před šesti lety představeného operačního systému pro chytré telefony vycházejícího z optimalizovaného a nakonfigurovaného Alpine Linuxu s vlastními balíčky. Přehled novinek v příspěvku na blogu. Na výběr jsou 4 uživatelská rozhraní: GNOME Shell, Phosh, Plasma a Sxmo. Aktuálně podporovaných zařízení je 30.
Byla vydána distribuce openSUSE Leap verze 15.5 (poznámky k vydání). Jde o konzervativní distribuci odpovídající komerčnímu SUSE Linux Enterprise 15, nyní Service Pack 5. Mělo jít o poslední aktualizaci Leap v současné podobě před přechodem na Adaptable Linux Platform s „neměnným“ základem, ale padlo rozhodnutí, že v roce 2024 ještě vyjde Leap 15.6 s podporou do konce roku 2025.
Alyssa Rosenzweig v příspěvku na blogu oznámila, že Asahi Linux už zvládá OpenGL 3.1. Dokončuje se podpora OpenGL ES 3.1. Dalším krokem bude Vulkan 1.0.
Intel nedávno představil a pod licencí SIL Open Font License (OFL) na GitHubu zveřejnil font Intel One Mono. Font je určen především pro zobrazování textu v emulátorech terminálu a vývojových prostředích (Přehled fontů s pevnou šířkou).
Na redditu byly publikovány zajímavé QR kódy vygenerované pomocí Stable Diffusion. Přehled použitého softwaru v článku na Ars Technica.
Byl vydán Mozilla Firefox 114.0. Přehled novinek v poznámkách k vydání, poznámkách k vydání pro firmy a na stránce věnované vývojářům. Nově jsou také na Linuxu podporovány USB FIDO2/WebAuthn bezpečnostní klíče. WebTransport je ve výchozím stavu povolen. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 114 je již k dispozici také na Flathubu a Snapcraftu.
Byla vydána červnová aktualizace aneb verze 2023.06-1 linuxové distribuce OSMC (Open Source Media Center). Z novinek lze zdůraznit povýšení verze multimediálního centra Kodi na 20. Na léto je plánováno představení nového vlajkového zařízení Vero, jež nahradí Vero 4K +.
Už zítra 7. června od 17 hodin proběhne SUSE Czech Open House 2023 aneb den otevřených dveří pražské pobočky SUSE. Těšit se lze na komentovanou prohlídku nebo přednášku o spotřebě procesorů.
Na vývojářské konferenci Applu WWDC23 byla představena řada novinek (cz): brýle Apple Vision Pro, MacBook Air 15” s čipem M2, Mac Studio s čipem M2 Max nebo M2 Ultra, Mac Pro s čipem M2 Ultra, iOS 17, iPadOS 17, macOS Sonoma, watchOS 10, …
Navic mi jeden obchodnik vysvetloval, ze jadro u AMD odpovida hyper threadovanemu jadru od intelu.
Marketing AMD by si zasloužil pár facek. Zatímco Intel čím dál tím víc prosazuje HT jádro = jádro (takže pro některé lidi je i7 najednou osmijádro), tak AMD má skutečné osmijádro (8x všechny věci co dělají procesor procesorem - sada registrů, ALU apod.), a jen některé věci jsou sdílené (jako třeba FPU) mezi dvě jádra. Díky tomu, někteří říkají, že AMD osmijádro je vlastně čtyřjádro. Takže v paralelnosti vyhrává AMD.
Tolik jen pro vysvětlení.
Tobě byl pokles výkonu byl právě na tom, že jednu FPU plnily dvě CPU požadavky, ze floating SSE2 instrukci.To by vysvětlilo nezvýšení, ovšem ne pokles. Tohle vypadá na úlohu která visí na přístupech do paměti a spuštění dalších threadů způsobilo vypadávání dat ze sdílené cache.
V tomto případě se nejedná o typický paralelizovaný výpočet, ale o sadu několika set jednovláknových nezávislých výpočtů na více strojích. Pro účely benchmarku je výpočet s týmiž vstupními parametry spuštěn na jednom či více jádrech. Pro zajímavost přikládám tabulku:
+=========================+===========+=======+=======+=========+ | CPU | kmitočet | jader | užito | čas [s] | +=========================+===========+=======+=======+=========+ | Intel Core 2 Quad Q9550 | 2.83 GHz | 4 | 1 | 102 | | Intel Core i7 965 | 3.20 GHz | 4 | 1 | 77 | | | | | 4 | 79 | | AMD FX 8350 | 4.00 GHz | 8 | 1 | 74 | | Intel Core i5 4670K | 3.40 GHz | 4 | 1 | 56 | | | | 4 | 4 | 56 | +=========================+===========+=======+=======+=========+ | Intel Celeron 847 | 1.10 GHz | 2 | 1 | 222 | | | | | 2 | 223 | | Intel Celeron 1037 | 1.80 GHz | 2 | 1 | 123 | | | | | 2 | 157 | | Intel Atom D2500 | 1.86 GHz | 2 | 1 | 471 | | | | | 2 | 474 | +=========================+===========+=======+=======+=========+
Program je přeložen s 64bitovými instrukcemi a SSE2, což se jeví jako nejvýkonnější varianta z možností 32/64-bit a SSE2/387. Program nezpracovává velké objemy dat, velkou část operací tvoří výpočty v plovoucí desetinné čárce (integrace, maticové operace). Časy jsou hodnoty user
z příkazu time
. Program využívá rovněž disk, ale v malé míře.
Některé testy jsem nedělal, nebo se ztratily. Intel Core 2 Quad vykazuje přibližně stejné časy při zatížení jednoho či všech jader, nemá HT. Core i7 má HT, ale zatížení všech 8 virtuálních jader prodlouží dobu na přibližně dvojnásobek oproti využití jen 4 jader. AMD FX8350 při zatížení čtyř jader počítá téměř stejně dlouho jako při zatížení jen jediného, naproti při zatížení všech osmi jader se propadne někam na úroveň Core 2 Quad (odtud těch 30 až 40 % výše).
Podstatné pro mě je, že SSE instrukce vykonává stejná jednotka jako x87 instrukce, tj. FPU, což vysvětluje onen dramatický propad výkonu. Předpokládám, že při celočíselných operacích by byl rozdíl v časech zanedbatelný.
AMD FX8350 při zatížení čtyř jader počítá téměř stejně dlouho jako při zatížení jen jedinéhoCož je zvláštní samo o sobě, protože 4x je v tom procesoru opravdu všechno včetně FPU. Chyba bude někde jinde (možná se procesy hádají o cache, nebo jsou náročné na datovou propustnost apod.). Na druhou stranu i ten convert je v mém případě často rychlejší než disk, takže intenzivní proud mezi CPU a RAM probíhá též a i tak, když to má data v RAM, tak to jede výrazně rychleji než 1x nebo 4x.
FX 8350 125W, i5 4670K 84W.Obě hodnoty jsou teoretickým maximem, minimálně u FX8150 žere 125 W celý počítač (při zátěži), ne jen procesor.
std::set
na pole (pro OpenMP) se mi zatím nechtělo, natož pak jej převádět na Cudu…
Plánovač v Linuxu (v hostiteli) málokdy nechá jedno vlákno běžet na jednom CPU
Dá se nastavit affinita. (Stejně by mě zajímalo, zda to v normálním provozu přinese nějaký měřitelný přínos.)
Dá se nastavit affinitaTeď si nejsem jistej, jestli to KVM (QEMU) umí. Samozřejmě jde nastavit "zvenku" pomocí taskset, ale to je AFAIK jenom pro celý proces, ne pro jednotlivá vlákna. Jinak viz poslední větu v mém předchozím příspěvku.
také nelze tvrdit ... funguje tam částečné sdíleníKdyž to bereš takto, tak se můžeme bavit o tom, že každé multijádro je vlastně jednojádro, protože některé věci, které jsou sdílené, jsou tam jen jednou
Člověk si sice připlatí, ale má vyšší výkonMůžu si koupit šestnáctijádro od AMD, nebo si připlatím a dostanu šestijádro od Intelu... no, opravdu nevěřim tomu, že tím dostanu vyšší výkon.
Vyšší výkon a v burnu nižší spotřebu.Tvrdit můžete cokoliv, ale uvěřím tomu, až uvidím čísla.
Se podívej třeba na Intel Xeon E7 řadu, 18core CPU na 2,5GHz a k tomu HT a jsi na 36 logických CPU. Proti tomu máš AMD s 6300 serie, které je 16core = 16 logických. Stejné TDP, stejná frekvence, ale Intel bude ještě na jádro výkonnější.Za cenu toho CPU od Intelu můžu mít dvanáct šestnáctijádrových Opteronů. Opravdu nevěřím, že bych tím od Intelu dostal víc výkonu za stejné peníze, i když započítám místo v racku a spol. A výpočty wedosu jako argument fakt neberu.
Tiskni
Sdílej: