abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:44 | Nová verze

    Po roce vývoje od vydání verze 1.24.0 byla vydána nová stabilní verze 1.26.0 webového serveru a reverzní proxy nginx (Wikipedie). Nová verze přináší řadu novinek. Podrobný přehled v souboru CHANGES-1.26.

    Ladislav Hagara | Komentářů: 0
    dnes 04:33 | Nová verze

    Byla vydána nová verze 6.2 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.14.

    Ladislav Hagara | Komentářů: 0
    dnes 04:22 | Nová verze

    Byla vydána nová verze 30.0.0 frameworku pro vývoj multiplatformních desktopových aplikací pomocí JavaScriptu, HTML a CSS Electron (Wikipedie, GitHub). Chromium bylo aktualizováno na verzi 124.0.6367.49, V8 na verzi 12.4 a Node.js na verzi 20.11.1. Electron byl původně vyvíjen pro editor Atom pod názvem Atom Shell. Dnes je na Electronu postavena celá řada dalších aplikací.

    Ladislav Hagara | Komentářů: 0
    dnes 04:11 | Nová verze

    Byla vydána nová verze 9.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 220 vývojářů. Provedeno bylo více než 2 700 commitů. Přehled úprav a nových vlastností v seznamu změn.

    Ladislav Hagara | Komentářů: 0
    včera 23:22 | IT novinky

    Evropský parlament dnes přijal směrnici týkající se tzv. práva spotřebitele na opravu. Poslanci ji podpořili 584 hlasy (3 bylo proti a 14 se zdrželo hlasování). Směrnice ujasňuje povinnosti výrobců opravovat zboží a motivovat spotřebitele k tomu, aby si výrobky nechávali opravit a prodloužili tak jejich životnost.

    Ladislav Hagara | Komentářů: 2
    včera 16:11 | Nová verze

    Bylo oznámeno (cs) vydání Fedora Linuxu 40. Přehled novinek ve Fedora Workstation 40 a Fedora KDE 40 na stránkách Fedora Magazinu. Současně byl oznámen notebook Slimbook Fedora 2.

    Ladislav Hagara | Komentářů: 5
    včera 13:44 | Upozornění

    ČTK (Česká tisková kancelář) upozorňuje (X), že na jejím zpravodajském webu České noviny byly dnes dopoledne neznámým útočníkem umístěny dva smyšlené texty, které nepocházejí z její produkce. Jde o text s titulkem „BIS zabránila pokusu o atentát na nově zvoleného slovenského prezidenta Petra Pelligriniho“ a o údajné mimořádné prohlášení ministra Lipavského k témuž. Tyto dezinformace byly útočníky zveřejněny i s příslušnými notifikacemi v mobilní aplikaci Českých novin. ČTK ve svém zpravodajském servisu žádnou informaci v tomto znění nevydala.

    Ladislav Hagara | Komentářů: 16
    včera 13:33 | Komunita

    Byla založena nadace Open Home Foundation zastřešující více než 240 projektů, standardů, ovladačů a knihoven (Home Assistant, ESPHome, Zigpy, Piper, Improv Wi-Fi, Wyoming, …) pro otevřenou chytrou domácnost s důrazem na soukromí, možnost výběru a udržitelnost.

    Ladislav Hagara | Komentářů: 0
    včera 13:00 | Nová verze

    Společnost Meta otevírá svůj operační systém Meta Horizon OS pro headsety pro virtuální a rozšířenou realitu. Vedle Meta Quest se bude používat i v připravovaných headsetech od Asusu a Lenova.

    Ladislav Hagara | Komentářů: 0
    včera 04:33 | IT novinky

    Společnost Espressif (ESP8266, ESP32, …) získala většinový podíl ve společnosti M5Stack, čímž posiluje ekosystém AIoT.

    Ladislav Hagara | Komentářů: 0
    KDE Plasma 6
     (72%)
     (10%)
     (2%)
     (17%)
    Celkem 700 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník
    Štítky: není přiřazen žádný štítek


    Vložit další komentář
    Jendа avatar 20.11.2015 01:55 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Zrovna drtím floaty na FX-8150, žere ho to něco přes půlku. Dá se v Linuxu nějak udělat, aby se to alokovalo na procesory tak, aby to pokud možno nesdílelo FPU? Je to gnuradio, tedy tisícivláknová aplikace v C++ slepená Swigem.
    20.11.2015 07:18 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    No mohl bys množiny procesů seskupit do CPUset v kontrolních skupinách (CONFIG_CGROUPS/CONFIG_CPUSETS, oblíbený systemd :-D). A každé skupině pak nastavit affinitu procesoru. A samozřejmě zjistit topologii nejdřív.

    Ale jestli tam máš tisíc vláken, tak i kdyby jsi polovinu jader vyřadil (třeba úplně vypnul někde v /sys/bus/cpu/devices/cpu0/ po natažení cpuhotplug), tak se ti stejně budou na zbylých mezi sebou přetahovat o zdroje.
    Jendа avatar 20.11.2015 16:39 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Ale jestli tam máš tisíc vláken, tak i kdyby jsi polovinu jader vyřadil (třeba úplně vypnul někde v /sys/bus/cpu/devices/cpu0/ po natažení cpuhotplug), tak se ti stejně budou na zbylých mezi sebou přetahovat o zdroje.
    Mně jde o to, abych vedle tisícivláknového floatového gnuradia, kterému efektivně stačí čtyři jádra (protože ten signál mi tam prostě přitéká realtime, takže ho víc není), mohl provozovat ještě celočíselné aplikace (které bych rád naalokoval na ta zbylá jádra). Ty cgrupy zní jako dobrý nápad.
    20.11.2015 13:13 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem

    Pokud nemáš hodně staré jádro, tak se defaultně scheduluje tak, aby se přednostně obsazovala jádra v různých modulech. Takže pokud mi na FX-8150 poběží jen čtyři thready, nestane se, že by měly dohromady jen dva nebo tři FPU schedulery. Pokud jich ale poběží tisíc a jen čtyři budou používat FPU, pak to AFAIK scheduler sám nepozná, aby je podle toho přemigroval.

    Zajímavé je, že je k tomu využit stejný mechanismus, který se používá kvůli intelímu hyperthreadingu, takže třeba lscpu reportuje údaje, které jsou vůču Bulldozerům hodně nefér:

    unicorn:~ # lscpu
    Architecture:          x86_64
    CPU op-mode(s):        32-bit, 64-bit
    Byte Order:            Little Endian
    CPU(s):                8
    On-line CPU(s) list:   0-7
    Thread(s) per core:    2
    Core(s) per socket:    4
    Socket(s):             1
    NUMA node(s):          1
    Vendor ID:             AuthenticAMD
    CPU family:            21
    Model:                 1
    Model name:            AMD FX(tm)-8150 Eight-Core Processor
    ...
    

    De facto je to pravý opak toho, kvůli čemu je ta žaloba.

    20.11.2015 07:08 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Prťavoučké ARM jádro Cortex-A35
    To bude zajímavý porovnat real life výkon s tím Intel Quarkem. Podle všeho Intel tvrdí, že Quark má menší spotřebu, ale při takových velikostech bude záležet i na pár kB RAM. Chtělo by to tabulku závislosti taktu a spotřeby (předpokládám, že ten ARM půjde taktovat dost dolů).

    Bylo by hustý mít v kalkulačce něco co může skutečně spustit třeba Octave :-D (a na rozdíl od výkonného CPU to utáhnou i wonderky).
    Pro AMD hovoří to, že historicky je CPU (dnes CPU jádro) chápáno jako jednotka pro integer výpočty
    Nechápu proč všechny zpravodajské servery řešej integer výpočty, některý procesory nemusí umět ani násobit, nebo jen omezeně. Důležité je kolik zvládne najednou skoků. Každopádně žalující by mohl být nemile překvapen až zjistí, že moderní procesory obsahují SIMD instrukce, kde se pracuje nad několika integery současně :-D.

    BTW RISC architektury můžou v jedné superskalární pipeline počítat třeba se třema integer a dvěma float operacema najednou (integer trvá třeba 2 takty, float třeba 4).

    P.S. Doufám, že nikdo nebude žalovat třeba cache plánovač, že děla bubliny (teda spíš halt) v pipeline :-D.
    20.11.2015 14:48 j
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Zalujici postavi zalobu uplne jednoduse - veme jedno(dvoj)jadrovy CPU a zmeri jeho vykon, 8 jader = rekneme 7-7,5x zvednuti vykonu. Pokud to pro AMD neplati (pro libovolnou ulohu) tak ma AMD problem a to hodne velkej.

    A dost pravdepodobne se mu povede dolozit, ze prave pro vypocet ve float ... je to "8mijadro" jen cca 3-3,5x rychlejsi nez jedno jadro.

    Ohanet se tim, ze v dobe XTcek a naposled v dobe i386 se to delalo jako extra swab ... lol, stejne tak muzu vytahnout, ze od dob 486 az do prvniho vicejadra byl vzdy soucasti kazdeho CPU i matematickej modul.
    20.11.2015 15:28 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem

    Zalujici postavi zalobu uplne jednoduse - veme jedno(dvoj)jadrovy CPU a zmeri jeho vykon, 8 jader = rekneme 7-7,5x zvednuti vykonu. Pokud to pro AMD neplati (pro libovolnou ulohu) tak ma AMD problem a to hodne velkej.

    A dost pravdepodobne se mu povede dolozit, ze prave pro vypocet ve float ... je to "8mijadro" jen cca 3-3,5x rychlejsi nez jedno jadro.

    Tímhle způsobem pomocí vhodně zvolené úlohy "dokážete", že žádný procesor nemá tolik jader, kolik uvádí (kromě jednojádrových, pochopitelně). Takže spíš - jako obvykle - půjde o to, kdo bude mít přesvědčivější právníky a experty.

    20.11.2015 19:07 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    A navíc existujou i procesory, co maj <1 IPC.
    Heron avatar 20.11.2015 16:13 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Multicore není totéž co více samostatných cpu. Jádra v multicore cpu z definice něco sdílí (třeba zrovna socket, že ;-) ), obvykle také vyšší levely cache, instrukční dekodéry, paměťové řadiče apod. Důležité tedy není najít test, který vytíží danou jednu sdílenou jednotku a vítězoslavně vyplivne výsledek: 1x, ale test, který dokáže, že ten cpu je schopný paralelizace. Protože to, že je něco sdílené víme, to se nemusí testovat.

    Dál, cpu není black box, výrobci cpu uvádějí, jaké je vnitřní uspořádání, aby bylo možné napsat OS a optimalizovat aplikace. To, že zrovna FPU je sdílené se ví. Stejně tak se ví, že jedno jádro umí (a to už od Athlonů) zpracovat víc integer výpočtů současně (na škole v 2002 jsme se bavili tím, jak AMD Athlon správně napsanou smyčkou počítající 4 integer výpočty projde na takt 4x rychleji, než tehdejší P4). Takže co? Je to snad každé jádro čtyřjádro? Ne není.

    Pokud chcete skutečnou paralelizaci bez kompromisů (i když...) tak nutně potřebujete x kompletních cpu. I tam potom budete řešit takové srandy jako třeba velmi drahý přesun procesů mezi cpu a koherenci cache. Pro některé úlohy je lepší multicore (protože jádra jsou blízko, na stejné sběrnici, rychlejší už to nebude), pro některé úlohy s oddělenými procesy je lepší více cpu.

    Potom je také otázkou cena takového řešení.

    Je velmi úsměvné, jak se v některých případech a v některých redakcích dělá z Intel HT "skutečné" 2*Xjádro, zatímco skutečné AMD osmijádro se degraduje na 4 jádro, protože si dovolí sdílet FPU (a ještě to drze přiznává). No tak si to pro ty real výpočty nekupujte. ;-) Nebo možná si raději spočítejte, zda nebude stále levnější si ty AMDčka koupit dvě (kdykoliv si k tomu sednu, naposledy letos v létě, tak pořád vychází AMD cca 2x levnější než stejně výkonný Intel s tím, že za ušetřené peníze za CPU lze nakoupit i desku a paměť), získat tak "plný" FPU výkon a jako bonus, dvojnásobný integer (nejen).
    Jendа avatar 20.11.2015 16:43 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Pokud to pro AMD neplati (pro libovolnou ulohu) tak ma AMD problem a to hodne velkej.
    Aby pak tímhle způsobem neplatil i Intel. Ten může viset třeba na sdílené cache nebo na čekání na paměť.
    20.11.2015 19:19 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Navíc protože Amdahlův zákon.
    20.11.2015 19:15 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    ze od dob 486 az do prvniho vicejadra byl vzdy soucasti kazdeho CPU i matematickej modul
    Nebyl ;-).

    Já jsem nikde o externím švábu nepsal. Dokonce jsem ve své úvaze vyhodil i ALU.
    little.owl avatar 20.11.2015 19:24 little.owl | skóre: 22 | blog: Messy_Nest | Brighton/Praha
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Zalujici postavi zalobu uplne jednoduse - veme jedno(dvoj)jadrovy CPU a zmeri jeho vykon, 8 jader = rekneme 7-7,5x zvednuti vykonu. Pokud to pro AMD neplati (pro libovolnou ulohu) tak ma AMD problem a to hodne velkej.
    To je pitomost, scaling neni dan jen poctem vypocetnich jader a sdileni casti subsystemu procesoru je celkem bezne. AMD se zde chova v mezich standardu a architekturu na teto urovni netajilo, at na urovni verejne prezentace ci manualech pro vyvojare.
    A former Red Hat freeloader.
    21.11.2015 01:00 Šrotovací stolice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Pokud to bude škálovat jen na 3-3,5násobek, tak bude chyba v programu, že prostě nesaturuje osm vláken, ne v Bulldozeru. I přes to sdílení FPU dokáže ten modul škálovat oběma jádry tak na 1,8násobek (a víc) jednoho vlákna, když je úloha MT-friendly.

    Čili pokud si řekneme, že teoretické ideální osmijádro by mělo škálovat na 8,0x, tak Bulldozer je tomu docela blízko, kór když v praxi škálování není lineární asi nikdy a ten "ideál" bude pro osm jader spíš tak 7,7-7,8x nebo méně.
    Jendа avatar 21.11.2015 01:45 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Pokud to bude škálovat jen na 3-3,5násobek, tak bude chyba v programu, že prostě nesaturuje osm vláken, ne v Bulldozeru.
    Jo, určitě to bude tím, že jsem ve skutečnosti nespustil osm vláken, a ne tím, že ve všech počítám floaty a AVX a tyhle jednotky tam jsou prostě jenom čtyři, nebo že čekám na náhodné přístupy do paměti, nebo že jsem zahltil paměťovou sběrnici, nebo že už se mi ty dvě paralelně běžící FFT nevejdou do sdílené L2 cache, zatímco jedna instance se tam těsně vešla.
    21.11.2015 23:04 Brad
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    ROFL, jestli podobná věta padne u toho soudu tak to AMD projede na plný čáře :-D
    21.11.2015 23:33 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Na pravý n-jádro bys stejně potřeboval n čipů. A pak bys stejně mohl žalovat výrobce desky, že nemůžou používat RAM současně.
    22.11.2015 12:34 Brad
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Chápu jak to tu někteří myslí, když to trochu zjednoduším tak z pohledu CPU je FPU „ten divnej soused ob dva baráky vedle„, ovšem aby vesnice správně fungovala tak tam toho divnýho matematika prostě potřebujou, půjčovat si ho z vedlejší vesnice je dost naprd.

    V dnešní době, kdy se šifruje a jedou multimédia snad na každým kroku (i když osobně si teď nejsem jistej, jestli komprimace jedou floaty) je od AMD nerozvážnost tam ty jednotky nemít, i když to nepochybně nemysleli zle a od začátku deklarovali, že to tak je (ovšem že v aplikacích s mnoha vlákny a výpočty s plovoucí řádovou čárkou bude menší výkon na krabici napsaný neměli). Srovnání s cache není tak úplně na místě, resp. byla by menší ostuda mít málo cache (protože to se dá snadno okecat a navíc není třeba řešit optimalizace kompilátorů). Intelu taky kdysi neprošlo když měl na prvních Pentiích chybu právě v FPU, a taky by principiálně šlo tehdy říct „tak tu jednotku prostě vypnem a u složitějších výpočtů si chvíli počkáte”.
    Heron avatar 22.11.2015 13:08 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    V dnešní době, kdy se šifruje a jedou multimédia snad na každým kroku (i když osobně si teď nejsem jistej, jestli komprimace jedou floaty) je od AMD nerozvážnost tam ty jednotky nemít

    Na šifrování je tam spešl HW podpora a šifrování v CPU je mnohem rychlejší, než jak rychle jsou schopné jakékoliv konvenční zdroje dat (síť, disky - možná až na PCI-E SSD) ta data dodávat. Na šifrování navíc FPU není potřeba, to jsou většinou logické operace nad bloky dat, tam se víc hodí SIMD.

    Na multimedia existují AVX. Buldozer má dvě 128b jednotky na modul (tedy jednu FMAC na jádro) a umožňuje je spojit do jedné 256b. Tedy čtyřmodulový buldozer má buď 8x128b FMAC nebo 4x256b FMAC (přičemž není nutné spojovat všechny jednotky). (Převod do řeči AVX je komplikovaný, některé instrukce udělají v buldozeru jiné jednotky a FMAC je volná.) Každopádně, když něco komprimuju v handbrake (což je asi stejně jen nastavba nad ffmpeg), tak to jede skoro osmijaderně (asi tak 720%). Což nevím, zda je dáno tím, že něco nestíhá dodávat data do threadů, nebo je to dané architekturou toho programu. Je to celkem jedno, těch 300fps (při konverzi na něco jako 576p (něco jako full non interleaved pal) to umí 300fps). A zvládá to i realtime 1080p záznam během hraní her (stejně málokterá umí víc jak 2 výpočetní threadu).

    Pokud někdo potřebuje FPU výpočty, tak je mu k disposici GPU. Tam to spočítá rychleji a levněji, než na kterémkoliv general purpose cpu. Tam třeba AMD směruje s APU (CPU + GPU v jednom socketu).

    Intelu taky kdysi neprošlo když měl na prvních Pentiích chybu právě v FPU, a taky by principiálně šlo tehdy říct „tak tu jednotku prostě vypnem a u složitějších výpočtů si chvíli počkáte”.

    Tj snad úplně jiné téma, ne? Mít tam vadnou jednotku a mít tam deklarovaný počet funkčních jednotek.

    Heron avatar 22.11.2015 13:17 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Jinak ještě k potřebě FPU obecně. Chápu, že někdo dělá výpočty (já jsem je taky dělal, ale tehdy ještě na jednojádře ;-) ), které se bez toho neobejdou a které ještě nikdo nepřepsal do OpenCL (pro výpočty na gpu). Ale troufnu si říct, že pro běžnou práci to až tak často potřeba není a navíc, když je zaměstnaná FPU, tak ALU může (pokud to dovolí out of order execution) vykonávat další instrukce. Takže kromě speciálních věcí je to stejně jedno.
    22.11.2015 14:04 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    aby vesnice správně fungovala tak tam toho divnýho matematika prostě potřebujou

    Ne všechny architektury ho mají. A zdaleka ne pro všechny úlohy ho potřebujete. Např. v jádře se nepoužívá vůbec a spousta userspace aplikací se bez FPU taky pohodlně obejde.

    V dnešní době, kdy se šifruje a jedou multimédia snad na každým kroku (i když osobně si teď nejsem jistej, jestli komprimace jedou floaty) je od AMD nerozvážnost tam ty jednotky nemít

    Tak třeba pro AES-NI se FPU nepoužívá vůbec (prakticky vyzkoušeno, na FX-8150 to škáluje perfektně až do osmi threadů) a tipoval bych, že výrazná většina šifrovacích algoritmů na tom bude stejně.

    Sečteno a podtrženo, snažit se po tomhle vozit je nesmysl. Pokud někdo potřebuje vysoký výkon v aplikacích masivně používajících FPU, tak si takový procesor nekoupí. A pro zbávajících 100-ε procent aplikací vůbec nepoznáte, že jsou tam jen čtyři FPU. Naopak, kdyby jich tam dali osm a místo toho museli slevit někde jinde (třeba cache), byl byste na tom v drtivé většině případů hůř.

    22.11.2015 14:07 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Ještě jsem zapomněl: taky je potřeba si uvědomit, že i většina z těch aplikací, které FPU využívají, neprovádí pořád jen FPU instrukce, takže ani tam nemusí nutně ke ztrátě výkonu docházet. Problém bude jen s těmi aplikacemi, které provádějí rozsáhlé výpočty (téměř) výhradně v FPU. A to už je hodně specifický use case a kdo takové aplikace ve velkém používá, dá si pozor, aby si pořídil procesor, který na to bude optimalizovaný.
    23.11.2015 12:30 trekker.dk | skóre: 72
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    No, ten blb, co žaluje AMD, si asi pozor nedal. (Pokud to teda není soud čistě pro to, aby jim uškodil a/nebo aby z nich vyrazil prachy.)
    Quando omni flunkus moritati
    23.11.2015 13:30 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem

    Jde o class action lawsuit, takže jediný, kdo má šanci na tom něco netriviálního vydělat, jsou právníci.

    23.11.2015 15:11 trekker.dk | skóre: 72
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    ...takže aby uškodil. A nebo - a nevim, jestli by to nebylo ještě horší - je to nějakej dobroser.
    Quando omni flunkus moritati
    Agent avatar 23.11.2015 23:38 Agent | blog: Life_in_Pieces | HC city
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem

    Rád bych se zeptal, u Zenu plánují až 40% nátůst výkonu, je to reálné a pokud jo, čím ho dosáhnou, když FPU jednotky nejsou až tak důležité? Zen prý staví na tom, že bude mít zas "plnohodnotné" FPU.

    Jinak děkuji fšem za pěknou diskusi. Už asi začínám chápat, proč se AMD vydalo touto cestou. Každopádně podle různých (zejména herních) testů má FX nižší výkon hlavně v single tasku, čím to může být, kromě možná FPU, ještě způsobeno?

    Nevěděl zpočátku, co si počít, jak žít, co dělat, ale brzy se vpravil do role samotáře.
    23.11.2015 23:54 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    u Zenu plánují až 40% nátůst výkonu, je to reálné

    Uvidíme příští rok.

    čím ho dosáhnou, když FPU jednotky nejsou až tak důležité?

    Podle materiálů, které byly zatím zveřejněny, se má především zlepšit "instructions per clock" poměr, tj. snížit průměrný počet taktů potřebných k vykonání instrukce. To je zatím jeden z hlavních faktorů, v němž AMD za Intelem zaostává (druhým je tempo přechodu na vyšší hustotu součástek).

    Zen prý staví na tom, že bude mít zas "plnohodnotné" FPU.

    Nevím, tuhle informaci jsem zatím nezaznamenal a, upřímně řečeno, je mi úplně jedno, jestli je to pravda nebo mne. U aplikací, kde je pro mne výkon nejdůležitější, na FPU nezáleží.

    nižší výkon hlavně v single tasku, čím to může být, kromě možná FPU, ještě způsobeno

    Především již zmíněná vyšší taktová náročnost instrukcí. Tím při stejné frekvenci stejný kus kódu trvá déle. Možná tam bude i nějaký rozdíl v efektivitě přístupu do paměti, ale to nevím jistě.

    Ale ono to celé záleží na tom, jak se porovnání postaví. Pro mne je třeba zajímavé kritérium "jsem ochoten za procesor dát přibližně 5000-6000 Kč, kdo mi nabídne nejvyšší výkon?" A v takovém případě odpověď zní AMD. Nasadím-li cenu dostatečně vysoko, odpovědí bude Intel. A stejně tak u kritéria "chci co nejvyšší výkon, ať to stojí, co to stojí" (tedy aspoň bavíme-li se o x86_64 architektuře) - jenže to je otázka, která zajímá především autory srovnávacích článků v časopisech a na webech, ty, kdo procesory opravdu kupují, většinou ne.

    24.11.2015 01:19 trekker.dk | skóre: 72
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Tohle mě docela fascinuje - jasně, Intel v segmentu "co nejvyšší výkon" jednoznačně vyhrává. Co ale lidi vede k tomu, že vezmou tuhle informaci, řeknou si "Intel je lepší" a pak si koupí midrange nebo lowend, to fakt nechápu.
    Quando omni flunkus moritati
    24.11.2015 07:29 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Někdo může spoléhat na to, že se mu vyšší pořizovací cena vrátí na nižší spotřebě. Většinou půjde spíš o iracionální potřebu mít tu lepší značku. Tedy samozřejmě u těch, kdo si procesor vybírají sami, skutečná většina si kupuje celý počítač, takže jde spíš o preference jejich výrobců.
    little.owl avatar 22.11.2015 14:20 little.owl | skóre: 22 | blog: Messy_Nest | Brighton/Praha
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    V dnešní době, kdy se šifruje a jedou multimédia snad na každým kroku (i když osobně si teď nejsem jistej, jestli komprimace jedou floaty) je od AMD nerozvážnost tam ty jednotky nemít,
    Vetsina aplikaci jede na intech, vcetne sifrovani. V praxi FPU jednotka neni i u vetsiny aplikaci vytizena a tak jeji sdileni nevadi, a navic bottleneck je vetsinou u pristupu k pameti.
    A former Red Hat freeloader.
    25.11.2015 00:38 ByCzech
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Architektura AMD XP procesorů není z dnešní doby, že? Navíc AMD umí počítat 8 vláken FPU ve 128 bit... To je jako se rozčilovat, že starší architektura Intel taky nezvládala rychleji 64 bit extensions rychleji, oproti 32 kódu, ale naopak pomaleji, kdežto konkurence byla v 64 bit režimu výrazně rychlejší.

    Porovnávat to s zmetkovým výrobkem - FPU v prvních Pentiích je podle mě mimo.
    22.11.2015 17:21 Šrotovací stolice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Jo, určitě to bude tím, že jsem ve skutečnosti nespustil osm vláken, a ne tím, že ve všech počítám floaty a AVX a tyhle jednotky tam jsou prostě jenom čtyři

    Z té argumentace vidím, že jsem to asi měl vysvětlit víc po lopatě.

    Vidím, že máte představu, že ta sdílená FPU má prostředky akorát tak na to, aby ji vytížilo jedno z těch integerových jader a když by si chtělo líznout i druhé, tak oba dostanou jen polovinu toho, co by mohlo jedno, takže rychlost spadne na 50 %. Ale to je vyslověně cyhbný předpoklad a tak to nefunguje, na což jsem ve svém komentu narážel. Ve skutečnosti je ta FPU pro jedno jádro silně předimenzovaná, ona je skutečně stavěná na dva thready.

    Právěže kdybyste si to pořádně ověřil benchmarky, tak byste dostal to škálování, o kteérm jsem mluvil, dejme tomu ze 100 % na jednom vlákně na 180 % na dvou. Platí to i pro úlohy které tu FPU silně vyěžují, například x264, které stráví 60% času v SIMD kódu (jede v té sdílené FPU). Ta jednotka má docela velkou kapacitu, jsou tam čtyři nebo u Steamrolleru tři pipe (eveidentně máte představu, že FPU je nějaká "jedna" jednotka), které jedno vlákno nemá v praxi moc šanci vytížit samo. Prostě v AMD nebyli dle vašeho předpokladu až tak pitomí aby si mysleli, že tam stačí šoupnout jednu FPU jaká by stačila na jedno jádro, ale použili o něco silnější.

    Fakt si to na těch CPU zkuste vyzkoušet, než budete říkat s prominutím blbosti jako to ocitované.

    22.11.2015 17:40 Šrotovací stolice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Tady výsledky z wPrime 32M na čtyřjádrovém Bulldozeru (respektive Piledriveru, ale architektura je to stejná). Upozorňuju, že jsem nevypnutl turbo, takže při běhu jednoho vlákna to mělo až o cca 10% vyšší takt než při běhu čtyř, takže škálování je ve skutečnosti lepší než moje čísla ukazujou.

    1 vlákno: 47,934 s (100 %)

    2 vlákna 25,715 s (186,4 %)

    3 vlákna 20,382 s (235,2 %)

    4 vlákna: 17,154 (279,4 % jednoho vlákna, 150,0 % dvou vláken)

    Tak a teď čekám, že svůj pohled obhájíte nějakým testem, kde na čtyřjádru dostanete ze čtyř vláken maximálně 100 % výkonu dvou vláken, což podle vaší představy zřejmě má nastávat :)

    Ještě zkusím někde vzít čísla pro nějaké konvenční vícejádro, aby byla představa jak moc to škáluje bez sdílené FPU, ale myslím, že tu asi najdu akorát dvoujádro, bohužel.
    22.11.2015 17:59 Šrotovací stolice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Dvoujádro Core 2 Duo pro srovnání:

    1 vlákno: 75,831 s (100,0 %)

    2 vlákna 40,611 s (186,7 %)

    3 vlákna 41,275 s (181,7 %)

    4 vlákna: 40,343 (187,0 % jednoho vlákna, 100,7 % dvou vláken)
    22.11.2015 18:00 Šrotovací stolice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Jinak tohle dvoujádro turbo nemá, takže tady je to škálování reálné, nepodhodnocené jako u toho BD.
    Jendа avatar 22.11.2015 20:52 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Příloha:
    Tak jsem si zkusil výpočet doublového FIR filtru z definice (samozřejmě v praxi se to dá řešit pomocí overlap-add) a singlové FFT pomocí FFTW.

    Je to FX-8150, Debian s jádrem 3.16 a ověřil jsem si, že když spustím 4 vlákna, přidělí je to „správně“ tak, jak píše Michal.

    FFTW škáluje až do 4 vláken dobře, v 8 vláknech má jen 530 % výkonu jednoho jádra.

    Ten FIR je ale hustej, tipoval bych to na nějaké strašlivé cache problémy.

    FIR dlouhý 8192 nad signálem 262144 (bench1.txt): 1 vlákno: 15 s, 2: 16 s, 4: 23 s, 8: 130 s.

    Signál 131072 (bench2.txt): 4.5, 5, 5, 17 s

    Signál 65536 (bench3.txt): 1.4, 1.4, 1.4, 2.6 s

    V tom posledním je podle mě už vidět, že se to do cache vejde a perou se právo o tu FPU.
    22.11.2015 22:35 Šrotovací stolice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Nemusela to být jenom cache, ale třeba i výkon paměťového řadiče. Ten není tak efektivní jako u Intelu.

    Hlavně chtělo by to chtělo srovnat s něčím co má osm samostatných jader (takže dneska asi jenom Xeon s vypnutým HT, na PS4 si to člověk bohužel asi nespustí...), protože ani tam to určitě škálování na 800 % nebude. A otázka teď je, jestli ta úloha na tom "pravém" osmijádru dává třeba 750 % nebo jenom 600 %, ergo jestli je jestli je těch 530 % u 8150 málo nebo ještě docela dost.

    Jinak bylo to s turbem aktivním, nebo na fixním taktu?
    23.11.2015 00:41 pc2005 | skóre: 38 | blog: GardenOfEdenConfiguration | liberec
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    UnixBench, LMBench jsou opensource.
    little.owl avatar 22.11.2015 23:46 little.owl | skóre: 22 | blog: Messy_Nest | Brighton/Praha
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Pro test FPU by to chtelo kod v assembleru, s minimem transferem dat. Cele je to postavene na tvrzeni, ze pokud by se pouzily dve FPU, bylo by to rychlejsi, jenze to neni v principu pravda, skutecne zalezi na tom, jak by takove FPU vypadaly a jak by byly integrovane. U Bulldozeru se nektere floating point operace provadi v integer unit, treba shuffle ci blend, tim se to jeste komplikuje.
    A former Red Hat freeloader.
    23.11.2015 08:21 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem

    To mi trochu připomíná mou první zkušenost s FPU ještě v době, kdy to byl samostatný koprocesor (387). Když jsem si ho pořídil, chtěl jsem ho hned vyzkoušet, tak jsem narychlo v Turbo Pascalu napsal vizualizaci Juliovy množiny tím nejtupějším způsobem a v double precision. Přeložil jsem to bez využití koprocesoru a s ním; s využitím koprocesoru byl sice program rychlejší, ale jen asi třikrát, což mi přišlo málo. Tak jsem se podíval disassemblerem a nevěřil jsem svým očím. Překladač vyrobil kód, kde např. vynásobení tří čísel probíhalo asi takto:

    • ulož A do FPU
    • ulož B do FPU
    • vynásob
    • přečti výsledek z FPU
    • ulož mezivýsledek (zpátky) do FPU
    • ulož C do FPU
    • vynásob
    • přečti výsledek z FPU

    Tak jsem vnitřní smyčku přepsal do assembleru s tím, že se celý výraz vždy počítal v FPU a zpátky se četl až výsledek. Finální verze byla oproti původnímu programu (bez FPU) rychlejší asi stokrát.

    Dnešní překladače jsou samozřejmě mnohem chytřejší, ale i tak je potřeba mít na paměti, že ani složitý výpočet ve float/double nemusí zdaleka celý probíhat v FPU. Ono i u "normálních" instrukcí se běžně stává, že se nějaká komplexní instrukce nepoužije, protože v konkrétním případě (nebo dokonce obecně) je rychlejší ji rozepsat do jednodušších.

    little.owl avatar 23.11.2015 21:19 little.owl | skóre: 22 | blog: Messy_Nest | Brighton/Praha
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    kdy to byl samostatný koprocesor (387).
    Podobna zkusenost s 80287 a pocitanim fraktalu v assembleru :-).
    Dnešní překladače jsou samozřejmě mnohem chytřejší, ale i tak je potřeba mít na paměti, že ani složitý výpočet ve float/double nemusí zdaleka celý probíhat v FPU.
    Stale se nam u numerickych algoritmu vyplaci pouziti SIMD (NEON/AVX/SSEx) a compiler intrinsics.
    A former Red Hat freeloader.
    25.11.2015 00:45 ByCzech
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Přesně tak. To co AMD brzdí občas k lepšímu škálování je sdílený dekodér instrukcí, který nestíhá zásobovat naopak velmi výkonná INT i FPU jádra. V ZEN by to mělo být vylepšeno. Každopádně kód optimalizovaný pro tuto HW výbavu vám to škálování blížící se násobku počtu jader zajistí. Stejně jako u konkurence. Protože je možné udělat v obou případech kód, na kterém se to bude uzlovat. Proto mají kompilátory optimalizace, že ;)
    20.11.2015 09:54 fe
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    >Ostatně podobným způsobem by se daly kritizovat procesory i jiných výrobců

    Například obskurní UltraSparc T1 – ale společnost Sun tehdy nikdo nežaloval:
    "The T1 only offered a single Floating Point unit to be shared by the 8 cores."
    Blaazen avatar 21.11.2015 23:27 Blaazen | skóre: 24 | blog: BL
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Možná to bylo naopak. Manažeři přišli za inženýrma a řekli jim: "Udělejte to tak, abysme mohli říkat, že je to osmijádro." "Tak tam dáme osm integer jedotek, ostatního stačí míň."
    22.11.2015 12:42 Brad
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    A když se to doslechli v Intelu tak nejdřív smíchem zbořili půl bafriky a pak rozdali mimořádný dovolený :-D
    22.11.2015 14:09 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Spíš bych se vůbec nedivil, kdyby Intel s podobnou architekturou časem přišel taky. Koneckonců o řadiči paměti v procesoru nebo o Hypertransportu se taky hardcore Intel fans nejdřív vyjadřovali pohdavě, jaká je to blbost, dokud to Intel nezačal používat také.
    22.11.2015 19:08 Brad
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Je to dost dobře možné, vzájemné dohody jim to umožňují... AMD je oproti Intelu poměrně malá firma a přesto v minulosti ukázali, že umí být proklatě inovativní, Intel od nich následně převzal už ledasco.

    Na vysvětlenou jako shrnutí (vidouc, že jsem některé svými příspěvky dost zaujal) - z tohoto logicky plyne to, co možná v mých předchozích příspěvcích neplynulo dostatečně zřejmě, a sice že proti AMD celkem nic nemám a v rámci zachování tržní rovnováhy jim i tak nějak fandím. Bohužel a k jejich škodě, jak jsme viděli už na mnoha případech (a nejen u nich), hospodářské výsledky nedělá jen produkt samotný, ale začíná i končí to v marketingovém oddělení, a tam je v současnosti asi největší slabina AMD.

    Zase na druhou stranu, Intel nenechá AMD padnout, protože pak by se stal monopolním dodavatelem na trhu a musel by se z moci úřední nějak rozdělit, a to se mu počítám taky nechce. Technologicky má náskok už značný, navíc na začátku roku koupil Alteru, jsem zvědav co z toho nakonec vyleze (tedy pokud se to někdy dozvíme - svého času nakoupil i patenty od Transmety a od té doby jsme o té firmě taky už nic neslyšeli).
    25.11.2015 00:54 ByCzech
    Rozbalit Rozbalit vše Re: HW novinky: světlé zítřky Broadwellu-E versus temná mračna nad Bulldozerem
    Osobně si myslím, že u Intelu to právě není tím lepším marketingem, ale nekalokonkurenčními taktikami. Neprofláklo se jich málo.

    BTW. co říkáte na toto, narazil jsem na to včera:

    http://www.technologyx.com/featured/amd-vs-intel-our-8-core-cpu-gaming-performance-showdown/4/

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.