abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:55 | Nová verze

    Google Chrome 150 byl prohlášen za stabilní. Nejnovější stabilní verze 150.0.7871.46 přináší řadu novinek. Podrobný přehled v poznámkách k vydání. Opraveno bylo 433 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    dnes 13:00 | Nová verze

    Soudní dvůr Evropské unie potvrdil rekordní pokutu 4,125 miliardy eur (100 miliard Kč) americké technologické firmě Google ze skupiny Alphabet. Pokutu firmě v roce 2018 vyměřila Evropská komise (EK) za to, že Google podle ní zneužívá operačního systému Android k potlačení konkurence na trhu vyhledávacích služeb.

    Ladislav Hagara | Komentářů: 15
    dnes 12:44 | IT novinky

    Administrativa amerického prezidenta Donalda Trumpa povolila firmě Anthropic obnovit plný přístup klientů k modelům umělé inteligence (AI) Fable 5 a Mythos 5. Ty byly nedostupné bezmála tři týdny kvůli bezpečnostním obavám vlády, třebaže americké ministerstvo obchodu minulý pátek povolilo omezený přístup k modelu Mythos 5 pro některé „důvěryhodné“ domácí organizace.

    Ladislav Hagara | Komentářů: 1
    dnes 12:22 | Zajímavý článek

    Francúzska organizácia na ochranu spotrebiteľa, po viac než ôsmych rokoch skúmania, žaluje Epson za plánované zastarávanie tlačiarní. Súd sa začína dnes, 2. 7. 2026, vo francúzskom Nanterre.

    Vlado99 | Komentářů: 4
    dnes 03:00 | Zajímavý software

    Erin Catto, autor open source 2D fyzikálního enginu Box2D (Wikipedie), představil nový 3D fyzikální engine Box3D. Engine je již používán ve hře The Legend of California.

    Ladislav Hagara | Komentářů: 0
    dnes 01:00 | Nová verze

    Byla vydána nová verze 4.0.0 multiplatformního svobodného frameworku pro zpracování obrazu G'MIC (GREYC's Magic for Image Computing, Wikipedie). Přehled novinek i s náhledy nových filtrů na PIXLS.US.

    Ladislav Hagara | Komentářů: 1
    včera 14:22 | Zajímavý článek

    Český statistický úřad (ČSÚ): Průměrná hrubá měsíční mzda ICT specialistů v roce 2025 meziročně vzrostla o 6 % na téměř 100 tisíc korun. Nejlépe placeni byli vývojáři softwaru. Dlouhodobým trendem zůstává nízké zastoupení žen, a to jak mezi specialisty, tak studenty těchto oborů.

    Ladislav Hagara | Komentářů: 15
    včera 14:11 | IT novinky

    Ochranný svaz autorský (OSA) připravuje žalobu na společnost Suno, která umožňuje generování hudby pomocí umělé inteligence (AI). ČTK to sdělil předseda představenstva OSA Roman Strejček. Suno podle něj bez souhlasu využívá k trénování svých modelů hudbu autorů, které svaz zastupuje. Nedávný investigativní materiál magazínu The Atlantic ukázal, že firmy jako Suno nebo Udio k trénování modelů používají rozsáhlé databáze obsahující miliony skladeb. V databázích, které časopis zveřejnil, lze dohledat i písně řady českých a slovenských umělců.

    Ladislav Hagara | Komentářů: 3
    včera 13:33 | Komunita

    Byl publikován přehled dění a novinek z vývoje Asahi Linuxu, tj. Linuxu pro Apple Silicon. Vyřešen byl problém s macOS 27 Golden Gate. Vývoj lze podpořit na Open Collective a GitHub Sponsors.

    Ladislav Hagara | Komentářů: 0
    včera 12:55 | IT novinky

    EU dnešním dnem zavedla clo ve výši 3 eur na balíky nízké hodnoty dovážené ze zemí mimo EU. To zahrnuje širokou škálu výrobků běžně nakupovaných on-line, jako jsou oděvy, hračky, elektronika a další spotřební zboží v hodnotě až 150 EUR.

    Ladislav Hagara | Komentářů: 11
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (17%)
     (31%)
     (4%)
     (6%)
     (2%)
     (15%)
     (26%)
    Celkem 2037 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: vektory a matice se SIMD (sse2)

    20.12.2006 14:08 vencas | skóre: 32
    vektory a matice se SIMD (sse2)
    Přečteno: 388×
    Zdravím, může mi někdo vyjasnit, které knihovny implementující (malé) matice a vektory používají sse2?
    1. atlas-sse2 je používá, rád bych případně něco s trochu objektovým rozhraním.
    2. Blitz++ si dělá jen svoje optimalizace na úrovni c++ (bez SIMD)?
    3. boost::ublas knihovnu blas (zde v implementaci atlas-sse2) nepoužívá (zběžně pročtené headery)...?
    Konečně, když napíšu něco jako (resp. když je něco takového v nějaké knihovně):
    double a[3], b[3], c[3];
    [...]
    c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
    
    dokáže to gcc optimalizovat a použít na to vektorový součin (MULPD) místo jednotlivých násobení?

    Díky.

    Odpovědi

    20.12.2006 14:30 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Jen střílím, ale při použití parametrů -mfpmath=sse -msse -msse2 by to mohlo dělat gcc samo, ne?
    20.12.2006 14:54 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Mezitím jsem si to vyzkoušel a bohužel nedělá (mimochodem, HTML validita příspěvků, to je fakt PITA - < a > jsem nahradil |).

    Kompilace: řekl bych, že -march=pentium4 implikuje -msse{,2,3}, ale v man to není. Na výsledek to každopádně nemá vliv; -ggdb3 taky nemá vliv, akorát je vidět zdroják v dumpu. Pořád tam je 3x mulsd.
    $ gcc -ggdb3 -O3 -march=pentium4 -mfpmath=sse,387 -msse -msse2 -msse3 sse1.c -o sse1
    $ objdump -d -S sse1
    [...]
    08048354 |main|:
    #include|stdio.h|
    int main(void){
     8048354:       8d 4c 24 04             lea    0x4(%esp),%ecx
     8048358:       83 e4 f0                and    $0xfffffff0,%esp
     804835b:       ff 71 fc                pushl  0xfffffffc(%ecx)
     804835e:       55                      push   %ebp
     804835f:       89 e5                   mov    %esp,%ebp
     8048361:       51                      push   %ecx
     8048362:       83 ec 54                sub    $0x54,%esp
            volatile double a[3], b[3];
            double c[3];
            a[0]=.5; a[1]=.5; a[2]=.5;
     8048365:       f2 0f 10 05 c0 84 04    movsd  0x80484c0,%xmm0
     804836c:       08 
     804836d:       f2 0f 11 45 e0          movsd  %xmm0,0xffffffe0(%ebp)
     8048372:       f2 0f 11 45 e8          movsd  %xmm0,0xffffffe8(%ebp)
     8048377:       f2 0f 11 45 f0          movsd  %xmm0,0xfffffff0(%ebp)
            b[0]=.5; b[1]=.5; b[2]=.5;
     804837c:       f2 0f 11 45 c8          movsd  %xmm0,0xffffffc8(%ebp)
     8048381:       f2 0f 11 45 d0          movsd  %xmm0,0xffffffd0(%ebp)
     8048386:       f2 0f 11 45 d8          movsd  %xmm0,0xffffffd8(%ebp)
            c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
     804838b:       f2 0f 10 5d e0          movsd  0xffffffe0(%ebp),%xmm3
     8048390:       f2 0f 10 6d c8          movsd  0xffffffc8(%ebp),%xmm5
     8048395:       f2 0f 10 55 e8          movsd  0xffffffe8(%ebp),%xmm2
     804839a:       f2 0f 10 65 d0          movsd  0xffffffd0(%ebp),%xmm4
     804839f:       f2 0f 10 45 f0          movsd  0xfffffff0(%ebp),%xmm0
     80483a4:       f2 0f 10 4d d8          movsd  0xffffffd8(%ebp),%xmm1
            printf("c=%g,%g,%g\n",c[0],c[1],c[2]);
     80483a9:       f2 0f 59 c1             mulsd  %xmm1,%xmm0
     80483ad:       f2 0f 11 44 24 14       movsd  %xmm0,0x14(%esp)
     80483b3:       f2 0f 59 d4             mulsd  %xmm4,%xmm2
     80483b7:       f2 0f 11 54 24 0c       movsd  %xmm2,0xc(%esp)
     80483bd:       f2 0f 59 dd             mulsd  %xmm5,%xmm3
     80483c1:       f2 0f 11 5c 24 04       movsd  %xmm3,0x4(%esp)
     80483c7:       c7 04 24 b0 84 04 08    movl   $0x80484b0,(%esp)
     80483ce:       e8 bd fe ff ff          call   8048290 |printf@plt|
            return 0;
    }
    [...]
    
    21.12.2006 10:16 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Co se gcc týče, našel jsem článek Automatic vectorization for the masses. Zkoušel jsem to na gcc-4.1 a výsledek je následující (options -O2 -ftree-vectorize -ftree-vectorizer-verbose=3 -march=pentium4):
    • c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2]; se nezvektorizuje (fuj, to je hnusný slovo...), ale
    • for(int i=0; i<3; i++) c[i]=a[i]*b[i]; ano.
    (Myslel jsem si, že když se rozbalují smyčky (loop unrolling), tak se z for udělá stejně něco podobné tomu prvnímu. Zřejmě ne úplně.)

    Jak autor zmíněného článku píše, podobné optimalizace mohou vést k nestabilnímu kódu.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.