abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:33 | Zajímavý software

    Cheat Engine (Wikipedie) je s verzí 7.7 k dispozici už také pro Linux. Jedná se o proprietární skener/debugger paměti používaný především k cheatování v počítačových hrách.

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | IT novinky

    Vláda USA nařídila společnosti Anthropic pozastavit přístup k modelům Fable 5 a Mythos 5 pro všechny cizince, včetně zaměstnanců Anthropicu.

    Ladislav Hagara | Komentářů: 6
    včera 02:22 | Nová verze

    Společnost Murena představila (YouTube) novou verzi 4.0 mobilního operačního systému /e/OS (Wikipedie) založeného na Androidu a LineageOS bez aplikací a služeb od Googlu.

    Ladislav Hagara | Komentářů: 0
    12.6. 16:33 | Bezpečnostní upozornění

    V Arch User Repository (AUR) bylo kompromitováno přes 400 opomíjených balíčků (jejich seznam). Útočník do nich začlenil škodlivý npm balíček atomic-lockfile, který krade citlivá data uživatelů. Publikována byla předběžná analýza spouštěného malwaru deps.

    Ladislav Hagara | Komentářů: 11
    12.6. 11:33 | Nová verze

    Homebrew, správce balíčků nejen pro macOS, byl vydán ve verzi 6.0.0 (seznam změn). Hlavními novinkami jsou bezpečnostní mechanismus tap trust kvůli důvěryhodnosti závislostí, vylepšení sandboxingu na Linuxu, interní JSON API nebo zlepšení výkonu.

    |🇵🇸 | Komentářů: 0
    12.6. 03:33 | Bezpečnostní upozornění

    Byla nalezena a 9. června opravena kritická zranitelnost ve FreeBSD v Kernel TLS (KTLS). Pojmenována byla Bumsrakete (FreeBSD-SA-26:26.ktls, CVE-2026-45257). Lokální neprivilegovaný uživatel může přepisovat soubory, ke kterým má právo pouze pro čtení. Přepsáním setuid binárky a jejím spuštěním může získat roota. Na všech verzích od verze 13.0 vydané v dubnu 2021.

    Ladislav Hagara | Komentářů: 2
    11.6. 14:11 | Komunita

    Vývojáři open source operačního systému ReactOS (Wikipedie), jehož cílem je kompletní binární kompatibilita s aplikacemi a ovladači pro Windows, se na síti 𝕏 pochlubili, že ReactOS zvládne počítačovou hru Half-Life.

    Ladislav Hagara | Komentářů: 5
    11.6. 10:44 | Nová verze

    Byla vydána nová verze 4.8 multiplatformního integrovaného vývojového prostředí (IDE) pro rychlý vývoj aplikaci (RAD) ve Free Pascalu Lazarus (Wikipedie). Využíván je Free Pascal Compiler (FPC) 3.2.2.

    Ladislav Hagara | Komentářů: 0
    11.6. 04:44 | Nová verze

    Apple container dospěl do verze 1.0.0. Jedná se o open source nástroj pro spouštění linuxových kontejnerů na macOS postavený nad containerization. Napsaný je v programovacím jazyce Swift a optimalizovaný pro Apple silicon.

    Ladislav Hagara | Komentářů: 5
    11.6. 03:33 | Nová verze

    Bylo vydáno Eclipse IDE 2026-06 aneb Eclipse 4.40. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (16%)
     (31%)
     (3%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1904 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: vektory a matice se SIMD (sse2)

    20.12.2006 14:08 vencas | skóre: 32
    vektory a matice se SIMD (sse2)
    Přečteno: 378×
    Zdravím, může mi někdo vyjasnit, které knihovny implementující (malé) matice a vektory používají sse2?
    1. atlas-sse2 je používá, rád bych případně něco s trochu objektovým rozhraním.
    2. Blitz++ si dělá jen svoje optimalizace na úrovni c++ (bez SIMD)?
    3. boost::ublas knihovnu blas (zde v implementaci atlas-sse2) nepoužívá (zběžně pročtené headery)...?
    Konečně, když napíšu něco jako (resp. když je něco takového v nějaké knihovně):
    double a[3], b[3], c[3];
    [...]
    c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
    
    dokáže to gcc optimalizovat a použít na to vektorový součin (MULPD) místo jednotlivých násobení?

    Díky.

    Odpovědi

    20.12.2006 14:30 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Jen střílím, ale při použití parametrů -mfpmath=sse -msse -msse2 by to mohlo dělat gcc samo, ne?
    20.12.2006 14:54 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Mezitím jsem si to vyzkoušel a bohužel nedělá (mimochodem, HTML validita příspěvků, to je fakt PITA - < a > jsem nahradil |).

    Kompilace: řekl bych, že -march=pentium4 implikuje -msse{,2,3}, ale v man to není. Na výsledek to každopádně nemá vliv; -ggdb3 taky nemá vliv, akorát je vidět zdroják v dumpu. Pořád tam je 3x mulsd.
    $ gcc -ggdb3 -O3 -march=pentium4 -mfpmath=sse,387 -msse -msse2 -msse3 sse1.c -o sse1
    $ objdump -d -S sse1
    [...]
    08048354 |main|:
    #include|stdio.h|
    int main(void){
     8048354:       8d 4c 24 04             lea    0x4(%esp),%ecx
     8048358:       83 e4 f0                and    $0xfffffff0,%esp
     804835b:       ff 71 fc                pushl  0xfffffffc(%ecx)
     804835e:       55                      push   %ebp
     804835f:       89 e5                   mov    %esp,%ebp
     8048361:       51                      push   %ecx
     8048362:       83 ec 54                sub    $0x54,%esp
            volatile double a[3], b[3];
            double c[3];
            a[0]=.5; a[1]=.5; a[2]=.5;
     8048365:       f2 0f 10 05 c0 84 04    movsd  0x80484c0,%xmm0
     804836c:       08 
     804836d:       f2 0f 11 45 e0          movsd  %xmm0,0xffffffe0(%ebp)
     8048372:       f2 0f 11 45 e8          movsd  %xmm0,0xffffffe8(%ebp)
     8048377:       f2 0f 11 45 f0          movsd  %xmm0,0xfffffff0(%ebp)
            b[0]=.5; b[1]=.5; b[2]=.5;
     804837c:       f2 0f 11 45 c8          movsd  %xmm0,0xffffffc8(%ebp)
     8048381:       f2 0f 11 45 d0          movsd  %xmm0,0xffffffd0(%ebp)
     8048386:       f2 0f 11 45 d8          movsd  %xmm0,0xffffffd8(%ebp)
            c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
     804838b:       f2 0f 10 5d e0          movsd  0xffffffe0(%ebp),%xmm3
     8048390:       f2 0f 10 6d c8          movsd  0xffffffc8(%ebp),%xmm5
     8048395:       f2 0f 10 55 e8          movsd  0xffffffe8(%ebp),%xmm2
     804839a:       f2 0f 10 65 d0          movsd  0xffffffd0(%ebp),%xmm4
     804839f:       f2 0f 10 45 f0          movsd  0xfffffff0(%ebp),%xmm0
     80483a4:       f2 0f 10 4d d8          movsd  0xffffffd8(%ebp),%xmm1
            printf("c=%g,%g,%g\n",c[0],c[1],c[2]);
     80483a9:       f2 0f 59 c1             mulsd  %xmm1,%xmm0
     80483ad:       f2 0f 11 44 24 14       movsd  %xmm0,0x14(%esp)
     80483b3:       f2 0f 59 d4             mulsd  %xmm4,%xmm2
     80483b7:       f2 0f 11 54 24 0c       movsd  %xmm2,0xc(%esp)
     80483bd:       f2 0f 59 dd             mulsd  %xmm5,%xmm3
     80483c1:       f2 0f 11 5c 24 04       movsd  %xmm3,0x4(%esp)
     80483c7:       c7 04 24 b0 84 04 08    movl   $0x80484b0,(%esp)
     80483ce:       e8 bd fe ff ff          call   8048290 |printf@plt|
            return 0;
    }
    [...]
    
    21.12.2006 10:16 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Co se gcc týče, našel jsem článek Automatic vectorization for the masses. Zkoušel jsem to na gcc-4.1 a výsledek je následující (options -O2 -ftree-vectorize -ftree-vectorizer-verbose=3 -march=pentium4):
    • c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2]; se nezvektorizuje (fuj, to je hnusný slovo...), ale
    • for(int i=0; i<3; i++) c[i]=a[i]*b[i]; ano.
    (Myslel jsem si, že když se rozbalují smyčky (loop unrolling), tak se z for udělá stejně něco podobné tomu prvnímu. Zřejmě ne úplně.)

    Jak autor zmíněného článku píše, podobné optimalizace mohou vést k nestabilnímu kódu.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.