abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 20:11 | Komunita

    Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma. V Týdnu v GNOME je zmíněn flatpak balíček pro GIMP 0.54.1 z roku 1996. Jedná se o poslední verzi GIMPu postavenou nad toolkitem Motif.

    Ladislav Hagara | Komentářů: 0
    dnes 19:11 | Nová verze

    Home Assistant Operating System, tj. linuxová distribuce optimalizována pro hostování Home Assistanta a jeho aplikací, byl vydán v nové major verzi 18.0.

    Ladislav Hagara | Komentářů: 0
    dnes 18:11 | Komunita

    Po šestiletém úsilí byla z jádra Linux odstraněna funkce strncpy(). Všechna předchozí volání této funkce byla převedena na bezpečnější alternativy.

    Ladislav Hagara | Komentářů: 1
    dnes 17:22 | Nová verze

    Byla vydána nová verze 261 správce systému a služeb systemd (Wikipedie, GitHub). Z novinek lze vypíchnout nový subsystém IMDS (Cloud "Instance Metadata Service"), nový příkaz storagectl nebo novou komponentu systemd-sysinstall.

    Ladislav Hagara | Komentářů: 2
    dnes 12:00 | Nová verze

    Vývojové prostředí Qt Creator bylo vydáno ve verzi 20 (seznam změn). Novinky zahrnují hlavně rozšíření pro integraci LLM agentů nebo minimalistický editační režim uživatelského rozhraní („zen mode“).

    |🇵🇸 | Komentářů: 0
    včera 10:22 | Humor

    Už jste se prolétli na webu Google Earth? Přibyl tam Simulátor letu (Nástroje / Simulátor letu). Funguje i bez účtu Google [𝕏].

    Ladislav Hagara | Komentářů: 0
    včera 09:55 | Nová verze

    Byla vydána nová verze 4.7 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 3
    18.6. 13:33 | Nová verze

    Mastodon (Wikipedie) - sociální síť, která není na prodej - byl vydán ve verzi 4.6. Přehled novinek s náhledy v oznámení na blogu.

    Ladislav Hagara | Komentářů: 0
    18.6. 12:44 | IT novinky

    V Edici CZ.NIC, knižní řady správce české národní domény, vychází nová kniha Martina Malého Kódy, buildy, firmwary. Autor po půl roce od vydání předchozího titulu přichází se svou již sedmou knihou, tentokrát zaměřenou na vývoj programového vybavení pro embedded zařízení. Publikace s podtitulem Základy vývojářského řemesla pro tvůrce hobby elektroniky nabízí praktického průvodce pro všechny, kdo své projekty vytvořené s Arduinem

    … více »
    Ladislav Hagara | Komentářů: 0
    18.6. 11:44 | Komunita

    V Brně na FIT VUT probíhá dvoudenní open source komunitní konference DevConf.CZ 2026. Na programu je celá řada zajímavých přednášek, lightning talků, meetupů a workshopů. Přednášky lze sledovat i online na YouTube kanálu konference. Aktuální dění lze sledovat na Matrixu, 𝕏 nebo Mastodonu.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (16%)
     (31%)
     (3%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1949 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: vektory a matice se SIMD (sse2)

    20.12.2006 14:08 vencas | skóre: 32
    vektory a matice se SIMD (sse2)
    Přečteno: 383×
    Zdravím, může mi někdo vyjasnit, které knihovny implementující (malé) matice a vektory používají sse2?
    1. atlas-sse2 je používá, rád bych případně něco s trochu objektovým rozhraním.
    2. Blitz++ si dělá jen svoje optimalizace na úrovni c++ (bez SIMD)?
    3. boost::ublas knihovnu blas (zde v implementaci atlas-sse2) nepoužívá (zběžně pročtené headery)...?
    Konečně, když napíšu něco jako (resp. když je něco takového v nějaké knihovně):
    double a[3], b[3], c[3];
    [...]
    c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
    
    dokáže to gcc optimalizovat a použít na to vektorový součin (MULPD) místo jednotlivých násobení?

    Díky.

    Odpovědi

    20.12.2006 14:30 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Jen střílím, ale při použití parametrů -mfpmath=sse -msse -msse2 by to mohlo dělat gcc samo, ne?
    20.12.2006 14:54 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Mezitím jsem si to vyzkoušel a bohužel nedělá (mimochodem, HTML validita příspěvků, to je fakt PITA - < a > jsem nahradil |).

    Kompilace: řekl bych, že -march=pentium4 implikuje -msse{,2,3}, ale v man to není. Na výsledek to každopádně nemá vliv; -ggdb3 taky nemá vliv, akorát je vidět zdroják v dumpu. Pořád tam je 3x mulsd.
    $ gcc -ggdb3 -O3 -march=pentium4 -mfpmath=sse,387 -msse -msse2 -msse3 sse1.c -o sse1
    $ objdump -d -S sse1
    [...]
    08048354 |main|:
    #include|stdio.h|
    int main(void){
     8048354:       8d 4c 24 04             lea    0x4(%esp),%ecx
     8048358:       83 e4 f0                and    $0xfffffff0,%esp
     804835b:       ff 71 fc                pushl  0xfffffffc(%ecx)
     804835e:       55                      push   %ebp
     804835f:       89 e5                   mov    %esp,%ebp
     8048361:       51                      push   %ecx
     8048362:       83 ec 54                sub    $0x54,%esp
            volatile double a[3], b[3];
            double c[3];
            a[0]=.5; a[1]=.5; a[2]=.5;
     8048365:       f2 0f 10 05 c0 84 04    movsd  0x80484c0,%xmm0
     804836c:       08 
     804836d:       f2 0f 11 45 e0          movsd  %xmm0,0xffffffe0(%ebp)
     8048372:       f2 0f 11 45 e8          movsd  %xmm0,0xffffffe8(%ebp)
     8048377:       f2 0f 11 45 f0          movsd  %xmm0,0xfffffff0(%ebp)
            b[0]=.5; b[1]=.5; b[2]=.5;
     804837c:       f2 0f 11 45 c8          movsd  %xmm0,0xffffffc8(%ebp)
     8048381:       f2 0f 11 45 d0          movsd  %xmm0,0xffffffd0(%ebp)
     8048386:       f2 0f 11 45 d8          movsd  %xmm0,0xffffffd8(%ebp)
            c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
     804838b:       f2 0f 10 5d e0          movsd  0xffffffe0(%ebp),%xmm3
     8048390:       f2 0f 10 6d c8          movsd  0xffffffc8(%ebp),%xmm5
     8048395:       f2 0f 10 55 e8          movsd  0xffffffe8(%ebp),%xmm2
     804839a:       f2 0f 10 65 d0          movsd  0xffffffd0(%ebp),%xmm4
     804839f:       f2 0f 10 45 f0          movsd  0xfffffff0(%ebp),%xmm0
     80483a4:       f2 0f 10 4d d8          movsd  0xffffffd8(%ebp),%xmm1
            printf("c=%g,%g,%g\n",c[0],c[1],c[2]);
     80483a9:       f2 0f 59 c1             mulsd  %xmm1,%xmm0
     80483ad:       f2 0f 11 44 24 14       movsd  %xmm0,0x14(%esp)
     80483b3:       f2 0f 59 d4             mulsd  %xmm4,%xmm2
     80483b7:       f2 0f 11 54 24 0c       movsd  %xmm2,0xc(%esp)
     80483bd:       f2 0f 59 dd             mulsd  %xmm5,%xmm3
     80483c1:       f2 0f 11 5c 24 04       movsd  %xmm3,0x4(%esp)
     80483c7:       c7 04 24 b0 84 04 08    movl   $0x80484b0,(%esp)
     80483ce:       e8 bd fe ff ff          call   8048290 |printf@plt|
            return 0;
    }
    [...]
    
    21.12.2006 10:16 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
    Co se gcc týče, našel jsem článek Automatic vectorization for the masses. Zkoušel jsem to na gcc-4.1 a výsledek je následující (options -O2 -ftree-vectorize -ftree-vectorizer-verbose=3 -march=pentium4):
    • c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2]; se nezvektorizuje (fuj, to je hnusný slovo...), ale
    • for(int i=0; i<3; i++) c[i]=a[i]*b[i]; ano.
    (Myslel jsem si, že když se rozbalují smyčky (loop unrolling), tak se z for udělá stejně něco podobné tomu prvnímu. Zřejmě ne úplně.)

    Jak autor zmíněného článku píše, podobné optimalizace mohou vést k nestabilnímu kódu.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.