Inzerujte na AbcPráce.cz od 950 Kč

napište » Zprávičky

NetBSD 11.0

dnes 04:11 | Nová verze

Byla vydána nová major verze 11.0 open source unixového operačního systému NetBSD (Wikipedie). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

NÚKIB podpořil mezinárodní doporučení pro lepší přehled o složení softwaru

včera 19:55 | IT novinky

Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) se zapojil do mezinárodní iniciativy vedené americkou agenturou CISA (Cybersecurity and Infrastructure Security Agency) a dalšími partnery, jejímž cílem je stanovit minimální náležitosti pro tzv. Software Bill of Materials (SBOM). Nový dokument přináší praktická doporučení, jak by měl vypadat přehled komponent softwaru a jak s ním v praxi pracovat. SBOM lze

… více »

Ladislav Hagara | Komentářů: 1

Servo 0.4.0

včera 03:00 | Nová verze

V aktuálním přehledu vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) bylo oznámeno vydání nové verze 0.4.0. Výrazně se zlepšilo vykreslování stránek jako lichess.org, Zulip nebo Speedtest.

Ladislav Hagara | Komentářů: 0

Kritické zranitelnosti v produktech VMware: CVE-2026-59309, CVE-2026-59310 a CVE-2026-47876

31.7. 19:22 | Bezpečnostní upozornění

Vládní CERT upozorňuje (𝕏) na kritické zranitelnosti v produktech VMware: CVE-2026-59309, CVE-2026-59310 a CVE-2026-47876. Zranitelnosti v VMware vCenter umožňují vzdálenému útočníkovi se síťovým přístupem obejít autentizaci a získat neoprávněný přístup k vCenter, případně zneužít directory traversal ke spuštění libovolného kódu na vCenter.

Ladislav Hagara | Komentářů: 1

Bezpečnostní chyba hardwarových kryptopeněženek Coldcard

31.7. 18:33 | Bezpečnostní upozornění

Společnost Coinkite upozorňuje na bezpečnostní chybu svých hardwarových kryptopeněženek Coldcard. Jedná se o kritickou chybu v generování náhodných čísel (RNG). Místo hardwarového generátoru náhodných čísel (TRNG) byl omylem používán softwarový fallback (PRNG).

Ladislav Hagara | Komentářů: 3

Shadowfetch Linux, nová distribuce s důrazem na lokální umělou inteligenci

31.7. 14:11 | Zajímavý projekt

Představena byla nová linuxová distribuce Shadowfetch Linux. Na rozdíl od mnoha nováčků, které nabízejí převážně jiné téma a výběr softwaru, tato distribuce založená na Debianu Testing s desktopovým prostředím KDE Plasma 6.6, klade lokálně běžící umělou inteligenci do centra svého desktopového zážitku.

Pinhead | Komentářů: 0

Max Leiter: Wayland, X11, GNOME a KDE nativně na iPadu

30.7. 17:22 | Zajímavý projekt

Max Leiter v roce 2019 zkusil zprovoznit X server na iPadu (iOS). Nyní se k tématu vrátil a s pomocí LLM a balíčkovacích nástrojů Procursus rozběhl desktop s X11 i Waylandem. Jeho balíčky jsou dostupné v repozitáři xiOS.

|🇵🇸 | Komentářů: 23

Google Cloud získal certifikaci pro český veřejný sektor

30.7. 13:33 | IT novinky

Společnost Google Cloud dnes oznámila, že její infrastruktura a služby byly oficiálně zařazeny do Katalogu cloud computingu vedeného Digitální a informační agenturou (DIA). Tato certifikace potvrzuje, že infrastruktura a služby Google Cloud splňují přísné bezpečnostní a regulační požadavky České republiky pro provoz cloudových služeb ve veřejném sektoru.

Ladislav Hagara | Komentářů: 6

Zátěžový test eDokladů / 13. srpna ve 13:00

30.7. 13:11 | IT novinky

Vůbec poprvé v historii se stát při testování digitálních služeb obrací na širokou veřejnost. Digitální a informační agentura (DIA) a Ministerstvo vnitra zvou občany k zapojení do zátěžového testu eDokladů, které od loňského podzimu prošly optimalizací aplikace a posílením infrastruktury. Test proběhne 13. srpna ve 13:00 a pro jeho úspěch bude potřeba zapojení několika desítek tisíc občanů. Zapojení do testu je zcela dobrovolné a úkol

… více »

Ladislav Hagara | Komentářů: 41

FireDragon 13

30.7. 13:00 | Nová verze

FireDragon je webový prohlížeč, doposud založený na Floorpu, jednom z forků Firefoxu s větším důrazem na ochranu soukromí a přizpůsobení uživatelského rozhraní. Spravuje ho člen komunity distribuce Garuda Linux. Nové vydání verze 13 opouští Floorp a přechází přímo na Firefox s patchi z LibreWolfu a vlastními úpravami. Dostupný je také na Flathubu.

|🇵🇸 | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Komentářů: 30, poslední 3.4. 20:20

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / vektory a matice se SIMD (sse2)

Štítky: C, C++, GCC, HTML, kompilace, programování, web

Dotaz: vektory a matice se SIMD (sse2)

20.12.2006 14:08 vencas | skóre: 32
vektory a matice se SIMD (sse2)

Přečteno: 445×

Odpovědět | Admin

Zdravím, může mi někdo vyjasnit, které knihovny implementující (malé) matice a vektory používají sse2?

atlas-sse2 je používá, rád bych případně něco s trochu objektovým rozhraním.
Blitz++ si dělá jen svoje optimalizace na úrovni c++ (bez SIMD)?
boost::ublas knihovnu blas (zde v implementaci atlas-sse2) nepoužívá (zběžně pročtené headery)...?

Konečně, když napíšu něco jako (resp. když je něco takového v nějaké knihovně):

double a[3], b[3], c[3];
[...]
c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];

dokáže to gcc optimalizovat a použít na to vektorový součin (MULPD) místo jednotlivých násobení?

Díky.

Nástroje: Začni sledovat (1) ?

Odpovědi

20.12.2006 14:30 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)

Jen střílím, ale při použití parametrů -mfpmath=sse -msse -msse2 by to mohlo dělat gcc samo, ne?

20.12.2006 14:54 vencas | skóre: 32
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)

Mezitím jsem si to vyzkoušel a bohužel nedělá (mimochodem, HTML validita příspěvků, to je fakt PITA - < a > jsem nahradil |).

Kompilace: řekl bych, že -march=pentium4 implikuje -msse{,2,3}, ale v man to není. Na výsledek to každopádně nemá vliv; -ggdb3 taky nemá vliv, akorát je vidět zdroják v dumpu. Pořád tam je 3x mulsd.

$ gcc -ggdb3 -O3 -march=pentium4 -mfpmath=sse,387 -msse -msse2 -msse3 sse1.c -o sse1
$ objdump -d -S sse1
[...]
08048354 |main|:
#include|stdio.h|
int main(void){
 8048354:       8d 4c 24 04             lea    0x4(%esp),%ecx
 8048358:       83 e4 f0                and    $0xfffffff0,%esp
 804835b:       ff 71 fc                pushl  0xfffffffc(%ecx)
 804835e:       55                      push   %ebp
 804835f:       89 e5                   mov    %esp,%ebp
 8048361:       51                      push   %ecx
 8048362:       83 ec 54                sub    $0x54,%esp
        volatile double a[3], b[3];
        double c[3];
        a[0]=.5; a[1]=.5; a[2]=.5;
 8048365:       f2 0f 10 05 c0 84 04    movsd  0x80484c0,%xmm0
 804836c:       08 
 804836d:       f2 0f 11 45 e0          movsd  %xmm0,0xffffffe0(%ebp)
 8048372:       f2 0f 11 45 e8          movsd  %xmm0,0xffffffe8(%ebp)
 8048377:       f2 0f 11 45 f0          movsd  %xmm0,0xfffffff0(%ebp)
        b[0]=.5; b[1]=.5; b[2]=.5;
 804837c:       f2 0f 11 45 c8          movsd  %xmm0,0xffffffc8(%ebp)
 8048381:       f2 0f 11 45 d0          movsd  %xmm0,0xffffffd0(%ebp)
 8048386:       f2 0f 11 45 d8          movsd  %xmm0,0xffffffd8(%ebp)
        c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
 804838b:       f2 0f 10 5d e0          movsd  0xffffffe0(%ebp),%xmm3
 8048390:       f2 0f 10 6d c8          movsd  0xffffffc8(%ebp),%xmm5
 8048395:       f2 0f 10 55 e8          movsd  0xffffffe8(%ebp),%xmm2
 804839a:       f2 0f 10 65 d0          movsd  0xffffffd0(%ebp),%xmm4
 804839f:       f2 0f 10 45 f0          movsd  0xfffffff0(%ebp),%xmm0
 80483a4:       f2 0f 10 4d d8          movsd  0xffffffd8(%ebp),%xmm1
        printf("c=%g,%g,%g\n",c[0],c[1],c[2]);
 80483a9:       f2 0f 59 c1             mulsd  %xmm1,%xmm0
 80483ad:       f2 0f 11 44 24 14       movsd  %xmm0,0x14(%esp)
 80483b3:       f2 0f 59 d4             mulsd  %xmm4,%xmm2
 80483b7:       f2 0f 11 54 24 0c       movsd  %xmm2,0xc(%esp)
 80483bd:       f2 0f 59 dd             mulsd  %xmm5,%xmm3
 80483c1:       f2 0f 11 5c 24 04       movsd  %xmm3,0x4(%esp)
 80483c7:       c7 04 24 b0 84 04 08    movl   $0x80484b0,(%esp)
 80483ce:       e8 bd fe ff ff          call   8048290 |printf@plt|
        return 0;
}
[...]

21.12.2006 10:16 vencas | skóre: 32
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)

Co se gcc týče, našel jsem článek Automatic vectorization for the masses. Zkoušel jsem to na gcc-4.1 a výsledek je následující (options -O2 -ftree-vectorize -ftree-vectorizer-verbose=3 -march=pentium4):

c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2]; se nezvektorizuje (fuj, to je hnusný slovo...), ale
for(int i=0; i<3; i++) c[i]=a[i]*b[i]; ano.

(Myslel jsem si, že když se rozbalují smyčky (loop unrolling), tak se z for udělá stejně něco podobné tomu prvnímu. Zřejmě ne úplně.)

Jak autor zmíněného článku píše, podobné optimalizace mohou vést k nestabilnímu kódu.

Založit nové vlákno • Nahoru

Tiskni Sdílej: