Přihlášení | Registrace

napište » Zprávičky

Firefox 143.0

včera 21:44 | Nová verze

Byl vydán Mozilla Firefox 143.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově se Firefox při ukončování anonymního režimu zeptá, zda chcete smazat stažené soubory. Dialog pro povolení přístupu ke kameře zobrazuje náhled. Obzvláště užitečné při přepínání mezi více kamerami. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 143 bude brzy k dispozici také na Flathubu a Snapcraftu.

Ladislav Hagara | Komentářů: 0

Fedora Linux 43 Beta

včera 17:22 | Nová verze

Byla vydána betaverze Fedora Linuxu 43 (ChangeSet), tj. poslední zastávka před vydáním finální verze, která je naplánována na úterý 21. října.

Ladislav Hagara | Komentářů: 0

Ghostty 1.2

včera 12:22 | Nová verze

Multiplatformní emulátor terminálu Ghostty byl vydán ve verzi 1.2 (𝕏, Mastodon). Přehled novinek, vylepšení a nových efektů v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Godot 4.5

včera 00:11 | Nová verze

Byla vydána nová verze 4.5 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.

Ladislav Hagara | Komentářů: 0

asciinema CLI 3.0

15.9. 21:33 | Nová verze

Byla vydána verze 3.0 (Mastodon) nástroje pro záznam a sdílení terminálových sezení asciinema (GitHub). S novou verzí formátu záznamu asciicast v3, podporou live streamingu a především kompletním přepisem z Pythonu do Rustu.

Ladislav Hagara | Komentářů: 0

Canonical oznámil, že bude podporovat a distribuovat toolkit NVIDIA CUDA v Ubuntu

15.9. 21:00 | Komunita

Canonical oznámil, že bude podporovat a distribuovat toolkit NVIDIA CUDA (Wikipedie) v Ubuntu.

Ladislav Hagara | Komentářů: 0

Hodnota společnosti Alphabet překonala hranici tří bilionů dolarů

15.9. 20:44 | IT novinky

Tržní hodnota americké společnosti Alphabet, která je majitelem internetového vyhledávače Google, dnes poprvé překonala hranici tří bilionů dolarů (62,1 bilionu Kč). Alphabet se připojil k malé skupině společností, které tuto hranici pokořily. Jsou mezi nimi zatím americké firmy Nvidia, Microsoft a Apple.

Ladislav Hagara | Komentářů: 2

Washington a Peking se dohodly na pokračování TikToku v USA

15.9. 20:33 | IT novinky

Spojené státy a Čína dosáhly dohody ohledně pokračování populární čínské platformy pro sdílení krátkých videí TikTok v USA. V příspěvku na síti Truth Social to dnes naznačil americký prezident Donald Trump. Dosažení rámcové dohody o TikToku vzápětí oznámil americký ministr financí Scott Bessent, který v Madridu jedná s čínskými představiteli o vzájemných obchodních vztazích mezi USA a Čínou. Bessentova slova později potvrdila také čínská strana.

Ladislav Hagara | Komentářů: 0

MKVToolNix 95.0. Podpora Matrosky míří do Firefoxu

15.9. 16:55 | Komunita

MKVToolNix, tj. sada nástrojů pro práci s formátem (medialnym kontajnerom) Matroska, byl vydán ve verzi 95.0. Podpora přehrávání formátu Matroska míří do Firefoxu [Bug 1422891, Technický popis]. Přehrávání lze již testovat ve Firefoxu Nightly.

Ladislav Hagara | Komentářů: 0

Pozvánka na 211. sraz spolku OpenAlt

13.9. 17:33 | Pozvánky

Spolek OpenAlt zve příznivce otevřených řešení a přístupu na 211. sraz, který proběhne v pátek 19. září od 18:00 ve Studentském klubu U Kachničky na Fakultě informačních technologií Vysokého učení technického na adrese Božetěchova 2/1. Na srazu proběhne přednáška Jiřího Eischmanna o nové verzi prostředí GNOME 49. Nemáte-li možnost se zúčastnit osobně, přednáškový blok bude opět streamován živě na server VHSky.cz a následně i zpřístupněn záznam.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (50%)

Gitlab (100%)

Atlassian (0%)

Bitbucket (0%)

Gitea (0%)

Mercurial (0%)

jen git (0%)

jen svn (0%)

Jiné (uvedu v diskusi) (0%)

Celkem 2 hlasů

Komentářů: 0

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / vektory a matice se SIMD (sse2)

Štítky: C, C++, GCC, HTML, kompilace, programování, web

Dotaz: vektory a matice se SIMD (sse2)

20.12.2006 14:08 vencas | skóre: 32
vektory a matice se SIMD (sse2)

Přečteno: 330×

Odpovědět | Admin

Zdravím, může mi někdo vyjasnit, které knihovny implementující (malé) matice a vektory používají sse2?

atlas-sse2 je používá, rád bych případně něco s trochu objektovým rozhraním.
Blitz++ si dělá jen svoje optimalizace na úrovni c++ (bez SIMD)?
boost::ublas knihovnu blas (zde v implementaci atlas-sse2) nepoužívá (zběžně pročtené headery)...?

Konečně, když napíšu něco jako (resp. když je něco takového v nějaké knihovně):

double a[3], b[3], c[3];
[...]
c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];

dokáže to gcc optimalizovat a použít na to vektorový součin (MULPD) místo jednotlivých násobení?

Díky.

Nástroje: Začni sledovat (1) ?

Odpovědi

20.12.2006 14:30 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)

Jen střílím, ale při použití parametrů -mfpmath=sse -msse -msse2 by to mohlo dělat gcc samo, ne?

20.12.2006 14:54 vencas | skóre: 32
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)

Mezitím jsem si to vyzkoušel a bohužel nedělá (mimochodem, HTML validita příspěvků, to je fakt PITA - < a > jsem nahradil |).

Kompilace: řekl bych, že -march=pentium4 implikuje -msse{,2,3}, ale v man to není. Na výsledek to každopádně nemá vliv; -ggdb3 taky nemá vliv, akorát je vidět zdroják v dumpu. Pořád tam je 3x mulsd.

$ gcc -ggdb3 -O3 -march=pentium4 -mfpmath=sse,387 -msse -msse2 -msse3 sse1.c -o sse1
$ objdump -d -S sse1
[...]
08048354 |main|:
#include|stdio.h|
int main(void){
 8048354:       8d 4c 24 04             lea    0x4(%esp),%ecx
 8048358:       83 e4 f0                and    $0xfffffff0,%esp
 804835b:       ff 71 fc                pushl  0xfffffffc(%ecx)
 804835e:       55                      push   %ebp
 804835f:       89 e5                   mov    %esp,%ebp
 8048361:       51                      push   %ecx
 8048362:       83 ec 54                sub    $0x54,%esp
        volatile double a[3], b[3];
        double c[3];
        a[0]=.5; a[1]=.5; a[2]=.5;
 8048365:       f2 0f 10 05 c0 84 04    movsd  0x80484c0,%xmm0
 804836c:       08 
 804836d:       f2 0f 11 45 e0          movsd  %xmm0,0xffffffe0(%ebp)
 8048372:       f2 0f 11 45 e8          movsd  %xmm0,0xffffffe8(%ebp)
 8048377:       f2 0f 11 45 f0          movsd  %xmm0,0xfffffff0(%ebp)
        b[0]=.5; b[1]=.5; b[2]=.5;
 804837c:       f2 0f 11 45 c8          movsd  %xmm0,0xffffffc8(%ebp)
 8048381:       f2 0f 11 45 d0          movsd  %xmm0,0xffffffd0(%ebp)
 8048386:       f2 0f 11 45 d8          movsd  %xmm0,0xffffffd8(%ebp)
        c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
 804838b:       f2 0f 10 5d e0          movsd  0xffffffe0(%ebp),%xmm3
 8048390:       f2 0f 10 6d c8          movsd  0xffffffc8(%ebp),%xmm5
 8048395:       f2 0f 10 55 e8          movsd  0xffffffe8(%ebp),%xmm2
 804839a:       f2 0f 10 65 d0          movsd  0xffffffd0(%ebp),%xmm4
 804839f:       f2 0f 10 45 f0          movsd  0xfffffff0(%ebp),%xmm0
 80483a4:       f2 0f 10 4d d8          movsd  0xffffffd8(%ebp),%xmm1
        printf("c=%g,%g,%g\n",c[0],c[1],c[2]);
 80483a9:       f2 0f 59 c1             mulsd  %xmm1,%xmm0
 80483ad:       f2 0f 11 44 24 14       movsd  %xmm0,0x14(%esp)
 80483b3:       f2 0f 59 d4             mulsd  %xmm4,%xmm2
 80483b7:       f2 0f 11 54 24 0c       movsd  %xmm2,0xc(%esp)
 80483bd:       f2 0f 59 dd             mulsd  %xmm5,%xmm3
 80483c1:       f2 0f 11 5c 24 04       movsd  %xmm3,0x4(%esp)
 80483c7:       c7 04 24 b0 84 04 08    movl   $0x80484b0,(%esp)
 80483ce:       e8 bd fe ff ff          call   8048290 |printf@plt|
        return 0;
}
[...]

21.12.2006 10:16 vencas | skóre: 32
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)

Co se gcc týče, našel jsem článek Automatic vectorization for the masses. Zkoušel jsem to na gcc-4.1 a výsledek je následující (options -O2 -ftree-vectorize -ftree-vectorizer-verbose=3 -march=pentium4):

c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2]; se nezvektorizuje (fuj, to je hnusný slovo...), ale
for(int i=0; i<3; i++) c[i]=a[i]*b[i]; ano.

(Myslel jsem si, že když se rozbalují smyčky (loop unrolling), tak se z for udělá stejně něco podobné tomu prvnímu. Zřejmě ne úplně.)

Jak autor zmíněného článku píše, podobné optimalizace mohou vést k nestabilnímu kódu.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje