abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
dnes 16:24 | Nová verze

Byla vydána Mageia 5.1. Jedná se o první opravné vydání verze 5, jež vyšla v červnu loňského roku (zprávička). Uživatelům verze 5 nepřináší opravné vydání nic nového, samozřejmě pokud pravidelně aktualizují. Vydání obsahuje všechny aktualizace za posledního téměř půldruhého roku. Mageia 5.1 obsahuje LibreOffice 4.4.7, Linux 4.4.32, KDE4 4.14.5 nebo GNOME 3.14.3.

Ladislav Hagara | Komentářů: 0
dnes 13:42 | Pozvánky

V Praze probíhá konference Internet a Technologie 16.2, volné pokračování jarní konference sdružení CZ.NIC. Konferenci lze sledovat online na YouTube. K dispozici je také archiv předchozích konferencí.

Ladislav Hagara | Komentářů: 0
včera 22:44 | Komunita

Joinup informuje, že Mnichov používá open source groupware Kolab. V srpnu byl dokončen dvouletý přechod na toto řešení. V provozu je asi 60 000 poštovních schránek. Nejenom Kolabu se věnoval Georg Greve ve své přednášce Open Source: the future for the European institutions (SlideShare) na konferenci DIGITEC 2016, jež proběhla v úterý 29. listopadu v Bruselu. Videozáznam přednášek z hlavního sálu je ke zhlédnutí na Livestreamu.

Ladislav Hagara | Komentářů: 8
včera 15:30 | Zajímavý projekt

Společnost Jolla oznámila v příspěvku Case study: Sailfish Watch na svém blogu, že naportovala Sailfish OS na chytré hodinky. Využila a inspirovala se otevřeným operačním systémem pro chytré hodinky AsteroidOS. Použita je knihovna libhybris. Ukázka ovládání hodinek na YouTube.

Ladislav Hagara | Komentářů: 8
včera 14:15 | Nová verze

Byla vydána verze 7.1.0 skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Jedná se o první stabilní verzi nejnovější větvě 7.1. Přehled novinek v dokumentaci. Podrobnosti v ChangeLogu. K dispozici je také příručka pro přechod z PHP 7.0.x na PHP 7.1.x.

Ladislav Hagara | Komentářů: 2
včera 12:55 | Nová verze

Google Chrome 55 byl prohlášen za stabilní. Nejnovější stabilní verze 55.0.2883.75 tohoto webového prohlížeče přináší řadu oprav a vylepšení (YouTube). Opraveno bylo také 36 bezpečnostních chyb. Mariusz Mlynski si například vydělal 22 500 dolarů za 3 nahlášené chyby (Universal XSS in Blink).

Ladislav Hagara | Komentářů: 4
včera 11:55 | Pozvánky

Máte rádi svobodný software a hardware nebo se o nich chcete něco dozvědět? Přijďte na 135. sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.

xkucf03 | Komentářů: 0
včera 00:10 | Nová verze

Byla vydána verze 3.2 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata. Z novinek lze zmínit například podporu protokolů DNP3 a CIP/ENIP, vylepšenou podporu TLS a samozřejmě také aktualizovanou dokumentaci.

Ladislav Hagara | Komentářů: 0
1.12. 21:00 | Nová verze

Byla vydána beta verze Linux Mintu 18.1 s kódovým jménem Serena. Na blogu Linux Mintu jsou hned dvě oznámení. První o vydání Linux Mintu s prostředím MATE a druhé o vydání Linux Mintu s prostředím Cinnamon. Stejným způsobem jsou rozděleny také poznámky k vydání (MATE, Cinnamon) a přehled novinek s náhledy (MATE, Cinnamon). Linux Mint 18.1 bude podporován až do roku 2021.

Ladislav Hagara | Komentářů: 0
1.12. 16:42 | Nová verze

Byl vydán Devuan Jessie 1.0 Beta 2. Jedná se o druhou beta verzi forku Debianu bez systemd představeného v listopadu 2014 (zprávička). První beta verze byla vydána v dubnu letošního roku (zprávička). Jedna z posledních přednášek věnovaných Devuanu proběhla v listopadu na konferenci FSCONS 2016 (YouTube, pdf).

Ladislav Hagara | Komentářů: 0
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 763 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: vektory a matice se SIMD (sse2)

20.12.2006 14:08 vencas | skóre: 32
vektory a matice se SIMD (sse2)
Přečteno: 295×
Zdravím, může mi někdo vyjasnit, které knihovny implementující (malé) matice a vektory používají sse2?
  1. atlas-sse2 je používá, rád bych případně něco s trochu objektovým rozhraním.
  2. Blitz++ si dělá jen svoje optimalizace na úrovni c++ (bez SIMD)?
  3. boost::ublas knihovnu blas (zde v implementaci atlas-sse2) nepoužívá (zběžně pročtené headery)...?
Konečně, když napíšu něco jako (resp. když je něco takového v nějaké knihovně):
double a[3], b[3], c[3];
[...]
c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
dokáže to gcc optimalizovat a použít na to vektorový součin (MULPD) místo jednotlivých násobení?

Díky.

Odpovědi

Marek Stopka avatar 20.12.2006 14:30 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
Jen střílím, ale při použití parametrů -mfpmath=sse -msse -msse2 by to mohlo dělat gcc samo, ne?
20.12.2006 14:54 vencas | skóre: 32
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
Mezitím jsem si to vyzkoušel a bohužel nedělá (mimochodem, HTML validita příspěvků, to je fakt PITA - < a > jsem nahradil |).

Kompilace: řekl bych, že -march=pentium4 implikuje -msse{,2,3}, ale v man to není. Na výsledek to každopádně nemá vliv; -ggdb3 taky nemá vliv, akorát je vidět zdroják v dumpu. Pořád tam je 3x mulsd.
$ gcc -ggdb3 -O3 -march=pentium4 -mfpmath=sse,387 -msse -msse2 -msse3 sse1.c -o sse1
$ objdump -d -S sse1
[...]
08048354 |main|:
#include|stdio.h|
int main(void){
 8048354:       8d 4c 24 04             lea    0x4(%esp),%ecx
 8048358:       83 e4 f0                and    $0xfffffff0,%esp
 804835b:       ff 71 fc                pushl  0xfffffffc(%ecx)
 804835e:       55                      push   %ebp
 804835f:       89 e5                   mov    %esp,%ebp
 8048361:       51                      push   %ecx
 8048362:       83 ec 54                sub    $0x54,%esp
        volatile double a[3], b[3];
        double c[3];
        a[0]=.5; a[1]=.5; a[2]=.5;
 8048365:       f2 0f 10 05 c0 84 04    movsd  0x80484c0,%xmm0
 804836c:       08 
 804836d:       f2 0f 11 45 e0          movsd  %xmm0,0xffffffe0(%ebp)
 8048372:       f2 0f 11 45 e8          movsd  %xmm0,0xffffffe8(%ebp)
 8048377:       f2 0f 11 45 f0          movsd  %xmm0,0xfffffff0(%ebp)
        b[0]=.5; b[1]=.5; b[2]=.5;
 804837c:       f2 0f 11 45 c8          movsd  %xmm0,0xffffffc8(%ebp)
 8048381:       f2 0f 11 45 d0          movsd  %xmm0,0xffffffd0(%ebp)
 8048386:       f2 0f 11 45 d8          movsd  %xmm0,0xffffffd8(%ebp)
        c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2];
 804838b:       f2 0f 10 5d e0          movsd  0xffffffe0(%ebp),%xmm3
 8048390:       f2 0f 10 6d c8          movsd  0xffffffc8(%ebp),%xmm5
 8048395:       f2 0f 10 55 e8          movsd  0xffffffe8(%ebp),%xmm2
 804839a:       f2 0f 10 65 d0          movsd  0xffffffd0(%ebp),%xmm4
 804839f:       f2 0f 10 45 f0          movsd  0xfffffff0(%ebp),%xmm0
 80483a4:       f2 0f 10 4d d8          movsd  0xffffffd8(%ebp),%xmm1
        printf("c=%g,%g,%g\n",c[0],c[1],c[2]);
 80483a9:       f2 0f 59 c1             mulsd  %xmm1,%xmm0
 80483ad:       f2 0f 11 44 24 14       movsd  %xmm0,0x14(%esp)
 80483b3:       f2 0f 59 d4             mulsd  %xmm4,%xmm2
 80483b7:       f2 0f 11 54 24 0c       movsd  %xmm2,0xc(%esp)
 80483bd:       f2 0f 59 dd             mulsd  %xmm5,%xmm3
 80483c1:       f2 0f 11 5c 24 04       movsd  %xmm3,0x4(%esp)
 80483c7:       c7 04 24 b0 84 04 08    movl   $0x80484b0,(%esp)
 80483ce:       e8 bd fe ff ff          call   8048290 |printf@plt|
        return 0;
}
[...]
21.12.2006 10:16 vencas | skóre: 32
Rozbalit Rozbalit vše Re: vektory a matice se SIMD (sse2)
Co se gcc týče, našel jsem článek Automatic vectorization for the masses. Zkoušel jsem to na gcc-4.1 a výsledek je následující (options -O2 -ftree-vectorize -ftree-vectorizer-verbose=3 -march=pentium4):
  • c[0]=a[0]*b[0]; c[1]=a[1]*b[1]; c[2]=a[2]*b[2]; se nezvektorizuje (fuj, to je hnusný slovo...), ale
  • for(int i=0; i<3; i++) c[i]=a[i]*b[i]; ano.
(Myslel jsem si, že když se rozbalují smyčky (loop unrolling), tak se z for udělá stejně něco podobné tomu prvnímu. Zřejmě ne úplně.)

Jak autor zmíněného článku píše, podobné optimalizace mohou vést k nestabilnímu kódu.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.