Byla vydána nová stabilní verze 7.6 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 140. Přehled novinek i s náhledy v příspěvku na blogu.
Byla vydána verze 1.90.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.
GNUnet (Wikipedie) byl vydán v nové major verzi 0.25.0. Jedná se o framework pro decentralizované peer-to-peer síťování, na kterém je postavena řada aplikací.
Byla vydána nová major verze 7.0 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Nově je postavena je na Debianu 13 (Trixie) a GNOME 48 (Bengaluru). Další novinky v příslušném seznamu.
Společnost Meta na dvoudenní konferenci Meta Connect 2025 představuje své novinky. První den byly představeny nové AI brýle: Ray-Ban Meta (Gen 2), sportovní Oakley Meta Vanguard a především Meta Ray-Ban Display s integrovaným displejem a EMG náramkem pro ovládání.
Po půl roce vývoje od vydání verze 48 bylo vydáno GNOME 49 s kódovým názvem Brescia (Mastodon). S přehrávačem videí Showtime místo Totemu a prohlížečem dokumentů Papers místo Evince. Podrobný přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře.
Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.
Byla vydána nová verze 258 správce systému a služeb systemd (GitHub).
Byla vydána Java 25 / JDK 25. Nových vlastností (JEP - JDK Enhancement Proposal) je 18. Jedná se o LTS verzi.
Věra Pohlová před 26 lety: „Tyhle aféry každého jenom otravují. Já bych všechny ty internety a počítače zakázala“. Jde o odpověď na anketní otázku deníku Metro vydaného 17. září 1999 na téma zneužití údajů o sporožirových účtech klientů České spořitelny.
#include <stdint.h> template<int N> struct Number { enum { WORDS = N / 32 }; uint32_t words[WORDS] __attribute__((__aligned__(16))); void erase() __attribute__((noinline)) { for (int i = 0; i < WORDS; ++i) { words[i] = 0; } } }; int main() { Number<512> x; for (int i = 0; i < 999999999; ++i) { x.erase(); } }kod erase() vygenerovany gcc 4.7.3:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc pxor %xmm0, %xmm0 movdqa %xmm0, (%rdi) movdqa %xmm0, 16(%rdi) movdqa %xmm0, 32(%rdi) movdqa %xmm0, 48(%rdi) retdoba behu:
$ time ./a.out real 0m2.435s user 0m2.416s sys 0m0.004skod vygenerovany gcc 4.8.1:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc testb $1, %dil movl $64, %edx jne .L27 testb $2, %dil jne .L28 .L3: testb $4, %dil jne .L29 .L4: movl %edx, %ecx xorl %eax, %eax shrl $3, %ecx testb $4, %dl rep stosq je .L5 movl $0, (%rdi) addq $4, %rdi .L5: testb $2, %dl je .L6 xorl %eax, %eax addq $2, %rdi movw %ax, -2(%rdi) .L6: andl $1, %edx je .L1 movb $0, (%rdi) .L1: rep ret .p2align 4,,10 .p2align 3 .L27: movb $0, (%rdi) addq $1, %rdi movb $63, %dl testb $2, %dil je .L3 .p2align 4,,10 .p2align 3 .L28: xorl %ecx, %ecx addq $2, %rdi subl $2, %edx movw %cx, -2(%rdi) testb $4, %dil je .L4 .p2align 4,,10 .p2align 3 .L29: movl $0, (%rdi) subl $4, %edx addq $4, %rdi jmp .L4 .cfi_endprocdoba behu:
$ time ./a.out real 0m14.199s user 0m14.052s sys 0m0.040sz toho asm to vypada ze tam proste placl nejaky genericky kod pro nulovani pameti. Ted hledam, zatim bez uspechu, jak tuhle hruzu vypnout.
Tiskni
Sdílej:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 40 f6 c7 01 test dil,0x1 400714: ba 40 00 00 00 mov edx,0x40 400719: 75 45 jne 400760 <_ZN6NumberILm512EE5eraseEv+0x50> 40071b: 40 f6 c7 02 test dil,0x2 40071f: 75 4f jne 400770 <_ZN6NumberILm512EE5eraseEv+0x60> 400721: 40 f6 c7 04 test dil,0x4 400725: 75 61 jne 400788 <_ZN6NumberILm512EE5eraseEv+0x78> 400727: 89 d1 mov ecx,edx 400729: 31 c0 xor eax,eax 40072b: c1 e9 03 shr ecx,0x3 40072e: f6 c2 04 test dl,0x4 400731: f3 48 ab rep stos QWORD PTR es:[rdi],rax 400734: 74 0a je 400740 <_ZN6NumberILm512EE5eraseEv+0x30> 400736: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40073c: 48 83 c7 04 add rdi,0x4 400740: f6 c2 02 test dl,0x2 400743: 74 0a je 40074f <_ZN6NumberILm512EE5eraseEv+0x3f> 400745: 31 c0 xor eax,eax 400747: 48 83 c7 02 add rdi,0x2 40074b: 66 89 47 fe mov WORD PTR [rdi-0x2],ax 40074f: 83 e2 01 and edx,0x1 400752: 74 03 je 400757 <_ZN6NumberILm512EE5eraseEv+0x47> 400754: c6 07 00 mov BYTE PTR [rdi],0x0 400757: f3 c3 repz ret 400759: 0f 1f 80 00 00 00 00 nop DWORD PTR [rax+0x0] 400760: c6 07 00 mov BYTE PTR [rdi],0x0 400763: 48 83 c7 01 add rdi,0x1 400767: b2 3f mov dl,0x3f 400769: 40 f6 c7 02 test dil,0x2 40076d: 74 b2 je 400721 <_ZN6NumberILm512EE5eraseEv+0x11> 40076f: 90 nop 400770: 31 c9 xor ecx,ecx 400772: 48 83 c7 02 add rdi,0x2 400776: 83 ea 02 sub edx,0x2 400779: 66 89 4f fe mov WORD PTR [rdi-0x2],cx 40077d: 40 f6 c7 04 test dil,0x4 400781: 74 a4 je 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400783: 0f 1f 44 00 00 nop DWORD PTR [rax+rax*1+0x0] 400788: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40078e: 83 ea 04 sub edx,0x4 400791: 48 83 c7 04 add rdi,0x4 400795: eb 90 jmp 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400797: 66 0f 1f 84 00 00 00 nop WORD PTR [rax+rax*1+0x0]g++ -O2 -ftree-vectorize:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 66 0f ef c0 pxor xmm0,xmm0 400714: 48 8d 47 40 lea rax,[rdi+0x40] 400718: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 40071c: 48 83 c7 10 add rdi,0x10 400720: 48 39 c7 cmp rdi,rax 400723: 75 f3 jne 400718 <_ZN6NumberILm512EE5eraseEv+0x8> 400725: f3 c3 repz retg++ -O2 -ftree-vectorize -funroll-loops
0000000000400750 <_ZN6NumberILm512EE5eraseEv>: 400750: 66 0f ef c0 pxor xmm0,xmm0 400754: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 400758: 66 0f 7f 47 10 movdqa XMMWORD PTR [rdi+0x10],xmm0 40075d: 66 0f 7f 47 20 movdqa XMMWORD PTR [rdi+0x20],xmm0 400762: 66 0f 7f 47 30 movdqa XMMWORD PTR [rdi+0x30],xmm0 400767: c3 retMůžeš zkusit
-ftree-vectorizer-verbose=5
aby to kecalo.
g++ -std=c++11 -O2 -o bla bla.cpp ; stejný výsledek jako autor blogu g++ -std=c++11 -O3 -o bla bla.cpp ; z toho vyleze ta prasárna a je to hůře zoptimalizované ; než s -O2, nemám páru proč g++ -std=c++11 -O2 -ftree-vectorize -o bla bla.cpp ; sse2, ale ve smyčce g++ -std=c++11 -O2 -ftree-vectorize -funroll-loops -o bla bla.cpp ; dostanu sse2 kód bez smyčkyŽádné extra -mtune či march nepřidávám, ale možná by stálo za to to zkusit. sse2 by to ale mělo použít bez nápovědy, to snad umí každý x86-64 cpu.
tree-loop-distribute-patterns
g++ -O2 -ftree-loop-distribute-patterns
generuje stejny kod jako -O3
.
g++ -O3 -fno-tree-loop-distribute-patterns
generuje:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc movl 4(%esp), %eax movl $0, (%eax) movl $0, 4(%eax) movl $0, 8(%eax) movl $0, 12(%eax) movl $0, 16(%eax) movl $0, 20(%eax) movl $0, 24(%eax) movl $0, 28(%eax) movl $0, 32(%eax) movl $0, 36(%eax) movl $0, 40(%eax) movl $0, 44(%eax) movl $0, 48(%eax) movl $0, 52(%eax) movl $0, 56(%eax) movl $0, 60(%eax) retcoz uz je o neco lepsi. Asi zkusim zkompilovat nejnovejsi gcc a jestli to dela taky tak jim poslu bug report.