Byl vydán Debian GNU/Hurd 2025. Jedná se o port Debianu s jádrem Hurd místo obvyklého Linuxu.
V sobotu 9. srpna uplynulo přesně 20 let od oznámení projektu openSUSE na konferenci LinuxWorld v San Franciscu. Pokuď máte archivní nebo nějakým způsobem zajímavé fotky s openSUSE, můžete se o ně s námi podělit.
Byl vydán Debian 13 s kódovým názvem Trixie. Přehled novinek v poznámkách k vydání.
WLED je open-source firmware pro ESP8266/ESP32, který umožňuje Wi-Fi ovládání adresovatelných LED pásků se stovkami efektů, synchronizací, audioreaktivním módem a Home-Assistant integrací. Je založen na Arduino frameworku.
Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.8.
Herní studio Hangar 13 vydalo novou Mafii. Mafia: Domovina je zasazena do krutého sicilského podsvětí na začátku 20. století. Na ProtonDB je zatím bez záznamu.
Operátor O2 má opět problémy. Jako omluvu za pondělní zhoršenou dostupnost služeb dal všem zákazníkům poukaz v hodnotě 300 Kč na nákup telefonu nebo příslušenství.
Společnost OpenAI představila GPT-5 (YouTube).
Byla vydána (𝕏) červencová aktualizace aneb nová verze 1.103 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.103 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
Americký prezident Donald Trump vyzval nového generálního ředitele firmy na výrobu čipů Intel, aby odstoupil. Prezident to zdůvodnil vazbami nového šéfa Lip-Bu Tana na čínské firmy.
#include <stdint.h> template<int N> struct Number { enum { WORDS = N / 32 }; uint32_t words[WORDS] __attribute__((__aligned__(16))); void erase() __attribute__((noinline)) { for (int i = 0; i < WORDS; ++i) { words[i] = 0; } } }; int main() { Number<512> x; for (int i = 0; i < 999999999; ++i) { x.erase(); } }kod erase() vygenerovany gcc 4.7.3:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc pxor %xmm0, %xmm0 movdqa %xmm0, (%rdi) movdqa %xmm0, 16(%rdi) movdqa %xmm0, 32(%rdi) movdqa %xmm0, 48(%rdi) retdoba behu:
$ time ./a.out real 0m2.435s user 0m2.416s sys 0m0.004skod vygenerovany gcc 4.8.1:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc testb $1, %dil movl $64, %edx jne .L27 testb $2, %dil jne .L28 .L3: testb $4, %dil jne .L29 .L4: movl %edx, %ecx xorl %eax, %eax shrl $3, %ecx testb $4, %dl rep stosq je .L5 movl $0, (%rdi) addq $4, %rdi .L5: testb $2, %dl je .L6 xorl %eax, %eax addq $2, %rdi movw %ax, -2(%rdi) .L6: andl $1, %edx je .L1 movb $0, (%rdi) .L1: rep ret .p2align 4,,10 .p2align 3 .L27: movb $0, (%rdi) addq $1, %rdi movb $63, %dl testb $2, %dil je .L3 .p2align 4,,10 .p2align 3 .L28: xorl %ecx, %ecx addq $2, %rdi subl $2, %edx movw %cx, -2(%rdi) testb $4, %dil je .L4 .p2align 4,,10 .p2align 3 .L29: movl $0, (%rdi) subl $4, %edx addq $4, %rdi jmp .L4 .cfi_endprocdoba behu:
$ time ./a.out real 0m14.199s user 0m14.052s sys 0m0.040sz toho asm to vypada ze tam proste placl nejaky genericky kod pro nulovani pameti. Ted hledam, zatim bez uspechu, jak tuhle hruzu vypnout.
Tiskni
Sdílej:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 40 f6 c7 01 test dil,0x1 400714: ba 40 00 00 00 mov edx,0x40 400719: 75 45 jne 400760 <_ZN6NumberILm512EE5eraseEv+0x50> 40071b: 40 f6 c7 02 test dil,0x2 40071f: 75 4f jne 400770 <_ZN6NumberILm512EE5eraseEv+0x60> 400721: 40 f6 c7 04 test dil,0x4 400725: 75 61 jne 400788 <_ZN6NumberILm512EE5eraseEv+0x78> 400727: 89 d1 mov ecx,edx 400729: 31 c0 xor eax,eax 40072b: c1 e9 03 shr ecx,0x3 40072e: f6 c2 04 test dl,0x4 400731: f3 48 ab rep stos QWORD PTR es:[rdi],rax 400734: 74 0a je 400740 <_ZN6NumberILm512EE5eraseEv+0x30> 400736: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40073c: 48 83 c7 04 add rdi,0x4 400740: f6 c2 02 test dl,0x2 400743: 74 0a je 40074f <_ZN6NumberILm512EE5eraseEv+0x3f> 400745: 31 c0 xor eax,eax 400747: 48 83 c7 02 add rdi,0x2 40074b: 66 89 47 fe mov WORD PTR [rdi-0x2],ax 40074f: 83 e2 01 and edx,0x1 400752: 74 03 je 400757 <_ZN6NumberILm512EE5eraseEv+0x47> 400754: c6 07 00 mov BYTE PTR [rdi],0x0 400757: f3 c3 repz ret 400759: 0f 1f 80 00 00 00 00 nop DWORD PTR [rax+0x0] 400760: c6 07 00 mov BYTE PTR [rdi],0x0 400763: 48 83 c7 01 add rdi,0x1 400767: b2 3f mov dl,0x3f 400769: 40 f6 c7 02 test dil,0x2 40076d: 74 b2 je 400721 <_ZN6NumberILm512EE5eraseEv+0x11> 40076f: 90 nop 400770: 31 c9 xor ecx,ecx 400772: 48 83 c7 02 add rdi,0x2 400776: 83 ea 02 sub edx,0x2 400779: 66 89 4f fe mov WORD PTR [rdi-0x2],cx 40077d: 40 f6 c7 04 test dil,0x4 400781: 74 a4 je 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400783: 0f 1f 44 00 00 nop DWORD PTR [rax+rax*1+0x0] 400788: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40078e: 83 ea 04 sub edx,0x4 400791: 48 83 c7 04 add rdi,0x4 400795: eb 90 jmp 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400797: 66 0f 1f 84 00 00 00 nop WORD PTR [rax+rax*1+0x0]g++ -O2 -ftree-vectorize:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 66 0f ef c0 pxor xmm0,xmm0 400714: 48 8d 47 40 lea rax,[rdi+0x40] 400718: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 40071c: 48 83 c7 10 add rdi,0x10 400720: 48 39 c7 cmp rdi,rax 400723: 75 f3 jne 400718 <_ZN6NumberILm512EE5eraseEv+0x8> 400725: f3 c3 repz retg++ -O2 -ftree-vectorize -funroll-loops
0000000000400750 <_ZN6NumberILm512EE5eraseEv>: 400750: 66 0f ef c0 pxor xmm0,xmm0 400754: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 400758: 66 0f 7f 47 10 movdqa XMMWORD PTR [rdi+0x10],xmm0 40075d: 66 0f 7f 47 20 movdqa XMMWORD PTR [rdi+0x20],xmm0 400762: 66 0f 7f 47 30 movdqa XMMWORD PTR [rdi+0x30],xmm0 400767: c3 retMůžeš zkusit
-ftree-vectorizer-verbose=5
aby to kecalo.
g++ -std=c++11 -O2 -o bla bla.cpp ; stejný výsledek jako autor blogu g++ -std=c++11 -O3 -o bla bla.cpp ; z toho vyleze ta prasárna a je to hůře zoptimalizované ; než s -O2, nemám páru proč g++ -std=c++11 -O2 -ftree-vectorize -o bla bla.cpp ; sse2, ale ve smyčce g++ -std=c++11 -O2 -ftree-vectorize -funroll-loops -o bla bla.cpp ; dostanu sse2 kód bez smyčkyŽádné extra -mtune či march nepřidávám, ale možná by stálo za to to zkusit. sse2 by to ale mělo použít bez nápovědy, to snad umí každý x86-64 cpu.
tree-loop-distribute-patterns
g++ -O2 -ftree-loop-distribute-patterns
generuje stejny kod jako -O3
.
g++ -O3 -fno-tree-loop-distribute-patterns
generuje:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc movl 4(%esp), %eax movl $0, (%eax) movl $0, 4(%eax) movl $0, 8(%eax) movl $0, 12(%eax) movl $0, 16(%eax) movl $0, 20(%eax) movl $0, 24(%eax) movl $0, 28(%eax) movl $0, 32(%eax) movl $0, 36(%eax) movl $0, 40(%eax) movl $0, 44(%eax) movl $0, 48(%eax) movl $0, 52(%eax) movl $0, 56(%eax) movl $0, 60(%eax) retcoz uz je o neco lepsi. Asi zkusim zkompilovat nejnovejsi gcc a jestli to dela taky tak jim poslu bug report.