Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 166 (pdf).
Blíží se prázdniny a než se rozutečete k moři, je na čase se opět sejít na Virtuální Bastlírně - pravidelném setkání elektroniků, ajťáků, bastlířů a obecně nadšenců do techniky. Co si pro vás strahovští bastlíři připravili tentokrát? Určitě proberou blížící se Linux Days i další události. U softwaru se chvíli zdrží a poví si kupříkladu o tom, jak se zbavit Bambu Cloudu, ale nepřijít o možnost ovládat tiskárnu na dálku. Řeč dojde i na AI,
… více »Vývojáři postmarketOS vydali verzi 26.06 tohoto operačního systému pro chytré telefony vycházejícího z optimalizovaného a nakonfigurovaného Alpine Linuxu s vlastními balíčky. Přehled novinek v příspěvku na blogu. Na výběr jsou 4 uživatelská rozhraní: GNOME, KDE Plasma Mobile, Phosh a Sxmo.
Byla vydána nová verze 2.55.0 distribuovaného systému správy verzí Git. Přispělo 100 vývojářů, z toho 33 nových. Přehled novinek v příspěvku na blogu GitHubu a v poznámkách k vydání.
Craig Loewen na blogu Microsoftu oznámil veřejnou preview verzi WSL kontejnerů, tj. linuxových kontejnerů ve Windows Subsystem for Linux (WSL). Spouští se příkazem wslc.exe.
Byla vydána (𝕏, Bluesky) nová verze 2026.2 linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek se seznamem 9 nových nástrojů v oficiálním oznámení na blogu.
Grafická aplikace Krokiet/Czkawka pro vyhledávání a odstraňovaní nepotřebných souborů (duplicitní soubory, prázdné složky, podobné obrázky, podobná videa, poškozené soubory a další) byla vydána ve verzi 12.0.0. Podrobný přehled novinek v příspěvku na Medium. Jedná se o poslední verzi frontendu Czkawka GTK nad Czkawka Core. Uživatelům se doporučuje migrovat na frontend Krokiet postavený nad frameworkem Slint. Představena byla aplikace Cedinia pro Android využívající Czkawka Core. Dostupná je jako APK pro ruční instalaci.
Po téměř třech letech od vydání verze 9 byla vydána nová verze 10 linuxové distribuce Mageia (Wikipedie). Přehled novinek v poznámkách k vydání.
Nourish (GitHub) je nový správce oken pro Linux. Tradiční plochy nahrazuje nekonečným plátnem a posouváním a přibližováním. Využívá vlastní kompozitor pro Wayland s názvem y5. Videoukázka.
#include <stdint.h>
template<int N>
struct Number {
enum { WORDS = N / 32 };
uint32_t words[WORDS] __attribute__((__aligned__(16)));
void erase() __attribute__((noinline)) {
for (int i = 0; i < WORDS; ++i) { words[i] = 0; }
}
};
int main() {
Number<512> x;
for (int i = 0; i < 999999999; ++i) {
x.erase();
}
}
kod erase() vygenerovany gcc 4.7.3:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc pxor %xmm0, %xmm0 movdqa %xmm0, (%rdi) movdqa %xmm0, 16(%rdi) movdqa %xmm0, 32(%rdi) movdqa %xmm0, 48(%rdi) retdoba behu:
$ time ./a.out real 0m2.435s user 0m2.416s sys 0m0.004skod vygenerovany gcc 4.8.1:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc testb $1, %dil movl $64, %edx jne .L27 testb $2, %dil jne .L28 .L3: testb $4, %dil jne .L29 .L4: movl %edx, %ecx xorl %eax, %eax shrl $3, %ecx testb $4, %dl rep stosq je .L5 movl $0, (%rdi) addq $4, %rdi .L5: testb $2, %dl je .L6 xorl %eax, %eax addq $2, %rdi movw %ax, -2(%rdi) .L6: andl $1, %edx je .L1 movb $0, (%rdi) .L1: rep ret .p2align 4,,10 .p2align 3 .L27: movb $0, (%rdi) addq $1, %rdi movb $63, %dl testb $2, %dil je .L3 .p2align 4,,10 .p2align 3 .L28: xorl %ecx, %ecx addq $2, %rdi subl $2, %edx movw %cx, -2(%rdi) testb $4, %dil je .L4 .p2align 4,,10 .p2align 3 .L29: movl $0, (%rdi) subl $4, %edx addq $4, %rdi jmp .L4 .cfi_endprocdoba behu:
$ time ./a.out real 0m14.199s user 0m14.052s sys 0m0.040sz toho asm to vypada ze tam proste placl nejaky genericky kod pro nulovani pameti. Ted hledam, zatim bez uspechu, jak tuhle hruzu vypnout.
Tiskni
Sdílej:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 40 f6 c7 01 test dil,0x1 400714: ba 40 00 00 00 mov edx,0x40 400719: 75 45 jne 400760 <_ZN6NumberILm512EE5eraseEv+0x50> 40071b: 40 f6 c7 02 test dil,0x2 40071f: 75 4f jne 400770 <_ZN6NumberILm512EE5eraseEv+0x60> 400721: 40 f6 c7 04 test dil,0x4 400725: 75 61 jne 400788 <_ZN6NumberILm512EE5eraseEv+0x78> 400727: 89 d1 mov ecx,edx 400729: 31 c0 xor eax,eax 40072b: c1 e9 03 shr ecx,0x3 40072e: f6 c2 04 test dl,0x4 400731: f3 48 ab rep stos QWORD PTR es:[rdi],rax 400734: 74 0a je 400740 <_ZN6NumberILm512EE5eraseEv+0x30> 400736: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40073c: 48 83 c7 04 add rdi,0x4 400740: f6 c2 02 test dl,0x2 400743: 74 0a je 40074f <_ZN6NumberILm512EE5eraseEv+0x3f> 400745: 31 c0 xor eax,eax 400747: 48 83 c7 02 add rdi,0x2 40074b: 66 89 47 fe mov WORD PTR [rdi-0x2],ax 40074f: 83 e2 01 and edx,0x1 400752: 74 03 je 400757 <_ZN6NumberILm512EE5eraseEv+0x47> 400754: c6 07 00 mov BYTE PTR [rdi],0x0 400757: f3 c3 repz ret 400759: 0f 1f 80 00 00 00 00 nop DWORD PTR [rax+0x0] 400760: c6 07 00 mov BYTE PTR [rdi],0x0 400763: 48 83 c7 01 add rdi,0x1 400767: b2 3f mov dl,0x3f 400769: 40 f6 c7 02 test dil,0x2 40076d: 74 b2 je 400721 <_ZN6NumberILm512EE5eraseEv+0x11> 40076f: 90 nop 400770: 31 c9 xor ecx,ecx 400772: 48 83 c7 02 add rdi,0x2 400776: 83 ea 02 sub edx,0x2 400779: 66 89 4f fe mov WORD PTR [rdi-0x2],cx 40077d: 40 f6 c7 04 test dil,0x4 400781: 74 a4 je 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400783: 0f 1f 44 00 00 nop DWORD PTR [rax+rax*1+0x0] 400788: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40078e: 83 ea 04 sub edx,0x4 400791: 48 83 c7 04 add rdi,0x4 400795: eb 90 jmp 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400797: 66 0f 1f 84 00 00 00 nop WORD PTR [rax+rax*1+0x0]g++ -O2 -ftree-vectorize:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 66 0f ef c0 pxor xmm0,xmm0 400714: 48 8d 47 40 lea rax,[rdi+0x40] 400718: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 40071c: 48 83 c7 10 add rdi,0x10 400720: 48 39 c7 cmp rdi,rax 400723: 75 f3 jne 400718 <_ZN6NumberILm512EE5eraseEv+0x8> 400725: f3 c3 repz retg++ -O2 -ftree-vectorize -funroll-loops
0000000000400750 <_ZN6NumberILm512EE5eraseEv>: 400750: 66 0f ef c0 pxor xmm0,xmm0 400754: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 400758: 66 0f 7f 47 10 movdqa XMMWORD PTR [rdi+0x10],xmm0 40075d: 66 0f 7f 47 20 movdqa XMMWORD PTR [rdi+0x20],xmm0 400762: 66 0f 7f 47 30 movdqa XMMWORD PTR [rdi+0x30],xmm0 400767: c3 retMůžeš zkusit
-ftree-vectorizer-verbose=5 aby to kecalo.
g++ -std=c++11 -O2 -o bla bla.cpp ; stejný výsledek jako autor blogu g++ -std=c++11 -O3 -o bla bla.cpp ; z toho vyleze ta prasárna a je to hůře zoptimalizované ; než s -O2, nemám páru proč g++ -std=c++11 -O2 -ftree-vectorize -o bla bla.cpp ; sse2, ale ve smyčce g++ -std=c++11 -O2 -ftree-vectorize -funroll-loops -o bla bla.cpp ; dostanu sse2 kód bez smyčkyŽádné extra -mtune či march nepřidávám, ale možná by stálo za to to zkusit. sse2 by to ale mělo použít bez nápovědy, to snad umí každý x86-64 cpu.
tree-loop-distribute-patterns
g++ -O2 -ftree-loop-distribute-patterns generuje stejny kod jako -O3.
g++ -O3 -fno-tree-loop-distribute-patterns generuje:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc movl 4(%esp), %eax movl $0, (%eax) movl $0, 4(%eax) movl $0, 8(%eax) movl $0, 12(%eax) movl $0, 16(%eax) movl $0, 20(%eax) movl $0, 24(%eax) movl $0, 28(%eax) movl $0, 32(%eax) movl $0, 36(%eax) movl $0, 40(%eax) movl $0, 44(%eax) movl $0, 48(%eax) movl $0, 52(%eax) movl $0, 56(%eax) movl $0, 60(%eax) retcoz uz je o neco lepsi. Asi zkusim zkompilovat nejnovejsi gcc a jestli to dela taky tak jim poslu bug report.