Byla vydána nová verze 2025.4 linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek se seznamem nových nástrojů v oficiálním oznámení na blogu.
Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) zveřejnil Národní politiku koordinovaného zveřejňování zranitelností (pdf), jejímž cílem je nejen zvyšování bezpečnosti produktů informačních a komunikačních technologií (ICT), ale také ochrana objevitelů zranitelností před negativními právními dopady. Součástí je rovněž vytvoření „koordinátora pro účely CVD“, jímž je podle nového zákona o kybernetické … více »
Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.12. Přehled novinek i s náhledy a videi v oficiálním oznámení.
Společnost System76 vydala Pop!_OS 24.04 LTS s desktopovým prostředím COSMIC. Videoukázky na YouTube.
Byla vydána verze 1.92.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.
Free Software Foundation zveřejnila ocenění Free Software Awards za rok 2024. Oceněni byli Andy Wingo, jeden ze správců GNU Guile, Alx Sa za příspěvky do Gimpu a Govdirectory jako společensky prospěšný projekt.
Bylo vydáno Eclipse IDE 2025-12 aneb Eclipse 4.38. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.
U příležitosti oslav osmi let prací na debianím balíčku vyšlo GPXSee 15.6. Nová verze přináší především podporu pro geotagované MP4 soubory, včetně GoPro videí. Kdo nechce čekat, až nová verze dorazí do jeho distribuce, nalezne zdrojové kódy na GitHubu.
Monado, tj. multiplatformní open source implementace standardu OpenXR specifikujícího přístup k platformám a zařízením pro XR, tj. platformám a zařízením pro virtuální realitu (VR) a rozšířenou realitu (AR), bylo vydáno ve verzi 25.1.0. Přehled novinek v poznámkách k vydání.
Byla vydána listopadová aktualizace aneb nová verze 1.107 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.107 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
#include <stdint.h>
template<int N>
struct Number {
enum { WORDS = N / 32 };
uint32_t words[WORDS] __attribute__((__aligned__(16)));
void erase() __attribute__((noinline)) {
for (int i = 0; i < WORDS; ++i) { words[i] = 0; }
}
};
int main() {
Number<512> x;
for (int i = 0; i < 999999999; ++i) {
x.erase();
}
}
kod erase() vygenerovany gcc 4.7.3:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc pxor %xmm0, %xmm0 movdqa %xmm0, (%rdi) movdqa %xmm0, 16(%rdi) movdqa %xmm0, 32(%rdi) movdqa %xmm0, 48(%rdi) retdoba behu:
$ time ./a.out real 0m2.435s user 0m2.416s sys 0m0.004skod vygenerovany gcc 4.8.1:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc testb $1, %dil movl $64, %edx jne .L27 testb $2, %dil jne .L28 .L3: testb $4, %dil jne .L29 .L4: movl %edx, %ecx xorl %eax, %eax shrl $3, %ecx testb $4, %dl rep stosq je .L5 movl $0, (%rdi) addq $4, %rdi .L5: testb $2, %dl je .L6 xorl %eax, %eax addq $2, %rdi movw %ax, -2(%rdi) .L6: andl $1, %edx je .L1 movb $0, (%rdi) .L1: rep ret .p2align 4,,10 .p2align 3 .L27: movb $0, (%rdi) addq $1, %rdi movb $63, %dl testb $2, %dil je .L3 .p2align 4,,10 .p2align 3 .L28: xorl %ecx, %ecx addq $2, %rdi subl $2, %edx movw %cx, -2(%rdi) testb $4, %dil je .L4 .p2align 4,,10 .p2align 3 .L29: movl $0, (%rdi) subl $4, %edx addq $4, %rdi jmp .L4 .cfi_endprocdoba behu:
$ time ./a.out real 0m14.199s user 0m14.052s sys 0m0.040sz toho asm to vypada ze tam proste placl nejaky genericky kod pro nulovani pameti. Ted hledam, zatim bez uspechu, jak tuhle hruzu vypnout.
Tiskni
Sdílej:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 40 f6 c7 01 test dil,0x1 400714: ba 40 00 00 00 mov edx,0x40 400719: 75 45 jne 400760 <_ZN6NumberILm512EE5eraseEv+0x50> 40071b: 40 f6 c7 02 test dil,0x2 40071f: 75 4f jne 400770 <_ZN6NumberILm512EE5eraseEv+0x60> 400721: 40 f6 c7 04 test dil,0x4 400725: 75 61 jne 400788 <_ZN6NumberILm512EE5eraseEv+0x78> 400727: 89 d1 mov ecx,edx 400729: 31 c0 xor eax,eax 40072b: c1 e9 03 shr ecx,0x3 40072e: f6 c2 04 test dl,0x4 400731: f3 48 ab rep stos QWORD PTR es:[rdi],rax 400734: 74 0a je 400740 <_ZN6NumberILm512EE5eraseEv+0x30> 400736: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40073c: 48 83 c7 04 add rdi,0x4 400740: f6 c2 02 test dl,0x2 400743: 74 0a je 40074f <_ZN6NumberILm512EE5eraseEv+0x3f> 400745: 31 c0 xor eax,eax 400747: 48 83 c7 02 add rdi,0x2 40074b: 66 89 47 fe mov WORD PTR [rdi-0x2],ax 40074f: 83 e2 01 and edx,0x1 400752: 74 03 je 400757 <_ZN6NumberILm512EE5eraseEv+0x47> 400754: c6 07 00 mov BYTE PTR [rdi],0x0 400757: f3 c3 repz ret 400759: 0f 1f 80 00 00 00 00 nop DWORD PTR [rax+0x0] 400760: c6 07 00 mov BYTE PTR [rdi],0x0 400763: 48 83 c7 01 add rdi,0x1 400767: b2 3f mov dl,0x3f 400769: 40 f6 c7 02 test dil,0x2 40076d: 74 b2 je 400721 <_ZN6NumberILm512EE5eraseEv+0x11> 40076f: 90 nop 400770: 31 c9 xor ecx,ecx 400772: 48 83 c7 02 add rdi,0x2 400776: 83 ea 02 sub edx,0x2 400779: 66 89 4f fe mov WORD PTR [rdi-0x2],cx 40077d: 40 f6 c7 04 test dil,0x4 400781: 74 a4 je 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400783: 0f 1f 44 00 00 nop DWORD PTR [rax+rax*1+0x0] 400788: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40078e: 83 ea 04 sub edx,0x4 400791: 48 83 c7 04 add rdi,0x4 400795: eb 90 jmp 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400797: 66 0f 1f 84 00 00 00 nop WORD PTR [rax+rax*1+0x0]g++ -O2 -ftree-vectorize:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 66 0f ef c0 pxor xmm0,xmm0 400714: 48 8d 47 40 lea rax,[rdi+0x40] 400718: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 40071c: 48 83 c7 10 add rdi,0x10 400720: 48 39 c7 cmp rdi,rax 400723: 75 f3 jne 400718 <_ZN6NumberILm512EE5eraseEv+0x8> 400725: f3 c3 repz retg++ -O2 -ftree-vectorize -funroll-loops
0000000000400750 <_ZN6NumberILm512EE5eraseEv>: 400750: 66 0f ef c0 pxor xmm0,xmm0 400754: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 400758: 66 0f 7f 47 10 movdqa XMMWORD PTR [rdi+0x10],xmm0 40075d: 66 0f 7f 47 20 movdqa XMMWORD PTR [rdi+0x20],xmm0 400762: 66 0f 7f 47 30 movdqa XMMWORD PTR [rdi+0x30],xmm0 400767: c3 retMůžeš zkusit
-ftree-vectorizer-verbose=5 aby to kecalo.
g++ -std=c++11 -O2 -o bla bla.cpp ; stejný výsledek jako autor blogu g++ -std=c++11 -O3 -o bla bla.cpp ; z toho vyleze ta prasárna a je to hůře zoptimalizované ; než s -O2, nemám páru proč g++ -std=c++11 -O2 -ftree-vectorize -o bla bla.cpp ; sse2, ale ve smyčce g++ -std=c++11 -O2 -ftree-vectorize -funroll-loops -o bla bla.cpp ; dostanu sse2 kód bez smyčkyŽádné extra -mtune či march nepřidávám, ale možná by stálo za to to zkusit. sse2 by to ale mělo použít bez nápovědy, to snad umí každý x86-64 cpu.
tree-loop-distribute-patterns
g++ -O2 -ftree-loop-distribute-patterns generuje stejny kod jako -O3.
g++ -O3 -fno-tree-loop-distribute-patterns generuje:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc movl 4(%esp), %eax movl $0, (%eax) movl $0, 4(%eax) movl $0, 8(%eax) movl $0, 12(%eax) movl $0, 16(%eax) movl $0, 20(%eax) movl $0, 24(%eax) movl $0, 28(%eax) movl $0, 32(%eax) movl $0, 36(%eax) movl $0, 40(%eax) movl $0, 44(%eax) movl $0, 48(%eax) movl $0, 52(%eax) movl $0, 56(%eax) movl $0, 60(%eax) retcoz uz je o neco lepsi. Asi zkusim zkompilovat nejnovejsi gcc a jestli to dela taky tak jim poslu bug report.