Byla vydána verze 1.96.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.
Společnosti IBM a Red Hat představily Project Lightwell s investicí 5 miliard dolarů. Jedná se o důvěryhodné clearingové centrum pro bezpečnost open source softwaru a zabezpečení dodavatelských řetězců s novým AI modelem a globální skupinou více než 20 000 softwarových inženýrů. Služby centra budou dostupné prostřednictvím komerčních předplatných. Project Lightwell staví na iniciativách jako Anthropic Glasswing nebo OpenAI Trust Access for Cyber.
Open source 3D herní a simulační engine Open 3D Engine (O3DE) byl vydán v nové verzi 26.05. Podrobný přehled novinek v poznámkách k vydání.
Český stát by v budoucnu mohl provozovat vlastní alternativu ke komunikačním aplikacím typu WhatsApp, Signal, Telegram, Facebook Messenger a podobně. Cílem je zajistit bezpečnou datovou komunikaci pro stát a jeho důležité subjekty, jako jsou bezpečnostní složky, ministerstva a další organizace.
Už za týden, ve čtvrtek 4. června, se v Národní technické knihovně v pražských Dejvicích uskuteční další konference věnovaná tématům spojeným s IPv6 - Den IPv6. Program akce a registrační formulář jsou k dispozici na webu akce. Kapacita konference je omezená, proto organizátoři doporučují, aby se vážní zájemci přihlásili včas (k dnešnímu dni zbývá přibližně 30 volných míst). Konferenci Den IPv6 2026 organizují i letos společně sdružení CESNET, CZ.NIC a NIX.CZ.
Zařízení Steam Deck OLED bylo znovu naskladněno, ale vlivem rostoucích cen pamětí a úložišť má novou, vyšší cenovku. Steam Deck OLED 512 GB stojí nově 779 EUR (stál 569 EUR) a Steam Deck OLED 1 TB stojí 919 EUR (stál 679 EUR). Samotné zařízení se nijak nezměnilo a nové ceny tedy pouze odráží aktuální náklady na komponenty a další globální logistické výzvy, se kterými se potýká celá branže.
Český telekomunikační úřad zahajuje novou etapu využívání vysokofrekvenčního rádiového spektra v pásmu 26 GHz. Toto pásmo bude od 1. 7. 2026 otevřeno pro provoz moderních bezdrátových sítí, zejména sítí páté generace (5G), pevných bezdrátových přístupových sítí (FWA) a lokálních či průmyslových sítí určených například pro výrobní areály, logistická centra nebo technologické kampusy. Současně s otevřením pásma 26 GHz přistoupil ČTÚ ke zpřístupnění informací o využívání rádiových kmitočtů v tomto pásmu.
Logitech představil myš Signature Comfort Plus M850 L s polstrovanou opěrkou dlaně pro větší pohodlí a sadu s touto myší a klávesnicí s integrovanou opěrkou dlaní Signature Comfort Plus Combo MK880.
Gaël Duval se rozepsal o novinkách a plánech Murena a /e/OS. Počet uživatelů telefonů Murena a mobilního operačního systému /e/OS bez aplikací a služeb od Googlu se blíží 100 000. Ambicí je, aby se /e/OS stal třetí mobilní platformou v Evropě i na světě, s potenciálem dostat se i na PC. Blíží se vydání nové verze 4 s funkcemi zálohování a obnova, import e-mailů z Gmailu a rozpoznávání hlasu. Murena Workspace přinese videohovory, elektronický podpis a správu zařízení (MDM).
Dnes a zítra probíhá Ubuntu Summit 26.04. Na programu je řada zajímavých přednášek. Sledovat je lze na YouTube. Úvodní slovo měli Mark Shuttleworth a Jon Seager.
#include <stdint.h>
template<int N>
struct Number {
enum { WORDS = N / 32 };
uint32_t words[WORDS] __attribute__((__aligned__(16)));
void erase() __attribute__((noinline)) {
for (int i = 0; i < WORDS; ++i) { words[i] = 0; }
}
};
int main() {
Number<512> x;
for (int i = 0; i < 999999999; ++i) {
x.erase();
}
}
kod erase() vygenerovany gcc 4.7.3:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc pxor %xmm0, %xmm0 movdqa %xmm0, (%rdi) movdqa %xmm0, 16(%rdi) movdqa %xmm0, 32(%rdi) movdqa %xmm0, 48(%rdi) retdoba behu:
$ time ./a.out real 0m2.435s user 0m2.416s sys 0m0.004skod vygenerovany gcc 4.8.1:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc testb $1, %dil movl $64, %edx jne .L27 testb $2, %dil jne .L28 .L3: testb $4, %dil jne .L29 .L4: movl %edx, %ecx xorl %eax, %eax shrl $3, %ecx testb $4, %dl rep stosq je .L5 movl $0, (%rdi) addq $4, %rdi .L5: testb $2, %dl je .L6 xorl %eax, %eax addq $2, %rdi movw %ax, -2(%rdi) .L6: andl $1, %edx je .L1 movb $0, (%rdi) .L1: rep ret .p2align 4,,10 .p2align 3 .L27: movb $0, (%rdi) addq $1, %rdi movb $63, %dl testb $2, %dil je .L3 .p2align 4,,10 .p2align 3 .L28: xorl %ecx, %ecx addq $2, %rdi subl $2, %edx movw %cx, -2(%rdi) testb $4, %dil je .L4 .p2align 4,,10 .p2align 3 .L29: movl $0, (%rdi) subl $4, %edx addq $4, %rdi jmp .L4 .cfi_endprocdoba behu:
$ time ./a.out real 0m14.199s user 0m14.052s sys 0m0.040sz toho asm to vypada ze tam proste placl nejaky genericky kod pro nulovani pameti. Ted hledam, zatim bez uspechu, jak tuhle hruzu vypnout.
Tiskni
Sdílej:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 40 f6 c7 01 test dil,0x1 400714: ba 40 00 00 00 mov edx,0x40 400719: 75 45 jne 400760 <_ZN6NumberILm512EE5eraseEv+0x50> 40071b: 40 f6 c7 02 test dil,0x2 40071f: 75 4f jne 400770 <_ZN6NumberILm512EE5eraseEv+0x60> 400721: 40 f6 c7 04 test dil,0x4 400725: 75 61 jne 400788 <_ZN6NumberILm512EE5eraseEv+0x78> 400727: 89 d1 mov ecx,edx 400729: 31 c0 xor eax,eax 40072b: c1 e9 03 shr ecx,0x3 40072e: f6 c2 04 test dl,0x4 400731: f3 48 ab rep stos QWORD PTR es:[rdi],rax 400734: 74 0a je 400740 <_ZN6NumberILm512EE5eraseEv+0x30> 400736: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40073c: 48 83 c7 04 add rdi,0x4 400740: f6 c2 02 test dl,0x2 400743: 74 0a je 40074f <_ZN6NumberILm512EE5eraseEv+0x3f> 400745: 31 c0 xor eax,eax 400747: 48 83 c7 02 add rdi,0x2 40074b: 66 89 47 fe mov WORD PTR [rdi-0x2],ax 40074f: 83 e2 01 and edx,0x1 400752: 74 03 je 400757 <_ZN6NumberILm512EE5eraseEv+0x47> 400754: c6 07 00 mov BYTE PTR [rdi],0x0 400757: f3 c3 repz ret 400759: 0f 1f 80 00 00 00 00 nop DWORD PTR [rax+0x0] 400760: c6 07 00 mov BYTE PTR [rdi],0x0 400763: 48 83 c7 01 add rdi,0x1 400767: b2 3f mov dl,0x3f 400769: 40 f6 c7 02 test dil,0x2 40076d: 74 b2 je 400721 <_ZN6NumberILm512EE5eraseEv+0x11> 40076f: 90 nop 400770: 31 c9 xor ecx,ecx 400772: 48 83 c7 02 add rdi,0x2 400776: 83 ea 02 sub edx,0x2 400779: 66 89 4f fe mov WORD PTR [rdi-0x2],cx 40077d: 40 f6 c7 04 test dil,0x4 400781: 74 a4 je 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400783: 0f 1f 44 00 00 nop DWORD PTR [rax+rax*1+0x0] 400788: c7 07 00 00 00 00 mov DWORD PTR [rdi],0x0 40078e: 83 ea 04 sub edx,0x4 400791: 48 83 c7 04 add rdi,0x4 400795: eb 90 jmp 400727 <_ZN6NumberILm512EE5eraseEv+0x17> 400797: 66 0f 1f 84 00 00 00 nop WORD PTR [rax+rax*1+0x0]g++ -O2 -ftree-vectorize:
0000000000400710 <_ZN6NumberILm512EE5eraseEv>: 400710: 66 0f ef c0 pxor xmm0,xmm0 400714: 48 8d 47 40 lea rax,[rdi+0x40] 400718: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 40071c: 48 83 c7 10 add rdi,0x10 400720: 48 39 c7 cmp rdi,rax 400723: 75 f3 jne 400718 <_ZN6NumberILm512EE5eraseEv+0x8> 400725: f3 c3 repz retg++ -O2 -ftree-vectorize -funroll-loops
0000000000400750 <_ZN6NumberILm512EE5eraseEv>: 400750: 66 0f ef c0 pxor xmm0,xmm0 400754: 66 0f 7f 07 movdqa XMMWORD PTR [rdi],xmm0 400758: 66 0f 7f 47 10 movdqa XMMWORD PTR [rdi+0x10],xmm0 40075d: 66 0f 7f 47 20 movdqa XMMWORD PTR [rdi+0x20],xmm0 400762: 66 0f 7f 47 30 movdqa XMMWORD PTR [rdi+0x30],xmm0 400767: c3 retMůžeš zkusit
-ftree-vectorizer-verbose=5 aby to kecalo.
g++ -std=c++11 -O2 -o bla bla.cpp ; stejný výsledek jako autor blogu g++ -std=c++11 -O3 -o bla bla.cpp ; z toho vyleze ta prasárna a je to hůře zoptimalizované ; než s -O2, nemám páru proč g++ -std=c++11 -O2 -ftree-vectorize -o bla bla.cpp ; sse2, ale ve smyčce g++ -std=c++11 -O2 -ftree-vectorize -funroll-loops -o bla bla.cpp ; dostanu sse2 kód bez smyčkyŽádné extra -mtune či march nepřidávám, ale možná by stálo za to to zkusit. sse2 by to ale mělo použít bez nápovědy, to snad umí každý x86-64 cpu.
tree-loop-distribute-patterns
g++ -O2 -ftree-loop-distribute-patterns generuje stejny kod jako -O3.
g++ -O3 -fno-tree-loop-distribute-patterns generuje:
_ZN6NumberILi512EE5eraseEv: .LFB2: .cfi_startproc movl 4(%esp), %eax movl $0, (%eax) movl $0, 4(%eax) movl $0, 8(%eax) movl $0, 12(%eax) movl $0, 16(%eax) movl $0, 20(%eax) movl $0, 24(%eax) movl $0, 28(%eax) movl $0, 32(%eax) movl $0, 36(%eax) movl $0, 40(%eax) movl $0, 44(%eax) movl $0, 48(%eax) movl $0, 52(%eax) movl $0, 56(%eax) movl $0, 60(%eax) retcoz uz je o neco lepsi. Asi zkusim zkompilovat nejnovejsi gcc a jestli to dela taky tak jim poslu bug report.