Český Nejvyšší soud potvrdil, že česká právní úprava plošného uchování dat o elektronické komunikaci porušuje právo Evropské unie. Pravomocným rozsudkem zamítl dovolání ministerstva průmyslu a obchodu. To se teď musí omluvit novináři Českého rozhlasu Janu Cibulkovi za zásah do práv na ochranu soukromí a osobních údajů. Ve sporu jde o povinnost provozovatelů sítí uchovávat údaje, ze kterých lze odvodit, kdo, s kým a odkud komunikoval.
Google bude vydávat zdrojové kódy Androidu pouze dvakrát ročně. Ve 2. a 4. čtvrtletí.
Bezpečnostní specialista Graham Helton z Low Orbit Security si všímá podezřelých anomálií v BGP, zaznamenaných krátce před vstupem ozbrojených sil USA na území Venezuely, které tam během bleskové speciální vojenské operace úspěšně zatkly venezuelského diktátora Madura za narkoterorismus. BGP (Border Gateway Protocol) je 'dynamický směrovací protokol, který umožňuje routerům automaticky reagovat na změny topologie počítačové sítě' a je v bezpečnostních kruzích znám jako 'notoricky nezabezpečený'.
Společnost Valve aktualizovala přehled o hardwarovém a softwarovém vybavení uživatelů služby Steam. Podíl uživatelů Linuxu dosáhl 3,58 %. Nejčastěji používané linuxové distribuce jsou Arch Linux, Linux Mint a Ubuntu. Při výběru jenom Linuxu vede SteamOS Holo s 26,32 %. Procesor AMD používá 67,43 % hráčů na Linuxu.
V Las Vegas probíhá veletrh CES (Consumer Electronics Show, Wikipedie). Firmy představují své novinky. Například LEGO představilo systém LEGO SMART Play: chytré kostky SMART Brick, dlaždičky SMART Tagy a SMART minifigurky. Kostka SMART Brick dokáže rozpoznat přítomnost SMART Tagů a SMART minifigurek, které se nacházejí v její blízkosti. Ty kostku SMART Brick aktivují a určí, co má dělat.
Vládní CERT (GovCERT.CZ) upozorňuje (𝕏) na kritickou zranitelnost v jsPDF, CVE-2025-68428. Tato zranitelnost umožňuje neautentizovaným vzdáleným útočníkům číst libovolné soubory z lokálního souborového systému serveru při použití jsPDF v prostředí Node.js. Problém vzniká kvůli nedostatečné validaci vstupu u cest k souborům předávaných několika metodám jsPDF. Útočník může zneužít tuto chybu k exfiltraci citlivých
… více »V úterý 13. ledna 2025 se v pražské kanceláři SUSE v Karlíně uskuteční 5. Mobile Hackday, komunitní setkání zaměřené na Linux na mobilních zařízeních, kernelový vývoj a související infrastrukturu. Akci pořádá David Heidelberg.
… více »Už je 14 dní zbývá do začátku osmého ročníku komunitního setkání nejen českých a slovenských správců sítí CSNOG 2026. Registrace na akci je stále otevřená, ale termín uzávěrky se blíží. I proto organizátoři doporučují, aby se zájemci přihlásili brzy, nejlépe ještě tento týden.
… více »Rok 2026 sotva začal, ale už v prvním týdnu se nashromáždilo nezvykle mnoho zajímavostí, událostí a zpráv. Jedno je ale jisté - už ve středu se koná Virtuální Bastlírna - online setkání techniků, bastlířů a ajťáků, kam rozhodně doražte, ideálně s mikrofonem a kamerou a zapojte se do diskuze o zajímavých technických tématech.
Dějí se i ne zcela šťastné věci – zdražování a nedostupnost RAM a SSD, nedostatek waferů, 3€ clo na každou položku z Číny … více »Vývojáři GNOME a Firefoxu zvažují ve výchozím nastavení vypnutí funkce vkládání prostředním tlačítkem myši. Zdůvodnění: "U většiny uživatelů tento X11ism způsobuje neočekávané chování".
Řešení dotazu:
#include string.h>
#include stdio.h>
#define COMB_COUNT 65536
int main(void)
{
const char *filename = "file.bin";
unsigned long long int treshold = 5;
unsigned long long int bin_arr[COMB_COUNT];
unsigned twob;
unsigned int i;
FILE *fd;
if (!(fd = fopen(filename, "rb"))) {
return -1;
}
memset(bin_arr, '\0', COMB_COUNT);
while ((i = fread(&twob, 2, 1, fd)) > 0) {
bin_arr[twob] += 1;
}
for (i = 0; i < COMB_COUNT; i++) {
if (bin_arr[i] < treshold) {
printf("%04x, %llu times\n", i, bin_arr[i]);
}
}
fclose(fd);
return 0;
}
muj pokus o co nejpodobnější přepsání do pythonu :O :D :D ;D
#!/usr/bin/env python3
POCET_KOMBINACI = 65536
TRESHOLD = 100
try:
fd = open('soubor.bin', 'rb')
except IOError:
print('nejde otevrit soubor binarni jeden :O :\'(') # :D :D
exit(-1)
with fd:
# uděláme si list vo velikosti počtu kombinací
bin_arr = [0] * POCET_KOMBINACI
# zkusíme přečíst dva byty
byty = fd.read(2)
# dokud máme dva byty přečtený
while len(byty) == 2:
# převedem na index v tom našem listu 'bin_arr'
# v metodě from_bites musíme říct jakej to je endian jakože jestli big nebo little
index = int.from_bytes(byty, 'little')
bin_arr[index] += 1
# načtem dvojici bytů pro další iteraci
byty = fd.read(2)
# zavřem soubor
fd.close()
# vypišem ty věčí hodnoty než treshold
for i in range(POCET_KOMBINACI):
if bin_arr[i] > TRESHOLD:
print(f'{i.to_bytes(2, "little")}, {bin_arr[i]} times')
# v pythonu mužem je asi obyklejší iterovat foreachem
# takže by to asi jako lepší bylo
# for hodnota in bin_arr:
# if hodnota > TRESHOLD:
# ....
exit(0) # zbytečný volat nakonec skriptu v pythonu si myslim ale nevim jistě :O :O
import sys
import struct
log = {}
with open(sys.argv[1], 'rb') as fh:
raw = fh.read(2)
while raw is not None and len(raw) == 2:
word = struct.unpack('<H', raw)[0]
if word in log:
log[word] += 1
else:
log[word] = 1
raw = fh.read(2)
for k in sorted(log.keys()):
v = log[k]
if v < 100:
print('[{}]: {}'.format(k, v))
int pole[100] = {0}; // immediate inicializace
2)
c.c: In function ‘main’:
c.c:20:3: warning: ‘memset’ used with length equal to number of elements without multiplication by element size [-Wmemset-elt-size]
20 | memset(bin_arr, '\0', COMB_COUNT);
| ^~~~~~
Doporučuju používat nějaký hustý kompilátor (třeba rozumně nové gcc) se zapnutými všemi warningy (tohle bylo -Wall -Wextra -Wduplicated-cond -Wduplicated-branches -Wlogical-op -Wrestrict -Wnull-dereference -Wjump-misses-init -Wdouble-promotion -Wshadow -Wformat=2).
atak já ti to teda zkusim napsat ale jako fakt nevim jestli je to jakože bude fakt správnej pythonistickej zápis :O ;D
# nóó začala bych jakoby tak že bych si udělala slovník kterej bude mit
# jako keys/klíče ty jednotlivý kombinace bytů a jako values/hodnoty
# počty nalezenejch výskytů
# takže uděláme slovník
slovnik = {}
# a do něj nastrkáme ty klíče pro všecky ty konbinace dvojic bytů
for i in range(256):
for j in range(256):
# do slovníku přidáme novej klíč a hodnotu normálně jako slovnik[klic]=hodnota
# tamto bytes([nejakej_int]) předělá int na bytes
# noa byty mužemenormálně strkat zasebe tim plusem
# tady ta podmínka if i > j je tady proto abysme ždycky ten věčí byte strčili
# nazačátek tý naší kombinace protože 'ab' je pronás to samý co 'ba'
# neni pro todleto náhodou nějakej víc lepšejší matematickej způsob????? :O :O
if i > j:
slovnik[ bytes([i]) + bytes([j])] = 0
else:
slovnik[ bytes([j]) + bytes([i])] = 0
# poznámka:
# nóó jak si jako teďko líp čtu tu tvou votázku :D tak jestli todleto nepotřebuješ a chceš jakože fakt kombinace jenom po sobě jdoucích bytů
# tak ty ify dej do pryč a v ckylu postupuj jenom po jednom bytu a pamatuj si ten zminulý iterace a znich si dělej ty kombinace :O ;D
# čteme soubor binárně
with open('soubor.bin', 'rb') as f:
# přečtem dvojici bytů takle
prvni_byte = f.read(1)
druhy_byte = f.read(1)
# pokud byte neni read vrátí b''
# TODO ošetřit situaci kdy máš lichej počet bytů :O :O :O :O
# b'' se vyhodnotí jako false všecko vostatní true
# nóó takže dokavaď máme dva byty
while prvni_byte and druhy_byte:
# kouknem jestli je první věčí než druhej jestli ne tak prohodíme
# znova pokavaď todleto nepotřebuješ dej do pryč
if druhy_byte > prvni_byte:
tmp = prvni_byte
prvni_byte = druhy_byte
druhy_byte = tmp
#sestavíme tu kombinaci
kombinace = prvni_byte + druhy_byte
# a inkrementujem hodnotu ve slovníku
slovnik[ kombinace ] += 1
# načteme byty pro další iteraci
prvni_byte = f.read(1)
druhy_byte = f.read(1)
# pro vokrasu seřadíme podle počtu výskytů těch kombinací
serazeno = sorted(slovnik.items(), key=lambda x: x[1])
# a vypišem všecky kde je víc jak těch tvejch 100 kombinací :O ;D
for klic, hodnota in serazeno:
if hodnota > 100:
print(f"kombinace: {klic} pocet: {hodnota}")
print('hotovo!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!')
nóó když neni tak neni :D ;D btw v komentu v poznámce pišu jestli to jako nechceš tak abys jakoby umazal ty ify a prohazování ;D
pokusila sem se ještě přepsat ten tvuj cčkovej zdrojáček do pythonu tak koukni jestli to je jakoby to co ty chceš :O ;D
Ale vzhledem k tomu, že se to změnou endianu přesune jen na jiné místo v tom poli, je to asi zbytečné.Ano, ke kolizím docházet nebude, ale vypíše to jiný výsledek (word
0xaabb na vstupu to bude prezentovat jako 0xbbaa na výstupu).
podobně jako v madcataxovým zdrojáčku de tady taky nahradit ten slovnik={} a jeho 'alokace' tim jendovým defaultdictem slovnik=defaultdict(int)
mmapované C vs Python:
C:
#include <stdio.h>
#include <stdlib.h>
#include <sys/mman.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <assert.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdint.h>
#include <string.h>
#define NUM_WORDS 65536
#define RESULTS_SIZE (sizeof(uint_fast64_t) * NUM_WORDS)
int main(int argc, char **argv)
{
int fd;
void *data;
size_t data_length;
unsigned short *pos;
unsigned short *end;
uint_fast64_t *results;
if (argc < 1)
return EXIT_FAILURE;
results = malloc(RESULTS_SIZE);
if (results == NULL)
return EXIT_FAILURE;
memset(results, 0, RESULTS_SIZE);
fd = open(argv[1], O_RDONLY);
if (fd < 0)
return EXIT_FAILURE;
data_length = lseek(fd, 0, SEEK_END);
data_length -= data_length % 2;
data = mmap(NULL, data_length, PROT_READ, MAP_PRIVATE, fd, 0);
if (data == MAP_FAILED)
return EXIT_FAILURE;
pos = (unsigned short *)data;
end = (unsigned short *)(data + data_length);
for (; pos < end; pos++)
results[*pos]++;
for (size_t idx = 0; idx < NUM_WORDS; idx++) {
uint_fast64_t value = results[idx];
if (value < 1500)
printf("[%zu]: %lu\n", idx, value);
}
return EXIT_SUCCESS;
}
Totéž v Pythonu:
import mmap
import struct
import sys
log = [0] * 65536
with open(sys.argv[1], 'rb') as fh:
fh.seek(0, 2)
data_length = fh.tell()
data_length -= data_length % 2
data = mmap.mmap(fh.fileno(), data_length, mmap.MAP_PRIVATE, mmap.PROT_READ)
unpack_word = struct.Struct('<H').unpack_from
idx = 0
while idx < data_length:
word = unpack_word(data, idx)[0]
log[word] += 1
idx += 2
for k,v in enumerate(log):
v = log[k]
if v < 200:
print('[{}]: {}'.format(k, v))
Časy pro 20, resp. 200 MB soubory z /dev/urandom:
C: 0,22; 0,35 s
Python: 4,8; 49,0 s
U Cčka je dost znát ten fixní overhead, zatímco Python visí v té čtecí smyčce. No co, aspoň je vidět, že na různé problémy je vhodné vzít si vždy správný šroubovák.
import numpy as np
a = np.fromfile("r", dtype=np.uint16)
bins = np.arange(0, 65535+1, 1)
hist, _ = np.histogram(a, bins)
ma_data = np.ma.masked_greater(hist, 100)
print(ma_data.compressed())
import sys
import numba
import numpy
@numba.jit(nopython=True)
def walk(buf):
log = [0] * 65536
for v in buf:
log[v] += 1
return log
with open(sys.argv[1], 'rb') as fh:
data = numpy.fromfile(fh, numpy.uint16)
log = walk(data)
for k, v in enumerate(log):
v = log[k]
if v < 150:
print('[{}]: {}'.format(k, v))
Dává do docela zajímavé výsledky:#!/usr/bin/python3
import numpy as np
import pandas as pd
pd.set_option("display.max_rows", None)
dt = np.dtype([('value', 'u2')])
data = np.fromfile('data.bin', dtype=dt)
df = pd.DataFrame(data)
df2 = df.groupby(by='value')['value'].count()
print(df2[df2 < 10])
mmap v Pythonu jsem zkoušel včera a vyšlo mi to na cca 150MB soubor skoro 2× pomalejší než prostý read po bajtech.
nóó jestli to jako neni děsně tajný proč to jakoby potřebuješ mit napsaný v tom pythonu misto v cčku?? :O :O
nóóóó ještě de udělat hulvátřešení jakože zkompilovat si cčkovej kód do binárky atu pouštět z pythonu a výstup si v pouštěcím skriptu parsovat :O ;D čistý ani pythonistický řešení to asi jako neni ale funguje to :D ;D tamto cffi asi jako bude vo něco rychleší si myslim
Chci o tom napsat blogpost.
hele už to napsal ;D
import sys
if len(sys.argv) != 2:
print('Hovno, vole.', file=sys.stderr)
sys.exit(3)
pairs = {}
with open(sys.argv[1], 'rb') as fuck:
while shit := fuck.read(2):
if len(shit) == 1:
print('Zasraný soubor.', file=sys.stderr)
sys.exit(5)
pairs.setdefault(shit, [0])[0] += 1
counts = {}
for pair, count in pairs.items():
counts.setdefault(count[0], []).append(pair)
for key in sorted(counts.keys(), reverse=True):
for b in sorted(counts[key]):
print(f'{key}: [{b[0]:02x}, {b[1]:02x}]')
$ xxd -c2 -ps file | sort | uniq -c | sort
ti tam jakoby eště chybí ten threshold ;D
možná jakoby ňák rozpůlit výstupy toho posledního sortu mezerou/bílejma znakama a první půlky předělat na int a koukat jestli sou věčí než treshold a pak to vypysovat ale toby jako byl mocmocmoc vošlivej oneliner :O :D :D ;D
Jo, tak ten hexdump je dost dobrý trik!!! To mne inspirovalo k úpravám v jiných skriptech, kde to "řeším" přes gawk. Takže moc díky za tip. Na oplátku dodám "improvement" navrhovaného one-lineru.
xxd -c2 -ps file | LANG=C sort --parallel=8 | uniq -c | sort -k 2 -k 1
Pro můj testovací 50MB file to na mém MacBook běží v parallel verzi cca 37sekund. Původně mě to běželo 3 minuty, což mě nepřijde jako "promptní" one-liner.
A proto ta motivace k inovaci na rychlost a úsporu času. Může být zajímavé v sort použít přepínač -S 8G, kdy si příkaz sort alokuje více RAM paměti na obcování s daty při jejich třídění.
Řešení, jak vypsat výskyty menší než trashold? (např. méně než 100), nechám dalším ke studiu. Byť ten návrh s grep mě přijde OK.
Bye. Charon
ešení, jak vypsat výskyty menší než trashold? (např. méně než 100), nechám dalším ke studiu. Byť ten n
xxd -c2 -ps file | LANG=C sort --parallel=8 | uniq -c | sort -k 2 -k 1 | awk -v thr="100" '$1 > thr'
Může být zajímavé v sort použít přepínač -S 8GA přitom ta úloha má zjevné lineární řešení s konstantní pamětí a sort třídí v nlogn čase a lineárně paměti
nj ale když uděláš něco takovýho
xxd -c2 -ps file | awk '{a[$0]++}END{for(i in a){if(a[i]>100)print a[i], i}}' | sort
tak už to jakoby neni žádnej oneliner hezkej :/ :/
Tiskni
Sdílej: