Google zveřejnil seznam 1272 projektů (vývojářů) od 185 organizací přijatých do letošního, již jednadvacátého, Google Summer of Code. Plánovaným vylepšením v grafických a multimediálních aplikacích se věnuje článek na Libre Arts.
Byla vydána (𝕏) dubnová aktualizace aneb nová verze 1.100 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.100 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.5.
OpenSearch (Wikipedie) byl vydán ve verzi 3.0. Podrobnosti v poznámkách k vydání. Jedná se o fork projektů Elasticsearch a Kibana.
PyXL je koncept procesora, ktorý dokáže priamo spúštat Python kód bez nutnosti prekladu ci Micropythonu. Podľa testov autora je pri 100 MHz približne 30x rýchlejší pri riadeni GPIO nez Micropython na Pyboard taktovanej na 168 MHz.
Grafana (Wikipedie), tj. open source nástroj pro vizualizaci různých metrik a s ní související dotazování, upozorňování a lepší porozumění, byla vydána ve verzi 12.0. Přehled novinek v aktualizované dokumentaci.
Raspberry Pi OS, oficiální operační systém pro Raspberry Pi, byl vydán v nové verzi 2025-05-06. Přehled novinek v příspěvku na blogu Raspberry Pi a poznámkách k vydání. Pravděpodobně se jedná o poslední verzi postavenou na Debianu 12 Bookworm. Následující verze by již měla být postavena na Debianu 13 Trixie.
Richard Stallman dnes v Liberci přednáší o svobodném softwaru a svobodě v digitální společnosti. Od 16:30 v aule budovy G na Technické univerzitě v Liberci. V anglickém jazyce s automaticky generovanými českými titulky. Vstup je zdarma i pro širokou veřejnost.
sudo-rs, tj. sudo a su přepsáné do programovacího jazyka Rust, nahradí v Ubuntu 25.10 klasické sudo. V plánu je také přechod od klasických coreutils k uutils coreutils napsaných v Rustu.
Fedora se stala oficiální distribucí WSL (Windows Subsystem for Linux).
Dobrý den
mám následující skript:
#!/bin/bash
FILE=`basename $1 .out`
grep "TEMP_HOT" $1 | awk '{print $1, $3}' > $FILE.temp
grep "TEMP_COLD" $1 | awk '{print $1, $3}' > $FILE.cold
grep "CURRENT" $1 | awk '{print $1, $3}' > $FILE.curr
sed '/Time/!d; /???/d;' $1 |cut -d : -f 2- |sed 's/:/ /g' |awk '{print $1, $3, $5, $7}' |sort -n |uniq > $FILE.fin
echo "hotovo sefe!"
exit 0
ten pouštím na soubor, který má cca 200MiB.
Na stanici s debianem amd64 (2GiB RAM) s procesorem :
model name : AMD Athlon(tm) 64 X2 Dual Core Processor 5600+ stepping : 3 cpu MHz : 2812.829 cache size : 1024 KBtrvá
real 1m12.978s user 1m23.369s sys 0m1.752skdežto na stanici s gentoo (zrejme 32bit, 1GiB RAM) s procesorem
model name : AMD Athlon(tm) 64 Processor 3500+ stepping : 0 cpu MHz : 2203.408 cache size : 512 KBtrvá:
real 0m26.438s user 0m23.921s sys 0m1.736sAni jeden stroj není jinými procesy nijak zatížen. Liší se pouze verze "sort" a "uniq". Gentoo má 6.4 vs. debianí 5.97. Ale i přesto... vysvětluje to tak závratný rozdíl v časech při takovém rozdílu hw? Zdrojová data jsou k mání třeba zde: data
Pozn: ten skript odpovídá mým skromným znalostem..., takže případná zlepšení jsou samozřejmě vítána :)
LANG=C sort
to přepnete do ascii. Není to ten důvod?
$ time ./rozhod.sh 2.5Anew.out
hotovo sefe!
real 0m39.779s
user 0m50.043s
sys 0m1.620s
Na gentoo je výsledek teměř totožný jako předtím:
$ time ./rozhod.sh 2.5Anew.out
hotovo sefe!
real 0m25.424s
user 0m23.621s
sys 0m1.672s
real 0m26.678s user 0m35.222s sys 0m1.716s
Přestože jsou nyní výsledky srovnatelné, čekal jsem, že na debianu půjde skript mnohem rychleji, vzhledem k dvojnásobku paměti, dvojímu jádru a ješte rychlejšimu taktování. No nic, hlavní zádrhel je vyřešen, za což moc děkuji. K dalšímu zrychlení bude zřejmě potřeba se zamyslet nad strukturou toho skriptu jako takového... :)
ano, to je pravda. Dvojjádro není žádný argument, nechal jsem se unést. Ovšem nerozumím té paměti.... je tím myšleno, že pokud se celý soubor vejde do RAM, tak už je to pak jedno? Jo, tak to bych taky bral.
No, když na ten skript tak koukám, tak mi přijde, že nejnáročnější bude sort
. Zajímalo by mě, zdali třídí rovnou to co leze z roury, nebo jestli počká, až dostane všechno a pak to roztřídí naráz? Nebo jak to vlastně dělá?
Ze souboru potřebuji nejprve vybrat řádky obsahující slova TEMP_COLD, TEMP_HOT a CURR. Ŕádky s jednotlivými slovy chci uložit do zvláštních souborů. Nelze to udělat nějak lépe, než, že ten soubor projdu 3x za sebou? Jinými slovy, nelze místo prvních tří grepů pustit grep jenom jeden a říci mu, aby dával příslušné řádky do třech různých souborů? Počítám, že tohle přímo nepůjde, ale myšlenka je zřejmá...Nebo ještě jinak, když už prvním grepem najdu příslušné datové řádky, rád bych je alespoň zároveň vyhodil ze souboru, abych je nemusel příště procházet zase...To by šlo?
je tím myšleno, že pokud se celý soubor vejde do RAM, tak už je to pak jedno?
Pokud na realizaci úlohy potřebujete určité množství paměti a toto množství máte k dispozici, pak je celkem jedno, jestli máte ještě nějakou navíc. Množství paměti se na rychlosti může projevit pouze v případě, že je buď paměti nedostatek a je nutno swapovat, nebo je při nedostatku paměti program nucen použít paměťově úspornější, ale pomalejší algoritmus.
Prvních tří grepů se můžeš zbavit např. takto:
#!/bin/bash
echo -e "AAA nic TRI\nBBB nic TRI\nCCC nic TRI" |\
gawk '
/AAA/ { print $1, $3 > "file.a" }
/BBB/ { print $1, $3 > "file.b" }
/CCC/ { print $1, $3 > "file.c" }
'
real 0m58.647s user 0m59.440s sys 0m1.216s
#!/bin/bash
FILE=`basename $1 .out`
LANG=C gawk '
/TEMP_HOT/ { print $1, $3 > "file.temp"}
/TEMP_COLD/ { print $1, $3 > "file.cold" }
/CURRENT/ { print $1, $3 > "file.curr" }
' $1
LANG=C sed '/Time/!d; /???/d; s/:/ /g' $1 | LANG=C awk '{print $3, $5, $7, $9}' |LANG=C sort -n |LANG=C uniq > $FILE.fin
echo "hotovo sefe!"
exit 0
Zkoušel jsem:
#!/bin/bash if [ "$2" == "gawk" ]; then gawk ' /AAA/ { print $1, $3 > "gawk.a"; next } /BBB/ { print $1, $3 > "gawk.b"; next } /CCC/ { print $1, $3 > "gawk.c"; next } ' $1 elif [ "$2" == "grep" ]; then grep "AAA" $1 |gawk '{ print $1, $3 }' > grep.a grep "BBB" $1 |gawk '{ print $1, $3 }' > grep.b grep "CCC" $1 |gawk '{ print $1, $3 }' > grep.c elif [ "$2" == "sed" ]; then grep "AAA" $1 |sed -n 's/\([^ ]\+\) \+\([^ ]\+\) \+\([^ ]\+\)/\1 \3/p' > sed.a grep "BBB" $1 |sed -n 's/\([^ ]\+\) \+\([^ ]\+\) \+\([^ ]\+\)/\1 \3/p' > sed.b grep "CCC" $1 |sed -n 's/\([^ ]\+\) \+\([^ ]\+\) \+\([^ ]\+\)/\1 \3/p' > sed.c elif [ "$2" == "bash" ]; then grep "AAA" $1 |while read c1 c2 c3; do echo $c1 $c3; done > bash.a grep "BBB" $1 |while read c1 c2 c3; do echo $c1 $c3; done > bash.b grep "CCC" $1 |while read c1 c2 c3; do echo $c1 $c3; done > bash.c elif [ "$2" == "c" ]; then grep "AAA" $1 |./column > c.a grep "BBB" $1 |./column > c.b grep "CCC" $1 |./column > c.c fi
Nejvíce zdržuje vypsání prvního a třetího sloupce. Rychlejší způsob než C jsem nenašel.
column.c:
#include <stdio.h> #include <stdlib.h> #include <string.h> #define BUFFER_MAX 1024 int main(void) { int i; char buffer[BUFFER_MAX]; char *p_buffer; char *column; while (fgets(buffer, BUFFER_MAX, stdin) != NULL) { p_buffer = buffer; for (i = 0; i < 3; ++i) { if (p_buffer == NULL) { continue; } while (*p_buffer == ' ') { ++p_buffer; } if ((column = strsep(&p_buffer, " ")) == NULL) { continue; } switch (i) { case 0: printf("%s", column); break; case 2: printf(" %s", column); break; default: break; } } } return 0; }
Jestli Tě zajímá jak pracuje sort
, máš k dispozici jeho zdrojáky Všimni si, že si vytváří v
/tmp
pomocné soubory (ls -lh /tmp/sort*
), takže když ho použiješ na velký soubor může pomalé RW disku znatelně zpomalit jeho běh, což může být další zásadní rozdíl mezi sestavami, na kterých jsi prováděl testy.
real 0m10.949s user 0m13.385s sys 0m1.212sreal<(user+sys) takze asi preci jen to je napsano mutithreadove.
pthread_create()
.
Tiskni
Sdílej: