Debian dnes slaví 32 let. Ian Murdock oznámil vydání "Debian Linux Release" 16. srpna 1993.
Policisté zadrželi odsouzeného drogového dealera Tomáše Jiřikovského, který daroval ministerstvu spravedlnosti za tehdejšího ministra Pavla Blažka (ODS) bitcoiny v miliardové hodnotě, a zajistili i darovanou kryproměnu. Zadržení Jiřikovského může být podle ministerstva důležité k rozuzlení kauzy, která vypukla koncem května a vedla ke konci Blažka. Zajištění daru podle úřadu potvrzuje závěry dříve publikovaných právních
… více »Administrativa amerického prezidenta Donalda Trumpa jedná o možném převzetí podílu ve výrobci čipů Intel. Agentuře Bloomberg to řekly zdroje obeznámené se situací. Akcie Intelu v reakci na tuto zprávu výrazně posílily. Trump minulý týden označil Tana za konfliktní osobu, a to kvůli jeho vazbám na čínské společnosti, čímž vyvolal nejistotu ohledně dlouholetého úsilí Intelu o obrat v hospodaření. Po pondělní schůzce však prezident o šéfovi Intelu hovořil příznivě.
Společnost Purism stojící za linuxovými telefony a počítači Librem má nově v nabídce postkvantový šifrátor Librem PQC Encryptor.
VirtualBox, tj. multiplatformní virtualizační software, byl vydán v nové verzi 7.2. Přehled novinek v Changelogu. Vypíchnou lze vylepšené GUI.
Eric Migicovsky, zakladatel společnosti Pebble, v lednu oznámil, že má v plánu spustit výrobu nových hodinek Pebble s již open source PebbleOS. V březnu spustil předprodej hodinek Pebble Time 2 (tenkrát ještě pod názvem Core Time 2) za 225 dolarů s dodáním v prosinci. Včera představil jejich konečný vzhled (YouTube).
Byla oznámena nativní podpora protokolu ACME (Automated Certificate Management Environment) ve webovém serveru a reverzní proxy NGINX. Modul nginx-acme je zatím v preview verzi.
Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.08. Přehled novinek i s náhledy a videi v oficiálním oznámení.
Společnost Perplexity AI působící v oblasti umělé inteligence (AI) podala nevyžádanou nabídku na převzetí webového prohlížeče Chrome internetové firmy Google za 34,5 miliardy dolarů (zhruba 723 miliard Kč). Informovala o tom včera agentura Reuters. Upozornila, že výše nabídky výrazně převyšuje hodnotu firmy Perplexity. Společnost Google se podle ní k nabídce zatím nevyjádřila.
Intel vydal 34 upozornění na bezpečnostní chyby ve svých produktech. Současně vydal verzi 20250812 mikrokódů pro své procesory řešící 6 bezpečnostních chyb.
text1
text2
text3
klic_slovo
text4
text5
...
Potreboval bych vysledek asi takto:text1
text2
text3
klic_slovo text4
text5
...
Zkousel jsem to pomoci sedu, awk i grepu, ale k touzenemu vysledku jsem se bohuzel nedostal..
Honza.
Dle
UZITEČNÉ JEDNOŘÁDKOVÉ SKRIPTY PRO SED
je řešení např. toto:
cat file.txt |sed -e :a -e '/klic_slovo$/N; s/\n/ /; ta'
python << EOF import gtk class TwoTexts: def __init__(self, buff, klic_slovo): self.klic_slovo = klic_slovo txtv1 = gtk.TextView() buff1 = txtv1.get_buffer() buff1.set_text(buff) sep = gtk.VSeparator() txtv2 = gtk.TextView() txtv2.set_editable(False) buff2 = txtv2.get_buffer() self.buffer_changed(buff1, buff2) buff1.connect('changed', self.buffer_changed, buff2) hbox = gtk.HBox(False, 0) hbox.pack_start(txtv1, True, True, 0) hbox.pack_start(sep, False, True, 0) hbox.pack_start(txtv2, True, True, 0) hbox.show_all() w = gtk.Window(gtk.WINDOW_TOPLEVEL) w.set_position(gtk.WIN_POS_CENTER) w.connect('destroy', gtk.main_quit) w.connect('delete_event', self.delete_event) w.add(hbox) w.show_all() def delete_event(self, widget, data = None): return False def buffer_changed(self, buff1, buff2): start, end = buff1.get_bounds() text = buff1.get_text(start, end) newtext = text.replace(self.klic_slovo + '\n', self.klic_slovo + ' ') buff2.set_text(newtext) def runapp(self): gtk.main() buff = '''text1 text2 text3 klic_slovo text4 text5''' twotexts = TwoTexts(buff, 'klic_slovo') twotexts.runapp() EOF
cat file.txt |python -c 'import re; import sys; print re.sub(r"(klic_slovo)\n", "\\1 ", sys.stdin.read())'
Na malý soubor je celkem jedno co použijete, ale jakmile bude soubor stejně velký jako vaše RAM, tak jste na tomto příkladu v pythonu skončili (jasný šlo by to vyřešit, ale to by bylo proti Unixové filozofii, proč znovu vymýšlet kolo). Zkuste se podívat na top, když pracuje python a když sed. Všimněte si, že sed nežere žádnou paměť a v tom je jeho síla, je to starý dobrý Unixový nástroj. BTW: sort a další sofistikované nástroje jsou na tom stejně, je jim jedno kolik máte paměti a přece dokončí svojí činost
Zkuste se podívat do /tmp při použití sort na velký soubor a uvidíte proč...
#!/usr/bin/env python import sys k1 = 'klic_slovo\n' k2 = 'klic_slovo ' for line in sys.stdin: if line == k1: line = k2 sys.stdout.write(line)
Sorry, verze na jednom řádku byla jen pro rýpaly a jak jsem se to snažil nahečmat na jeden řádek, tak jsem udělal tu blbost, že jsem nejprve načetl komplet celý vstup do paměti což je moje chyba a ne Pythonu
Nechci tvrdit, že je něco lepší nebo horší, Python mám rád, jen si chci ujasnit na co je lepší se mu vyhnout. Na menší množství dat je bez diskuze pohodlnější po všech stránkách, pokud to není věc, která se jednou napíše přímo do příkazové řádky, již nikdy se nepoužuje a dotyčný zvládá sed, gawk atp.
Myslím, že když chceš srovnávat rychlost, bylo by férové použít i v Pythonu regulární výrazy. Přeci jenom není to vždy takovéto jednoduché porovnávání.
~12x pomalejší:
for line in sys.stdin:
sys.stdout.write(re.sub(r"(klic_slovo)\n", "\\1 ", line))
~6x pomalejší:
pattern1 = re.compile(r"klic_slovo\n")
pattern2 = re.compile(r"(klic_slovo)\n")
for line in sys.stdin:
if (re.search(pattern1, line) == None):
sys.stdout.write(line)
else:
sys.stdout.write(re.sub(pattern2, "\\1 ", line))
Napadá Tě jak to v Pythonu ještě urychlit? Podmínka je samozřejmě zachovat možnost využití regulárních výrazů
Jinak u sedu si můžeme v tomto případě odpustit skákání na značku a, pak je to ještě krapet (opravdu zanedbatelně) rychlejší:
cat file.txt |sed '/klic_slovo$/N; s/\n/ /;'
re.search(pattern1, line)
je podle mých pokusů rychlejší pattern1.search (line)
.
#!/usr/bin/env python import sys, re def run(): search = re.compile(r'(klic_slovo)\n').search write = sys.stdout.write for line in sys.stdin: s = search(line) if s: line = s.groups()[0] + ' ' write(line) run()Ale je to pořád o cca 70% pomalejší než sed nebo perl.
Tiskni
Sdílej: