Přihlášení | Registrace

napište » Zprávičky

DietPi 9.13

včera 23:33 | Nová verze

Byla vydána nová verze 9.13 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Týden v GNOME a Týden v KDE Plasma (30. a 31. května 2025)

včera 21:44 | Komunita

Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.

Ladislav Hagara | Komentářů: 0

Alpine Linux 3.22.0

včera 16:33 | Nová verze

Byla vydána nová stabilní verze 3.22.0, tj. první z nové řady 3.22, minimalistické linuxové distribuce zaměřené na bezpečnost Alpine Linux (Wikipedie) postavené na standardní knihovně jazyka C musl libc a BusyBoxu. Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

FEL ČVUT vyvinula robotickou stavebnici pro mladé programátory

30.5. 00:33 | IT novinky

FEL ČVUT vyvinula robotickou stavebnici pro mladé programátory. Stavebnice Brian byla navržená speciálně pro potřeby populární Robosoutěže. Jde ale také o samostatný produkt, který si může koupit každý fanoušek robotiky a programování od 10 let, ideální je i pro střední školy jako výuková pomůcka. Jádro stavebnice tvoří programovatelná řídicí jednotka, kterou vyvinul tým z FEL ČVUT ve spolupráci s průmyslovými partnery. Stavebnici

… více »

Ladislav Hagara | Komentářů: 41

Ubuntu bude pro testování nových verzí vydávat měsíční snapshoty

29.5. 20:33 | Komunita

Ubuntu bude pro testování nových verzí vydávat měsíční snapshoty. Dnes vyšel 1. snapshot Ubuntu 25.10 (Questing Quokka).

Ladislav Hagara | Komentářů: 0

pfSense Community Edition (CE) 2.8.0

29.5. 14:55 | Nová verze

Společnost Netgate oznámila vydání nové verze 2.8.0 open source firewallové, routovací a VPN platformy pfSense (Wikipedie) postavené na FreeBSD. Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Tails 6.16

29.5. 14:00 | Nová verze

Byla vydána nová verze 6.16 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Tor Browser byl povýšen na verzi 14.5.3. Linux na verzi 6.1.140. Další změny v příslušném seznamu.

Ladislav Hagara | Komentářů: 0

Deník N: Odsouzený muž daroval ministerstvu bitcoiny, řeší to policie

29.5. 12:33 | Zajímavý článek

Člověk odsouzený za obchod s drogami daroval letos ministerstvu spravedlnosti 468 kusů kryptoměny bitcoin, které pak resort v aukcích prodal za skoro miliardu korun. Darováním se zabývá policejní Národní centrála proti organizovanému zločinu (NCOZ). Deníku N to potvrdil přímo ministr spravedlnosti Pavel Blažek (ODS). Podle resortu bylo nicméně vše v souladu s právem.

Ladislav Hagara | Komentářů: 58

Sigil a PageEdit 2.5.0

28.5. 20:44 | Nová verze

Svobodný a otevřený multiplatformní editor EPUB souborů Sigil (Wikipedie, GitHub) byl vydán ve verzi 2.5.0. Stejně tak doprovodný vizuální EPUB XHTML editor PageEdit (GitHub).

Ladislav Hagara | Komentářů: 0

Prohlášení vlády České republiky ke kybernetickému útoku z Čínské lidové republiky

28.5. 12:22 | IT novinky

Na základě národního atribučního procesu vláda České republiky označila Čínskou lidovou republiku za zodpovědnou za škodlivou kybernetickou kampaň proti jedné z neutajovaných komunikačních sítí Ministerstva zahraničních věcí ČR. Tato škodlivá aktivita, která trvala od roku 2022 a zasáhla instituci zařazenou na seznam české kritické infrastruktury, byla provedena kyberšpionážní skupinou APT31, veřejně spojovanou se zpravodajskou službou Ministerstvo státní bezpečnosti (MSS).

Ladislav Hagara | Komentářů: 52

Centrum | Napsat | Starší

navrhněte » Anketa

Jaký je váš oblíbený skriptovací jazyk?

bash (55%)

python (32%)

perl (7%)

powershell (2%)

batch (0%)

vbscript (1%)

jiný, uvedu v diskusi (3%)

Celkem 168 hlasů

Komentářů: 13, poslední 30.5. 12:26

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Filtr noveho radku

Štítky: AWK, hardware, HTML, KDE, Perl, programování, Python, RAM, sed, web

Dotaz: Filtr noveho radku

2.4.2007 20:15 bizi | skóre: 8
Filtr noveho radku

Přečteno: 157×

Odpovědět | Admin

Dobry den, chtel bych se zeptat, jakym zpusobem je mozne odfiltrovat novy radek v souboru na radcich, na kterych se vyskytuje urcity vyraz. Priklad:

text1

text2

text3

klic_slovo

text4

text5

...

Potreboval bych vysledek asi takto:

text1

text2

text3

klic_slovo text4

text5

...

Zkousel jsem to pomoci sedu, awk i grepu, ale k touzenemu vysledku jsem se bohuzel nedostal.. Honza.

Nástroje: Začni sledovat (2) ?

Odpovědi

2.4.2007 21:30 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Filtr noveho radku

Dle UZITEČNÉ JEDNOŘÁDKOVÉ SKRIPTY PRO SED je řešení např. toto:
cat file.txt |sed -e :a -e '/klic_slovo$/N; s/\n/ /; ta'

-- RÁMO: psí tábor , ETriatlon: Výuka plavání

2.4.2007 23:32 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku

Tady je taková malá interaktivní verze. Spusť tohle a zkus editovat text v levé části okna.
Následující zdroják označ myší a prostředním tlačítkem zkopíruj do terminálu:

python << EOF
import gtk

class TwoTexts:
    def __init__(self, buff, klic_slovo):
        self.klic_slovo = klic_slovo

        txtv1 = gtk.TextView()
        buff1 = txtv1.get_buffer()
        buff1.set_text(buff)

        sep = gtk.VSeparator()

        txtv2 = gtk.TextView()
        txtv2.set_editable(False)
        buff2 = txtv2.get_buffer()

        self.buffer_changed(buff1, buff2)
        buff1.connect('changed', self.buffer_changed, buff2)

        hbox = gtk.HBox(False, 0)
        hbox.pack_start(txtv1, True, True, 0)
        hbox.pack_start(sep, False, True, 0)
        hbox.pack_start(txtv2, True, True, 0)
        hbox.show_all()

        w = gtk.Window(gtk.WINDOW_TOPLEVEL)
        w.set_position(gtk.WIN_POS_CENTER)
        w.connect('destroy', gtk.main_quit)
        w.connect('delete_event', self.delete_event)
        w.add(hbox)
        w.show_all()

    def delete_event(self, widget, data = None):
        return False

    def buffer_changed(self, buff1, buff2):
        start, end = buff1.get_bounds()
        text = buff1.get_text(start, end)
        newtext = text.replace(self.klic_slovo + '\n',
                               self.klic_slovo + ' ')
        buff2.set_text(newtext)

    def runapp(self):
        gtk.main()

buff = '''text1
text2
text3
klic_slovo
text4
text5'''

twotexts = TwoTexts(buff, 'klic_slovo')
twotexts.runapp()
EOF

3.4.2007 08:31 ajikdpoe | skóre: 23 | blog: dvh
Rozbalit Rozbalit vše Re: Filtr noveho radku

Hmm... docela peky rozdiel napisat sed "oneliner" a 30 riadkov pythonieho kodu... Ale toto je priklad jednoznacne na sed

3.4.2007 10:05 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Filtr noveho radku

cat file.txt |python -c 'import re; import sys; print re.sub(r"(klic_slovo)\n", "\\1 ", sys.stdin.read())'

Na malý soubor je celkem jedno co použijete, ale jakmile bude soubor stejně velký jako vaše RAM, tak jste na tomto příkladu v pythonu skončili (jasný šlo by to vyřešit, ale to by bylo proti Unixové filozofii, proč znovu vymýšlet kolo). Zkuste se podívat na top, když pracuje python a když sed. Všimněte si, že sed nežere žádnou paměť ;-) a v tom je jeho síla, je to starý dobrý Unixový nástroj. BTW: sort a další sofistikované nástroje jsou na tom stejně, je jim jedno kolik máte paměti a přece dokončí svojí činost ;-) Zkuste se podívat do /tmp při použití sort na velký soubor a uvidíte proč...

-- RÁMO: psí tábor , ETriatlon: Výuka plavání

3.4.2007 12:01 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku

Prosím, nepište v pythonu onelinery. Není k tomu důvod a špatně se to čte. Následující program zpracovává soubor po řádcích, takže paměť nesežere. Běží o 30% pomaleji než varianta v sedu.
Netvrdím, že něco je lepší a něco horší - v tom už má stejně každý jasno. Řešení uvádím pro ty, kteří už v pythonu píšou a náhodou by řešili stejný problém.

#!/usr/bin/env python
import sys
k1 = 'klic_slovo\n'
k2 = 'klic_slovo '
for line in sys.stdin:
    if line == k1: line = k2
    sys.stdout.write(line)

3.4.2007 13:35 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Filtr noveho radku

Sorry, verze na jednom řádku byla jen pro rýpaly a jak jsem se to snažil nahečmat na jeden řádek, tak jsem udělal tu blbost, že jsem nejprve načetl komplet celý vstup do paměti což je moje chyba a ne Pythonu :-D

Nechci tvrdit, že je něco lepší nebo horší, Python mám rád, jen si chci ujasnit na co je lepší se mu vyhnout. Na menší množství dat je bez diskuze pohodlnější po všech stránkách, pokud to není věc, která se jednou napíše přímo do příkazové řádky, již nikdy se nepoužuje a dotyčný zvládá sed, gawk atp.

Myslím, že když chceš srovnávat rychlost, bylo by férové použít i v Pythonu regulární výrazy. Přeci jenom není to vždy takovéto jednoduché porovnávání.

~12x pomalejší:

for line in sys.stdin:
  sys.stdout.write(re.sub(r"(klic_slovo)\n", "\\1 ", line))

~6x pomalejší:

pattern1 = re.compile(r"klic_slovo\n")
pattern2 = re.compile(r"(klic_slovo)\n")
  
for line in sys.stdin:
  if (re.search(pattern1, line) == None):
    sys.stdout.write(line)
  else:
    sys.stdout.write(re.sub(pattern2, "\\1 ", line))

Napadá Tě jak to v Pythonu ještě urychlit? Podmínka je samozřejmě zachovat možnost využití regulárních výrazů ;-)

Jinak u sedu si můžeme v tomto případě odpustit skákání na značku a, pak je to ještě krapet (opravdu zanedbatelně) rychlejší:

cat file.txt |sed '/klic_slovo$/N; s/\n/ /;'

-- RÁMO: psí tábor , ETriatlon: Výuka plavání

3.4.2007 18:13 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku

Myslím, že máme stejný pohled na věc.
A co se týče těch regulárních výrazů, máš pravdu, jsou fakt pomalé. Zajímalo by mě, kde je úzké hrdlo, jestli to souvisí s pythonem jako takovým, jeho dynamičností, function call overheadem (jak se to safra řekne česky?), s algoritmem, který používá pro vyhodnocení nebo jestli je to vším dohromady.
Srovnával jsem rychlost načítání souboru a tisk řádků v pythonu, perlu a sedu a rozdíly jsou celkem malé. Ale přidáním regulárních výrazů začne python výrazně zaostávat. Přitom soudě podle tohoto
http://swtch.com/~rsc/regexp/regexp1.html
By se od perlu moc lišit nemusel. Divné ...

3.4.2007 22:27 Messa | skóre: 39 | blog: Messa
Rozbalit Rozbalit vše Re: Filtr noveho radku

Dalo by se to urychlit předkompilováním těch regulárních výrazů. Sice to tam máš, ale místo re.search(pattern1, line) je podle mých pokusů rychlejší pattern1.search (line).

4.4.2007 00:18 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku

Tohle je to nejrychlejší, co dokážu vymyslet:

#!/usr/bin/env python
import sys, re

def run():
    search = re.compile(r'(klic_slovo)\n').search
    write = sys.stdout.write
    for line in sys.stdin:
        s = search(line)
        if s: line = s.groups()[0] + ' '
        write(line)
run()

Ale je to pořád o cca 70% pomalejší než sed nebo perl.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje