abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 17:00 | Nová verze

Byl vydán Docker 1.13. Přehled novinek na YouTube a v poznámkách k vydání na GitHubu. Docker umožňuje běh aplikací v softwarových kontejnerech (Wikipedia).

Ladislav Hagara | Komentářů: 3
včera 15:51 | Komunita

Mozilla.cz informuje, že nástroje pro webové vývojáře se možná oddělí od Firefoxu a stanou doplňkem. Nástroje pro webové vývojáře prošly velkým přepisem a tým, který se stará o jejich vývoj, by uvítal možnost jejich častějších aktualizacích nezávisle na vydávání nových verzí Firefoxu.

Ladislav Hagara | Komentářů: 5
včera 07:00 | Humor

Čtenářům AbcLinuxu vše nejlepší k dnešnímu Dni zvýšení povědomí o tučňácích (Penguin Awareness Day).

Ladislav Hagara | Komentářů: 0
včera 06:00 | Komunita

Bylo spuštěno hlasování o přednáškách a workshopech pro letošní InstallFest, jenž proběhne o víkendu 4. a 5. března v Praze. Současně byla oznámena změna místa. InstallFest se letos vrací zpět na Karlovo náměstí do budovy E.

Ladislav Hagara | Komentářů: 0
včera 02:48 | Komunita

Greg Kroah-Hartman potvrdil, že Linux 4.9 je jádrem s prodlouženou upstream podporou (LTS, Long Term Support). Podpora je plánována do ledna 2019. Aktuální jádra s prodlouženou podporou jsou tedy 3.2, 3.4, 3.10, 3.12, 3.16, 3.18, 4.1, 4.4 a 4.9.

Ladislav Hagara | Komentářů: 0
včera 00:11 | Zajímavý článek

Výrobce síťových prvků, společnost Netgear, spustila nový program, který slibuje vývojářům, expertům, ale i běžným uživatelům vyplacení finanční odměny za nalezení bezpečnostních chyby v jejich produktech. Za nalezení zranitelnosti v hardware, API nebo mobilní aplikaci nabízí odměnu od 150 do 15 tisíc dolarů (dle závažnosti).

Michal Makovec | Komentářů: 0
včera 00:08 | Pozvánky

V sobotu 18. 2. se v Praze v prostorách VŠE uskuteční od 9:30 již 4. ročník největší české konference o open source redakčním systému WordPress (WP) - WordCamp Praha 2017.

… více »
smíťa | Komentářů: 0
19.1. 23:58 | Komunita

Kryptoměnová komunita zahájila nový rok spuštěním projektu Blockchain.cz, jehož cílem je kolektivně nalézt ideální překlad pro čím dál frekventovanější slovo „blockchain“. Přispět návrhem může kdokoli. Sběr bude trvat až do konce září 2017. Následně bude probíhat dvoutýdenní veřejné hlasování, které bude zakončeno výběrem toho nejlepšího návrhu.

xHire | Komentářů: 9
19.1. 15:55 | Bezpečnostní upozornění

Společnost Oracle vydala čtvrtletní bezpečnostní aktualizaci svých softwarových produktů (CPU, Critical Patch Update). Opraveno je celkově 270 bezpečnostních chyb. V Oracle Java SE je například opraveno 17 bezpečnostních chyb. Vzdáleně zneužitelných bez autentizace je 16 z nich. V Oracle MySQL je opraveno 27 bezpečnostních chyb. Vzdáleně zneužitelných bez autentizace je 5 z nich.

Ladislav Hagara | Komentářů: 0
19.1. 02:48 | Nová verze

Po půl roce od vydání verze 9.0 (zprávička) byla vydána verze 10.0 zvukového serveru PulseAudio. Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 36
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (10%)
 (2%)
 (73%)
 (3%)
 (11%)
Celkem 350 hlasů
 Komentářů: 25, poslední dnes 13:34
    Rozcestník
    Reklama

    Dotaz: Filtr noveho radku

    2.4.2007 20:15 bizi | skóre: 8
    Filtr noveho radku
    Přečteno: 114×
    Dobry den, chtel bych se zeptat, jakym zpusobem je mozne odfiltrovat novy radek v souboru na radcich, na kterych se vyskytuje urcity vyraz. Priklad:
    text1
    text2
    text3
    klic_slovo
    text4
    text5
    ...
    Potreboval bych vysledek asi takto:
    text1
    text2
    text3
    klic_slovo text4
    text5
    ...
    Zkousel jsem to pomoci sedu, awk i grepu, ale k touzenemu vysledku jsem se bohuzel nedostal.. Honza.

    Odpovědi

    Fuky avatar 2.4.2007 21:30 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: Filtr noveho radku

    Dle UZITEČNÉ JEDNOŘÁDKOVÉ SKRIPTY PRO SED je řešení např. toto:
    cat file.txt |sed -e :a -e '/klic_slovo$/N; s/\n/ /; ta'

    2.4.2007 23:32 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Filtr noveho radku
    Tady je taková malá interaktivní verze. Spusť tohle a zkus editovat text v levé části okna.
    Následující zdroják označ myší a prostředním tlačítkem zkopíruj do terminálu:
    python << EOF
    import gtk
    
    class TwoTexts:
        def __init__(self, buff, klic_slovo):
            self.klic_slovo = klic_slovo
    
            txtv1 = gtk.TextView()
            buff1 = txtv1.get_buffer()
            buff1.set_text(buff)
    
            sep = gtk.VSeparator()
    
            txtv2 = gtk.TextView()
            txtv2.set_editable(False)
            buff2 = txtv2.get_buffer()
    
            self.buffer_changed(buff1, buff2)
            buff1.connect('changed', self.buffer_changed, buff2)
    
            hbox = gtk.HBox(False, 0)
            hbox.pack_start(txtv1, True, True, 0)
            hbox.pack_start(sep, False, True, 0)
            hbox.pack_start(txtv2, True, True, 0)
            hbox.show_all()
    
            w = gtk.Window(gtk.WINDOW_TOPLEVEL)
            w.set_position(gtk.WIN_POS_CENTER)
            w.connect('destroy', gtk.main_quit)
            w.connect('delete_event', self.delete_event)
            w.add(hbox)
            w.show_all()
    
        def delete_event(self, widget, data = None):
            return False
    
        def buffer_changed(self, buff1, buff2):
            start, end = buff1.get_bounds()
            text = buff1.get_text(start, end)
            newtext = text.replace(self.klic_slovo + '\n',
                                   self.klic_slovo + ' ')
            buff2.set_text(newtext)
    
        def runapp(self):
            gtk.main()
    
    buff = '''text1
    text2
    text3
    klic_slovo
    text4
    text5'''
    
    twotexts = TwoTexts(buff, 'klic_slovo')
    twotexts.runapp()
    EOF
    
    3.4.2007 08:31 ajikdpoe | skóre: 23 | blog: dvh
    Rozbalit Rozbalit vše Re: Filtr noveho radku
    Hmm... docela peky rozdiel napisat sed "oneliner" a 30 riadkov pythonieho kodu... Ale toto je priklad jednoznacne na sed
    Fuky avatar 3.4.2007 10:05 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: Filtr noveho radku

    cat file.txt |python -c 'import re; import sys; print re.sub(r"(klic_slovo)\n", "\\1 ", sys.stdin.read())'

    Na malý soubor je celkem jedno co použijete, ale jakmile bude soubor stejně velký jako vaše RAM, tak jste na tomto příkladu v pythonu skončili (jasný šlo by to vyřešit, ale to by bylo proti Unixové filozofii, proč znovu vymýšlet kolo). Zkuste se podívat na top, když pracuje python a když sed. Všimněte si, že sed nežere žádnou paměť ;-) a v tom je jeho síla, je to starý dobrý Unixový nástroj. BTW: sort a další sofistikované nástroje jsou na tom stejně, je jim jedno kolik máte paměti a přece dokončí svojí činost ;-) Zkuste se podívat do /tmp při použití sort na velký soubor a uvidíte proč...

    3.4.2007 12:01 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Filtr noveho radku
    Prosím, nepište v pythonu onelinery. Není k tomu důvod a špatně se to čte. Následující program zpracovává soubor po řádcích, takže paměť nesežere. Běží o 30% pomaleji než varianta v sedu.
    Netvrdím, že něco je lepší a něco horší - v tom už má stejně každý jasno. Řešení uvádím pro ty, kteří už v pythonu píšou a náhodou by řešili stejný problém.
    #!/usr/bin/env python
    import sys
    k1 = 'klic_slovo\n'
    k2 = 'klic_slovo '
    for line in sys.stdin:
        if line == k1: line = k2
        sys.stdout.write(line)
    
    Fuky avatar 3.4.2007 13:35 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: Filtr noveho radku

    Sorry, verze na jednom řádku byla jen pro rýpaly a jak jsem se to snažil nahečmat na jeden řádek, tak jsem udělal tu blbost, že jsem nejprve načetl komplet celý vstup do paměti což je moje chyba a ne Pythonu :-D

    Nechci tvrdit, že je něco lepší nebo horší, Python mám rád, jen si chci ujasnit na co je lepší se mu vyhnout. Na menší množství dat je bez diskuze pohodlnější po všech stránkách, pokud to není věc, která se jednou napíše přímo do příkazové řádky, již nikdy se nepoužuje a dotyčný zvládá sed, gawk atp.

    Myslím, že když chceš srovnávat rychlost, bylo by férové použít i v Pythonu regulární výrazy. Přeci jenom není to vždy takovéto jednoduché porovnávání.

    ~12x pomalejší:

    for line in sys.stdin:
      sys.stdout.write(re.sub(r"(klic_slovo)\n", "\\1 ", line))
    

    ~6x pomalejší:

    pattern1 = re.compile(r"klic_slovo\n")
    pattern2 = re.compile(r"(klic_slovo)\n")
      
    for line in sys.stdin:
      if (re.search(pattern1, line) == None):
        sys.stdout.write(line)
      else:
        sys.stdout.write(re.sub(pattern2, "\\1 ", line))
    

    Napadá Tě jak to v Pythonu ještě urychlit? Podmínka je samozřejmě zachovat možnost využití regulárních výrazů ;-)

    Jinak u sedu si můžeme v tomto případě odpustit skákání na značku a, pak je to ještě krapet (opravdu zanedbatelně) rychlejší:

    cat file.txt |sed '/klic_slovo$/N; s/\n/ /;'
    

    3.4.2007 18:13 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Filtr noveho radku
    Myslím, že máme stejný pohled na věc.
    A co se týče těch regulárních výrazů, máš pravdu, jsou fakt pomalé. Zajímalo by mě, kde je úzké hrdlo, jestli to souvisí s pythonem jako takovým, jeho dynamičností, function call overheadem (jak se to safra řekne česky?), s algoritmem, který používá pro vyhodnocení nebo jestli je to vším dohromady.
    Srovnával jsem rychlost načítání souboru a tisk řádků v pythonu, perlu a sedu a rozdíly jsou celkem malé. Ale přidáním regulárních výrazů začne python výrazně zaostávat. Přitom soudě podle tohoto
    http://swtch.com/~rsc/regexp/regexp1.html
    By se od perlu moc lišit nemusel. Divné ...
    3.4.2007 22:27 Messa | skóre: 39 | blog: Messa
    Rozbalit Rozbalit vše Re: Filtr noveho radku
    Dalo by se to urychlit předkompilováním těch regulárních výrazů. Sice to tam máš, ale místo re.search(pattern1, line) je podle mých pokusů rychlejší pattern1.search (line).
    4.4.2007 00:18 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Filtr noveho radku
    Tohle je to nejrychlejší, co dokážu vymyslet:
    #!/usr/bin/env python
    import sys, re
    
    def run():
        search = re.compile(r'(klic_slovo)\n').search
        write = sys.stdout.write
        for line in sys.stdin:
            s = search(line)
            if s: line = s.groups()[0] + ' '
            write(line)
    run()
    
    Ale je to pořád o cca 70% pomalejší než sed nebo perl.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.