abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
včera 22:44 | Komunita

Joinup informuje, že Mnichov používá open source groupware Kolab. V srpnu byl dokončen dvouletý přechod na toto řešení. V provozu je asi 60 000 poštovních schránek. Nejenom Kolabu se věnoval Georg Greve ve své přednášce Open Source: the future for the European institutions (SlideShare) na konferenci DIGITEC 2016, jež proběhla v úterý 29. listopadu v Bruselu. Videozáznam přednášek z hlavního sálu je ke zhlédnutí na Livestreamu.

Ladislav Hagara | Komentářů: 1
včera 15:30 | Zajímavý projekt

Společnost Jolla oznámila v příspěvku Case study: Sailfish Watch na svém blogu, že naportovala Sailfish OS na chytré hodinky. Využila a inspirovala se otevřeným operačním systémem pro chytré hodinky AsteroidOS. Použita je knihovna libhybris. Ukázka ovládání hodinek na YouTube.

Ladislav Hagara | Komentářů: 5
včera 14:15 | Nová verze

Byla vydána verze 7.1.0 skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Jedná se o první stabilní verzi nejnovější větvě 7.1. Přehled novinek v dokumentaci. Podrobnosti v ChangeLogu. K dispozici je také příručka pro přechod z PHP 7.0.x na PHP 7.1.x.

Ladislav Hagara | Komentářů: 0
včera 12:55 | Nová verze

Google Chrome 55 byl prohlášen za stabilní. Nejnovější stabilní verze 55.0.2883.75 tohoto webového prohlížeče přináší řadu oprav a vylepšení (YouTube). Opraveno bylo také 36 bezpečnostních chyb. Mariusz Mlynski si například vydělal 22 500 dolarů za 3 nahlášené chyby (Universal XSS in Blink).

Ladislav Hagara | Komentářů: 4
včera 11:55 | Pozvánky

Máte rádi svobodný software a hardware nebo se o nich chcete něco dozvědět? Přijďte na 135. sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.

xkucf03 | Komentářů: 0
včera 00:10 | Nová verze

Byla vydána verze 3.2 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata. Z novinek lze zmínit například podporu protokolů DNP3 a CIP/ENIP, vylepšenou podporu TLS a samozřejmě také aktualizovanou dokumentaci.

Ladislav Hagara | Komentářů: 0
1.12. 21:00 | Nová verze

Byla vydána beta verze Linux Mintu 18.1 s kódovým jménem Serena. Na blogu Linux Mintu jsou hned dvě oznámení. První o vydání Linux Mintu s prostředím MATE a druhé o vydání Linux Mintu s prostředím Cinnamon. Stejným způsobem jsou rozděleny také poznámky k vydání (MATE, Cinnamon) a přehled novinek s náhledy (MATE, Cinnamon). Linux Mint 18.1 bude podporován až do roku 2021.

Ladislav Hagara | Komentářů: 0
1.12. 16:42 | Nová verze

Byl vydán Devuan Jessie 1.0 Beta 2. Jedná se o druhou beta verzi forku Debianu bez systemd představeného v listopadu 2014 (zprávička). První beta verze byla vydána v dubnu letošního roku (zprávička). Jedna z posledních přednášek věnovaných Devuanu proběhla v listopadu na konferenci FSCONS 2016 (YouTube, pdf).

Ladislav Hagara | Komentářů: 0
1.12. 15:16 | Komunita

Na GOG.com začal zimní výprodej. Řada zlevněných her běží oficiálně také na Linuxu. Hru Neverwinter Nights Diamond lze dva dny získat zdarma. Hra dle stránek GOG.com na Linuxu neběží. Pomocí návodu ji lze ale rozběhnout také na Linuxu [Gaming On Linux].

Ladislav Hagara | Komentářů: 1
1.12. 13:14 | Bezpečnostní upozornění

Byla vydána verze 2.7.1 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Řešeno je několik bezpečnostních problémů. Aktualizován byl především Tor Browser na verzi 6.0.7. Tor Browser je postaven na Firefoxu ESR (Extended Support Release) a právě ve Firefoxu byla nalezena a opravena vážná bezpečnostní chyba MFSA 2016-92 (CVE-2016-9079, Firefox SVG Animation

… více »
Ladislav Hagara | Komentářů: 0
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 759 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: Filtr noveho radku

2.4.2007 20:15 bizi | skóre: 8
Filtr noveho radku
Přečteno: 113×
Dobry den, chtel bych se zeptat, jakym zpusobem je mozne odfiltrovat novy radek v souboru na radcich, na kterych se vyskytuje urcity vyraz. Priklad:
text1
text2
text3
klic_slovo
text4
text5
...
Potreboval bych vysledek asi takto:
text1
text2
text3
klic_slovo text4
text5
...
Zkousel jsem to pomoci sedu, awk i grepu, ale k touzenemu vysledku jsem se bohuzel nedostal.. Honza.

Odpovědi

Fuky avatar 2.4.2007 21:30 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Filtr noveho radku

Dle UZITEČNÉ JEDNOŘÁDKOVÉ SKRIPTY PRO SED je řešení např. toto:
cat file.txt |sed -e :a -e '/klic_slovo$/N; s/\n/ /; ta'

2.4.2007 23:32 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku
Tady je taková malá interaktivní verze. Spusť tohle a zkus editovat text v levé části okna.
Následující zdroják označ myší a prostředním tlačítkem zkopíruj do terminálu:
python << EOF
import gtk

class TwoTexts:
    def __init__(self, buff, klic_slovo):
        self.klic_slovo = klic_slovo

        txtv1 = gtk.TextView()
        buff1 = txtv1.get_buffer()
        buff1.set_text(buff)

        sep = gtk.VSeparator()

        txtv2 = gtk.TextView()
        txtv2.set_editable(False)
        buff2 = txtv2.get_buffer()

        self.buffer_changed(buff1, buff2)
        buff1.connect('changed', self.buffer_changed, buff2)

        hbox = gtk.HBox(False, 0)
        hbox.pack_start(txtv1, True, True, 0)
        hbox.pack_start(sep, False, True, 0)
        hbox.pack_start(txtv2, True, True, 0)
        hbox.show_all()

        w = gtk.Window(gtk.WINDOW_TOPLEVEL)
        w.set_position(gtk.WIN_POS_CENTER)
        w.connect('destroy', gtk.main_quit)
        w.connect('delete_event', self.delete_event)
        w.add(hbox)
        w.show_all()

    def delete_event(self, widget, data = None):
        return False

    def buffer_changed(self, buff1, buff2):
        start, end = buff1.get_bounds()
        text = buff1.get_text(start, end)
        newtext = text.replace(self.klic_slovo + '\n',
                               self.klic_slovo + ' ')
        buff2.set_text(newtext)

    def runapp(self):
        gtk.main()

buff = '''text1
text2
text3
klic_slovo
text4
text5'''

twotexts = TwoTexts(buff, 'klic_slovo')
twotexts.runapp()
EOF
3.4.2007 08:31 ajikdpoe | skóre: 23 | blog: dvh
Rozbalit Rozbalit vše Re: Filtr noveho radku
Hmm... docela peky rozdiel napisat sed "oneliner" a 30 riadkov pythonieho kodu... Ale toto je priklad jednoznacne na sed
Fuky avatar 3.4.2007 10:05 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Filtr noveho radku

cat file.txt |python -c 'import re; import sys; print re.sub(r"(klic_slovo)\n", "\\1 ", sys.stdin.read())'

Na malý soubor je celkem jedno co použijete, ale jakmile bude soubor stejně velký jako vaše RAM, tak jste na tomto příkladu v pythonu skončili (jasný šlo by to vyřešit, ale to by bylo proti Unixové filozofii, proč znovu vymýšlet kolo). Zkuste se podívat na top, když pracuje python a když sed. Všimněte si, že sed nežere žádnou paměť ;-) a v tom je jeho síla, je to starý dobrý Unixový nástroj. BTW: sort a další sofistikované nástroje jsou na tom stejně, je jim jedno kolik máte paměti a přece dokončí svojí činost ;-) Zkuste se podívat do /tmp při použití sort na velký soubor a uvidíte proč...

3.4.2007 12:01 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku
Prosím, nepište v pythonu onelinery. Není k tomu důvod a špatně se to čte. Následující program zpracovává soubor po řádcích, takže paměť nesežere. Běží o 30% pomaleji než varianta v sedu.
Netvrdím, že něco je lepší a něco horší - v tom už má stejně každý jasno. Řešení uvádím pro ty, kteří už v pythonu píšou a náhodou by řešili stejný problém.
#!/usr/bin/env python
import sys
k1 = 'klic_slovo\n'
k2 = 'klic_slovo '
for line in sys.stdin:
    if line == k1: line = k2
    sys.stdout.write(line)
Fuky avatar 3.4.2007 13:35 Fuky | skóre: 52 | blog: 4u
Rozbalit Rozbalit vše Re: Filtr noveho radku

Sorry, verze na jednom řádku byla jen pro rýpaly a jak jsem se to snažil nahečmat na jeden řádek, tak jsem udělal tu blbost, že jsem nejprve načetl komplet celý vstup do paměti což je moje chyba a ne Pythonu :-D

Nechci tvrdit, že je něco lepší nebo horší, Python mám rád, jen si chci ujasnit na co je lepší se mu vyhnout. Na menší množství dat je bez diskuze pohodlnější po všech stránkách, pokud to není věc, která se jednou napíše přímo do příkazové řádky, již nikdy se nepoužuje a dotyčný zvládá sed, gawk atp.

Myslím, že když chceš srovnávat rychlost, bylo by férové použít i v Pythonu regulární výrazy. Přeci jenom není to vždy takovéto jednoduché porovnávání.

~12x pomalejší:

for line in sys.stdin:
  sys.stdout.write(re.sub(r"(klic_slovo)\n", "\\1 ", line))

~6x pomalejší:

pattern1 = re.compile(r"klic_slovo\n")
pattern2 = re.compile(r"(klic_slovo)\n")
  
for line in sys.stdin:
  if (re.search(pattern1, line) == None):
    sys.stdout.write(line)
  else:
    sys.stdout.write(re.sub(pattern2, "\\1 ", line))

Napadá Tě jak to v Pythonu ještě urychlit? Podmínka je samozřejmě zachovat možnost využití regulárních výrazů ;-)

Jinak u sedu si můžeme v tomto případě odpustit skákání na značku a, pak je to ještě krapet (opravdu zanedbatelně) rychlejší:

cat file.txt |sed '/klic_slovo$/N; s/\n/ /;'

3.4.2007 18:13 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku
Myslím, že máme stejný pohled na věc.
A co se týče těch regulárních výrazů, máš pravdu, jsou fakt pomalé. Zajímalo by mě, kde je úzké hrdlo, jestli to souvisí s pythonem jako takovým, jeho dynamičností, function call overheadem (jak se to safra řekne česky?), s algoritmem, který používá pro vyhodnocení nebo jestli je to vším dohromady.
Srovnával jsem rychlost načítání souboru a tisk řádků v pythonu, perlu a sedu a rozdíly jsou celkem malé. Ale přidáním regulárních výrazů začne python výrazně zaostávat. Přitom soudě podle tohoto
http://swtch.com/~rsc/regexp/regexp1.html
By se od perlu moc lišit nemusel. Divné ...
3.4.2007 22:27 Messa | skóre: 39 | blog: Messa
Rozbalit Rozbalit vše Re: Filtr noveho radku
Dalo by se to urychlit předkompilováním těch regulárních výrazů. Sice to tam máš, ale místo re.search(pattern1, line) je podle mých pokusů rychlejší pattern1.search (line).
4.4.2007 00:18 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Filtr noveho radku
Tohle je to nejrychlejší, co dokážu vymyslet:
#!/usr/bin/env python
import sys, re

def run():
    search = re.compile(r'(klic_slovo)\n').search
    write = sys.stdout.write
    for line in sys.stdin:
        s = search(line)
        if s: line = s.groups()[0] + ' '
        write(line)
run()
Ale je to pořád o cca 70% pomalejší než sed nebo perl.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.