abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 17:44 | Zajímavý článek

    Jak si zobrazit pomocí Chrome a na Chromiu založených webových prohlížečích stránky s neplatným certifikátem? Stačí napsat thisisunsafe.

    Ladislav Hagara | Komentářů: 0
    dnes 00:33 | Bezpečnostní upozornění

    V repozitáři AUR (Arch User Repository) linuxové distribuce Arch Linux byly nalezeny a odstraněny tři balíčky s malwarem. Jedná se o librewolf-fix-bin, firefox-patch-bin a zen-browser-patched-bin.

    Ladislav Hagara | Komentářů: 8
    dnes 00:22 | Komunita

    Dle plánu by Debian 13 s kódovým názvem Trixie měl vyjít v sobotu 9. srpna.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Komunita

    Vývoj linuxové distribuce Clear Linux (Wikipedie) vyvíjené společností Intel a optimalizováné pro jejich procesory byl oficiálně ukončen.

    Ladislav Hagara | Komentářů: 1
    18.7. 14:00 | Zajímavý článek

    Byl publikován aktuální přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie).

    Ladislav Hagara | Komentářů: 0
    18.7. 12:00 | Nová verze

    V programovacím jazyce Go naprogramovaná webová aplikace pro spolupráci na zdrojových kódech pomocí gitu Forgejo byla vydána ve verzi 12.0 (Mastodon). Forgejo je fork Gitei.

    Ladislav Hagara | Komentářů: 1
    17.7. 18:44 | Zajímavý článek

    Nová čísla časopisů od nakladatelství Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 155 (pdf) a Hello World 27 (pdf).

    Ladislav Hagara | Komentářů: 1
    17.7. 16:11 | Nová verze

    Hyprland, tj. kompozitor pro Wayland zaměřený na dláždění okny a zároveň grafické efekty, byl vydán ve verzi 0.50.0. Podrobný přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 4
    17.7. 15:55 | Komunita

    Patrick Volkerding oznámil před dvaatřiceti lety vydání Slackware Linuxu 1.00. Slackware Linux byl tenkrát k dispozici na 3,5 palcových disketách. Základní systém byl na 13 disketách. Kdo chtěl grafiku, potřeboval dalších 11 disket. Slackware Linux 1.00 byl postaven na Linuxu .99pl11 Alpha, libc 4.4.1, g++ 2.4.5 a XFree86 1.3.

    Ladislav Hagara | Komentářů: 5
    16.7. 21:22 | IT novinky

    Ministerstvo pro místní rozvoj (MMR) jako první orgán státní správy v Česku spustilo takzvaný „bug bounty“ program pro odhalování bezpečnostních rizik a zranitelných míst ve svých informačních systémech. Za nalezení kritické zranitelnosti nabízí veřejnosti odměnu 1000 eur, v případě vysoké závažnosti je to 500 eur. Program se inspiruje přístupy běžnými v komerčním sektoru nebo ve veřejné sféře v zahraničí.

    Ladislav Hagara | Komentářů: 19
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (19%)
     (19%)
     (4%)
     (8%)
     (4%)
     (8%)
     (4%)
     (35%)
    Celkem 26 hlasů
     Komentářů: 4, poslední dnes 16:33
    Rozcestník

    Dotaz: regulární výraz s podmínkou (python)

    20.2.2013 14:32 dik
    regulární výraz s podmínkou (python)
    Přečteno: 295×
    Ahoj, mám textový soubor a potřebuju vyextrahovat jmeno s rokem pro danou hlavičku. mezi hlavičkou a dalším řádkem s textem nikdy není mezera. Poradíte jak zadat do RE nejlépe pro python. Díky dik

    some junk text some junk text
    
    some junk text some junk text
    
    textová hlavička jedna
    karel 1997
    jarda 1995
    lenka 1978
    zdenka 2000
    karel 1990
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    some junk text some junk text
    
    textová hlavička dvě
    laďa 1997
    jarda 2000
    karel 1978
    zdenka 2001
    mara 1977
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    
    some junk text some junk text
    
    
    textová hlavička tři
    vít 1999
    jarda 1995
    lenka 1978
    lenka 2000
    karel 1990
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    
    some junk text some junk text
    

    Odpovědi

    20.2.2013 15:24 NN
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Tu hlavicku chces taky ? Jaky ma format ? Nebo ti staci jen seznam jmen a cisel:
    #!/usr/bin/python
    import re
    
    foo=open('foo.txt')
    
    matches = re.findall('.+ \d+', foo.read())
    
    for match in matches:
            print match
    
    20.2.2013 15:45 dik
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Jojo hlavička je důležitá, defakto pro mě definuje určitou vlastnost, kterou pak aplikuji na získaný seznam jmeno, rok.

    S výstupním formátem si už poradím, jen neumím zapsat RE ve tvaru "když najdu hlavičku tu a tu tak mi vrať třeba re.iter na následující dvojice jméno,rok třeba v re.match.dict" a musím si dát bacha na junk text. Snad jsem se vyjádřil srozumitelně :) Dík
    20.2.2013 23:21 NN
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Dodavam, ze v pythonu se teprve ucim:
    #!/usr/bin/python
    import re
    
    f = open('foo.txt')
    
    for line in f:
            if  re.match('.*hlavi.*',line):
                    print line
                    while True:
                            n = f.next()
                            if re.match('.* \d+',n):
                                    print n
                            else:
                                    break
    
    22.2.2013 14:07 Jan Šimák | skóre: 37 | Hradec Králové
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Ahoj,

    vyzkoušej tento regex, který zachytí celý požadovaný blok textu do jedné skupiny. Jednotlivé položky pak získáš třeba pomocí metody split().
    regex = re.compile(r"(.*?\n(?:\w+ \d+\n)+)", re.U|re.M)
    
    for m in regex.finditer(string):
        print m.group(0)
        print m.groups()

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.