abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:00 | Nová verze

    Vyšlo Pharo 13 s vylepšenou podporou HiDPI či objektovým Transcriptem. Pharo je programovací jazyk a vývojové prostředí s řadou pokročilých vlastností.

    Pavel Křivánek | Komentářů: 0
    dnes 04:00 | IT novinky

    Java má dnes 30. narozeniny. Veřejnosti byla představena 23. května 1995.

    Ladislav Hagara | Komentářů: 4
    včera 21:55 | IT novinky

    1. července Mozilla vypne službu Fakespot pro detekci podvodných recenzí v internetových obchodech. Mozilla koupila Fakespot v květnu 2023.

    Ladislav Hagara | Komentářů: 1
    včera 21:33 | IT novinky

    8. července Mozilla vypne službu Pocket (Wikipedie) pro ukládání článků z webu na později. Do 8. října si uživatelé mohou vyexportovat data. Mozilla koupila Pocket v únoru 2017. Několik měsíců byl Pocket integrovanou součástí Firefoxu.

    Ladislav Hagara | Komentářů: 2
    včera 13:22 | Upozornění

    Turris OS má aktuálně problém s aktualizací související s ukončením podpory protokolu OCSP u certifikační autority Let's Encrypt.

    Ladislav Hagara | Komentářů: 4
    včera 04:00 | Zajímavý článek

    Nevidomý uživatel Linuxu v blogu upozornil na tristní stav přístupnosti na linuxovém desktopu (část první, druhá, závěr), přičemž stížnosti jsou podobné jako v roce 2022. Vyvolal bouřlivou odezvu. Následně např. Georges Stavracas shrnul situaci v GNOME. Debata o jiném aspektu přístupnosti, emulaci vstupu pod Waylandem, také proběhla na Redditu.

    Fluttershy, yay! | Komentářů: 8
    včera 03:00 | Komunita

    DevConf.CZ 2025, tj. open source komunitní konference sponzorovaná společností Red Hat, proběhne od 12. do 14. června v Brně na FIT VUT. Publikován byl program a spuštěna byla registrace.

    Ladislav Hagara | Komentářů: 0
    21.5. 18:22 | Nová verze

    Byla vydána nová major verze 28.0 programovacího jazyka Erlang (Wikipedie) a související platformy OTP (Open Telecom Platform, Wikipedie). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    21.5. 13:11 | Zajímavý článek

    Český telekomunikační úřad zveřejnil Výroční zprávu za rok 2024 (pdf), kde shrnuje své aktivity v loňském roce a přináší i základní popis situace na trhu. Celkový objem přenesených mobilních dat za rok 2024 dosáhl dle odhadu hodnoty přibližně 1,73 tis. PB a jeho meziroční nárůst činí zhruba 30 %. Průměrná měsíční spotřeba dat na datovou SIM kartu odhadem dosáhla 12,5 GB – v předchozím roce šlo o 9,8 GB.

    Ladislav Hagara | Komentářů: 14
    21.5. 12:33 | IT novinky

    Z novinek představených na Google I/O 2025: Přehledy od AI (AI Overviews) se rozšiřují do dalších zemí. Užitečné, syntetizované přehledy od generativní AI jsou nově k dispozici i českým uživatelům Vyhledávače.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (56%)
     (29%)
     (7%)
     (2%)
     (0%)
     (0%)
     (6%)
    Celkem 84 hlasů
     Komentářů: 6, poslední včera 14:43
    Rozcestník

    Dotaz: regulární výraz s podmínkou (python)

    20.2.2013 14:32 dik
    regulární výraz s podmínkou (python)
    Přečteno: 294×
    Ahoj, mám textový soubor a potřebuju vyextrahovat jmeno s rokem pro danou hlavičku. mezi hlavičkou a dalším řádkem s textem nikdy není mezera. Poradíte jak zadat do RE nejlépe pro python. Díky dik

    some junk text some junk text
    
    some junk text some junk text
    
    textová hlavička jedna
    karel 1997
    jarda 1995
    lenka 1978
    zdenka 2000
    karel 1990
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    some junk text some junk text
    
    textová hlavička dvě
    laďa 1997
    jarda 2000
    karel 1978
    zdenka 2001
    mara 1977
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    
    some junk text some junk text
    
    
    textová hlavička tři
    vít 1999
    jarda 1995
    lenka 1978
    lenka 2000
    karel 1990
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    
    some junk text some junk text
    

    Odpovědi

    20.2.2013 15:24 NN
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Tu hlavicku chces taky ? Jaky ma format ? Nebo ti staci jen seznam jmen a cisel:
    #!/usr/bin/python
    import re
    
    foo=open('foo.txt')
    
    matches = re.findall('.+ \d+', foo.read())
    
    for match in matches:
            print match
    
    20.2.2013 15:45 dik
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Jojo hlavička je důležitá, defakto pro mě definuje určitou vlastnost, kterou pak aplikuji na získaný seznam jmeno, rok.

    S výstupním formátem si už poradím, jen neumím zapsat RE ve tvaru "když najdu hlavičku tu a tu tak mi vrať třeba re.iter na následující dvojice jméno,rok třeba v re.match.dict" a musím si dát bacha na junk text. Snad jsem se vyjádřil srozumitelně :) Dík
    20.2.2013 23:21 NN
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Dodavam, ze v pythonu se teprve ucim:
    #!/usr/bin/python
    import re
    
    f = open('foo.txt')
    
    for line in f:
            if  re.match('.*hlavi.*',line):
                    print line
                    while True:
                            n = f.next()
                            if re.match('.* \d+',n):
                                    print n
                            else:
                                    break
    
    22.2.2013 14:07 Jan Šimák | skóre: 37 | Hradec Králové
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Ahoj,

    vyzkoušej tento regex, který zachytí celý požadovaný blok textu do jedné skupiny. Jednotlivé položky pak získáš třeba pomocí metody split().
    regex = re.compile(r"(.*?\n(?:\w+ \d+\n)+)", re.U|re.M)
    
    for m in regex.finditer(string):
        print m.group(0)
        print m.groups()

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.