abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 22:00 | IT novinky

    Společnost OpenAI představila svůj nejnovější AI model GPT-4o (o jako omni, tj. vše). Nově také "vidí" a "slyší". Videoukázky na 𝕏 nebo YouTube.

    Ladislav Hagara | Komentářů: 0
    včera 15:44 | Zajímavý článek

    Ondřej Filip publikoval reportáž z ceremonie podpisu kořenové zóny DNS. Zhlédnout lze také jeho nedávnou přednášku Jak se podepisuje kořenová zóna Internetu v rámci cyklu Fyzikální čtvrtky FEL ČVUT.

    Ladislav Hagara | Komentářů: 0
    včera 14:22 | IT novinky

    Společnost BenQ uvádí na trh novou řadu monitorů RD určenou pro programátory. První z nich je RD240Q.

    Ladislav Hagara | Komentářů: 9
    včera 13:00 | IT novinky

    Byl aktualizován seznam 500 nejvýkonnějších superpočítačů na světě TOP500. Nejvýkonnějším superpočítačem nadále zůstává Frontier od HPE (Cray) s výkonem 1,206 exaFLOPS. Druhá Aurora má oproti loňsku přibližně dvojnásobný počet jader a dvojnásobný výkon: 1,012 exaFLOPS. Novým počítačem v první desítce je na 6. místě Alps. Novým českým počítačem v TOP500 je na 112. místě C24 ve Škoda Auto v Mladé Boleslavi. Ostravská Karolina, GPU

    … více »
    Ladislav Hagara | Komentářů: 0
    včera 10:11 | Nová verze

    GHC (Glasgow Haskell Compiler, Wikipedie), tj. překladač funkcionálního programovacího jazyka Haskell (Wikipedie), byl vydán ve verzi 9.10.1. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 09:22 | Nová verze

    Po 9 týdnech vývoje od vydání Linuxu 6.8 oznámil Linus Torvalds vydání Linuxu 6.9. Přehled novinek a vylepšení na LWN.net: první a druhá polovina začleňovacího okna. Později také na Linux Kernel Newbies.

    Ladislav Hagara | Komentářů: 2
    11.5. 18:22 | Nová verze

    Byla vydána verze 0.2.0 v Rustu napsaného frameworku Pingora pro vytváření rychlých, spolehlivých a programovatelných síťových systémů. Společnost Cloudflare jej letos v únoru uvolnila pod licencí Apache 2.0.

    Ladislav Hagara | Komentářů: 0
    10.5. 19:11 | Nová verze

    Open source RDP (Remote Desktop Protocol) server xrdp (Wikipedie) byl vydán ve verzi 0.10.0. Z novinek je vypíchnuta podpora GFX (Graphic Pipeline Extension). Nová větev řeší také několik bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 16
    10.5. 04:11 | Nová verze

    Rocky Linux byl vydán v nové stabilní verzi 9.4. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    9.5. 22:22 | Bezpečnostní upozornění

    Dellu byla odcizena databáze zákazníků (jméno, adresa, seznam zakoupených produktů) [Customer Care, Bleeping Computer].

    Ladislav Hagara | Komentářů: 22
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (71%)
     (6%)
     (10%)
     (12%)
    Celkem 220 hlasů
     Komentářů: 15, poslední včera 21:33
    Rozcestník

    Dotaz: regulární výraz s podmínkou (python)

    20.2.2013 14:32 dik
    regulární výraz s podmínkou (python)
    Přečteno: 275×
    Ahoj, mám textový soubor a potřebuju vyextrahovat jmeno s rokem pro danou hlavičku. mezi hlavičkou a dalším řádkem s textem nikdy není mezera. Poradíte jak zadat do RE nejlépe pro python. Díky dik

    some junk text some junk text
    
    some junk text some junk text
    
    textová hlavička jedna
    karel 1997
    jarda 1995
    lenka 1978
    zdenka 2000
    karel 1990
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    some junk text some junk text
    
    textová hlavička dvě
    laďa 1997
    jarda 2000
    karel 1978
    zdenka 2001
    mara 1977
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    
    some junk text some junk text
    
    
    textová hlavička tři
    vít 1999
    jarda 1995
    lenka 1978
    lenka 2000
    karel 1990
    
    some junk text some junk text
    some junk text some junk text
    
    some junk text some junk text
    
    some junk text some junk text
    

    Odpovědi

    20.2.2013 15:24 NN
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Tu hlavicku chces taky ? Jaky ma format ? Nebo ti staci jen seznam jmen a cisel:
    #!/usr/bin/python
    import re
    
    foo=open('foo.txt')
    
    matches = re.findall('.+ \d+', foo.read())
    
    for match in matches:
            print match
    
    20.2.2013 15:45 dik
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Jojo hlavička je důležitá, defakto pro mě definuje určitou vlastnost, kterou pak aplikuji na získaný seznam jmeno, rok.

    S výstupním formátem si už poradím, jen neumím zapsat RE ve tvaru "když najdu hlavičku tu a tu tak mi vrať třeba re.iter na následující dvojice jméno,rok třeba v re.match.dict" a musím si dát bacha na junk text. Snad jsem se vyjádřil srozumitelně :) Dík
    20.2.2013 23:21 NN
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Dodavam, ze v pythonu se teprve ucim:
    #!/usr/bin/python
    import re
    
    f = open('foo.txt')
    
    for line in f:
            if  re.match('.*hlavi.*',line):
                    print line
                    while True:
                            n = f.next()
                            if re.match('.* \d+',n):
                                    print n
                            else:
                                    break
    
    22.2.2013 14:07 Jan Šimák | skóre: 37 | Hradec Králové
    Rozbalit Rozbalit vše Re: regulární výraz s podmínkou (python)
    Ahoj,

    vyzkoušej tento regex, který zachytí celý požadovaný blok textu do jedné skupiny. Jednotlivé položky pak získáš třeba pomocí metody split().
    regex = re.compile(r"(.*?\n(?:\w+ \d+\n)+)", re.U|re.M)
    
    for m in regex.finditer(string):
        print m.group(0)
        print m.groups()

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.