abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 01:00 | Komunita

    Debian dnes slaví 32 let. Ian Murdock oznámil vydání "Debian Linux Release" 16. srpna 1993.

    Ladislav Hagara | Komentářů: 12
    15.8. 17:44 | IT novinky

    Policisté zadrželi odsouzeného drogového dealera Tomáše Jiřikovského, který daroval ministerstvu spravedlnosti za tehdejšího ministra Pavla Blažka (ODS) bitcoiny v miliardové hodnotě, a zajistili i darovanou kryproměnu. Zadržení Jiřikovského může být podle ministerstva důležité k rozuzlení kauzy, která vypukla koncem května a vedla ke konci Blažka. Zajištění daru podle úřadu potvrzuje závěry dříve publikovaných právních

    … více »
    Ladislav Hagara | Komentářů: 7
    15.8. 13:44 | IT novinky

    Administrativa amerického prezidenta Donalda Trumpa jedná o možném převzetí podílu ve výrobci čipů Intel. Agentuře Bloomberg to řekly zdroje obeznámené se situací. Akcie Intelu v reakci na tuto zprávu výrazně posílily. Trump minulý týden označil Tana za konfliktní osobu, a to kvůli jeho vazbám na čínské společnosti, čímž vyvolal nejistotu ohledně dlouholetého úsilí Intelu o obrat v hospodaření. Po pondělní schůzce však prezident o šéfovi Intelu hovořil příznivě.

    Ladislav Hagara | Komentářů: 3
    15.8. 05:44 | IT novinky

    Společnost Purism stojící za linuxovými telefony a počítači Librem má nově v nabídce postkvantový šifrátor Librem PQC Encryptor.

    Ladislav Hagara | Komentářů: 10
    14.8. 18:00 | Nová verze

    VirtualBox, tj. multiplatformní virtualizační software, byl vydán v nové verzi 7.2. Přehled novinek v Changelogu. Vypíchnou lze vylepšené GUI.

    Ladislav Hagara | Komentářů: 0
    14.8. 14:11 | IT novinky

    Eric Migicovsky, zakladatel společnosti Pebble, v lednu oznámil, že má v plánu spustit výrobu nových hodinek Pebble s již open source PebbleOS. V březnu spustil předprodej hodinek Pebble Time 2 (tenkrát ještě pod názvem Core Time 2) za 225 dolarů s dodáním v prosinci. Včera představil jejich konečný vzhled (YouTube).

    Ladislav Hagara | Komentářů: 28
    14.8. 12:44 | Zajímavý software

    Byla oznámena nativní podpora protokolu ACME (Automated Certificate Management Environment) ve webovém serveru a reverzní proxy NGINX. Modul nginx-acme je zatím v preview verzi.

    Ladislav Hagara | Komentářů: 1
    14.8. 12:22 | Nová verze

    Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.08. Přehled novinek i s náhledy a videi v oficiálním oznámení.

    Ladislav Hagara | Komentářů: 0
    13.8. 11:55 | IT novinky

    Společnost Perplexity AI působící v oblasti umělé inteligence (AI) podala nevyžádanou nabídku na převzetí webového prohlížeče Chrome internetové firmy Google za 34,5 miliardy dolarů (zhruba 723 miliard Kč). Informovala o tom včera agentura Reuters. Upozornila, že výše nabídky výrazně převyšuje hodnotu firmy Perplexity. Společnost Google se podle ní k nabídce zatím nevyjádřila.

    Ladislav Hagara | Komentářů: 5
    13.8. 04:33 | Bezpečnostní upozornění

    Intel vydal 34 upozornění na bezpečnostní chyby ve svých produktech. Současně vydal verzi 20250812 mikrokódů pro své procesory řešící 6 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (52%)
     (19%)
     (4%)
     (5%)
     (2%)
     (1%)
     (1%)
     (17%)
    Celkem 406 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Dotaz: regexp na chybne atributy

    22.6.2006 10:44 tyctor | skóre: 13
    regexp na chybne atributy
    Přečteno: 85×
    ahojte
    nejako ma nenapada ako napisat regexp, ktory matchne chybny html atribut ak title obsahuje vnutri uvodzovky:
    napr.: <a title="nejaky titulok" chybna cast" >
    regexp pre python, ktora matchne aj spravny:
    (?P<badtag>\<a+\s+title=\".*?\"[^<>]*?\>)" takze mu potrebujem este povedat aby .*? obsahovala minimalne 1 uvodzovky navyse.
    pomoze niekto? ;o)

    Odpovědi

    22.6.2006 12:36 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: regexp na chybne atributy
    [^"]*("[^"]*)+
    22.6.2006 15:20 tyctor | skóre: 13
    Rozbalit Rozbalit vše Re: regexp na chybne atributy
    diky to je ono
    este som to trochu upravil. cele to mam takto:
    (?P<badtag>\<a\s+title=\"[^\"]+?\"(?P<badpart>[^\"<>]*(?:\"[^\"<>]*)+?)\>)
    22.6.2006 12:44 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: regexp na chybne atributy
    Asi bych to dělal takhle:
    #!/usr/bin/env python
    import elementtree.ElementTree
    
    def get_title(stream):
        print stream
        stream += '</a>'
        tree = elementtree.ElementTree.fromstring(stream)
        return tree.get('title')
    
    try:
        print get_title('<a title="nejaky titulok" >')
        print get_title('<a title="nejaky titulok chybna" cast" >>')
    except:
        print 'Je tam nejaka chyba'
    
    Funkce get_title() vrací titulek a když se to nepovede, tak vyhodí výjimku.
    22.6.2006 13:09 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: regexp na chybne atributy
    #!/usr/bin/perl
    
    ($/, $\) = ('>', "\n");
    
    while (<>) {
      print $ARGV unless m/\A[^<]*<(?:\w+(?:\s+\w+="[^"]*")*)|(?:\/\w+)>/;
    }
    
    
    pouzitie:
    perl script.pl *.html
    
    vypise nazvy suborov s chybnymi elementami ten regex nie je 100%tny, pre html myslim postacuje

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.