abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

včera 20:55 | Komunita

Od 18. do 21. května proběhla v Saint-Étienne Linux Audio Conference 2017. Na programu byla řada zajímavých přednášek a seminářů. Videozáznamy přednášek lze zhlédnout na YouTube. K dispozici jsou také články a prezentace.

Ladislav Hagara | Komentářů: 0
včera 20:44 | IT novinky

Hodnota Bitcoinu, decentralizované kryptoměny, překonala hranici 2 200 dolarů. Za posledních 30 dnů tak vzrostla přibližně o 80 % [reddit].

Ladislav Hagara | Komentářů: 0
včera 17:33 | Nová verze

Po 5 měsících vývoje od vydání verze 0.12.0 byla vydána verze 0.13.0 správce balíčků GNU Guix a na něm postavené systémové distribuce GuixSD (Guix System Distribution). Na vývoji se podílelo 83 vývojářů. Přibylo 840 nových balíčků. Jejich aktuální počet je 5 454. Aktualizována byla také dokumentace.

Ladislav Hagara | Komentářů: 1
včera 17:22 | Nová verze

Po 5 měsících vývoje a 3 týdnech intenzivního testování byla vydána verze 12 open source systému Nextcloud, forku ownCloudu, umožňujícího provoz vlastního cloudového úložiště. Přehled novinek i s videoukázkami v poznámkách k vydání. Pro vyzkoušení je k dispozici demo.

Ladislav Hagara | Komentářů: 2
včera 11:44 | Zajímavý článek

Týden po prvním číslu publikoval Michal Špaček na svých stránkách druhé číslo newsletteru věnovanému bezpečnosti, bezpečnému vývoji převážně webových aplikací a bezpečnosti uživatelů. Věnuje se výpadku Let's Encrypt, únikům dat, bug bounty pro WordPress nebo SQL Injection v Joomla. Zmiňuje také, že Mozilla plánuje z Firefoxu odstranit podporu pro Encrypted Media Extensions (EME) na nešifrovaném HTTP a nadále pro EME vyžadovat HTTPS.

Ladislav Hagara | Komentářů: 0
včera 02:00 | Pozvánky

Ve středu 31. května 2017 od 17:00 proběhne v pražské pobočce SUSE Den otevřených dveří v SUSE. Čekají vás přednášky o live kernel patchingu a nástroji SaltStack. Také se dozvíte zajímavé informace o SUSE, openSUSE, a vlastně všech produktech, na kterých lidé ze SUSE pracují.

Ladislav Hagara | Komentářů: 4
včera 01:00 | Pozvánky

Czech JBoss User Group srdečně zve na setkání JBUG v Brně, které se koná ve středu 7. června 2017 v prostorách Fakulty informatiky Masarykovy univerzity v místnosti A318 od 18:00. Přednáší Tomáš Livora na téma Fault Tolerance with Hystrix. Více informací na Facebooku a Twitteru #jbugcz.

mjedlick | Komentářů: 0
19.5. 23:22 | Zajímavý projekt

Na Texture Ninja je volně k dispozici více než 4 tisíce textur. Autora lze podpořit na Patreonu.

Ladislav Hagara | Komentářů: 0
19.5. 10:22 | Pozvánky

Mozilla.cz zve na MozBeer Prague #2. Druhé setkání Mozilla.cz proběhne 26. května od 18:00 v Praze v Diversion Bistru v ulici Mělnická.

Ladislav Hagara | Komentářů: 0
18.5. 23:22 | Bezpečnostní upozornění

Průvodce restauracemi Zomato, jenž v roce 2014 koupil Lunchtime.cz, potvrdil bezpečnostní problém. Odcizeno bylo 17 miliónů záznamů o uživatelích (jména, emailové adresy, osolené hashe).

Ladislav Hagara | Komentářů: 8
Chystáte se pořídit CPU AMD Ryzen?
 (6%)
 (32%)
 (1%)
 (8%)
 (44%)
 (9%)
Celkem 588 hlasů
 Komentářů: 62, poslední 19.5. 01:57
    Rozcestník

    Dotaz: Regexp na vymazání středníků mimo entit typu & amp ;

    20.7.2010 17:51 outlier | skóre: 14
    Regexp na vymazání středníků mimo entit typu & amp ;
    Přečteno: 250×
    Ahoj, nenapadá někoho, jak (pro python) napsat regulární výraz, který z řetězce (např. "&_amp_; one ; two; &_nbsp_;" - podtržítka jsou přidaná pro zobrazení v html) vymaže všechny středníky, které nejsou z html entit typu &something; ? Tj. z daného řetězce by vrátil "&_amp_; one two  ". Vím, že se to udělat jinak než přes jeden regexp, ale přeci jen je to výzva. Přes lookbehind konstrukci to asi nejde, zkoušel jsem nějak přes skupiny, ale k pozitivnímu výsledku jsem se zatím nedobral...

    "\&\; one ; two;  " 
    --> "\&\; one  two \ \;"

    Řešení dotazu:


    Odpovědi

    20.7.2010 19:12 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Entitu &something; můžete zapstat jako &something; První část (&) se převede na ampersand a společně s druhou částí dotvoří požadovaný text.
    "& one ; two;  " 
    --> "& one  two  "
    20.7.2010 20:51 Filip Jirsák | skóre: 66 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Proč by to přes lookbehind nemělo jít? Zkusil jsem to v Groovy (Javovskou třídu pro regexp znám, Pythonovskou bych musel hledat), ale v Javě se používají Perl-like regulární výrazy stejně jako v Pythonu, takže tenhle výraz by měl fungovat:
    java.util.regex.Pattern.compile("(?<!&amp|&nbsp);").matcher("&amp; one ; two; &nbsp;").replaceAll("");
    
    20.7.2010 23:30 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    V Pythonu musí být v tom lookbehind výrazu řetězec fixované délky, tedy žádné + ani *, dokonce neprojde ani &amp|&nbsp, protože obě varianty nemají stejnou délku.
    wamba avatar 20.7.2010 23:37 wamba | skóre: 37 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

     ten rgulární výraz by mohl vypadat např:

    /(&[^&;]*;|[^&;]*)/g

     Test v perlu:

    echo "&amp; one; two; &nbsp; " |perl -ne 'print m/(&[^&;]*;|[^&;]*)/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    wamba avatar 20.7.2010 23:58 wamba | skóre: 37 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

    popř:

    echo "&amp; one; two; &nbsp; " |perl -pe 's/(&[^&;]*;|[^&;]*);?/$1/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    21.7.2010 10:40 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Díky, funguje i v Pythonu:

    line=re.sub(r'(&[^&;]*;|[^&;]*);?',r'\g<1>',line)

    Dobrá práce, na to bych sám nepřišel.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.