abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

    dnes 12:55 | Komunita

    Před 25 lety byl uvolněn zdrojový kód balíku aplikací Netscape Communicator jako open source (např. dobová zpráva CNET), z čehož vzešel projekt Mozilla – ten si výročí nyní připomíná.

    Fluttershy, yay! | Komentářů: 1
    včera 17:11 | Zajímavý software

    Na GOG.com běží Spring Sale. Při té příležitosti lze získat zdarma počítačovou hru Deep Sky Derelicts.

    Ladislav Hagara | Komentářů: 5
    včera 14:22 | Nová verze

    Sound Open Firmware, projekt Linux Foundation, open source audio DSP firmware a SDK, byl vydán ve verzi 2.5.0. Přináší podporu platformy Mediatek mt8188 nebo nový audio modul ARIA (Automatic Regressive Input Amplifier Module).

    Ladislav Hagara | Komentářů: 1
    včera 12:33 | Nová verze

    Byla vydána nová verze 5.8 programovacího jazyka Swift (Wikipedie). Zdrojové kódy jsou k dispozici na GitHubu. Ke stažení budou oficiální binární balíčky pro Ubuntu 18.04, Ubuntu 20.04, Ubuntu 22.04, CentOS 7, Amazon Linux 2 a Red Hat Universal Base Image 9.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Nová verze

    Byla vydána nová verze 1.77 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a animovanými gify v poznámkách k vydání. Ve verzi 1.77 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 5
    včera 12:11 | Nová verze

    Byla vydána beta verze Ubuntu 23.04 s kódovým názvem Lunar Lobster. Přehled novinek v poznámkách k vydání. Dle plánu by Ubuntu 23.04 mělo vyjít 20. dubna 2023.

    Ladislav Hagara | Komentářů: 0
    30.3. 17:44 | Nová verze

    Linuxová distribuce OpenMandriva byla vydána ve verzi ROME 23.03. Název ROME říká, že se jedná se o průběžně aktualizovanou (rolling) edici. Stabilní edice nese název Rock, aktuálně OpenMandriva Lx 4.3 Dysprosium.

    Ladislav Hagara | Komentářů: 4
    30.3. 17:33 | Pozvánky

    Tento pátek od 14:00 proběhne v Brně na FI MUNI konference DevConf Mini. Na programu je celá řada zajímavých přednášek od testování releasů Fedory, přes super počítače nebo Big Data, až po závody autonomních aut. Konferenci bude možné sledovat i na online streamu.

    joejoe | Komentářů: 0
    30.3. 15:00 | Zajímavý článek

    Minulý týden proběhla hackerská soutěž Pwn2Own Vancouver 2023. Adobe Reader, Microsoft SharePoint, Oracle VirtualBox, Tesla, Ubuntu Desktop, Windows 11, macOS, Microsoft Teams, VMWare Workstation. Vše hacknuto. Synacktiv získal 530 000 dolarů a Teslu Model 3.

    Ladislav Hagara | Komentářů: 17
    30.3. 07:00 | Nová verze

    Byla vydána nová stabilní verze 3.5 svobodného 3D softwaru Blender. Přehled novinek i s náhledy v oznámení o vydání a na YouTube.

    Ladislav Hagara | Komentářů: 0
    Chodí vám kočka nebo jiné domácí zvíře po klávesnici?
     (58%)
     (8%)
     (8%)
     (8%)
     (17%)
    Celkem 12 hlasů
     Komentářů: 0
    Rozcestník


    Dotaz: Regexp na vymazání středníků mimo entit typu & amp ;

    20.7.2010 17:51 outlier | skóre: 14
    Regexp na vymazání středníků mimo entit typu & amp ;
    Přečteno: 290×
    Ahoj, nenapadá někoho, jak (pro python) napsat regulární výraz, který z řetězce (např. "&_amp_; one ; two; &_nbsp_;" - podtržítka jsou přidaná pro zobrazení v html) vymaže všechny středníky, které nejsou z html entit typu &something; ? Tj. z daného řetězce by vrátil "&_amp_; one two  ". Vím, že se to udělat jinak než přes jeden regexp, ale přeci jen je to výzva. Přes lookbehind konstrukci to asi nejde, zkoušel jsem nějak přes skupiny, ale k pozitivnímu výsledku jsem se zatím nedobral...

    "\&\; one ; two;  " 
    --> "\&\; one  two \ \;"

    Řešení dotazu:


    Odpovědi

    20.7.2010 19:12 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Entitu &something; můžete zapstat jako &something; První část (&) se převede na ampersand a společně s druhou částí dotvoří požadovaný text.
    "& one ; two;  " 
    --> "& one  two  "
    20.7.2010 20:51 Filip Jirsák | skóre: 68 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Proč by to přes lookbehind nemělo jít? Zkusil jsem to v Groovy (Javovskou třídu pro regexp znám, Pythonovskou bych musel hledat), ale v Javě se používají Perl-like regulární výrazy stejně jako v Pythonu, takže tenhle výraz by měl fungovat:
    java.util.regex.Pattern.compile("(?<!&amp|&nbsp);").matcher("&amp; one ; two; &nbsp;").replaceAll("");
    
    20.7.2010 23:30 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    V Pythonu musí být v tom lookbehind výrazu řetězec fixované délky, tedy žádné + ani *, dokonce neprojde ani &amp|&nbsp, protože obě varianty nemají stejnou délku.
    wamba avatar 20.7.2010 23:37 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

     ten rgulární výraz by mohl vypadat např:

    /(&[^&;]*;|[^&;]*)/g

     Test v perlu:

    echo "&amp; one; two; &nbsp; " |perl -ne 'print m/(&[^&;]*;|[^&;]*)/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    wamba avatar 20.7.2010 23:58 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

    popř:

    echo "&amp; one; two; &nbsp; " |perl -pe 's/(&[^&;]*;|[^&;]*);?/$1/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    21.7.2010 10:40 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Díky, funguje i v Pythonu:

    line=re.sub(r'(&[^&;]*;|[^&;]*);?',r'\g<1>',line)

    Dobrá práce, na to bych sám nepřišel.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.