abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 01:22 | Nová verze

    Byla vydána nová verze 1.12.0 dynamického programovacího jazyka Julia (Wikipedie) určeného zejména pro vědecké výpočty. Přehled novinek v příspěvku na blogu a v poznámkách k vydání. Aktualizována byla také dokumentace.

    Ladislav Hagara | Komentářů: 0
    včera 15:11 | Bezpečnostní upozornění

    V Redisu byla nalezena a v upstreamu již opravena kritická zranitelnost CVE-2025-49844 s CVSS 10.0 (RCE, vzdálené spouštění kódu).

    Ladislav Hagara | Komentářů: 3
    včera 14:00 | IT novinky

    Ministr a vicepremiér pro digitalizaci Marian Jurečka dnes oznámil, že přijme rezignaci ředitele Digitální a informační agentury Martina Mesršmída, a to k 23. říjnu 2025. Mesršmíd nabídl svou funkci během minulého víkendu, kdy se DIA potýkala s problémy eDokladů, které některým občanům znepříjemnily využití možnosti prokázat se digitální občankou u volebních komisí při volbách do Poslanecké sněmovny.

    Ladislav Hagara | Komentářů: 11
    včera 12:33 | Zajímavý software

    Společnost Meta představila OpenZL. Jedná se o open source framework pro kompresi dat s ohledem na jejich formát. Zdrojové kódy jsou k dispozici na GitHubu.

    Ladislav Hagara | Komentářů: 0
    včera 03:33 | IT novinky

    Google postupně zpřístupňuje českým uživatelům Režim AI (AI Mode), tj. nový režim vyhledávání založený na umělé inteligenci. Režim AI nabízí pokročilé uvažování, multimodalitu a možnost prozkoumat jakékoliv téma do hloubky pomocí dodatečných dotazů a užitečných odkazů na weby.

    Ladislav Hagara | Komentářů: 0
    7.10. 18:11 | Nová verze

    Programovací jazyk Python byl vydán v nové major verzi 3.14.0. Podrobný přehled novinek v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 2
    7.10. 16:33 | IT novinky

    Bylo oznámeno, že Qualcomm kupuje Arduino. Současně byla představena nová deska Arduino UNO Q se dvěma čipy: MPU Qualcomm Dragonwing QRB2210, na kterém může běžet Linux, a MCU STM32U585 a vývojové prostředí Arduino App Lab.

    Ladislav Hagara | Komentářů: 3
    7.10. 15:55 | Nová verze

    Multiplatformní open source voxelový herní engine Luanti byl vydán ve verzi 5.14.0. Podrobný přehled novinek v changelogu. Původně se jedná o Minecraftem inspirovaný Minetest v říjnu loňského roku přejmenovaný na Luanti.

    Ladislav Hagara | Komentářů: 0
    7.10. 13:22 | Nová verze

    Byla vydána nová stabilní verze 6.10 (YouTube) multiplatformního frameworku a GUI toolkitu Qt. Podrobný přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    6.10. 23:55 | Komunita

    Ubuntu 26.04 LTS bude (𝕏) Resolute Raccoon (rezolutní mýval).

    Ladislav Hagara | Komentářů: 5
    Jaké řešení používáte k vývoji / práci?
     (38%)
     (46%)
     (15%)
     (17%)
     (21%)
     (15%)
     (17%)
     (15%)
     (15%)
    Celkem 198 hlasů
     Komentářů: 13, poslední včera 07:41
    Rozcestník

    Dotaz: Regexp na vymazání středníků mimo entit typu & amp ;

    20.7.2010 17:51 outlier | skóre: 14
    Regexp na vymazání středníků mimo entit typu & amp ;
    Přečteno: 344×
    Ahoj, nenapadá někoho, jak (pro python) napsat regulární výraz, který z řetězce (např. "&_amp_; one ; two; &_nbsp_;" - podtržítka jsou přidaná pro zobrazení v html) vymaže všechny středníky, které nejsou z html entit typu &something; ? Tj. z daného řetězce by vrátil "&_amp_; one two  ". Vím, že se to udělat jinak než přes jeden regexp, ale přeci jen je to výzva. Přes lookbehind konstrukci to asi nejde, zkoušel jsem nějak přes skupiny, ale k pozitivnímu výsledku jsem se zatím nedobral...

    "\&\; one ; two;  " 
    --> "\&\; one  two \ \;"

    Řešení dotazu:


    Odpovědi

    20.7.2010 19:12 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Entitu &something; můžete zapstat jako &something; První část (&) se převede na ampersand a společně s druhou částí dotvoří požadovaný text.
    "& one ; two;  " 
    --> "& one  two  "
    20.7.2010 20:51 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Proč by to přes lookbehind nemělo jít? Zkusil jsem to v Groovy (Javovskou třídu pro regexp znám, Pythonovskou bych musel hledat), ale v Javě se používají Perl-like regulární výrazy stejně jako v Pythonu, takže tenhle výraz by měl fungovat:
    java.util.regex.Pattern.compile("(?<!&amp|&nbsp);").matcher("&amp; one ; two; &nbsp;").replaceAll("");
    
    20.7.2010 23:30 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    V Pythonu musí být v tom lookbehind výrazu řetězec fixované délky, tedy žádné + ani *, dokonce neprojde ani &amp|&nbsp, protože obě varianty nemají stejnou délku.
    wamba avatar 20.7.2010 23:37 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

     ten rgulární výraz by mohl vypadat např:

    /(&[^&;]*;|[^&;]*)/g

     Test v perlu:

    echo "&amp; one; two; &nbsp; " |perl -ne 'print m/(&[^&;]*;|[^&;]*)/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    wamba avatar 20.7.2010 23:58 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

    popř:

    echo "&amp; one; two; &nbsp; " |perl -pe 's/(&[^&;]*;|[^&;]*);?/$1/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    21.7.2010 10:40 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Díky, funguje i v Pythonu:

    line=re.sub(r'(&[^&;]*;|[^&;]*);?',r'\g<1>',line)

    Dobrá práce, na to bych sám nepřišel.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.