abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 22:33 | Bezpečnostní upozornění

    npm balíčky @redhat-cloud-services byly kompromitovány.

    Ladislav Hagara | Komentářů: 1
    včera 22:22 | Bezpečnostní upozornění

    Byly publikovány informace o zranitelnosti CVE-2026-46243 pojmenované CIFSwitch v Linuxu od roku 2007. Běžný uživatel může získat práva roota (lokální eskalaci práv). V upstreamu je již opraveno.

    Ladislav Hagara | Komentářů: 0
    včera 19:22 | IT novinky

    Nvidia na své konferenci NVIDIA GTC Taipei 2026 představila řadu novinek. Společně s Microsoftem představili superčip NVIDIA RTX Spark (až 6 144 jader GPU, 20 jader CPU, 1 petaflop AI výkonu v FP4 a 128 GB jednotné paměti). První notebooky a stolní počítače s tímto čipem od Nvidie místo Intelu nebo AMD by se měly na trh dostat na podzim letošního roku.

    Ladislav Hagara | Komentářů: 3
    včera 13:22 | IT novinky

    Na Kickstarteru běží kampaň na podporu kapesního počítače s Linuxem CardputerZero od společnosti M5Stack. Postaven je na Raspberry Pi Compute Module 0. Podporuje moduly M5. Koupit lze s rozšířeními LoRa a CC1101.

    Ladislav Hagara | Komentářů: 0
    včera 11:11 | Pozvánky

    Tento týden se bude vyznačovat zejména deštěm, a proto vás může zajímat, že již v úterý proběhne 63. Virtuální Bastlírna, která se bude odehrávat přímo v teple vašich domovů a bastlíren. Proto se připojte k této volné otevřené diskuzi bastlířů, techniků, vědců, ve které se probírají novinky a zajímavá témata z techniky. Mezi největší novinky bude tentokrát patrně patřit oznámení hackerského nástroje Flipper One. Zároveň úspěšně probíhá

    … více »
    bkralik | Komentářů: 0
    včera 03:22 | Nová verze

    86Box (Wikipedie), tj. emulátor retro počítačů založených na x86, byl vydán ve verzi 6.0. Přibyly například zvuky pevného disku. Na GitHubu jsou vedle zdrojových kódů ke stažení také připravené balíčky ve formátu AppImage.

    Ladislav Hagara | Komentářů: 0
    včera 03:00 | Nová verze

    Byla vydána nová verze 4.6 audio přehrávače Audacious (Wikipedie). Z novinek lze vypíchnout nový plugin pro procházení soubory, podporu audio formátu Musepack SV8 nebo přechod na build systém Meson.

    Ladislav Hagara | Komentářů: 0
    31.5. 15:55 | Nová verze

    Alliance for Open Media vydala verzi 1.0.0 specifikace svobodného videoformátu AV2. Jean-Baptiste Kempf, prezident neziskové organizace VideoLAN stojící za svobodným multiplatformním multimediálním přehrávačem a frameworkem VLC, představil na svém blogu dekodér AV2 s názvem dav2d.

    Ladislav Hagara | Komentářů: 0
    31.5. 15:00 | Nová verze

    V aktuálním přehledu vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) bylo oznámeno vydání nové verze 0.2.0.

    Ladislav Hagara | Komentářů: 0
    31.5. 14:33 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 26.5.1. Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (14%)
     (31%)
     (4%)
     (6%)
     (3%)
     (16%)
     (26%)
    Celkem 1796 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: Regexp na vymazání středníků mimo entit typu & amp ;

    20.7.2010 17:51 outlier | skóre: 14
    Regexp na vymazání středníků mimo entit typu & amp ;
    Přečteno: 381×
    Ahoj, nenapadá někoho, jak (pro python) napsat regulární výraz, který z řetězce (např. "&_amp_; one ; two; &_nbsp_;" - podtržítka jsou přidaná pro zobrazení v html) vymaže všechny středníky, které nejsou z html entit typu &something; ? Tj. z daného řetězce by vrátil "&_amp_; one two  ". Vím, že se to udělat jinak než přes jeden regexp, ale přeci jen je to výzva. Přes lookbehind konstrukci to asi nejde, zkoušel jsem nějak přes skupiny, ale k pozitivnímu výsledku jsem se zatím nedobral...

    "\&\; one ; two;  " 
    --> "\&\; one  two \ \;"

    Řešení dotazu:


    Odpovědi

    20.7.2010 19:12 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Entitu &something; můžete zapstat jako &something; První část (&) se převede na ampersand a společně s druhou částí dotvoří požadovaný text.
    "& one ; two;  " 
    --> "& one  two  "
    20.7.2010 20:51 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Proč by to přes lookbehind nemělo jít? Zkusil jsem to v Groovy (Javovskou třídu pro regexp znám, Pythonovskou bych musel hledat), ale v Javě se používají Perl-like regulární výrazy stejně jako v Pythonu, takže tenhle výraz by měl fungovat:
    java.util.regex.Pattern.compile("(?<!&amp|&nbsp);").matcher("&amp; one ; two; &nbsp;").replaceAll("");
    
    20.7.2010 23:30 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    V Pythonu musí být v tom lookbehind výrazu řetězec fixované délky, tedy žádné + ani *, dokonce neprojde ani &amp|&nbsp, protože obě varianty nemají stejnou délku.
    wamba avatar 20.7.2010 23:37 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

     ten rgulární výraz by mohl vypadat např:

    /(&[^&;]*;|[^&;]*)/g

     Test v perlu:

    echo "&amp; one; two; &nbsp; " |perl -ne 'print m/(&[^&;]*;|[^&;]*)/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    wamba avatar 20.7.2010 23:58 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;

    popř:

    echo "&amp; one; two; &nbsp; " |perl -pe 's/(&[^&;]*;|[^&;]*);?/$1/g'
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    21.7.2010 10:40 outlier | skóre: 14
    Rozbalit Rozbalit vše Re: Regexp na vymazání středníků mimo entit typu & amp ;
    Díky, funguje i v Pythonu:

    line=re.sub(r'(&[^&;]*;|[^&;]*);?',r'\g<1>',line)

    Dobrá práce, na to bych sám nepřišel.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.