abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

dnes 18:55 | Komunita

NHSbuntu (Joinup, prezentace) měla být z Ubuntu vycházející linuxová distribuce přizpůsobená pro potřeby britské Národní zdravotní služby (NHS). NHS se název nelíbil, nejednalo se o oficiální projekt NHS, a proto bylo NHSbuntu v září loňského roku přejmenováno na NHoS. Vývojáři NHoS tento týden oznámili, že NHS se nelíbí ani název NHoS a už nemají sílu na další přejmenování a pokračování v projektu. Dodávají, že několik jednání s vedením

… více »
Ladislav Hagara | Komentářů: 1
dnes 18:44 | Pozvánky

Koncem ledna, 29. 1. 2018 od 17 do 20 hodin se v Akademii CZ.NIC uskuteční večer s Turrisem.

Co bude na programu?… více »
Miška | Komentářů: 0
dnes 18:33 | Pozvánky

Na tri dni sa hlavné mesto Slovenska po tretíkrát zmení na miesto s najväčšou koncentráciou profesionálnych programátorov, systémových administrátorov, učiteľov informatiky aj technologických nadšencov. Hlavným lákadlom bude konferencia PyCon SK 2018, určená záujemcom o Python, jeden z najpopulárnejších programovacích jazykov na svete.

… více »
RicCo386 | Komentářů: 0
dnes 18:22 | Pozvánky

Letošní ročník konference Prague PostgreSQL Developer Day se koná ve dnech 14. 2. a 15. 2. 2018. Zveřejněn byl program s přednáškami a školeními. Otevřena byla také registrace na konferenci.

TomasVondra | Komentářů: 0
dnes 11:33 | Komunita

Společnost Canonical stojící za linuxovou distribucí Ubuntu oznámila dostupnost nástroje pro týmovou spolupráci Slack (Wikipedie) ve formátu snap. Instalovat jej lze ze Snapcraftu. Slack pro Linux je dostupný také ve formátu klasických balíčků pro Ubuntu a Fedoru.

Ladislav Hagara | Komentářů: 9
včera 17:33 | Nová verze

Po roce vývoje od vydání verze 2.0 a 6 000 změnách byla vydána nová stabilní verze 3.0 softwaru, který vytváří aplikační rozhraní umožňující chod aplikací pro Microsoft Windows také pod GNU/Linuxem, Wine (Wikipedie). Z novinek lze zdůraznit například podporu Direct3D 10 a 11. Podrobnosti v poznámkách k vydání.

Ladislav Hagara | Komentářů: 14
včera 13:44 | Zajímavý projekt

V říjnu loňského roku úspěšně skončila kampaň na podporu chytrého telefonu Librem 5, jenž by měl respektovat bezpečnost, svobodu a soukromí uživatelů. Společnost Purism informuje o aktuálním vývoji tohoto telefonu. Místo plánovaného SoC i.MX6 by měl být použit úspornější i.MX8.

Ladislav Hagara | Komentářů: 3
včera 12:33 | Zajímavý projekt

V květnu loňského roku měl na YouTube premiéru krátký animovaný film Agent 327: Operation Barbershop. Blender Animation Studio včera zveřejnilo alternativní konec tohoto filmu.

Ladislav Hagara | Komentářů: 0
včera 05:55 | Bezpečnostní upozornění

Společnost Oracle vydala čtvrtletní bezpečnostní aktualizaci svých softwarových produktů (CPU, Critical Patch Update). Opraveno bylo celkově 237 bezpečnostních chyb. V Oracle Java SE je například opraveno 21 bezpečnostních chyb. Vzdáleně zneužitelných bez autentizace je 18 z nich. V Oracle MySQL je opraveno 25 bezpečnostních chyb. Vzdáleně zneužitelných bez autentizace je 6 z nich.

Ladislav Hagara | Komentářů: 0
17.1. 20:55 | Komunita

Linux ve VirtualBoxu nebude potřebovat Přídavky pro hosta (Guest Additions). Budou součástí linuxového jádra. Ovladač vboxguest by se měl dostat do Linuxu 4.16. Ovladač vboxsf by měl následovat.

Ladislav Hagara | Komentářů: 26
Jak se vás potenciálně dotkne trend odstraňování analogového audio konektoru typu 3,5mm jack z „chytrých telefonů“?
 (7%)
 (1%)
 (1%)
 (1%)
 (77%)
 (13%)
Celkem 1337 hlasů
 Komentářů: 53, poslední 17.1. 16:55
    Rozcestník

    Dotaz: PHP: Regulární výraz a diakritika v UTF-8

    9.6.2009 15:44 N0rT0n | skóre: 9 | blog: Lama | Brno
    PHP: Regulární výraz a diakritika v UTF-8
    Přečteno: 4127×

    Zdravím,

    řešil už někdo prapodivné chování PHP funkce mb_ereg() ?

    regulární výraz

    mb_ereg("^[a-zA-Z]*$","příšera")

    se vyhodnotí negativně, zatímco regulární výraz

    mb_ereg("^[a-zA-Z]*","příšera")

    se vyhodnotí pozitivně (odstraněn znak pro konec řetězce).

    Výraz:

    mb_ereg("^[a-zA-Z]*$","prisera")

    se vyhodnoti pozitivně.

     

    Narazil jsem na tento problém při sestavování podstatně složitějšího výrazu, který u slov bez diakritiky fungoval naprosto bez problému. Problém je v tom, že ve výrazu nutně potřebuji omezit chování konec řetězce. Všechny patterny obsahující znak $ (pro konec řetězce) se vyhodnocují automaticky negativně.

    Vstupem i výstupem je kódování UTF-8. mb_internal_encoding() hlasi UTF-8, mb_regex_encoding() taktéž. Tím, že řetězce na vstupu jsou v UTF-8, jsem si naprosto jist. Verze PHP je 5.2.6.

     

    Má někdo nějaký nápad, či případně toto nějak řešil?

    Odpovědi

    9.6.2009 16:01 Blondak
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8

    mb_ereg("^[a-zA-Z]*","příšera")
    se vyhodnocuje správně pozitivně, protože souhlasí "p" na začátku, pokud budeš dělat
    mb_ereg("^[a-zA-Z]*","činka")
    tak to už vyhodnotí negativně, možná bych zkusil
    preg_match("/^[\S]*$/u","příšera")
    , ale nevím co přesně máš na vstupech.

    9.6.2009 17:41 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8
    se nevyhodnocuje správně pozitivně proto, že souhlasí "p" na začátku, ale proto, že výrazu ^[a-zA-Z]* vyhovuje jakýkoliv řetězec, který má začátek (to má každý) a pak náseduje 0 až N výskytů a-zA-Z. Takže by vyhovovala i šíšera.
    10.6.2009 04:01 zha
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8
    Takže by vyhovovala i šíšera.

    Měla by, ale proč neprojde ta činka?
    10.6.2009 07:39 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8
    činka projde
    10.6.2009 10:56 Blondak
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8

    jj, pravda nějak jsem si spletl * a +

    Tarmaq avatar 9.6.2009 16:31 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8
    je to jak kolega pise v tom, ze v prvnim pripade se ten regular vyhodnoti jen na p
    nevim jestli je to uplne koser reseni, ale slo by to asi udelat nejak takto:
    setlocale(LC_CTYPE, 'cs_CZ.utf8');
    $foo = iconv('utf-8', 'ascii//TRANSLIT', "příšera");
    
    # mb_ereg se vyhodnoti pozitivne
    mb_ereg("^[a-zA-Z]*$", $foo);
    
    # jinak lze pouzit i tento tvar
    mb_ereg("^[[:alpha:]]*$", $foo);
    
    Don't panic!
    9.6.2009 17:24 Sinuhet | skóre: 31
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8
    preg_match("/^\p{L}*$/", "příšera");
    9.6.2009 17:40 N0rT0n | skóre: 9 | blog: Lama | Brno
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8

    Díky za reakce,

    ten nápad s iconv mě taky napadl. Leč jsem si stále myslel, že mě napadne něco elegantního. V tom skriptu se jedná o ošetření vkládání klíčových slov. Pravidla jsou taková, že mohou začínat libovolným písmenem, mohou obsahovat číslici, od sebe jsou odděleny čárkou (či případně čárkou a mezerou) a musí končit slovem. Žádné jiné znaky nejsou povoleny, takže nelze použít třídu [[:alpha:]]. Vše až na to ošetření konce slova jsem už zvládl.

    Správně by se měl vyhodnotit tento řetězec (i s vloženou frází "sportovní náčiní"):

    činka, sportovní náčiní, číslo21, google
    

    chybně by se měl vyhodnotit řetězec obsahující například:

    činka, sportovní náčiní, 21. století, google,

    (slovo nesmí začínat číslicí, tečka není přípustná a řetězec nesmí končit žádným jiným znakem, než [a-zA-Z0-9]). Něco jako

    ^[a-zA-Z0-9]*(,| )*[a-zA-Z0-9]*$
    
    9.6.2009 19:16 N0rT0n | skóre: 9 | blog: Lama | Brno
    Rozbalit Rozbalit vše Re: PHP: Regulární výraz a diakritika v UTF-8

    Moc elegantní to není, ale snad by to mohlo pomoci někomu, kdo podobný problém řeší:

    $foo = iconv('utf-8', 'ASCII//IGNORE', $text);
    if(ereg('^([a-zA-Z]{1,}[0-9]*(,| ){0,1})*[a-zA-Z]{1,}[0-9]*$',$foo)) {

      $result=1;

    } else { $result=0; }

    /*

    1) do proměnné $foo se překóduje text z proměnné $text, která je kódována v UTF-8, proměnná $foo je nyní reprezentována v kódování ASCII s tím, že znaky, které nemohly být zkonvertovány do ASCII "tiše" zmizí (zajišťuje příznak //IGNORE)

    2) klíčová slova musí začínat písmenem a případně končit číslicí, mezi slovy je přípustná čárka (oddělovač klíčových slov) nebo mezera (oddělovač slov v slovní frázi). Celý regulární výraz musí končit slovem (případně slovem s číslicí na konci).

    */

     Vypadá to, že to funguje, že jsem neudělal chybu (po 11 hodinách v práci by mě to ani nepřekvapilo).

     

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.