abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 01:00 | Komunita

    Debian dnes slaví 32 let. Ian Murdock oznámil vydání "Debian Linux Release" 16. srpna 1993.

    Ladislav Hagara | Komentářů: 5
    včera 17:44 | IT novinky

    Policisté zadrželi odsouzeného drogového dealera Tomáše Jiřikovského, který daroval ministerstvu spravedlnosti za tehdejšího ministra Pavla Blažka (ODS) bitcoiny v miliardové hodnotě, a zajistili i darovanou kryproměnu. Zadržení Jiřikovského může být podle ministerstva důležité k rozuzlení kauzy, která vypukla koncem května a vedla ke konci Blažka. Zajištění daru podle úřadu potvrzuje závěry dříve publikovaných právních

    … více »
    Ladislav Hagara | Komentářů: 5
    včera 13:44 | IT novinky

    Administrativa amerického prezidenta Donalda Trumpa jedná o možném převzetí podílu ve výrobci čipů Intel. Agentuře Bloomberg to řekly zdroje obeznámené se situací. Akcie Intelu v reakci na tuto zprávu výrazně posílily. Trump minulý týden označil Tana za konfliktní osobu, a to kvůli jeho vazbám na čínské společnosti, čímž vyvolal nejistotu ohledně dlouholetého úsilí Intelu o obrat v hospodaření. Po pondělní schůzce však prezident o šéfovi Intelu hovořil příznivě.

    Ladislav Hagara | Komentářů: 3
    včera 05:44 | IT novinky

    Společnost Purism stojící za linuxovými telefony a počítači Librem má nově v nabídce postkvantový šifrátor Librem PQC Encryptor.

    Ladislav Hagara | Komentářů: 10
    14.8. 18:00 | Nová verze

    VirtualBox, tj. multiplatformní virtualizační software, byl vydán v nové verzi 7.2. Přehled novinek v Changelogu. Vypíchnou lze vylepšené GUI.

    Ladislav Hagara | Komentářů: 0
    14.8. 14:11 | IT novinky

    Eric Migicovsky, zakladatel společnosti Pebble, v lednu oznámil, že má v plánu spustit výrobu nových hodinek Pebble s již open source PebbleOS. V březnu spustil předprodej hodinek Pebble Time 2 (tenkrát ještě pod názvem Core Time 2) za 225 dolarů s dodáním v prosinci. Včera představil jejich konečný vzhled (YouTube).

    Ladislav Hagara | Komentářů: 18
    14.8. 12:44 | Zajímavý software

    Byla oznámena nativní podpora protokolu ACME (Automated Certificate Management Environment) ve webovém serveru a reverzní proxy NGINX. Modul nginx-acme je zatím v preview verzi.

    Ladislav Hagara | Komentářů: 1
    14.8. 12:22 | Nová verze

    Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.08. Přehled novinek i s náhledy a videi v oficiálním oznámení.

    Ladislav Hagara | Komentářů: 0
    13.8. 11:55 | IT novinky

    Společnost Perplexity AI působící v oblasti umělé inteligence (AI) podala nevyžádanou nabídku na převzetí webového prohlížeče Chrome internetové firmy Google za 34,5 miliardy dolarů (zhruba 723 miliard Kč). Informovala o tom včera agentura Reuters. Upozornila, že výše nabídky výrazně převyšuje hodnotu firmy Perplexity. Společnost Google se podle ní k nabídce zatím nevyjádřila.

    Ladislav Hagara | Komentářů: 5
    13.8. 04:33 | Bezpečnostní upozornění

    Intel vydal 34 upozornění na bezpečnostní chyby ve svých produktech. Současně vydal verzi 20250812 mikrokódů pro své procesory řešící 6 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (52%)
     (19%)
     (4%)
     (5%)
     (3%)
     (1%)
     (1%)
     (17%)
    Celkem 397 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Dotaz: Perl: problém s češtinou v regexpu

    13.4.2008 22:23 Herry
    Perl: problém s češtinou v regexpu
    Přečteno: 2015×
    Dobrý den,
    mám problém s češtinou v regulárních výrazech,
    /\w/ "nesežere" některé znaky s diakritikou v kódování UTF8.

    Příklad:

    #!/usr/bin/perl -w
    
    use utf8;
    use locale;
    use encoding 'utf-8';
    
    binmode STDOUT, ":utf8";
    binmode STDERR, ":utf8";
    
    print "ě>$1<\n" if "ě" =~ /(\w)/;
    print "š>$1<\n" if "š" =~ /(\w)/;
    print "č>$1<\n" if "č" =~ /(\w)/;
    print "ř>$1<\n" if "ř" =~ /(\w)/;
    print "ž>$1<\n" if "ž" =~ /(\w)/;
    print "ý>$1<\n" if "ý" =~ /(\w)/;
    print "á>$1<\n" if "á" =~ /(\w)/;
    print "í>$1<\n" if "í" =~ /(\w)/;
    print "é>$1<\n" if "é" =~ /(\w)/;
    

    Výraz /(\w)/ projde jenom pro ě,š,č,ř,ž

    locales mám nastaveno na:

    LANG=cs_CZ.UTF-8
    LC_CTYPE="cs_CZ.UTF-8"
    LC_NUMERIC="cs_CZ.UTF-8"
    LC_TIME="cs_CZ.UTF-8"
    LC_COLLATE="cs_CZ.UTF-8"
    LC_MONETARY="cs_CZ.UTF-8"
    LC_MESSAGES="cs_CZ.UTF-8"
    LC_PAPER="cs_CZ.UTF-8"
    LC_NAME="cs_CZ.UTF-8"
    LC_ADDRESS="cs_CZ.UTF-8"
    LC_TELEPHONE="cs_CZ.UTF-8"
    LC_MEASUREMENT="cs_CZ.UTF-8"
    LC_IDENTIFICATION="cs_CZ.UTF-8"
    LC_ALL=
    

    Někde jsem našel řešení něco jako /(\p{L})/, ale nikde jsem se nedočetl co to přesně znamená a proč to původní řešení nefunguje přestože je to uvedeno v mnoha návodech.

    Díky za odpovědi

    Odpovědi

    13.4.2008 23:06 Hery
    Rozbalit Rozbalit vše Dodatek

    /(\p{L})/ nespolkne číslice, potřeboval bych něco na alfanumerický znaky.

    osladil avatar 14.4.2008 08:49 osladil | skóre: 12
    Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu
    Ahoj, v jenom skriptu pouzivam neco podobneho. Zkousel jsem to ted na tomhle:
    #!/usr/bin/perl
    
    use strict;
    use warnings;
    use utf8;
    
    binmode STDIN, ":utf8";
    binmode STDOUT, ":utf8";
    
    my $string = "Čeština je ČESKÁ";
    $string =~ /(\w+)/;
    my ($result) = ($1);
    
    print "Hledam v $string\n";
    print "Nalezeno $result\n";
    
    print "Čeština je cool!\n" if $result eq "Čeština";
    
    Moje locales:
    mira@batman:~$ env|grep LANG
    LANG=en_US.UTF-8
    
    zoul avatar 14.4.2008 09:19 zoul | skóre: 43 | blog: | Boskovice
    Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu
    Mně to funguje:
    perl -e "use locale; print 'Yep' if ('ý' =~ /\w/)"
    Yep
    OS X 10.5.2, Perl 5.8.8, locale en_US.UTF-8. Možná zkus nastavit ještě LC_ALL?
    20.9.2008 17:22 harry
    Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu
    RESENI

    doinstaloval jsem nejaky baliky, uz nevim ktery presne zabral:

    language-pack-cs
    language-gnome-cs
    language-support-cs
    language-translate-cs

    reinstaloval jsem locale

    sudo apt-get install --reinstall locales

    a potom to zaclo fungovat:

    LC_ALL=en_US.UTF-8 perl -C -Mutf8 -e '$_="aábcčdďeěéfghiíjklmnňoópqrřsštťuúůvwxyýzž"; s/\W/-/g; print $_, "\n"'

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.