abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

    dnes 22:33 | Komunita

    Ubuntu Cinnamon bude od Ubuntu 23.04 oficiální odnoží Ubuntu (návrh, schválení).

    Ladislav Hagara | Komentářů: 0
    dnes 19:22 | Nová verze

    Byla vydána nová major verze 5.0 účetního softwaru GnuCash (Wikipedie). Ve formátu Flatpak je již k dispozici na Flathubu.

    Ladislav Hagara | Komentářů: 0
    dnes 18:33 | Nová verze

    Na GOG.com běží Spring Sale. Při té příležitosti lze získat zdarma počítačovou hru Alwa's Awakening (ProtonDB).

    Ladislav Hagara | Komentářů: 0
    dnes 16:55 | Nová verze

    Byla vydána verze 3.28.0 2D CAD (computer-aided design) softwaru QCAD (Wikipedie). Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    dnes 08:00 | IT novinky

    Změna ve vedení společnosti SUSE. Dosavadní CEO Melissa Di Donato odstoupila. Od 1. května je novým CEO Dirk-Peter van Leeuwen, bývalý Senior Vice President a General Manager ve společnosti Red Hat.

    Ladislav Hagara | Komentářů: 8
    včera 22:22 | Nová verze

    CyberChef je webová aplikace pro analýzu dat a jejich kódování a dekódování, šifrování a dešifrování, kompresi a dekompresi, atd. Často je využívaná při kybernetických cvičeních a CTF (Capture the Flag). Vydána byla nová major verze 10 (aktuálně 10.4.0). Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    včera 19:22 | Nová verze

    UBports, nadace a komunita kolem Ubuntu pro telefony a tablety Ubuntu Touch, vydala Ubuntu Touch OTA-1 Focal založené na Ubuntu 20.04 Focal Fossa.

    Ladislav Hagara | Komentářů: 0
    včera 17:11 | IT novinky

    Společnost Red Hat slaví 30 let.

    Ladislav Hagara | Komentářů: 2
    včera 15:22 | IT novinky

    Ve věku 91 let zemřel izraelský informatik Ja'akov Ziv, spolutvůrce bezztrátových kompresních algoritmů LZ77, LZ78 a LZW (Lempel–Ziv–Welch).

    Ladislav Hagara | Komentářů: 0
    včera 11:00 | IT novinky

    Byla představena nová Arduino deska Arduino UNO R4 s 32bitovým MCU RA4M1 (Arm Cortex-M4). Desku lze zatím získat pouze v rámci early access programu.

    Ladislav Hagara | Komentářů: 0
    Používáte WSL (Windows Subsystem for Linux)?
     (73%)
     (12%)
     (4%)
     (11%)
    Celkem 358 hlasů
     Komentářů: 7, poslední dnes 17:34
    Rozcestník


    Dotaz: Blbne čeština (utf8) v perlu a v C

    ⧠ A = 0 avatar 7.10.2007 18:26 ⧠ A = 0 | skóre: 10 | blog: Technokratovo_zrcadlo | Helsinki
    Blbne čeština (utf8) v perlu a v C
    Přečteno: 699×
    Zdravím. Mám debian s cs_CZ.utf8 a potřeboval bych nějakým způsobem přečíst jednotlivý znak (i český) a nějak ho zpracovat. Nejprve jsem si hrál v C, s pomocí wcharů, ale getwchar() mi začne vracet WEOF, jakmile narazí na český non-ascii znak.

    Pak jsem zkoušel něco napsat v perlu. A třeba na následující jednoduché utilitce na počítání četnosti znaků jsem si vylámal zuby:

    use locale;
    $_ = <STDIN>;
    %znaky = ();
    while ( /(\S)/) {
    if (exists($znaky{$&})) {
    $znaky{$&} += 1;
    }
    else {
    $znaky{$&} = 1;
    }
    $_ = $';
    }

    foreach $c (keys(%znaky))
    {
    print "$c $znaky{$c}\n"
    }

    Tady mi to pro změnu české non-ascii znaky půlí na nějaké dva nečitelné znaky. Např. pro vstup "ščdfs" dostanu tohle:

    � 1
    � 1
    d 1
    � 1
    s 1
    f 1
    � 1

    Naveďte mě, co dělám špatně, prosím.

    Nevolte zmrdy.

    Odpovědi

    7.10.2007 18:37 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    perl-u treba o utf8 povedať. Štandardne sa tvári, ako keby nič také neexistovalo.
    use utf8;
    
    binmode (STDIN, 'utf8');
    binmode (STDOUT, 'utf8');
    
    7.10.2007 23:27 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    use utf8; pouze říká, že od teď je zdroják v UTF-8.

    Co se týče binmode(STDIN, ':utf8'), tak záleží na verzi (a distribuci). Jsou takové, kde jedině binmode zajistí korektní I/O, jsou takové, kde to funguje podle locale, ale padají varování, a jsou takové, kde to funguje „samo od sebe“.
    8.10.2007 09:30 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    utf8 obsahuje zopár užitočných funkcií ..

    čo sa týka samotného perlu, ten, ak mu inak nik nepovie, utf8 nepozná. Povedať sa mu to (o STDIN/OUT/ERROR) dá napr. perl -C L (podľa locale), perl -IOEioA (natvrdo, aj @ARGV v utf8)

    7.10.2007 18:38 Filip Jirsák | skóre: 68 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    Ty dva nečitelné znaky je bajtová reprezentace těch českých znaků. Tj. Perl ten vstup zpracovává po bajtech – buď neumí UTF-8, nebo neví, že vstup je v UTF-8. Máte locale nastaveno na cs_CZ.UTF-8?
    ⧠ A = 0 avatar 7.10.2007 19:12 ⧠ A = 0 | skóre: 10 | blog: Technokratovo_zrcadlo | Helsinki
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    To je mi celkem jasné. Locale samozřejmě nastavené mám. Pomohlo to binmode. Ještě by mě zajímalo, jak je to s tím Cčkem.
    Nevolte zmrdy.
    8.10.2007 01:10 megi | skóre: 11 | blog:
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    Na C potrebujes nejakou knihovnu. Ja pouzivanm glib2, pze je vsude.

    http://library.gnome.org/devel/glib/stable/glib-Unicode-Manipulation.html
    ⧠ A = 0 avatar 11.10.2007 16:41 ⧠ A = 0 | skóre: 10 | blog: Technokratovo_zrcadlo | Helsinki
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    A to tedy podle Vás standardní C99 s wchary a locale vůbec neumí utf8?
    Nevolte zmrdy.
    8.10.2007 13:20 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    Pardon jestli jem mimo co se týče Perlu, ale v Pythonu je třeba explicitně říci, že má používat systémové locale voláním
    import locale; locale.setlocale(locale.LC_ALL, '')
    . Není to v Perlu podobně?
    8.10.2007 14:41 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: Blbne čeština (utf8) v perlu a v C
    nie, pragma use locale to robí automaticky. setlocale je treba len vtedy, ak chce program iné

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.