abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

dnes 13:22 | Zajímavý software

Jordi Sanfeliu vydal verzi 1.0.0 svého unixového jádra Fiwix (Wikipedie) určeného také pro výuku operačních systémů. Dle článku na OSNews na něm začal pracovat již před více než dvaceti lety. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT. Stáhnout a vyzkoušet lze živou disketu nebo CD s GNU/Fiwixem.

Ladislav Hagara | Komentářů: 0
dnes 06:00 | Nová verze

Byla vydána nová verze 10.7 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab (Wikipedie). Představení nových vlastností v příspěvku na blogu. Vývojáři GitLabu zdůrazňují Web IDE (YouTube) a SAST (Static Application Security Testing) pro Go a C/C++.

Ladislav Hagara | Komentářů: 0
včera 14:00 | Zajímavý článek

David Revoy, autor open source webového komiksu Pepper&Carrot nebo portrétu GNU/Linuxu, zveřejnil na svém blogu recenzi notebooku Librem 13 od společnosti Purism. Používá jej již sedm měsíců a s ním i jako umělec spokojen. Potřebu francouzské AZERTY klávesnice vyřešil přelepkami. Na displej se podíval kalibrační sondou, barvy vyladil pomocí open source softwaru DisplayCAL, v aplikaci Inkscape nastavil zvětšování na 170 % aby 1 cm v Inkscapu byl 1 cm v reálu. Webovou kameru, mikrofon, Wi-Fi a Bluetooth lze na Librem 13 hardwarově vypnout.

Ladislav Hagara | Komentářů: 4
21.4. 23:44 | Komunita

Několik posledních verzí GNOME Shellu obsahuje chybu způsobující memory leak (únik paměti). Viz například videozáznamy verzí 3.26 nebo 3.28. Nalezení chyby #64 a její opravě se věnuje Georges Basile Stavracas Neto v příspěvku na svém blogu [reddit].

Ladislav Hagara | Komentářů: 0
21.4. 10:33 | Komunita

V pondělí měl na YouTube online premiéru otevřený krátký 2D film Hero vytvořený v 3D softwaru Blender. Cílem stejnojmenného projektu Hero je vylepšit nástroj Grease Pencil (tužka) v Blenderu 2.8.

Ladislav Hagara | Komentářů: 4
20.4. 23:22 | Nová verze

Byla vydána verze 4.0 kolekce svobodného softwaru umožňujícího nahrávání, konverzi a streamovaní digitálního zvuku a obrazu FFmpeg (Wikipedie). Přehled novinek v Changelogu (GitHub).

Ladislav Hagara | Komentářů: 0
20.4. 17:22 | Komunita

Včera vydanou hru Rise of the Tomb Raider pro Linux lze do pondělí 23. dubna koupit na Steamu s 67% slevou. Místo 49,99 € za 16,49 €.

Ladislav Hagara | Komentářů: 0
20.4. 16:11 | Komunita

Na Humble Bundle lze získat počítačovou hru Satellite Reign (Wikipedie, YouTube) běžící také v Linuxu zdarma. Speciální akce končí v sobotu v 19:00.

Ladislav Hagara | Komentářů: 5
20.4. 15:44 | Zajímavý software

Společnost Apple koupila před třemi lety společnost FoundationDB vyvíjející stejnojmenný NoSQL databázový systém FoundationDB (Wikipedie). Včera byl tento systém uvolněn jako open source pod licencí Apache 2.0. Zdrojové kódy jsou k dispozici na GitHubu.

Ladislav Hagara | Komentářů: 0
20.4. 15:00 | Nová verze

Po dva a půl roce od vydání verze 5.7 oznámila společnost Oracle vydání nové major verze 8.0 (8.0.11) databázového systému MySQL (Wikipedie). Přehled novinek v poznámkách k vydání. Zdrojové kódy komunitní verze MySQL jsou k dispozici na GitHubu.

Ladislav Hagara | Komentářů: 8
Používáte na serverech port knocking?
 (3%)
 (7%)
 (46%)
 (27%)
 (17%)
Celkem 358 hlasů
 Komentářů: 29, poslední 5.4. 12:25
    Rozcestník

    Dotaz: Počítání českých znaků v Reg Exp

    8.9.2011 11:18 Hufy
    Počítání českých znaků v Reg Exp
    Přečteno: 337×
    Prosím o radu s regulárními výrazy v Perlu (5.10.1 pod Kubuntu 11.04) Mám text ve dvou sloupcích a rozděluji ho pomocí /^(.{66})(.*)$/ na ty dvě půlky. Jenže když tam jsou české znaky, každý se počítá za dva, vypadá to, že {66} počítá byty, ne znaky. Mám nastaveno use encoding 'utf-8'; Zkoušel jsem locale a binmode, ale bez výsledku. Strávil jsem dvě hodiny čtením dokumentace a mám z toho tak akorát zamotanou hlavu. Umíte mi někdo poradit? Díky


    Řešení dotazu:


    Odpovědi

    8.9.2011 13:31 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Máte ten text načtený správně v kódování UTF-8? Zkuste si třeba zjistit délku toho textu nebo vypsat některý znak s diakritikem – uvidíte, zda vstup Perl přečetl správně jako UTF-8 znaky, nebo zda to načítáte špatně a Perl to chápe jako ASCII.
    8.9.2011 18:15 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Sorry, asi nerozumím... Mám vypsat délku načteného řádku?
    8.9.2011 18:19 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Třeba. Prostě nějak zjistit, zda to Perl vidí jako bajty nebo jako znaky.
    8.9.2011 18:53 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Mám tu

    while (<>) { /^([\w\W]{70})(.*$)/; # rozdelim radek na dva sloupce
    print "$1 ".length($1)."\n"; # pisu levou a delku
    next;
    }

    a píše to všude délku 70, jenže ne pod sebe, je vidět, že každý řádek je jinak dlouhý. Celý prográmek dám k další odpovědi.
    8.9.2011 13:34 Sten
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Základní operátory regulárních výrazů, jako je ".", fungují z výkonnostních důvodů nad bajty, nikoliv znaky. Pokud chcete vybírat znaky, použijte operátor "\W".
    8.9.2011 18:20 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Jenže \W nebere písmena. Zkouším [\w\W], ale dělá to totéž.
    8.9.2011 15:12 ams
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Dela se to pomoci binmode, takze jak jste to zkousel?
    binmode *STDIN, "utf8";  # Ted tecka = znak a ne byte
    binmode *STDOUT, "utf8"; # Aby nebyly Warnings: wide character in print
    
    while (<>) {
      print join ":", /^(.{66})(.*)$/;
    }
    
    8.9.2011 15:13 ams
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Samozrejme tam musi byt ":utf8". binmode *STDIN, ":utf8" atd.
    8.9.2011 15:19 Sten
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    To sice přepne matchování z bajtů na code pointy, ale tečka potom stále není znak, protože některé znaky mohou být tvořené více code pointy, třeba u kombinované diakritiky. Na znaky je právě ten operátor "\W".
    8.9.2011 18:59 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Pro jistotu dávám celý "program" a jestli přijdu na to, jak se to dělá, přidám i zdrojová data.

    #!/usr/bin/perl
    use encoding ':utf-8';
    binmode *STDIN, ":utf8"; # Ted tecka = znak a ne byte
    binmode *STDOUT, ":utf8";

    my @radky;
    while (<>) {
    /^([\w\W]{70})(.*$)/; # rozdelim radek na dva sloupce
    push @radky, $2."\n"; # pravou pulku schovam
    print "$1 ".length($1)."\n"; # levou pisu rovnou - s udajnym poctem znaku
    next;
    }

    print @radky; # dotisknu pravy sloupec pod levy
    # jenze zacatky radku jsou rozhazene

    8.9.2011 19:09 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Přílohy:
    Vkládám zdrojová data HH.txt a výsledek, který dostávám bbb.txt Pokud mi to někdo dokáže vysvětlit, budu neskonale vděčen.
    Řešení 2× (Vojtěch Horký, Hufy (tazatel))
    8.9.2011 20:16 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Řešení je popsané třeba zde: How do I read UTF-8 with diamond operator (<<>>)?.

    Místo
    binmode STDOUT, ":utf-8";
    použijte
    use open qw(:std :utf8);
    8.9.2011 20:45 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    To je ono! A dokonce jsem asi i pochopil v čem je ten problém :-) Díky moc všem za rady.
    8.9.2011 19:24 Sten
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Pardon, Unicodový znak je \X. Bohužel, teď nemůžu vyzkoušet ty vaše soubory, mám Perl akorát přes SSH v mobilu:
    $ perl -pe 'use encoding "utf8";s/^\X{4}//' <<<'Žluťoučký kůň' 
    oučký kůň
    8.9.2011 19:48 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Díky, ale ani \X nepomáhá. Musí být špatně něco jiného... Ten vstupní soubor přitom opravdu vypadá na utf8, aspoň pokud dokážu posoudit.
    8.9.2011 19:54 jurasek
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Zdar
    Kodovani souboru overis prikazem file. file HH.txt
    Zdar
    8.9.2011 20:42 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Ano, je to utf-8, dík

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.