abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

dnes 09:22 | Pozvánky

V Praze dnes probíhá Konference e-infrastruktury CESNET. Na programu je řada zajímavých přednášek. Sledovat je lze i online na stránce konference.

Ladislav Hagara | Komentářů: 0
9.12. 20:11 | Nová verze

Byl vydán Debian 9.3, tj. třetí opravná verze Debianu 9 s kódovým názvem Stretch a Debian 8.10, tj. desátá opravná verze Debianu 8 s kódovým názvem Jessie. Řešeny jsou především bezpečnostní problémy, ale také několik vážných chyb. Instalační média Debianu 9 a Debianu 8 lze samozřejmě nadále k instalaci používat. Po instalaci stačí systém aktualizovat.

Ladislav Hagara | Komentářů: 0
9.12. 00:44 | Nová verze

Po 6 měsících vývoje od vydání verze 0.13.0 byla vydána verze 0.14.0 správce balíčků GNU Guix a na něm postavené systémové distribuce GuixSD (Guix System Distribution). Na vývoji se podílelo 88 vývojářů. Přibylo 1 211 nových balíčků. Jejich aktuální počet je 6 668. Aktualizována byla také dokumentace.

Ladislav Hagara | Komentářů: 3
8.12. 21:33 | Nová verze

Po půl roce vývoje od vydání verze 5.9 byla vydána nová stabilní verze 5.10 toolkitu Qt. Přehled novinek na wiki stránce. Současně byla vydána nová verze 4.5.0 integrovaného vývojového prostředí (IDE) Qt Creator nebo verze 1.10 nástroje pro překlad a sestavení programů ze zdrojových kódů Qbs.

Ladislav Hagara | Komentářů: 0
7.12. 11:11 | Komunita

Naprostá většina příjmů Mozilly pochází od výchozích webových vyhledávačů ve Firefoxu. Do konce listopadu 2014 měla Mozilla globální smlouvu se společností Google. Následně bylo místo jedné globální smlouvy uzavřeno několik smluv s konkrétními vyhledávači pro jednotlivé země. V USA byla podepsána pětiletá smlouva s vyhledávačem Yahoo. Dle příspěvku na blogu Mozilly podala společnost Yahoo na Mozillu žalobu ohledně porušení této

… více »
Ladislav Hagara | Komentářů: 0
7.12. 05:55 | Zajímavý článek

V Londýně probíhá konference věnovaná počítačové bezpečnosti Black Hat Europe 2017. Průběžně jsou zveřejňovány prezentace. Videozáznamy budou na YouTube zveřejněny o několik měsíců. Zveřejněna byla například prezentace (pdf) k přednášce "Jak se nabourat do vypnutého počítače, a nebo jak v Intel Management Engine spustit vlastní nepodepsaný kód". Dle oznámení na Twitteru, aktualizace vydaná společností Intel nevylučuje možnost útoku.

Ladislav Hagara | Komentářů: 5
7.12. 04:44 | Komunita

Virtualizační nástroj GNOME Boxy ve Fedoře 27 umožňuje jednoduše stáhnout a nainstalovat Red Hat Enterprise Linux, který je pro vývojáře zdarma. Vývojová verze GNOME Boxy již umožňuje jednoduše stáhnout a nainstalovat další linuxové distribuce. Ukázka na YouTube. Seznam distribucí a jejich verze, nastavení a cesty k ISO obrazům je udržován v knihovně a databázi libosinfo (GitLab).

Ladislav Hagara | Komentářů: 0
7.12. 03:33 | Nová verze

Google Chrome 63 byl prohlášen za stabilní (YouTube). Nejnovější stabilní verze 63.0.3239.84 tohoto webového prohlížeče přináší řadu oprav a vylepšení. Vylepšeny byly také nástroje pro vývojáře. Opraveno bylo 37 bezpečnostních chyb.

Ladislav Hagara | Komentářů: 10
6.12. 22:55 | Pozvánky

Spolek OpenAlt zve příznivce otevřených technologií a otevřeného přístupu na 147. brněnský sraz, který proběhne v pátek 15. prosince od 18:00 hodin v restauraci Severka na rohu Tučkové a Zahradníkové.

Ladislav Hagara | Komentářů: 0
6.12. 22:33 | Komunita

V roce 2013 byl představen projekt Debsources, jehož cílem bylo a je poskytnout webové rozhraní ke zdrojovým kódům balíčků obsažených v Debianu. Projekt doteď běžel na doméně debian.net. Dnes bylo oznámeno, že projekt byl přesunut na oficiální infrastrukturu Debianu. Služba Debian Sources nově běží na doméně debian.org. V plánů je řada vylepšení. Již dnes je ke službě k dispozici API a procházet lze také patche a licence.

Ladislav Hagara | Komentářů: 0
Jak se vás potenciálně dotkne trend odstraňování analogového audio konektoru typu 3,5mm jack z „chytrých telefonů“?
 (8%)
 (1%)
 (1%)
 (1%)
 (75%)
 (14%)
Celkem 947 hlasů
 Komentářů: 45, poslední 1.12. 19:00
    Rozcestník

    Dotaz: Počítání českých znaků v Reg Exp

    8.9.2011 11:18 Hufy
    Počítání českých znaků v Reg Exp
    Přečteno: 337×
    Prosím o radu s regulárními výrazy v Perlu (5.10.1 pod Kubuntu 11.04) Mám text ve dvou sloupcích a rozděluji ho pomocí /^(.{66})(.*)$/ na ty dvě půlky. Jenže když tam jsou české znaky, každý se počítá za dva, vypadá to, že {66} počítá byty, ne znaky. Mám nastaveno use encoding 'utf-8'; Zkoušel jsem locale a binmode, ale bez výsledku. Strávil jsem dvě hodiny čtením dokumentace a mám z toho tak akorát zamotanou hlavu. Umíte mi někdo poradit? Díky


    Řešení dotazu:


    Odpovědi

    8.9.2011 13:31 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Máte ten text načtený správně v kódování UTF-8? Zkuste si třeba zjistit délku toho textu nebo vypsat některý znak s diakritikem – uvidíte, zda vstup Perl přečetl správně jako UTF-8 znaky, nebo zda to načítáte špatně a Perl to chápe jako ASCII.
    8.9.2011 18:15 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Sorry, asi nerozumím... Mám vypsat délku načteného řádku?
    8.9.2011 18:19 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Třeba. Prostě nějak zjistit, zda to Perl vidí jako bajty nebo jako znaky.
    8.9.2011 18:53 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Mám tu

    while (<>) { /^([\w\W]{70})(.*$)/; # rozdelim radek na dva sloupce
    print "$1 ".length($1)."\n"; # pisu levou a delku
    next;
    }

    a píše to všude délku 70, jenže ne pod sebe, je vidět, že každý řádek je jinak dlouhý. Celý prográmek dám k další odpovědi.
    8.9.2011 13:34 Sten
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Základní operátory regulárních výrazů, jako je ".", fungují z výkonnostních důvodů nad bajty, nikoliv znaky. Pokud chcete vybírat znaky, použijte operátor "\W".
    8.9.2011 18:20 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Jenže \W nebere písmena. Zkouším [\w\W], ale dělá to totéž.
    8.9.2011 15:12 ams
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Dela se to pomoci binmode, takze jak jste to zkousel?
    binmode *STDIN, "utf8";  # Ted tecka = znak a ne byte
    binmode *STDOUT, "utf8"; # Aby nebyly Warnings: wide character in print
    
    while (<>) {
      print join ":", /^(.{66})(.*)$/;
    }
    
    8.9.2011 15:13 ams
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Samozrejme tam musi byt ":utf8". binmode *STDIN, ":utf8" atd.
    8.9.2011 15:19 Sten
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    To sice přepne matchování z bajtů na code pointy, ale tečka potom stále není znak, protože některé znaky mohou být tvořené více code pointy, třeba u kombinované diakritiky. Na znaky je právě ten operátor "\W".
    8.9.2011 18:59 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Pro jistotu dávám celý "program" a jestli přijdu na to, jak se to dělá, přidám i zdrojová data.

    #!/usr/bin/perl
    use encoding ':utf-8';
    binmode *STDIN, ":utf8"; # Ted tecka = znak a ne byte
    binmode *STDOUT, ":utf8";

    my @radky;
    while (<>) {
    /^([\w\W]{70})(.*$)/; # rozdelim radek na dva sloupce
    push @radky, $2."\n"; # pravou pulku schovam
    print "$1 ".length($1)."\n"; # levou pisu rovnou - s udajnym poctem znaku
    next;
    }

    print @radky; # dotisknu pravy sloupec pod levy
    # jenze zacatky radku jsou rozhazene

    8.9.2011 19:09 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Přílohy:
    Vkládám zdrojová data HH.txt a výsledek, který dostávám bbb.txt Pokud mi to někdo dokáže vysvětlit, budu neskonale vděčen.
    Řešení 2× (Vojtěch Horký, Hufy (tazatel))
    8.9.2011 20:16 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Řešení je popsané třeba zde: How do I read UTF-8 with diamond operator (<<>>)?.

    Místo
    binmode STDOUT, ":utf-8";
    použijte
    use open qw(:std :utf8);
    8.9.2011 20:45 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    To je ono! A dokonce jsem asi i pochopil v čem je ten problém :-) Díky moc všem za rady.
    8.9.2011 19:24 Sten
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Pardon, Unicodový znak je \X. Bohužel, teď nemůžu vyzkoušet ty vaše soubory, mám Perl akorát přes SSH v mobilu:
    $ perl -pe 'use encoding "utf8";s/^\X{4}//' <<<'Žluťoučký kůň' 
    oučký kůň
    8.9.2011 19:48 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Díky, ale ani \X nepomáhá. Musí být špatně něco jiného... Ten vstupní soubor přitom opravdu vypadá na utf8, aspoň pokud dokážu posoudit.
    8.9.2011 19:54 jurasek
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Zdar
    Kodovani souboru overis prikazem file. file HH.txt
    Zdar
    8.9.2011 20:42 Hufy
    Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp
    Ano, je to utf-8, dík

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.