abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 02:20 | Zajímavý článek

David Revoy, autor open source webového komiksu Pepper&Carrot nebo portrétu GNU/Linuxu, upozorňuje na svém blogu, že nový Inkscape 0.92 rozbíjí dokumenty vytvořené v předchozích verzích Inkscape. Problém by měl být vyřešen v Inkscape 0.92.2 [reddit].

Ladislav Hagara | Komentářů: 0
včera 02:02 | Komunita

Øyvind Kolås, hlavní vývojář grafických knihoven GEGL a babl, které využívá grafický program GIMP, žádá o podporu na Patreonu. Díky ní bude moci pracovat na vývoji na plný úvazek. Milník 1000 $, který by stačil na holé přežití, se již téměř podařilo vybrat, dalším cílem je dosažení 2500 $, které mu umožní běžně fungovat ve společnosti.

xkomczax | Komentářů: 12
21.1. 23:54 | Pozvánky

DevConf.cz 2017, již devátý ročník jedné z největších akcí zaměřených na Linux a open source ve střední Evropě, proběhne od pátku 27. ledna do neděle 29. ledna v prostorách Fakulty informačních technologií Vysokého učení technického v Brně. Na programu je celá řada zajímavých přednášek a workshopů. Letos je povinná registrace.

Ladislav Hagara | Komentářů: 0
21.1. 22:11 | Nová verze

Byla vydána verze 1.0.0 emulátoru terminálu Terminology postaveného nad EFL (Enlightenment Foundation Libraries). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
20.1. 17:00 | Nová verze

Byl vydán Docker 1.13. Přehled novinek na YouTube a v poznámkách k vydání na GitHubu. Docker umožňuje běh aplikací v softwarových kontejnerech (Wikipedia).

Ladislav Hagara | Komentářů: 5
20.1. 15:51 | Komunita

Mozilla.cz informuje, že nástroje pro webové vývojáře se možná oddělí od Firefoxu a stanou doplňkem. Nástroje pro webové vývojáře prošly velkým přepisem a tým, který se stará o jejich vývoj, by uvítal možnost jejich častějších aktualizacích nezávisle na vydávání nových verzí Firefoxu.

Ladislav Hagara | Komentářů: 10
20.1. 07:00 | Humor

Čtenářům AbcLinuxu vše nejlepší k dnešnímu Dni zvýšení povědomí o tučňácích (Penguin Awareness Day).

Ladislav Hagara | Komentářů: 0
20.1. 06:00 | Komunita

Bylo spuštěno hlasování o přednáškách a workshopech pro letošní InstallFest, jenž proběhne o víkendu 4. a 5. března v Praze. Současně byla oznámena změna místa. InstallFest se letos vrací zpět na Karlovo náměstí do budovy E.

Ladislav Hagara | Komentářů: 0
20.1. 02:48 | Komunita

Greg Kroah-Hartman potvrdil, že Linux 4.9 je jádrem s prodlouženou upstream podporou (LTS, Long Term Support). Podpora je plánována do ledna 2019. Aktuální jádra s prodlouženou podporou jsou tedy 3.2, 3.4, 3.10, 3.12, 3.16, 3.18, 4.1, 4.4 a 4.9.

Ladislav Hagara | Komentářů: 0
20.1. 00:11 | Zajímavý článek

Výrobce síťových prvků, společnost Netgear, spustila nový program, který slibuje vývojářům, expertům, ale i běžným uživatelům vyplacení finanční odměny za nalezení bezpečnostních chyby v jejich produktech. Za nalezení zranitelnosti v hardware, API nebo mobilní aplikaci nabízí odměnu od 150 do 15 tisíc dolarů (dle závažnosti).

Michal Makovec | Komentářů: 0
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (10%)
 (2%)
 (74%)
 (4%)
 (10%)
Celkem 367 hlasů
 Komentářů: 25, poslední 21.1. 13:34
Rozcestník
Reklama

Dotaz: České třídění v perlu

18.10.2012 19:23 Tomáš
České třídění v perlu
Přečteno: 441×
Nevím jak donutit perl, aby třídil správně česky, jakmile přepnu LC_COLLATE zařadí se řetězce s mezerou chybně na konec:
use POSIX qw /locale_h/;
use locale;

@a = ('A š', 'A v', 'Aaa');

setlocale LC_COLLATE, "C";
print "$_\n" foreach sort @a;

print "\n";
setlocale LC_COLLATE, "cs_CZ.UTF-8";
print "$_\n" foreach sort @a;
A v
A š
Aaa

Aaa
A š
A v

Odpovědi

18.10.2012 20:52 myšák | skóre: 26 | blog: EmentuX | Ostrava
Rozbalit Rozbalit vše Re: České třídění v perlu

No jestli on nebude problém spíš v tom, že sort v Perlu spoléhá na to, co mu "vrátí systémový sort". Viz následující:

mike@tinky:~$ locale
LANG=cs_CZ.UTF-8
LANGUAGE=
LC_CTYPE="cs_CZ.UTF-8"
LC_NUMERIC="cs_CZ.UTF-8"
LC_TIME="cs_CZ.UTF-8"
LC_COLLATE="cs_CZ.UTF-8"
LC_MONETARY="cs_CZ.UTF-8"
LC_MESSAGES="cs_CZ.UTF-8"
LC_PAPER="cs_CZ.UTF-8"
LC_NAME="cs_CZ.UTF-8"
LC_ADDRESS="cs_CZ.UTF-8"
LC_TELEPHONE="cs_CZ.UTF-8"
LC_MEASUREMENT="cs_CZ.UTF-8"
LC_IDENTIFICATION="cs_CZ.UTF-8"
LC_ALL=
mike@tinky:~$ cat ./foo 
A š
A v
Aaa
mike@tinky:~$ sort ./foo 
Aaa
A š
A v

Možná bych popřemýšlel o použití Cz::Sort

Je nesmírně těžké být idiotem, konkurence je obrovská...
18.10.2012 21:58 tom
Rozbalit Rozbalit vše Re: České třídění v perlu
Ono to je nejspis podle normy dobre, protoze ta pred abecedu radi jen tvrdou mezeru.
18.10.2012 22:11 myšák | skóre: 26 | blog: EmentuX | Ostrava
Rozbalit Rozbalit vše Re: České třídění v perlu
Jak je to přesně podle normy netuším :-( Na to by musel odpovědět nějaký znalec, za kterého se rozhodně nepovažuji...
Je nesmírně těžké být idiotem, konkurence je obrovská...
18.10.2012 22:51 tom
Rozbalit Rozbalit vše Re: České třídění v perlu
Ve vycucu z ČSN 97 6030 se pise
Spojovník a nepřerušující mezera před abecedou.
vizte http://racek.vlada.cz/usneseni/usneseni_webtest.nsf/WebGovRes/0AD8FEF4CC04B7A4C12571B6006D69D0?OpenDocument
19.10.2012 12:45 myšák | skóre: 26 | blog: EmentuX | Ostrava
Rozbalit Rozbalit vše Re: České třídění v perlu
Díky za odkaz - člověk se pořád učí. Nicméně bych si v tomto případě dovolil postesknout nad jistou nelogičností, kterou v tomto pravidle vidím. Ačkoliv chápu, že v češtině máme podobných úchvatných „mozkolamů“ přehršel, tak konkrétně v tomto případě je to opravdu na mašli. Pokud odhlédneme od typografie, kde rozdíl mezi spojovníkem, nezalomitelnou mezerou a obyčejnou mezerou dává smysl, tak při řazení slov smysl poněkud postrádám. Ale jak jsem psal v předchozím příspěvku, necítím se být odborníkem na všechny kličky mého rodného jazyka a jsem rád, že intuitivně ovládám alespoň jeho základy.
Je nesmírně těžké být idiotem, konkurence je obrovská...
19.10.2012 12:47 l4m4
Rozbalit Rozbalit vše Re: České třídění v perlu
Tady ale nejde o řazení slov, slova mezery neobsahují žádné. Jde o řazení frází.
18.10.2012 20:55 Mirek
Rozbalit Rozbalit vše Re: České třídění v perlu
18.10.2012 21:42 myšák | skóre: 26 | blog: EmentuX | Ostrava
Rozbalit Rozbalit vše Re: České třídění v perlu
Proměnnou LANG může mít nastavenou jak chce, protože v tom skriptu si nastavuje dle potřeby LC_COLLATE na cs_CZ.utf8 ;-)
Je nesmírně těžké být idiotem, konkurence je obrovská...
18.10.2012 22:08 myšák | skóre: 26 | blog: EmentuX | Ostrava
Rozbalit Rozbalit vše Re: České třídění v perlu

Problém je v tom, že v definici locale je pro znak "mezera" (nejen) v cs_CZ.utf8 krpa, která znepříjemňuje život nejen v Perlu, ale tak nějak napříč systémem. :-( Existuje pro to dokonce zdokumentovaná oprava:

  1. V souboru /usr/share/i18n/locales/cs_CZ je třeba opravit řádek:
    <U0020> IGNORE;IGNORE;IGNORE;<U0020> na <U0020> <U0020>;IGNORE;<U0020>;<U0020>
  2. Vypsat z archivu všechny české definice:
    $ localedef --list-archive | grep cs_CZ
    cs_CZ
    cs_CZ.utf8
    
    a smazat je:
    localedef --delete-from-archive cs_CZ
    localedef --delete-from-archive cs_CZ.utf8
    
  3. Vytvořit novou binární podobu z opravené textové definice:
    localedef -i /usr/share/i18n/locales/cs_CZ -f UTF-8 /usr/lib/locale/cs_CZ
    localedef -i /usr/share/i18n/locales/cs_CZ -f UTF-8 /usr/lib/locale/cs_CZ.UTF-8
    
  4. V adresáři s archivem přidat binárky do archivu:
    cd /usr/lib/locale/
    localedef --add-to-archive cs_CZ
    localedef --add-to-archive cs_CZ.UTF-8
    
  5. Na konci pro jistotu zkontrolovat, že je vše OK:
    $ localedef --list-archive | grep cs_CZ
    cs_CZ
    cs_CZ.utf8
    

A voilá po opravě locale:

$ cat foo 
A v
Abc
A b
A š
A č
Aaa

$ sort foo 
A b
A č
A š
A v
Aaa
Abc

Je nesmírně těžké být idiotem, konkurence je obrovská...
19.10.2012 10:45 Tomáš
Rozbalit Rozbalit vše Re: České třídění v perlu

Díky moc

A musim říct, že v glibc jsem chybu opravdu nečekal, nemělo by se to někam bugreportovat? Nebo existuje nějaký důvod proč je to takhle?

19.10.2012 12:01 tom
Rozbalit Rozbalit vše Re: České třídění v perlu
Nebo existuje nějaký důvod proč je to takhle?
http://www.abclinuxu.cz/poradna/programovani/show/367555#7

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.