abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 14:55 | Zajímavý projekt

Vyšlo piate číslo Magazínu KPI — webového časopisu Katedry počítačov a informatiky Technickej univerzity v Košiciach. V čísle sú články o vizualizácii dát v jazyku Python, nástroji Docker, a použití protokolu MQTT.

sergejx | Komentářů: 1
dnes 10:44 | Nová verze

Po dvou a půl měsících vývoje od vydání verze 5.0 byla vydána nová verze 5.1 svobodného open source redakčního systému WordPress. Kódové označením Betty bylo vybráno na počest americké jazzové zpěvačky Betty Carter.

Ladislav Hagara | Komentářů: 0
včera 16:11 | Bezpečnostní upozornění

V Linuxu byla nalezena bezpečnostní chyba CVE-2019-8912. Jedná se o vážnou (CVSS v3.0: 9.8) bezpečnostní chybu typu CWE-416: Use After Free v crypto/af_alg.c. Chyba byla nalezena pomocí detektoru chyb při práci s pamětí KASAN (Kernel Address Sanitizer).

Ladislav Hagara | Komentářů: 5
včera 11:11 | Komunita

Mozilla.cz informuje, že další vydání SeaMonkey se zdrží. Infrastruktura projektu SeaMonkey prochází mnoha změnami. Důvodem je požadavek na nezávislost na infrastruktuře Firefoxu do konce roku, protože jeho vývoj nebude SeaMonkey následovat ve stejném tempu a rozdíly jsou moc veliké. Bohužel se při těchto přesunech nepodařilo udržet vše ve funkčním stavu a tak není možné sestavovat a vydávat nové verze SeaMonkey.

Ladislav Hagara | Komentářů: 0
20.2. 16:55 | Bezpečnostní upozornění

V Drupalu byla nalezena vysoce kritická zranitelnost PSA-2019-02-19. Podrobnosti a opravy 8.5.x a 8.6.x budou zveřejněny dnes mezi 19:00 a 23:00.

Ladislav Hagara | Komentářů: 1
20.2. 16:33 | Zajímavý projekt

Mozilla.cz informuje o stavu češtiny v projektu Common Voice. Projekt Common Voice sbírá hlasová data, na základě kterých bude možné trénovat modely a software pro rozpoznávání řeči. Aktuálně je nutné rozšířit počet vět v datové sadě a alespoň 5 tisíc vět musí být ručně ověřených několika lidmi.

Ladislav Hagara | Komentářů: 0
20.2. 16:22 | Nová verze

Byla vydána nová vývojová verze datového formátu a souvisejících nástrojů Relational pipes. Hlavní novinkou verze v0.10 je nástroj relpipe-tr-guile, který díky GNU Guile umožňuje filtrovat a transformovat relační data pomocí výrazů jazyka Scheme.

xkucf03 | Komentářů: 0
20.2. 00:33 | Bezpečnostní upozornění

CSIRT.CZ upozorňuje na kritickou zranitelnost ve WordPressu umožňující vzdálené spuštění libovolného kódu. Prakticky se jedná o kombinací dvou různých zranitelností (Directory Traversal a Local File Inclusion), pro jejichž úspěšné zneužití musí útočník získat v rámci instance WordPressu alespoň oprávnění autora.

Ladislav Hagara | Komentářů: 2
19.2. 17:33 | Nová verze

Po dvou a půl letech od vydání verze 5.0.0 byla oficiálně vydána nová major verze 6.0.0 správce digitálních fotografií a nově i videí digiKam (digiKam Software Collection). Přehled novinek i s náhledy v oficiálním oznámení. Ke stažení je také balíček ve formátu AppImage. Stačí jej stáhnout, nastavit právo ke spuštění a spustit.

Ladislav Hagara | Komentářů: 1
19.2. 00:44 | Komunita

Do 2. dubna se lze přihlásit do dalšího kola programu Outreachy (Wikipedie), jehož cílem je přitáhnout do světa svobodného a otevřeného softwaru lidi ze skupin, jež jsou ve světě svobodného a otevřeného softwaru málo zastoupeny. Za 3 měsíce práce, od 20. května do 20. srpna 2019, v participujících organizacích lze vydělat 5 500 USD.

Ladislav Hagara | Komentářů: 1
Máte v desktopovém prostředí zapnutou zvukovou znělku po přihlášení se do systému?
 (8%)
 (1%)
 (90%)
 (1%)
Celkem 385 hlasů
 Komentářů: 11, poslední 14.2. 07:59
Rozcestník

Dotaz: spolehlive odstraneni diakritiky

17.11.2003 12:34 orfanix
spolehlive odstraneni diakritiky
Přečteno: 3979×
ahoj, potrebuju odstranit diakritiku z txt souboru v UTF-8 napriklad enca mi pri syntaxi enca -x ASCII x.txt udela z "Kouzelný meč " "Kouzelnc "

potreboval bych neco spolehliveho, abych nemusel ty spousty textu znovu procitat? zrejme to bude mezi klavesnici a zidli, ale fakt nevim. jak na to s recode, iconv, cstocs jsem teda neprisel dekuji

Odpovědi

17.11.2003 13:10 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
Ohledně enca a toho, co si lidé přestavují pod -x ascii, viz Enca FAQ: why `enca -x ascii' doesn't work ;-) enca -C extern -E b-cstocs -x ascii nejspíš dělá, co chceš (vysvětelení je ve FAQ). Jo, a před chvíli jsem našel chybku při používání externích konvrtorů v rouře, takže to možná nefunguje v rouře (na soubor by to mělo být OK), oprava vyjde nejspíš za chvíli.
17.11.2003 13:51 orfanix
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
FAQ jsem se pokousel cist. popravde, i kdyz jsem to precetl, tak jsem to stejne nepochopil. takze na text:

"Příliš žluťoučký kůň úpěl ďábelské ódy."
jsem pustil
enca -C extern -E b-cstocs -x ascii
a vysledek

"Př š žluťoučk ď lsk dy."
vysledny kodovani je
Universal transformation format 8 bits; UTF-8
Doubly-encoded to UTF-8 from KOI-8_CS_2SCII

docela bych pochopil ze vlastne nepotrebuju ASCII soubor, ze muze byt v jakemkoli kodovani, jen potrebuju odstranit hacky, carky atd.
kde jeste muzu delat chybu?
17.11.2003 14:00 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
To je zajímavé, mně to totiž nomrálně funguje. Mám dva soubory, z a zz, s textem Příliš žluťoučký kůň úpěl ďábelské ódy. v jednom v ISO Latin2, v druhém v UTF-8, spustím enca -C extern -E b-cstocs -x ascii z zz a poté je v obou Prilis zlutoucky kun upel dabelske ody. Jediné možné vysvětlení je, že máš perl >= 5.8.0 a UTF-8 locales. V této kombinaci nefunguje cstocs a dělá hrozné věci (Pazdziora o tom ví, ale zatím to neumí zařídit, aby to fungovalo i s novým i se starým perlem ;-(
17.11.2003 16:02 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
Poznamenal bych, že cstocs je jediný program, který umí správně odstraňovat diakritiku, takže pokud ti nejede cstocs, tak jsi namydlený. A tu chybu s chováním v rourách už jsem mezitím opravil, viz Enca-1.1
17.11.2003 17:44 Robert Krátký | skóre: 94 | blog: Robertův bloček
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
mozna jsem na chybu zatim pouze nenarazil, ale gnu recode mi vzdy odstranilo diakritiku take bez problemu.
17.11.2003 21:00 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
To by mě hrozně zajímalo, jak to děláš. Dlouho jsem si myslel, že recode to umí, že jsem jen já tak blbej, ale nikdy jsem ho k tomu nedokázal přimět, i když jsem se na hlavu stavěl. Takže teď už si myslím, že to neumí.
17.11.2003 17:43 orfanix
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
aha, udelal jsem chybu, ze jsem hned neuvedl muj OS
Red Hat 9
perl-5.8.0-88.3
locale default: cs_CZ.UTF-8
takze tedy tam je zakopany pes?

hm jasne, pri LANG=cs_CZ to funguje.
takze se da rict, ze pokud chci nejak "funkcne" carovat s textem, mel bych zrejme s UTF v locale pockat?

no kazdopadne diky moc za ochotu a peci :-)
17.11.2003 21:28 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
Mno, zkus napsat Pazdziorovi... Možná by mohl vydat alespoň nějakou verzi, která funguje jen s perlem >= 5.8.0, když už je tak obtížné, aby to fungovalo všude (což věřím, že je -- svoje programy v Perlu, které něco dělají s Unicode a převody znakových sad, běžně přepisuji při vydání každé nové verze Perlu ;-)
16.1.2007 10:03 Bzzzwaa
Rozbalit Rozbalit vše Re: spolehlive odstraneni diakritiky
Pouzil jsem s uspechem program WinDia, ktery beha dobre ve Wine. Najdes ho na http://medved.braillnet.cz/freeware.htm
16.1.2007 10:33 Fuck You | skóre: 16 | blog: NeOpToLeMoS
Rozbalit Rozbalit vše Re: spolehlive odstraneni diakritiky
Boooooooooooože - prečo tak zložito - a ešte aj pomocou wine (ako som to tu v nejakom príspevku čítal). A nestačilo by:

recode --force utf8..flat $PrevadzanyText

???:-D
16.1.2007 10:35 Fuck You | skóre: 16 | blog: NeOpToLeMoS
Rozbalit Rozbalit vše Re: spolehlive odstraneni diakritiky
Sakra - dal som sa nachytať - otvárame 3 roky staré témy?! :-D

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.