abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    5.6. 22:22 | Nová verze

    Byla vydána nová verze 9.7 multiplatformní digitální pracovní stanice pro práci s audiem (DAW) Ardour. Přehled novinek, vylepšení a oprav v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    5.6. 18:22 | Komunita

    Vývojáři webového prohlížeče Ladybird dnes oznámili, že mění způsob vývoje. S blížícím se vydáním alfa verze přestávají přijímat veřejné pull requesty. Všechny otevřené veřejné pull requesty budou uzavřeny. Tým nedokáže garantovat bezpečnost AI generovaných pull requestů.

    Ladislav Hagara | Komentářů: 2
    5.6. 17:33 | Zajímavý software

    OpenLogi (GitHub) je open source náhrada aplikace Logi Options+ pro přizpůsobení myší od společnosti Logitech. Zatím běží pouze na macOS.

    Ladislav Hagara | Komentářů: 1
    5.6. 04:33 | Nová verze

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za květen (YouTube).

    Ladislav Hagara | Komentářů: 9
    4.6. 11:22 | Bezpečnostní upozornění

    Úřad pro ochranu osobních údajů řeší desítky stížností na jednotné měsíční hlášení zaměstnavatele, které stát spustil počátkem dubna. Systém, jenž má firmám odlehčit od desítek formulářů, nejenže výrazně zatížil jejich účetní oddělení, ale docházelo v něm i k únikům osobních dat zaměstnanců k firmám, kde nepracovali. Podle ministerstva práce a sociálních věcí stála za problémem technická chyba. „Incident se týkal několika stovek

    … více »
    Ladislav Hagara | Komentářů: 23
    4.6. 10:46 | Nová verze

    Byla vydána (𝕏, Bluesky) nová verze 22.0.0 open source webového aplikačního frameworku Angular (Wikipedie). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    4.6. 04:33 | Nová verze

    Vim Classic byl vydán ve verzi 8.3. Drew DeVault oznámil tento fork editoru Vim (verze 8.2.0148, tj. těsně před zavedením Vim9 skriptování) v březnu letošního roku. Důvodem forku bylo, že vývojáři editorů Vim a Neovim začali při vývoji využívat LLM.

    Ladislav Hagara | Komentářů: 7
    4.6. 03:44 | Komunita

    Open source konference DevConf.CZ 2026 proběhne 18. a 19. června v Brně na FIT VUT. Publikován byl program a spuštěna byla registrace.

    Ladislav Hagara | Komentářů: 1
    3.6. 19:44 | Nová verze

    Společnost JetBrains uvolnila verzi 2 svého open-source velkého jazykového modelu (LLM) pro vývojáře Mellum.

    Ladislav Hagara | Komentářů: 0
    3.6. 14:44 | IT novinky

    Probíhá konference Microsoft Build 2026. Microsoft představuje své novinky: kvantový čip Majorana 2, Surface Laptop Ultra a Surface RTX Spark Dev Box s NVIDIA RTX Spark, Intelligent Terminal, Coreutils for Windows (fork Rust Coreutils), AI modely MAI, AI agenta Scout, platformu pro agent-first zařízení Project Solara, …

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (15%)
     (31%)
     (3%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1845 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: spolehlive odstraneni diakritiky

    17.11.2003 12:34 orfanix
    spolehlive odstraneni diakritiky
    Přečteno: 4152×
    ahoj, potrebuju odstranit diakritiku z txt souboru v UTF-8 napriklad enca mi pri syntaxi enca -x ASCII x.txt udela z "Kouzelný meč " "Kouzelnc "

    potreboval bych neco spolehliveho, abych nemusel ty spousty textu znovu procitat? zrejme to bude mezi klavesnici a zidli, ale fakt nevim. jak na to s recode, iconv, cstocs jsem teda neprisel dekuji

    Odpovědi

    17.11.2003 13:10 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    Ohledně enca a toho, co si lidé přestavují pod -x ascii, viz Enca FAQ: why `enca -x ascii' doesn't work ;-) enca -C extern -E b-cstocs -x ascii nejspíš dělá, co chceš (vysvětelení je ve FAQ). Jo, a před chvíli jsem našel chybku při používání externích konvrtorů v rouře, takže to možná nefunguje v rouře (na soubor by to mělo být OK), oprava vyjde nejspíš za chvíli.
    17.11.2003 13:51 orfanix
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    FAQ jsem se pokousel cist. popravde, i kdyz jsem to precetl, tak jsem to stejne nepochopil. takze na text:

    "Příliš žluťoučký kůň úpěl ďábelské ódy."
    jsem pustil
    enca -C extern -E b-cstocs -x ascii
    a vysledek

    "Př š žluťoučk ď lsk dy."
    vysledny kodovani je
    Universal transformation format 8 bits; UTF-8
    Doubly-encoded to UTF-8 from KOI-8_CS_2SCII

    docela bych pochopil ze vlastne nepotrebuju ASCII soubor, ze muze byt v jakemkoli kodovani, jen potrebuju odstranit hacky, carky atd.
    kde jeste muzu delat chybu?
    17.11.2003 14:00 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    To je zajímavé, mně to totiž nomrálně funguje. Mám dva soubory, z a zz, s textem Příliš žluťoučký kůň úpěl ďábelské ódy. v jednom v ISO Latin2, v druhém v UTF-8, spustím enca -C extern -E b-cstocs -x ascii z zz a poté je v obou Prilis zlutoucky kun upel dabelske ody. Jediné možné vysvětlení je, že máš perl >= 5.8.0 a UTF-8 locales. V této kombinaci nefunguje cstocs a dělá hrozné věci (Pazdziora o tom ví, ale zatím to neumí zařídit, aby to fungovalo i s novým i se starým perlem ;-(
    17.11.2003 16:02 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    Poznamenal bych, že cstocs je jediný program, který umí správně odstraňovat diakritiku, takže pokud ti nejede cstocs, tak jsi namydlený. A tu chybu s chováním v rourách už jsem mezitím opravil, viz Enca-1.1
    17.11.2003 17:44 Robert Krátký | skóre: 94 | blog: Robertův bloček
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    mozna jsem na chybu zatim pouze nenarazil, ale gnu recode mi vzdy odstranilo diakritiku take bez problemu.
    17.11.2003 21:00 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    To by mě hrozně zajímalo, jak to děláš. Dlouho jsem si myslel, že recode to umí, že jsem jen já tak blbej, ale nikdy jsem ho k tomu nedokázal přimět, i když jsem se na hlavu stavěl. Takže teď už si myslím, že to neumí.
    17.11.2003 17:43 orfanix
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    aha, udelal jsem chybu, ze jsem hned neuvedl muj OS
    Red Hat 9
    perl-5.8.0-88.3
    locale default: cs_CZ.UTF-8
    takze tedy tam je zakopany pes?

    hm jasne, pri LANG=cs_CZ to funguje.
    takze se da rict, ze pokud chci nejak "funkcne" carovat s textem, mel bych zrejme s UTF v locale pockat?

    no kazdopadne diky moc za ochotu a peci :-)
    17.11.2003 21:28 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše spolehlive odstraneni diakritiky
    Mno, zkus napsat Pazdziorovi... Možná by mohl vydat alespoň nějakou verzi, která funguje jen s perlem >= 5.8.0, když už je tak obtížné, aby to fungovalo všude (což věřím, že je -- svoje programy v Perlu, které něco dělají s Unicode a převody znakových sad, běžně přepisuji při vydání každé nové verze Perlu ;-)
    16.1.2007 10:03 Bzzzwaa
    Rozbalit Rozbalit vše Re: spolehlive odstraneni diakritiky
    Pouzil jsem s uspechem program WinDia, ktery beha dobre ve Wine. Najdes ho na http://medved.braillnet.cz/freeware.htm
    16.1.2007 10:33 Fuck You | skóre: 16 | blog: NeOpToLeMoS
    Rozbalit Rozbalit vše Re: spolehlive odstraneni diakritiky
    Boooooooooooože - prečo tak zložito - a ešte aj pomocou wine (ako som to tu v nejakom príspevku čítal). A nestačilo by:

    recode --force utf8..flat $PrevadzanyText

    ???:-D
    16.1.2007 10:35 Fuck You | skóre: 16 | blog: NeOpToLeMoS
    Rozbalit Rozbalit vše Re: spolehlive odstraneni diakritiky
    Sakra - dal som sa nachytať - otvárame 3 roky staré témy?! :-D

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.