abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 11:22 | Bezpečnostní upozornění

    Úřad pro ochranu osobních údajů řeší desítky stížností na jednotné měsíční hlášení zaměstnavatele, které stát spustil počátkem dubna. Systém, jenž má firmám odlehčit od desítek formulářů, nejenže výrazně zatížil jejich účetní oddělení, ale docházelo v něm i k únikům osobních dat zaměstnanců k firmám, kde nepracovali. Podle ministerstva práce a sociálních věcí stála za problémem technická chyba. „Incident se týkal několika stovek

    … více »
    Ladislav Hagara | Komentářů: 3
    včera 10:46 | Nová verze

    Byla vydána (𝕏, Bluesky) nová verze 22.0.0 open source webového aplikačního frameworku Angular (Wikipedie). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    včera 04:33 | Nová verze

    Vim Classic byl vydán ve verzi 8.3. Drew DeVault oznámil tento fork editoru Vim (verze 8.2.0148, tj. těsně před zavedením Vim9 skriptování) v březnu letošního roku. Důvodem forku bylo, že vývojáři editorů Vim a Neovim začali při vývoji využívat LLM.

    Ladislav Hagara | Komentářů: 5
    včera 03:44 | Komunita

    Open source konference DevConf.CZ 2026 proběhne 18. a 19. června v Brně na FIT VUT. Publikován byl program a spuštěna byla registrace.

    Ladislav Hagara | Komentářů: 0
    3.6. 19:44 | Nová verze

    Společnost JetBrains uvolnila verzi 2 svého open-source velkého jazykového modelu (LLM) pro vývojáře Mellum.

    Ladislav Hagara | Komentářů: 0
    3.6. 14:44 | IT novinky

    Probíhá konference Microsoft Build 2026. Microsoft představuje své novinky: kvantový čip Majorana 2, Surface Laptop Ultra a Surface RTX Spark Dev Box s NVIDIA RTX Spark, Intelligent Terminal, Coreutils for Windows (fork Rust Coreutils), AI modely MAI, AI agenta Scout, platformu pro agent-first zařízení Project Solara, …

    Ladislav Hagara | Komentářů: 0
    3.6. 12:44 | Nová verze

    Google Chrome 149 byl prohlášen za stabilní. Nejnovější stabilní verze 149.0.7827.53 přináší řadu novinek. Podrobný přehled v poznámkách k vydání. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    3.6. 10:55 | Nová verze

    Pluto.jl, reaktivní notebook pro programovací jazyk Julia, dospěl do verze 1.0.

    Ladislav Hagara | Komentářů: 4
    2.6. 13:44 | Nová verze

    Byla vydána nová verze 12.0.0 vizuálního programovacího jazyka Snap! (Wikipedie) inspirovaného jazykem Scratch (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 0
    2.6. 11:44 | IT novinky

    Počítačovou hru Gravity Circuit (ProtonDB) lze do 14. června do 19:00 získat na Steamu zdarma. Napořád.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (15%)
     (31%)
     (4%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1817 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: Ako sa zbavit diakritiky

    22.4.2006 19:56 GeorgeWH | skóre: 42
    Ako sa zbavit diakritiky
    Přečteno: 548×
    Zdravim. Mam textovy subor (konfigurak k Postfixu), ktory obsahuje komentare s diakritikou, ktorej sa chcem zbavit. Ako "pretransformujem" pismena "ľ š ý á ..." na "l s y a ..."?

    file mi hodil: UTF-8 Unicode English text.

    Vdaka.

    Odpovědi

    vencour avatar 22.4.2006 20:32 vencour | skóre: 56 | blog: Tady je Vencourovo | Praha+západní Čechy
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky

    Muj laickej postup by byl otevřít v textovym editoru a pak nahradit všechny písmena (replace all) ... když už to nechcete dělat skriptem.

    Ty nejhlubší objevy nečekají nutně za příští hvězdou. Jsou uvnitř nás utkány do vláken, která nás spojují, nás všechny.
    22.4.2006 20:42 Martin Šebek | skóre: 18 | blog: Tady je Indiánovo | Mladá Boleslav
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky
    cstocs -i utf-8 ascii file_name
    22.4.2006 20:45 Pavel1 | skóre: 33
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky
    Další na překódování : iconv, recode.
    slackman avatar 23.4.2006 08:46 slackman | skóre: 13 | Praha
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky

    Moznosti je spousta, jde to treba takto:
    cat soubor1 | \
    tr áéěíóúůýžščřďťňľ aeeiouuyzscrdtnl > \
    soubor2

    Pokud chybi nejaka, treba velka pismena, staci doplnit.

    Nebo zkuste: skript cnv pro SED od L. Škarvady. Pro ziskani informaci o pouziti staci spustit:
    # ./cnv
    jen tak na prazdno bez parametru.

    mood = (machine != slackware) ? depressed : euphoria;
    Jan Zahornadsky avatar 23.4.2006 09:32 Jan Zahornadsky | skóre: 22 | blog: hans_blog
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky

    Moznosti je spousta, jde to treba takto:
    cat soubor1 | tr áéěíóúůýžščřďťňľ aeeiouuyzscrdtnl > soubor2

    Tohle jede i v utf8? Máš na to nějaký patch pro tr, po kterém to nahrazuje ne po osmibitových skupinách, ale po písmenech podle locale?
    Actually, I was half an hour into the pointer scripting documentation when she got dressed and left.
    slackman avatar 23.4.2006 10:19 slackman | skóre: 13 | Praha
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky

    No jo, nejak jsem prehlidnul ze se tady mluvi o utf8. Moc se omlouvam. Vtom pripadu asi nebude fungovat ani ta legracka cnv.

    mood = (machine != slackware) ? depressed : euphoria;
    23.4.2006 16:24 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky
    Odstranit diakritiku z UTF-8 není nic jednoduchého, protože substituce není vždy jednoznačná. Ale pro české znaky funguje toto:
    $ cat abeceda_cz
    áÁčČďĎěĚéÉíÍňŇóÓřŘšŠťŤúÚůŮýÝžŽ
    $ recode --force utf8..flat abeceda_cz
    $ cat abeceda_cz
    aAcCdDeEeEiInNoOrRsStTuUuUyYzZ
    
    Musí se dát parametr --force, protože jde o nevratné překódování.
    29.8.2006 10:29 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky
    Dalo by se to taky takhle:
    #!/usr/bin/env python
    
    import unicodedata
    
    old = u'ahojáÁčČďĎěĚéÉíÍňŇóÓřŘšŠťŤúÚůŮýÝžŽ'
    norm = unicodedata.normalize('NFKD', old)
    new = norm.encode('ascii', 'ignore')
    print old
    print new
    
    Výsledek:
    ahojáÁčČďĎěĚéÉíÍňŇóÓřŘšŠťŤúÚůŮýÝžŽ
    ahojaAcCdDeEeEiInNoOrRsStTuUuUyYzZ
    
    Základní myšlenka by měla fungovat pro jakékoli kódování.
    Opravdu nerad vytahuji staré vyřešené vlákno, ale momentálně nemám kam jinam bych si to zapsal ;-)
    hajma avatar 30.8.2006 07:28 hajma | skóre: 27 | blog: hajma | Říčany
    Rozbalit Rozbalit vše Re: Ako sa zbavit diakritiky
    na češtinu jsem to nezkoušel, ale z franštiny mi pomohlo uni2ascii
    21 promarněných znaků

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.