abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 14:33 | IT novinky

    Společnost Flipper Devices oznámila Flipper One. Zcela nový Flipper postavený od nuly. Jedná se o open-source linuxovou platformu založenou na čipu Rockchip RK3576. Hledají se dobrovolníci pro pomoc s dokončením vývoje (ovladače, testování, tvorba modulů).

    Ladislav Hagara | Komentářů: 1
    dnes 14:00 | Nová verze

    Vývojáři Wine oznámili vydání verze 2.0 knihovny vkd3d pro překlad volání Direct3D na Vulkan. Přehled novinek na GitLabu.

    Ladislav Hagara | Komentářů: 0
    dnes 11:33 | Nová verze

    Společnost Red Hat oznámila vydání Red Hat Enterprise Linuxu (RHEL) 10.2 a 9.8. Vedle nových vlastností a oprav chyb přináší také aktualizaci ovladačů a předběžné ukázky budoucích technologií. Vypíchnout lze CLI AI asistenta goose. Podrobnosti v poznámkách k vydání (10.2 a 9.8).

    Ladislav Hagara | Komentářů: 0
    dnes 05:11 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 30 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 0
    dnes 05:00 | Nová verze

    Byla vydána nová verze 7.0 svobodného open source redakčního systému WordPress. Kódové jméno Armstrong bylo vybráno na počest amerického jazzového trumpetisty a zpěváka Louise Armstronga (What A Wonderful World).

    Ladislav Hagara | Komentářů: 0
    dnes 04:55 | Bezpečnostní upozornění

    V Drupalu byla nalezena a opravena kritická zranitelnost SA-CORE-2026-004 (CVE-2026-9082). Útočník může provádět libovolné SQL dotazy na webech používajících databázi PostgreSQL.

    Ladislav Hagara | Komentářů: 0
    včera 14:11 | Komunita

    Richard Hughes oznámil, že službu Linux Vendor Firmware Service (LVFS) umožňující aktualizovat firmware zařízení na počítačích s Linuxem, nově sponzoruje také společnost HP.

    Ladislav Hagara | Komentářů: 3
    včera 13:33 | IT novinky

    O víkendu proběhla demopárty Outline 2026. Publikována byla prezentovaná dema. Upozornit lze na 16 bajtové, opravdu šestnáct bajtové, zvukově obrazové demo Wake Up! 16b (YouTube).

    Ladislav Hagara | Komentářů: 2
    včera 04:22 | Nová verze

    Byla vydána nová verze 9.5 multiplatformní digitální pracovní stanice pro práci s audiem (DAW) Ardour. Přehled novinek, vylepšení a oprav v poznámkách k vydání a na YouTube.

    Ladislav Hagara | Komentářů: 0
    19.5. 21:00 | IT novinky

    Dnes a zítra probíhá vývojářská konference Google I/O 2026. Sledovat lze na YouTube a na síti 𝕏 (#GoogleIO).

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (8%)
     (2%)
     (14%)
     (31%)
     (4%)
     (7%)
     (3%)
     (16%)
     (26%)
    Celkem 1675 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: enca a CP1250

    7.2.2005 16:17 BillyThePilgrim
    enca a CP1250
    Přečteno: 654×
    Zdravim vsechny, zvlaste pak Yetiho (dotaz bude asi spis na nej ;-)

    Mam mensi problem s jednim programkem jmenem "enca". Jde o to, ze mi nejak odmita rozpoznat cokoliv, co je kodovano v CP-1250. Chtel jsem ho pouzit na prekodovani nazvu nekolika souboru, ale uspel jsem jenom castecne (cca 50%).

    Jednak nerozpoznal cokoliv v CP1250 (Unknown encoding, pri pokusu o enconv to hodi chybu: Cannot convert 'STDIN' from unknown encoding) a jednak u nekterych veci v ISO 8859-2 se mi snazil vnutit nejake pomerne jine (spatne) kodovani.

    Divne na tom je hlavne to, ze treba iconv zminene texty v CP1250 prevede na ISO vcelku bez problemu.

    Do zdrojaku enca jsem se nedival, ale docela by me zajimalo, odkud enca bere "vstupni" kodovani.

    Dalsi info o systemu:
    verze enca: puvodne 1.5 (gentoo), ted i 1.6
    system: gentoo, 2.6.10-gentoo-r4, v jadre NLS jak CP-1250, tak ISO a UTF
    locales:LC_ALL i LANG = cs_CZ (manualne udelane pomoci localedef -i cs_CZ -f ISO-8859-2 cs_CZ)
    font konzole: setfont "lat2-16" Predem dik za kazdy novy napad, ty moje uz mi dosly ;-)

    Odpovědi

    7.2.2005 17:03 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: enca a CP1250
    Zavěs někam testovací soubor. Nebo mi ho pošli mailem. No, ale když už jsi začal ve fóru, tak pokračujme zde...
    7.2.2005 18:08 BillyThePilgrim@seznam.cz
    Rozbalit Rozbalit vše Re: enca a CP1250
    http://jaja.kn.vutbr.cz/~hnilica2/CP1250.txt

    Tohle je vystup z konstrukce ve stylu find ... -exec ... "... echo $name | enca" > file Ty soubory s diakritikou maji nazvy normalne v CP1250 Jeste na doplneni - nehledej chybu v ence. Na notebooku mi to jede normalne. Na co ale nemuzu prijit je to, kde je chyba. locale je stejny (cs_CZ s ISO8859-2), v kernelu sou zakompilovany stejny NLS, neni to zadna FATka (ty soubory sou normalne na ext3) aby tam mohla byt chyba v iocharset. Proto by me zajimalo podle ceho enca zjistuje to kodovani...
    7.2.2005 18:21 Tomáš Hála | skóre: 39 | blog: blog
    Rozbalit Rozbalit vše Re: enca a CP1250
    Ty "ť" ve slově křesťan nevypadají zrovna na CP1250..
    7.2.2005 18:28 BillyThePilgrim
    Rozbalit Rozbalit vše Re: enca a CP1250
    Jo, to je mozny... netvrdim, ze je to vsechno 100% CP1250... neco asi neni... ale jde mi o to, ze to nerozpoznalo ani to, co CP1250 je 100% (BTW nepoustel sem to na celej soubor, ale na jednotlivy polozky)
    7.2.2005 18:28 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: enca a CP1250
    Tři věci.

    1. Detekční chování enca by mělo záviset na locale jen do té míry, že určuje defaultní jazyk a výstupní kódování, tudíž s explicitním optionem -L (případně -x) by nemělo záviset vůbec na ničem kromě vstupního textu. (Konverze naopak závisí úplně na všem ;-) Závisí-li, je to samo o sobě bug, ať už závisí jakkoli, a prosím v tom případě o detaily. Zkusil bych ještě find ... >soubor, přenést soubor a porovnat.

    2. Zdá se, že se snažíš detekovat kódování jmen jednotlivých skladeb. To moc dobře nefunguje, protože jsou velmi krátké a obsahují jen velmi málo písmen s diakritikou, takže statistické metody v enca nedávají spolehlivé výsledky.

    3. Řádek ./Robert Křesťan a Druhá Tráva/Disk 2/03 - Vrs<9d> se.mp3 zjevně obsahuje ť ve dvou různých kódováních zároveň, tudíž není v žádném konkrétním kódování.
    7.2.2005 18:31 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: enca a CP1250
    Tady je vidět, jak může špatná čeština úplně změnit smysl věty:

    s/protože jsou velmi krátké/protože jsou velmi krátká/

    (tj. jména skladeb, ne skladby).
    7.2.2005 18:37 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: enca a CP1250
    Dneska mi ty formulace opravdu nejdou... Řádek samozřejmě neobsahuje ť ve dvou různých kódováních zároveň (jak by to asi vypadalo?), ale jednoduše obsahuje ť ve dvou různých kódováních.
    7.2.2005 19:08 BillyThePilgrim@seznam.cz
    Rozbalit Rozbalit vše Re: enca a CP1250
    Ok, dik za odpoved... Zkusim to jeste porovnat s tim druhym kompem... napadlo me totiz, ze s nazvama adresaru na tom kompu kde mi to nejede jsem si uz predtim trochu hral (ISO <-> UTF), takze mozna by mohla byt zrada trochu v tom... Taky ty nemam uplne to samo na obou kompech (na tom kde to jede je jenom vyber - tzn. proto mozna ten rozdil v uspesnosti (cca 95% x cca 50%)). Zkusim to jeste projit trochu lip a jeste se ozvu (ale asi az behem zitrka)...
    Kazdopadne pokud ses vyznavacem "free beer" licence, mas u me pivo ;-) Vzhledem k tomu, ze ses z MUNI, tak nekdy dej vedet, k nam na koleje do Alterny to mas kousek ;-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.