abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 21:33 | Komunita

    Fedora 40 release party v Praze proběhne v pátek 17. května od 18:30 v prostorách společnosti Etnetera Core na adrese Jankovcova 1037/49, Praha 7. Součástí bude program kratších přednášek o novinkách ve Fedoře.

    Ladislav Hagara | Komentářů: 5
    včera 21:11 | IT novinky

    Stack Overflow se dohodl s OpenAI o zpřístupnění obsahu Stack Overflow pro vylepšení OpenAI AI modelů.

    Ladislav Hagara | Komentářů: 1
    včera 17:55 | Nová verze

    AlmaLinux byl vydán v nové stabilní verzi 9.4 (Mastodon, 𝕏). S kódovým názvem Seafoam Ocelot. Přehled novinek v příspěvku na blogu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 17:11 | IT novinky

    Před 50 lety, 5. května 1974 v žurnálu IEEE Transactions on Communications, Vint Cerf a Bob Kahn popsali protokol TCP (pdf).

    Ladislav Hagara | Komentářů: 0
    včera 13:44 | Zajímavý článek

    Bylo vydáno do češtiny přeložené číslo 717 týdeníku WeeklyOSM přinášející zprávy ze světa OpenStreetMap.

    Ladislav Hagara | Komentářů: 0
    včera 04:00 | Nová verze

    Byla vydána (Mastodon, 𝕏) nová stabilní verze 2.10.38 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP je již k dispozici také na Flathubu.

    Ladislav Hagara | Komentářů: 6
    včera 00:22 | Komunita

    Google zveřejnil seznam 1220 projektů od 195 organizací (Debian, GNU, openSUSE, Linux Foundation, Haiku, Python, …) přijatých do letošního, již dvacátého, Google Summer of Code.

    Ladislav Hagara | Komentářů: 2
    5.5. 22:22 | IT novinky

    Na základě DMCA požadavku bylo na konci dubna z GitHubu odstraněno 8535 repozitářů se zdrojovými kódy open source emulátoru přenosné herní konzole Nintendo Switch yuzu.

    Ladislav Hagara | Komentářů: 7
    5.5. 00:33 | Nová verze

    Webový prohlížeč Dillo (Wikipedie) byl vydán ve verzi 3.1.0. Po devíti letech od vydání předchozí verze 3.0.5. Doména dillo.org již nepatří vývojářům Dilla.

    Ladislav Hagara | Komentářů: 0
    4.5. 15:00 | Komunita

    O víkendu probíhá v Bostonu, a také virtuálně, konference LibrePlanet 2024 organizovaná nadací Free Software Foundation (FSF).

    Ladislav Hagara | Komentářů: 0
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (63%)
     (8%)
     (14%)
     (15%)
    Celkem 127 hlasů
     Komentářů: 8, poslední 4.5. 08:25
    Rozcestník

    Dotaz: Tak jak to vypadá s podporou utf8?

    16.3.2004 18:11 Michal Kováč | skóre: 12 | Praha
    Tak jak to vypadá s podporou utf8?
    Přečteno: 258×
    Zajímalo by mě, jak to dnes vypadá s podporou utf8 v základních programech unixu jako je sed... já bych rád přešel na utf8, ale vadilo mi, že například příkaz fmt by na utf8 nefungoval. Pokud to náhodou už neni nějak upraveno, nevíte, zda se něco plánuje s tím udělat? Po pravdě řečeno uvědomuji si, že to je nelehký problém udělat to tak, aby se při tom zachovala zpětná kompatibilita.

    Škoda, že Linux od začátku nebyl udělán pro utf8.

    Odpovědi

    16.3.2004 19:00 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    Škoda, že Linux od začátku nebyl udělán pro utf8.

    Kdyby Linux od začátku používal pro všechno UTF-8, dnes by stále ještě vypadal tak, že by skupinka neznámých programátorů ladila nějaké buffer overflows v řetězcích :o)

    Ale vážně, při srovnání historie Unicode a Linuxu ti musí být jasné, že k tomu mohlo dojít stěží. Navíc s Linuxem (tj. jádrem) problémy s UTF-8 nemám, problematické jsou aplikace (opět často starší než Unicode).

    Sed mi funguje (mám GNU sed 4.0.8), alespoň tedy s///, nijak zvlášť jsem ho netestoval; fmt mi připadá, že ne.

    Nic se s tím neplánuje udělat. Nic se neudělá samo. Prostě se musí najít někdo, kdo s tím něco udělá (například ty), tj. přidá podporu vícebajtových znaků do programů, které ji zatím nemají. Pomáhá i posílat dobré bugreporty (hlavně pokud to nějak funguje, ale s chybami), např. chyba s ${x##y} a spol. v bashi, na kterou jsem si stěžoval, už byla opravena -- poté, co jsem poslal jasný bugreport...

    Pokud fmt (nebo podobná jednoduchá utilita) skutečně nefunguje s vícebajtovými znaky, tak to je IMHO ideální příležitost pro začínajícího programátora udělat něco užitečného (namísto třístého textového editoru nebo osmdesátého filemanageru).
    16.3.2004 19:16 Michal Kováč | skóre: 12 | Praha
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    ano, historie je mi jasna... ale skoda, ze utf8 nebylo driv

    No, ja si myslim, ze obecne, tak jak to v linuxu je ted, neni ani mozne, aby sed ci fmt umel sam od sebe rozpoznat, ze se jedna o vicebajtove znaky. Proto se mi zda i divne, ze by sed fungoval (napr. rozpoznal o kolik znaku jde). Jedine "reseni", jak me napada, by bylo, ze by "utf8" zacinalo nejakym specifickym retezcem...

    Nicmene sed i fmt by se dal jeste rozsirit o nejaky ten parametr a postupne prepsat vsechny programy, co je pouzivaji. Co je ale horsi, ze stejny problem je ve standardnich knihovnach na regularni vyrazy a ty pouziva hooodne programu.
    16.3.2004 19:18 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    neni ani mozne, aby sed ci fmt umel sam od sebe rozpoznat, ze se jedna o vicebajtove znaky

    No pozná to podle nastavených locales, jinak to asi nepůjde...
    16.3.2004 19:46 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    Ohledně locales ti už odpověděl druhý Michal ;-) a ohledně standardních knihoven a regulárních výrazů: v glibc je určitě kód pracující s wchar_t, libpcre by snad měla také pracovat s vícebajtovými znaky, pokud je skutečně perl-compatible...
    16.3.2004 20:31 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    Ony tedy takové značky existují, a to BOM (byte order marks). Existuje i UTF-8 BOM, i když v UTF-8 žádný jiný byte order není možný, protože znaky nemají pevný počet bajtů ... ovšem v praxi jsem je neviděl moc používat, obzvlášť ne u UTF-8. Kromě toho to má snad význam na celých souborech, ale představa, že by v shellu s sebou každé slovo tahalo BOM, je praštěná...
    16.3.2004 21:05 Michal Kováč | skóre: 12 | Praha
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    A pracuje to s locales? Nevim, jestli by to bylo spravne chovani... asi ano... nejdrive se mi vsak nezdalo - preci jen, zkyz clovek chce spoustet regularni vyraz na text, nevim zda predpoklada, ze musi byt ten text ve stejnem kodovani jako ma nastaveno uzivatel

    Jinak ja jsem vychazel ze stareho Unicode-HOWTO, ted jsem nasel novy a tam je doopravdy, ze od glibc 2.2 je podporovan

    dik za info, tak mozna precijen prejdu na utf8
    16.3.2004 21:24 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    Locale určuje, jakou znakovou sadu (kódování) používáš. Pracovat defaultně v ní asi proto nebude špatně...

    Jiná otázka je, jaké bys měl mít možnosti práce s textem v Big5, když je tvoje znaková sada KOI8-R, ale to bychom možná od fmt chtěli skutečně příliš, bežně se tyhle věci řeší lokální změnou locale jen pro ten konkrétní příkaz.
    16.3.2004 20:18 polov
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    me osobne nejvice stve, ze pod UTF-8 nefunguje Acrobat Reader...a Adobe se nejak nema k vyvoji...
    16.3.2004 21:10 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    Mě nepřipadalo, že by nefungoval, ale moc jsem to nezkoumal :-))
    17.3.2004 11:42 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
    Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?
    Funguje pod UTF-8 bez problémů.

    Akorát někdy vypisuje že nezná font nebo tak něco (přesnou hlášku již nevím) odstranění je nastavením proměnné LC_ALL na C.

    Takže na začátek skriptu kterým se spouští acrobatreader dodáme export LC_ALL=C. :-) viz:
    #!/bin/sh
    #
    export LC_ALL=C
    
    ver=5.0.6
    install_dir=/usr/local/Acrobat5/Reader
    
    #
    # Prepend a colon separated environment variable
    # $1 string to be prepended
    # $2 environment variable
    #
    prepend()
    {
    .........

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.