Přihlášení | Registrace

napište » Zprávičky

včera 21:33 | Komunita

Fedora 40 release party v Praze proběhne v pátek 17. května od 18:30 v prostorách společnosti Etnetera Core na adrese Jankovcova 1037/49, Praha 7. Součástí bude program kratších přednášek o novinkách ve Fedoře.

Ladislav Hagara | Komentářů: 5

Dohoda mezi Stack Overflow a OpenAI

včera 21:11 | IT novinky

Stack Overflow se dohodl s OpenAI o zpřístupnění obsahu Stack Overflow pro vylepšení OpenAI AI modelů.

Ladislav Hagara | Komentářů: 1

AlmaLinux 9.4

včera 17:55 | Nová verze

AlmaLinux byl vydán v nové stabilní verzi 9.4 (Mastodon, 𝕏). S kódovým názvem Seafoam Ocelot. Přehled novinek v příspěvku na blogu a v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Vint Cerf a Bob Kahn před 50 lety popsali protokol TCP

včera 17:11 | IT novinky

Před 50 lety, 5. května 1974 v žurnálu IEEE Transactions on Communications, Vint Cerf a Bob Kahn popsali protokol TCP (pdf).

Ladislav Hagara | Komentářů: 0

WeeklyOSM CZ 717

včera 13:44 | Zajímavý článek

Bylo vydáno do češtiny přeložené číslo 717 týdeníku WeeklyOSM přinášející zprávy ze světa OpenStreetMap.

Ladislav Hagara | Komentářů: 0

GIMP 2.10.38

včera 04:00 | Nová verze

Byla vydána (Mastodon, 𝕏) nová stabilní verze 2.10.38 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP je již k dispozici také na Flathubu.

Ladislav Hagara | Komentářů: 6

1220 projektů přijatých do Google Summer of Code 2024

včera 00:22 | Komunita

Google zveřejnil seznam 1220 projektů od 195 organizací (Debian, GNU, openSUSE, Linux Foundation, Haiku, Python, …) přijatých do letošního, již dvacátého, Google Summer of Code.

Ladislav Hagara | Komentářů: 2

Z GitHubu bylo odstraněno 8535 repozitářů se zdrojovými kódy open source emulátoru yuzu

5.5. 22:22 | IT novinky

Na základě DMCA požadavku bylo na konci dubna z GitHubu odstraněno 8535 repozitářů se zdrojovými kódy open source emulátoru přenosné herní konzole Nintendo Switch yuzu.

Ladislav Hagara | Komentářů: 7

Dillo 3.1.0

5.5. 00:33 | Nová verze

Webový prohlížeč Dillo (Wikipedie) byl vydán ve verzi 3.1.0. Po devíti letech od vydání předchozí verze 3.0.5. Doména dillo.org již nepatří vývojářům Dilla.

Ladislav Hagara | Komentářů: 0

LibrePlanet 2024

4.5. 15:00 | Komunita

O víkendu probíhá v Bostonu, a také virtuálně, konference LibrePlanet 2024 organizovaná nadací Free Software Foundation (FSF).

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.

Jsem bot. (63%)

Jsem člověk. (8%)

Opravdu jsem člověk! (14%)

Jsem něco jiného. (15%)

Celkem 127 hlasů

Komentářů: 8, poslední 4.5. 08:25

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Tak jak to vypadá s podporou utf8?

Štítky: C, glibc, GNU, kernel, Linux, programování, sed

Dotaz: Tak jak to vypadá s podporou utf8?

16.3.2004 18:11 Michal Kováč | skóre: 12 | Praha
Tak jak to vypadá s podporou utf8?

Přečteno: 258×

Odpovědět | Admin

Zajímalo by mě, jak to dnes vypadá s podporou utf8 v základních programech unixu jako je sed... já bych rád přešel na utf8, ale vadilo mi, že například příkaz fmt by na utf8 nefungoval. Pokud to náhodou už neni nějak upraveno, nevíte, zda se něco plánuje s tím udělat? Po pravdě řečeno uvědomuji si, že to je nelehký problém udělat to tak, aby se při tom zachovala zpětná kompatibilita.

Škoda, že Linux od začátku nebyl udělán pro utf8.

Nástroje: Začni sledovat (1) ?

Odpovědi

16.3.2004 19:00 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

Škoda, že Linux od začátku nebyl udělán pro utf8.

Kdyby Linux od začátku používal pro všechno UTF-8, dnes by stále ještě vypadal tak, že by skupinka neznámých programátorů ladila nějaké buffer overflows v řetězcích :o)

Ale vážně, při srovnání historie Unicode a Linuxu ti musí být jasné, že k tomu mohlo dojít stěží. Navíc s Linuxem (tj. jádrem) problémy s UTF-8 nemám, problematické jsou aplikace (opět často starší než Unicode).

Sed mi funguje (mám GNU sed 4.0.8), alespoň tedy s///, nijak zvlášť jsem ho netestoval; fmt mi připadá, že ne.

Nic se s tím neplánuje udělat. Nic se neudělá samo. Prostě se musí najít někdo, kdo s tím něco udělá (například ty), tj. přidá podporu vícebajtových znaků do programů, které ji zatím nemají. Pomáhá i posílat dobré bugreporty (hlavně pokud to nějak funguje, ale s chybami), např. chyba s ${x##y} a spol. v bashi, na kterou jsem si stěžoval, už byla opravena -- poté, co jsem poslal jasný bugreport...

Pokud fmt (nebo podobná jednoduchá utilita) skutečně nefunguje s vícebajtovými znaky, tak to je IMHO ideální příležitost pro začínajícího programátora udělat něco užitečného (namísto třístého textového editoru nebo osmdesátého filemanageru).

16.3.2004 19:16 Michal Kováč | skóre: 12 | Praha
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

ano, historie je mi jasna... ale skoda, ze utf8 nebylo driv

No, ja si myslim, ze obecne, tak jak to v linuxu je ted, neni ani mozne, aby sed ci fmt umel sam od sebe rozpoznat, ze se jedna o vicebajtove znaky. Proto se mi zda i divne, ze by sed fungoval (napr. rozpoznal o kolik znaku jde). Jedine "reseni", jak me napada, by bylo, ze by "utf8" zacinalo nejakym specifickym retezcem...

Nicmene sed i fmt by se dal jeste rozsirit o nejaky ten parametr a postupne prepsat vsechny programy, co je pouzivaji. Co je ale horsi, ze stejny problem je ve standardnich knihovnach na regularni vyrazy a ty pouziva hooodne programu.

16.3.2004 19:18 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

neni ani mozne, aby sed ci fmt umel sam od sebe rozpoznat, ze se jedna o vicebajtove znaky

No pozná to podle nastavených locales, jinak to asi nepůjde...

Weblate - překládání přes web | Gammu SMSD - posílání SMS | Blog

16.3.2004 19:46 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

Ohledně locales ti už odpověděl druhý Michal ;-) a ohledně standardních knihoven a regulárních výrazů: v glibc je určitě kód pracující s wchar_t, libpcre by snad měla také pracovat s vícebajtovými znaky, pokud je skutečně perl-compatible...

16.3.2004 20:31 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

Ony tedy takové značky existují, a to BOM (byte order marks). Existuje i UTF-8 BOM, i když v UTF-8 žádný jiný byte order není možný, protože znaky nemají pevný počet bajtů ... ovšem v praxi jsem je neviděl moc používat, obzvlášť ne u UTF-8. Kromě toho to má snad význam na celých souborech, ale představa, že by v shellu s sebou každé slovo tahalo BOM, je praštěná...

16.3.2004 21:05 Michal Kováč | skóre: 12 | Praha
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

A pracuje to s locales? Nevim, jestli by to bylo spravne chovani... asi ano... nejdrive se mi vsak nezdalo - preci jen, zkyz clovek chce spoustet regularni vyraz na text, nevim zda predpoklada, ze musi byt ten text ve stejnem kodovani jako ma nastaveno uzivatel

Jinak ja jsem vychazel ze stareho Unicode-HOWTO, ted jsem nasel novy a tam je doopravdy, ze od glibc 2.2 je podporovan

dik za info, tak mozna precijen prejdu na utf8

16.3.2004 21:24 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

Locale určuje, jakou znakovou sadu (kódování) používáš. Pracovat defaultně v ní asi proto nebude špatně...

Jiná otázka je, jaké bys měl mít možnosti práce s textem v Big5, když je tvoje znaková sada KOI8-R, ale to bychom možná od fmt chtěli skutečně příliš, bežně se tyhle věci řeší lokální změnou locale jen pro ten konkrétní příkaz.

16.3.2004 20:18 polov
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

me osobne nejvice stve, ze pod UTF-8 nefunguje Acrobat Reader...a Adobe se nejak nema k vyvoji...

16.3.2004 21:10 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

Mě nepřipadalo, že by nefungoval, ale moc jsem to nezkoumal :-)

)

Weblate - překládání přes web | Gammu SMSD - posílání SMS | Blog

17.3.2004 11:42 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Tak jak to vypadá s podporou utf8?

Funguje pod UTF-8 bez problémů.

Akorát někdy vypisuje že nezná font nebo tak něco (přesnou hlášku již nevím) odstranění je nastavením proměnné LC_ALL na C.

Takže na začátek skriptu kterým se spouští acrobatreader dodáme export LC_ALL=C. :-)

viz:

#!/bin/sh
#
export LC_ALL=C

ver=5.0.6
install_dir=/usr/local/Acrobat5/Reader

#
# Prepend a colon separated environment variable
# $1 string to be prepended
# $2 environment variable
#
prepend()
{
.........

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje