Přihlášení | Registrace

napište » Zprávičky

ROCm 7.0.0

dnes 16:22 | Nová verze

Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.

Ladislav Hagara | Komentářů: 0

systemd 258

dnes 15:22 | Nová verze

Byla vydána nová verze 258 správce systému a služeb systemd (GitHub).

Ladislav Hagara | Komentářů: 4

Java 25 / JDK 25

dnes 15:11 | Nová verze

Byla vydána Java 25 / JDK 25. Nových vlastností (JEP - JDK Enhancement Proposal) je 18. Jedná se o LTS verzi.

Ladislav Hagara | Komentářů: 0

Věra Pohlová před 26 lety: „Já bych všechny ty internety a počítače zakázala“

dnes 14:44 | Humor

Věra Pohlová před 26 lety: „Tyhle aféry každého jenom otravují. Já bych všechny ty internety a počítače zakázala“. Jde o odpověď na anketní otázku deníku Metro vydaného 17. září 1999 na téma zneužití údajů o sporožirových účtech klientů České spořitelny.

Ladislav Hagara | Komentářů: 1

Výroční zpráva Blender Foundation za rok 2024

dnes 11:33 | Zajímavý článek

Byla publikována Výroční zpráva Blender Foundation za rok 2024 (pdf).

Ladislav Hagara | Komentářů: 0

Firefox 143.0

včera 21:44 | Nová verze

Byl vydán Mozilla Firefox 143.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově se Firefox při ukončování anonymního režimu zeptá, zda chcete smazat stažené soubory. Dialog pro povolení přístupu ke kameře zobrazuje náhled. Obzvláště užitečné při přepínání mezi více kamerami. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 143 bude brzy k dispozici také na Flathubu a Snapcraftu.

Ladislav Hagara | Komentářů: 0

Fedora Linux 43 Beta

včera 17:22 | Nová verze

Byla vydána betaverze Fedora Linuxu 43 (ChangeSet), tj. poslední zastávka před vydáním finální verze, která je naplánována na úterý 21. října.

Ladislav Hagara | Komentářů: 0

Ghostty 1.2

včera 12:22 | Nová verze

Multiplatformní emulátor terminálu Ghostty byl vydán ve verzi 1.2 (𝕏, Mastodon). Přehled novinek, vylepšení a nových efektů v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Godot 4.5

včera 00:11 | Nová verze

Byla vydána nová verze 4.5 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.

Ladislav Hagara | Komentářů: 0

asciinema CLI 3.0

15.9. 21:33 | Nová verze

Byla vydána verze 3.0 (Mastodon) nástroje pro záznam a sdílení terminálových sezení asciinema (GitHub). S novou verzí formátu záznamu asciicast v3, podporou live streamingu a především kompletním přepisem z Pythonu do Rustu.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (45%)

Gitlab (73%)

Atlassian (0%)

Bitbucket (9%)

Gitea (9%)

Mercurial (9%)

jen git (18%)

jen svn (0%)

Jiné (uvedu v diskusi) (18%)

Celkem 11 hlasů

Komentářů: 1, poslední dnes 13:49

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / ncurses a utf-8

Štítky: kódování, problém

Dotaz: ncurses a utf-8

9.8.2010 23:05 sallyx | skóre: 2
ncurses a utf-8

Přečteno: 452×

Odpovědět | Admin

Ahoj, mam problem s delkou retezcu v UTF-8. Nevite nahodou nekdo, jak vytisknout spravne retzce tak, aby byli zarovnany podle pozadovane delky? Viz priklad, prvni volani mvprintw funguje spravne, druhe spatne. Soubor je ulozen v kodovani UTF-8. Uz jsem z toho zoufaly :(

#include stdio.h
#include wchar.h
#include locale.h
#include curses.h
#include stdlib.h
#include string.h

int uc; 

int main(void)
{
    wint_t ch; 
  if ((setlocale(LC_ALL, "") == NULL))
  {
    fprintf (stderr, "Nelze inicializovat locales.");
    exit(1);
  }
  initscr (); 
  noecho (); 
  keypad (stdscr, TRUE);    

    clear (); 
    mvprintw (4, 1, " %10i %10s %10s",55,"01234567","0123456");
    mvprintw (5, 1, " %10i %10s %10s\n",55,"Žluťásek","šeřeček");

    refresh (); 

    (void) get_wch(&ch);
    echo();
    endwin(); 
    return 0;
}

Nástroje: Začni sledovat (1) ?

Odpovědi

10.8.2010 17:32 anonym
Rozbalit Rozbalit vše Re: ncurses a utf-8

Tak problém je v tom, že utf-8 je vícebajtové kódování, které zabírá 1-6 bytů, pro češtinu to však vychazí na 1-2 byty. Ve tvém příkladě je v obou řetězcích po třech českých znacích, tzn je potřeba připočítat 3 znaky do šířky.

Nástin řešení je dole, dám 10 (tvoje šířka, co se má vytisknout) a přičtu k tomu rozdíl délky v bytech a počtu skutečných znaků. Asi by to chtělo vytknout do funkce a taky najít fci na převod mezi normálním řetězcem a řetězcem dlouhých znaků, abys každý řetězec nemusel mít dvakrát.

...
#define A "Žluťásek"
#define B "šeřeček"
#define LA L"Žluťásek"
#define LB L"šeřeček"
...
    mvprintw (5, 1, " %10i %*ls %*ls",55, 10 + strlen(A) - wcswidth(LA, 20), LA, 10 + strlen(B) - wcswidth(LB, 20), LB);
...

Alternativně počkat na někoho, kdo tomu opravdu rozumí. ;-)

10.8.2010 21:57 sallyx | skóre: 2
Rozbalit Rozbalit vše Re: ncurses a utf-8

Tohle je přesně věc, které jsem se chtěl vyhnout :) Navic pro omezeni delky retezce na max. pocet znaku to fungovat nebude (umim si predstavit jak to upravit aby to fungovalo, ale ...).

Doufal jsem, že to jde nějak jednoduššeji. Například pomocí funkce wprintf z knihovny wchar.h mohu napsat tohle:

include stdio.h
#include wchar.h
#include locale.h
#include stdlib.h

int main(void)
{
  if ((setlocale(LC_ALL, "") == NULL))
  {
    fprintf (stderr, "Nelze inicializovat locales.");
    exit(1);
  }

 if(fwide(stdout, 0) == 0) {
        if(fwide(stdout, 1) <= 0) {
            fprintf(stdout, "could not switch to wide char mode!\n");
            exit(1);
        }   
        else {
            wprintf(L"switched to wide char mode!\n");
        }   
 }
    wprintf(L" %10i %10s %.4s\n",55,"01234567","0123456");
    wprintf(L" %10i %10s %.4s\n",55,"Žluťásek","čeřešek");
    return 0;
}

To funguje OK, ale existuje neco takoveho i pro ncurses?

10.8.2010 22:27 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: ncurses a utf-8

Zklamu vás, ale ani wprintf() není dokonalé. Vy totiž nechcete určit počet unicodových znaků, ale počet znaků/bajtů, kolik se vejde do určitého počtu sloupců. A to závisí na konkrétních znacích (například všelijaké zvláštní znaky typu word-joiner, soft-hyphen nezabírají žádný sloupec) a na schopnostech terminálu (například japonské symboly se vypisují přes dva sloupce).

A zklamu vás ještě víc, standardní céčková knihovna žádnou pěknou funkci na to nemá. Ale nabízí drobky, ze kterých se dá požadovaná funkcionalita poskládat.

Řešil jsem to ve svém programu Šigofumi. Začíná to funkcí utf8width().

Nicméně bych se podivoval, kdyby to ncursesw už neřešila.

10.8.2010 23:31 sallyx
Rozbalit Rozbalit vše Re: ncurses a utf-8

Nojo, máte pravdu, bohužel /: Také bych rád věřil, že ncursesw tohle nějak řeší, ale nevím jak, nikde jsem nic nevygooglil, tak se tu na to ptám. Pokud zanedbám japonské znaky, tak pro české národní prostředí my zatím nejhezčejc s ncurses vychází toto:

wchar_t tmp[512];
swprintf(tmp,sizeof(tmp)/sizeof(wchar_t),L" %20i '%20s' %.4s\n",55,"Žluťásek","šeřeček");
mvprintw (6, 1, "%ls",tmp);
swprintf(tmp,sizeof(tmp)/sizeof(wchar_t),L" %20i '%20s' %.4s\n",55,"以以以以","以以以以");
mvprintw (6, 1, "%ls",tmp);

Česká verze bude fungovat bez problémů, ale ta japonská ne .. Takže pokud nepřijde někdo s něčím lepším, mám jen 2 možnosti