abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:22 | Nová verze

    Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.

    Ladislav Hagara | Komentářů: 0
    dnes 15:22 | Nová verze

    Byla vydána nová verze 258 správce systému a služeb systemd (GitHub).

    Ladislav Hagara | Komentářů: 4
    dnes 15:11 | Nová verze

    Byla vydána Java 25 / JDK 25. Nových vlastností (JEP - JDK Enhancement Proposal) je 18. Jedná se o LTS verzi.

    Ladislav Hagara | Komentářů: 0
    dnes 14:44 | Humor

    Věra Pohlová před 26 lety: „Tyhle aféry každého jenom otravují. Já bych všechny ty internety a počítače zakázala“. Jde o odpověď na anketní otázku deníku Metro vydaného 17. září 1999 na téma zneužití údajů o sporožirových účtech klientů České spořitelny.

    Ladislav Hagara | Komentářů: 1
    dnes 11:33 | Zajímavý článek Ladislav Hagara | Komentářů: 0
    včera 21:44 | Nová verze

    Byl vydán Mozilla Firefox 143.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově se Firefox při ukončování anonymního režimu zeptá, zda chcete smazat stažené soubory. Dialog pro povolení přístupu ke kameře zobrazuje náhled. Obzvláště užitečné při přepínání mezi více kamerami. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 143 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    včera 17:22 | Nová verze

    Byla vydána betaverze Fedora Linuxu 43 (ChangeSet), tj. poslední zastávka před vydáním finální verze, která je naplánována na úterý 21. října.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Nová verze

    Multiplatformní emulátor terminálu Ghostty byl vydán ve verzi 1.2 (𝕏, Mastodon). Přehled novinek, vylepšení a nových efektů v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 00:11 | Nová verze

    Byla vydána nová verze 4.5 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    15.9. 21:33 | Nová verze

    Byla vydána verze 3.0 (Mastodon) nástroje pro záznam a sdílení terminálových sezení asciinema (GitHub). S novou verzí formátu záznamu asciicast v3, podporou live streamingu a především kompletním přepisem z Pythonu do Rustu.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (45%)
     (73%)
     (0%)
     (9%)
     (9%)
     (9%)
     (18%)
     (0%)
     (18%)
    Celkem 11 hlasů
     Komentářů: 1, poslední dnes 13:49
    Rozcestník

    Dotaz: ncurses a utf-8

    9.8.2010 23:05 sallyx | skóre: 2
    ncurses a utf-8
    Přečteno: 452×
    Ahoj, mam problem s delkou retezcu v UTF-8. Nevite nahodou nekdo, jak vytisknout spravne retzce tak, aby byli zarovnany podle pozadovane delky? Viz priklad, prvni volani mvprintw funguje spravne, druhe spatne. Soubor je ulozen v kodovani UTF-8. Uz jsem z toho zoufaly :(

    #include stdio.h
    #include wchar.h
    #include locale.h
    #include curses.h
    #include stdlib.h
    #include string.h
    
    int uc; 
    
    int main(void)
    {
        wint_t ch; 
      if ((setlocale(LC_ALL, "") == NULL))
      {
        fprintf (stderr, "Nelze inicializovat locales.");
        exit(1);
      }
      initscr (); 
      noecho (); 
      keypad (stdscr, TRUE);    
    
        clear (); 
        mvprintw (4, 1, " %10i %10s %10s",55,"01234567","0123456");
        mvprintw (5, 1, " %10i %10s %10s\n",55,"Žluťásek","šeřeček");
    
        refresh (); 
    
        (void) get_wch(&ch);
        echo();
        endwin(); 
        return 0;
    }
    

    Odpovědi

    10.8.2010 17:32 anonym
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    Tak problém je v tom, že utf-8 je vícebajtové kódování, které zabírá 1-6 bytů, pro češtinu to však vychazí na 1-2 byty. Ve tvém příkladě je v obou řetězcích po třech českých znacích, tzn je potřeba připočítat 3 znaky do šířky.

    Nástin řešení je dole, dám 10 (tvoje šířka, co se má vytisknout) a přičtu k tomu rozdíl délky v bytech a počtu skutečných znaků. Asi by to chtělo vytknout do funkce a taky najít fci na převod mezi normálním řetězcem a řetězcem dlouhých znaků, abys každý řetězec nemusel mít dvakrát.
    ...
    #define A "Žluťásek"
    #define B "šeřeček"
    #define LA L"Žluťásek"
    #define LB L"šeřeček"
    ...
        mvprintw (5, 1, " %10i %*ls %*ls",55, 10 + strlen(A) - wcswidth(LA, 20), LA, 10 + strlen(B) - wcswidth(LB, 20), LB);
    ...
    Alternativně počkat na někoho, kdo tomu opravdu rozumí. ;-)
    10.8.2010 21:57 sallyx | skóre: 2
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    Tohle je přesně věc, které jsem se chtěl vyhnout :) Navic pro omezeni delky retezce na max. pocet znaku to fungovat nebude (umim si predstavit jak to upravit aby to fungovalo, ale ...).

    Doufal jsem, že to jde nějak jednoduššeji. Například pomocí funkce wprintf z knihovny wchar.h mohu napsat tohle:

    include stdio.h
    #include wchar.h
    #include locale.h
    #include stdlib.h
    
    int main(void)
    {
      if ((setlocale(LC_ALL, "") == NULL))
      {
        fprintf (stderr, "Nelze inicializovat locales.");
        exit(1);
      }
    
     if(fwide(stdout, 0) == 0) {
            if(fwide(stdout, 1) <= 0) {
                fprintf(stdout, "could not switch to wide char mode!\n");
                exit(1);
            }   
            else {
                wprintf(L"switched to wide char mode!\n");
            }   
     }
        wprintf(L" %10i %10s %.4s\n",55,"01234567","0123456");
        wprintf(L" %10i %10s %.4s\n",55,"Žluťásek","čeřešek");
        return 0;
    }
    

    To funguje OK, ale existuje neco takoveho i pro ncurses?
    10.8.2010 22:27 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: ncurses a utf-8

    Zklamu vás, ale ani wprintf() není dokonalé. Vy totiž nechcete určit počet unicodových znaků, ale počet znaků/bajtů, kolik se vejde do určitého počtu sloupců. A to závisí na konkrétních znacích (například všelijaké zvláštní znaky typu word-joiner, soft-hyphen nezabírají žádný sloupec) a na schopnostech terminálu (například japonské symboly se vypisují přes dva sloupce).

    A zklamu vás ještě víc, standardní céčková knihovna žádnou pěknou funkci na to nemá. Ale nabízí drobky, ze kterých se dá požadovaná funkcionalita poskládat.

    Řešil jsem to ve svém programu Šigofumi. Začíná to funkcí utf8width().

    Nicméně bych se podivoval, kdyby to ncursesw už neřešila.

    10.8.2010 23:31 sallyx
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    Nojo, máte pravdu, bohužel /: Také bych rád věřil, že ncursesw tohle nějak řeší, ale nevím jak, nikde jsem nic nevygooglil, tak se tu na to ptám. Pokud zanedbám japonské znaky, tak pro české národní prostředí my zatím nejhezčejc s ncurses vychází toto:
    wchar_t tmp[512];
    swprintf(tmp,sizeof(tmp)/sizeof(wchar_t),L" %20i '%20s' %.4s\n",55,"Žluťásek","šeřeček");
    mvprintw (6, 1, "%ls",tmp);
    swprintf(tmp,sizeof(tmp)/sizeof(wchar_t),L" %20i '%20s' %.4s\n",55,"以以以以","以以以以");
    mvprintw (6, 1, "%ls",tmp);
    
    Česká verze bude fungovat bez problémů, ale ta japonská ne .. Takže pokud nepřijde někdo s něčím lepším, mám jen 2 možnosti
    1. prohlásit program za ryze 'čengliš' a o jiné kódování se nestarat
    2. jít tou vaší cestou a sesmolit si podobné funkce
    Každopoádně díky za pomoc :)
    11.8.2010 15:10 anonym
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    A nebo taky použít mvprintw(y, x, ... pro každé "pole" míto řádku a neřešit takové věci.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.