abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

    včera 12:33 | Komunita

    Alex Ellis upozornil 15. března, že firma Docker se chystala zrušit bezplatný hosting open-source projektů na Docker Hubu. Po vlně odporu se představitelé firmy omluvili a posléze byl původní záměr odvolán.

    Fluttershy, yay! | Komentářů: 0
    včera 07:00 | IT novinky

    Ve věku 94 let zemřel Gordon Moore, mj. spoluzakladatel společnosti Intel a autor Moorova zákona.

    Ladislav Hagara | Komentářů: 1
    24.3. 17:11 | Nová verze

    Mercurial (Wikipedie), software pro SCM (Source Code Management), byl vydán ve verzi 6.4. Přehled novinek v poznámkách k vydání. Ve dnech 5. až 7. dubna proběhne konference Mercurial Paris.

    Ladislav Hagara | Komentářů: 0
    24.3. 11:55 | IT novinky

    Byly rozdány Ceny Velkého bratra (Big Brother Awards) za rok 2022 pro největší slídily pořádané nevládní organizací Iuridicum Remedium. Dlouhodobý slídil: Microsoft. Firemní slídil: Seznam. Úřední slídil: Nejvyšší správní soud. Výrok Velkého bratra: Marian Jurečka. Pozitivní cena: NoLog.

    Ladislav Hagara | Komentářů: 10
    24.3. 11:11 | Zajímavý projekt

    Byla představena online vzdělávací platforma Ada Computer Science pro učitele, studenty a kohokoli, kdo se zajímá o informatiku. Stojí za ní Raspberry Pi Foundation a Univerzita v Cambridgi.

    Ladislav Hagara | Komentářů: 0
    24.3. 09:11 | Bezpečnostní upozornění

    GitHub má nový RSA SSH klíč. Předchozí soukromý klíč byl krátce vystaven na GitHubu.

    Ladislav Hagara | Komentářů: 0
    24.3. 08:55 | IT novinky

    Společnost Framework Computer představila (YouTube) nové modulární notebooky: Laptop 13 s Intel Core nebo AMD Ryzen a Laptop 16 (YouTube).

    Ladislav Hagara | Komentářů: 0
    23.3. 19:33 | Nová verze

    Bylo vydáno Ubuntu 20.04.6 LTS, tj. šesté opravné vydání Ubuntu 20.04 LTS s kódovým názvem Focal Fossa. Přehled novinek v poznámkách k vydání a v přehledu změn.

    Ladislav Hagara | Komentářů: 2
    23.3. 14:44 | IT novinky

    Připojit neznámý USB flash disk do počítače může být nebezpečné. Dokonce může jít i o život. Někdo rozeslal ekvádorským novinářům USB flash disky, které po připojení do počítače explodují [BBC, Twitter].

    Ladislav Hagara | Komentářů: 2
    23.3. 13:33 | Nová verze

    Byla vydána nová verze 7.4 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu.

    Ladislav Hagara | Komentářů: 0
    Používáte WSL (Windows Subsystem for Linux)?
     (74%)
     (12%)
     (4%)
     (10%)
    Celkem 320 hlasů
     Komentářů: 4, poslední 24.3. 06:42
    Rozcestník


    Dotaz: ncurses a utf-8

    9.8.2010 23:05 sallyx | skóre: 2
    ncurses a utf-8
    Přečteno: 428×
    Ahoj, mam problem s delkou retezcu v UTF-8. Nevite nahodou nekdo, jak vytisknout spravne retzce tak, aby byli zarovnany podle pozadovane delky? Viz priklad, prvni volani mvprintw funguje spravne, druhe spatne. Soubor je ulozen v kodovani UTF-8. Uz jsem z toho zoufaly :(

    #include stdio.h
    #include wchar.h
    #include locale.h
    #include curses.h
    #include stdlib.h
    #include string.h
    
    int uc; 
    
    int main(void)
    {
        wint_t ch; 
      if ((setlocale(LC_ALL, "") == NULL))
      {
        fprintf (stderr, "Nelze inicializovat locales.");
        exit(1);
      }
      initscr (); 
      noecho (); 
      keypad (stdscr, TRUE);    
    
        clear (); 
        mvprintw (4, 1, " %10i %10s %10s",55,"01234567","0123456");
        mvprintw (5, 1, " %10i %10s %10s\n",55,"Žluťásek","šeřeček");
    
        refresh (); 
    
        (void) get_wch(&ch);
        echo();
        endwin(); 
        return 0;
    }
    

    Odpovědi

    10.8.2010 17:32 anonym
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    Tak problém je v tom, že utf-8 je vícebajtové kódování, které zabírá 1-6 bytů, pro češtinu to však vychazí na 1-2 byty. Ve tvém příkladě je v obou řetězcích po třech českých znacích, tzn je potřeba připočítat 3 znaky do šířky.

    Nástin řešení je dole, dám 10 (tvoje šířka, co se má vytisknout) a přičtu k tomu rozdíl délky v bytech a počtu skutečných znaků. Asi by to chtělo vytknout do funkce a taky najít fci na převod mezi normálním řetězcem a řetězcem dlouhých znaků, abys každý řetězec nemusel mít dvakrát.
    ...
    #define A "Žluťásek"
    #define B "šeřeček"
    #define LA L"Žluťásek"
    #define LB L"šeřeček"
    ...
        mvprintw (5, 1, " %10i %*ls %*ls",55, 10 + strlen(A) - wcswidth(LA, 20), LA, 10 + strlen(B) - wcswidth(LB, 20), LB);
    ...
    Alternativně počkat na někoho, kdo tomu opravdu rozumí. ;-)
    10.8.2010 21:57 sallyx | skóre: 2
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    Tohle je přesně věc, které jsem se chtěl vyhnout :) Navic pro omezeni delky retezce na max. pocet znaku to fungovat nebude (umim si predstavit jak to upravit aby to fungovalo, ale ...).

    Doufal jsem, že to jde nějak jednoduššeji. Například pomocí funkce wprintf z knihovny wchar.h mohu napsat tohle:

    include stdio.h
    #include wchar.h
    #include locale.h
    #include stdlib.h
    
    int main(void)
    {
      if ((setlocale(LC_ALL, "") == NULL))
      {
        fprintf (stderr, "Nelze inicializovat locales.");
        exit(1);
      }
    
     if(fwide(stdout, 0) == 0) {
            if(fwide(stdout, 1) <= 0) {
                fprintf(stdout, "could not switch to wide char mode!\n");
                exit(1);
            }   
            else {
                wprintf(L"switched to wide char mode!\n");
            }   
     }
        wprintf(L" %10i %10s %.4s\n",55,"01234567","0123456");
        wprintf(L" %10i %10s %.4s\n",55,"Žluťásek","čeřešek");
        return 0;
    }
    

    To funguje OK, ale existuje neco takoveho i pro ncurses?
    10.8.2010 22:27 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: ncurses a utf-8

    Zklamu vás, ale ani wprintf() není dokonalé. Vy totiž nechcete určit počet unicodových znaků, ale počet znaků/bajtů, kolik se vejde do určitého počtu sloupců. A to závisí na konkrétních znacích (například všelijaké zvláštní znaky typu word-joiner, soft-hyphen nezabírají žádný sloupec) a na schopnostech terminálu (například japonské symboly se vypisují přes dva sloupce).

    A zklamu vás ještě víc, standardní céčková knihovna žádnou pěknou funkci na to nemá. Ale nabízí drobky, ze kterých se dá požadovaná funkcionalita poskládat.

    Řešil jsem to ve svém programu Šigofumi. Začíná to funkcí utf8width().

    Nicméně bych se podivoval, kdyby to ncursesw už neřešila.

    10.8.2010 23:31 sallyx
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    Nojo, máte pravdu, bohužel /: Také bych rád věřil, že ncursesw tohle nějak řeší, ale nevím jak, nikde jsem nic nevygooglil, tak se tu na to ptám. Pokud zanedbám japonské znaky, tak pro české národní prostředí my zatím nejhezčejc s ncurses vychází toto:
    wchar_t tmp[512];
    swprintf(tmp,sizeof(tmp)/sizeof(wchar_t),L" %20i '%20s' %.4s\n",55,"Žluťásek","šeřeček");
    mvprintw (6, 1, "%ls",tmp);
    swprintf(tmp,sizeof(tmp)/sizeof(wchar_t),L" %20i '%20s' %.4s\n",55,"以以以以","以以以以");
    mvprintw (6, 1, "%ls",tmp);
    
    Česká verze bude fungovat bez problémů, ale ta japonská ne .. Takže pokud nepřijde někdo s něčím lepším, mám jen 2 možnosti
    1. prohlásit program za ryze 'čengliš' a o jiné kódování se nestarat
    2. jít tou vaší cestou a sesmolit si podobné funkce
    Každopoádně díky za pomoc :)
    11.8.2010 15:10 anonym
    Rozbalit Rozbalit vše Re: ncurses a utf-8
    A nebo taky použít mvprintw(y, x, ... pro každé "pole" míto řádku a neřešit takové věci.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.