abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 20:44 | Komunita

    openSUSE Leap 16, včetně Leap Micra 6.2+, nově nabízí 24 měsíců podpory pro každé vydání. To je dva roky aktualizací a stability, což z něj činí nejdéle podporovanou komunitní distribuci vůbec. Leap se tak stává ideální platformou pro všechny, kdo hledají moderní, stabilní a dlouhodobě podporovanou komunitní Linux distribuci.

    lkocman | Komentářů: 0
    dnes 16:33 | Bezpečnostní upozornění

    Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) vydal dne 3. 9. 2025 VAROVÁNÍ před hrozbou v oblasti kybernetické bezpečnosti spočívající v předávání systémových a uživatelských dat do Čínské lidové republiky a ve vzdálené správě technických aktiv vykonávané z území Čínské lidové republiky. Varováním se musí zabývat povinné osoby podle zákona o kybernetické bezpečnosti.

    Ladislav Hagara | Komentářů: 10
    dnes 11:55 | IT novinky

    Americká internetová společnost Google nemusí prodat svůj prohlížeč Chrome ani operační systém Android. Rozhodl o tom soud ve Washingtonu, který tak zamítl požadavek amerického ministerstva spravedlnosti. Soud ale firmě nařídil sdílet data s jinými podniky v zájmu posílení konkurence v oblasti internetového vyhledávání. Zároveň Googlu zakázal uzavírat dohody s výrobci mobilních a dalších zařízení, které by znemožňovaly

    … více »
    Ladislav Hagara | Komentářů: 3
    dnes 11:33 | Humor

    Prvního září ozbrojení policisté zatkli na na londýnském letišti Heathrow scénáristu a režiséra Grahama Linehana, známého především komediálními seriály Ajťáci, Otec Ted nebo Black Books. Během výslechu měl 57letý Graham nebezpečně zvýšený krevní tlak až na samou hranici mrtvice a proto byl z policejní stanice převezen do nemocnice. Důvodem zatčení bylo údajné podněcování násilí v jeho 'vtipných' příspěvcích na sociální síti

    … více »
    Gréta | Komentářů: 55
    dnes 10:22 | Pozvánky

    Studentská dílna Macgyver zve na další Virtuální Bastlírnu - pravidelné online setkání všech, kdo mají blízko k bastlení, elektronice, IT, vědě a technice. Letní prázdniny jsou za námi a je čas probrat novinky, které se přes srpen nahromadily. Tentokrát jich je více než 50! Těšit se můžete mimo jiné na:

    Hardware – Bus Pirate na ESP32, reverse engineering Raspberry Pi, pseudo-ZX-80 na RISC-V, PicoCalc, organizéry na nářadí z pěny nebo … více »
    bkralik | Komentářů: 0
    dnes 03:11 | Nová verze

    Google Chrome 140 byl prohlášen za stabilní. Nejnovější stabilní verze 140.0.7339.80 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 6 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    dnes 02:22 | Nová verze

    LeoCAD (Wikipedie) je svobodná multiplatformní aplikace umožňující také na Linuxu vytvářet virtuální 3D modely z kostek lega. Vydána byla verze 25.09. Zdrojové kódy a AppImage jsou k dispozici na GitHubu. Instalovat lze také z Flathubu.

    Ladislav Hagara | Komentářů: 1
    včera 21:00 | IT novinky

    RubyMine, tj. IDE pro Ruby a Rails od společnosti JetBrains, je nově zdarma pro nekomerční použití.

    Ladislav Hagara | Komentářů: 0
    včera 18:22 | Nová verze

    Český LibreOffice tým vydává překlad příručky LibreOffice Calc 25.2. Calc je tabulkový procesor kancelářského balíku LibreOffice. Příručka je ke stažení na stránce dokumentace.

    ZCR | Komentářů: 2
    včera 01:44 | Nová verze

    Byla vydána (Mastodon, 𝕏) vývojová verze 3.1.4 příští stabilní verze 3.2 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání.

    Ladislav Hagara | Komentářů: 0
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (81%)
     (8%)
     (2%)
     (3%)
     (4%)
     (1%)
    Celkem 134 hlasů
     Komentářů: 9, poslední 28.8. 11:53
    Rozcestník

    man2po2tmx2po2man \n bug

    16.8.2008 17:47 | Přečteno: 982× | man-pages-cs | poslední úprava: 16.8.2008 17:50

    Tento zápisek slouží pouze jako podklad pro bugreport. Navíc je anglicky.
    This entry is just an attachment to a bugreport. Nothing interesting here.

    My goal is to move the current Linux manual pages translation framework (translating to czech) to OmegaT. As OmegaT handles .properties and .po files only, I'm using po4a to transform the man pages to po files and back. To ease the transition I'm creating translation memories from existing translations using po2tmx.

    The original en/intro.1 looks like this:

    ...
    .BI "knuth login: " aeb
    .BI "Password: " ********
    .BI "% " date
    Tue Aug  6 23:50:44 CEST 2002
    .BI "% " cal
         August 2002
    Su Mo Tu We Th Fr Sa
                 1  2  3
     4  5  6  7  8  9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31
    
    .BI "% " ls
    ...
    
    Its czech translation cs/intro.1 looks like this:
    ...
    .BI "knuth login: " aeb
    .BI "Password: " ********
    .BI "% " date
    Út Srp  6 23:50:44 CEST 2002
    .BI "% " cal
         Srpen 2002
    Ne Po Út St Čt Pá So
                 1  2  3
     4  5  6  7  8  9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31
    
    .BI "% " ls
    ...
    

    This is how it looks when viewed using man en/intro.1 or man cs/intro.1:

    To create a po file from the man pages I use the following command:

    $ po4a-gettextize -f man -m en/intro.1 -l cs/intro.1 -L utf8 -p intro.1.po
    
    The relevant part of the created intro.1.po file looks like this:
    ...
    # type: Plain text
    #: en/intro.1:106
    #, fuzzy, no-wrap
    msgid ""
    "B<knuth login: >I<aeb>\n"
    "B<Password: >I<********>\n"
    "B<% >I<date>\n"
    "Tue Aug  6 23:50:44 CEST 2002\n"
    "B<% >I<cal>\n"
    "     August 2002\n"
    "Su Mo Tu We Th Fr Sa\n"
    "             1  2  3\n"
    " 4  5  6  7  8  9 10\n"
    "11 12 13 14 15 16 17\n"
    "18 19 20 21 22 23 24\n"
    "25 26 27 28 29 30 31\n"
    msgstr ""
    "B<knuth login: >I<aeb>\n"
    "B<Password: >I<********>\n"
    "B<% >I<date>\n"
    "Út Srp  6 23:50:44 CEST 2002\n"
    "B<% >I<cal>\n"
    "     Srpen 2002\n"
    "Ne Po Út St Čt Pá So\n"
    "             1  2  3\n"
    " 4  5  6  7  8  9 10\n"
    "11 12 13 14 15 16 17\n"
    "18 19 20 21 22 23 24\n"
    "25 26 27 28 29 30 31\n"
    ...
    
    I have to remove the ', fuzzy' indications that were automatically inserted by po4a, otherwise po2tmx would ignore all the messages:
    $ sed -i 's/, fuzzy//' intro.1.po
    
    Because of bug 2021007 in OmegaT, I also have to remove the strings ', no-wrap' from the po file:
    $ sed -i 's/, no-wrap//' intro.1.po
    
    Then I create a tmx file from the po file:
    $ po2tmx -l cs -i intro.1.po -o intro.1.tmx
    
    The relevant part of the intro.1.tmx file looks like this:
    ...
                    <tu>
                            <tuv xml:lang="en">
                                    <seg>B&lt;knuth login: &gt;I&lt;aeb&gt;
    B&lt;Password: &gt;I&lt;********&gt;
    B&lt;% &gt;I&lt;date&gt;
    Tue Aug  6 23:50:44 CEST 2002
    B&lt;% &gt;I&lt;cal&gt;
         August 2002
    Su Mo Tu We Th Fr Sa
                 1  2  3
     4  5  6  7  8  9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31
    </seg>
                            </tuv>
                            <tuv xml:lang="cs">
                                    <seg>B&lt;knuth login: &gt;I&lt;aeb&gt;
    B&lt;Password: &gt;I&lt;********&gt;
    B&lt;% &gt;I&lt;date&gt;
    Út Srp  6 23:50:44 CEST 2002
    B&lt;% &gt;I&lt;cal&gt;
         Srpen 2002
    Ne Po Út St Čt Pá So
                 1  2  3
     4  5  6  7  8  9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31
    </seg>
                            </tuv>
                    </tu>
    ...
    
    Then I launch OmegaT, select 'Project'->'New' and give 'manpagestest' as the new project's name. The Source files language is en-us, target language is cs. Sentence-level segmenting is disabled. I quit the project.
    Then I copy the tmx to the project:
    $ cp intro.1.tmx manpagestest/tm/
    
    Then I create an english po file from the original man page and place it to the source directory of the project:
    $ po4a-gettextize -f man -m en/intro.1 -p manpagestest/source/intro.1.po
    

    Then I launch OmegaT, open the manpagestest project and click on the intro.1.po file to edit it. When I change to the message containing the calendar, I can see that the suggested translation (based on the tmx) is not 100% as with other strings, it's only 67 % :

    Still hoping it will turn out ok I put the fuzzy match as new translation:

    save the project and click 'Project'->'Create translated documents'. I close OmegaT now.

    The relevant part of the translated manpagestest/target/intro.1.po file now looks like this:

    ...
    # type: Plain text
    #: en/intro.1:106
    #, no-wrap
    msgid ""
    "B<knuth login: >I<aeb>\n"
    "B<Password: >I<********>\n"
    "B<% >I<date>\n"
    "Tue Aug  6 23:50:44 CEST 2002\n"
    "B<% >I<cal>\n"
    "     August 2002\n"
    "Su Mo Tu We Th Fr Sa\n"
    "             1  2  3\n"
    " 4  5  6  7  8  9 10\n"
    "11 12 13 14 15 16 17\n"
    "18 19 20 21 22 23 24\n"
    "25 26 27 28 29 30 31\n"
    msgstr B<knuth login: >I<aeb>
    B<Password: >I<********>
    B<% >I<date>
    Út Srp  6 23:50:44 CEST 2002
    B<% >I<cal>
         Srpen 2002
    Ne Po Út St Čt Pá So
                 1  2  3
     4  5  6  7  8  9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31
    ...
    
    Obviously this is already wrong but for the sake of the experiment, I'm going on:
    $ po4a-translate -f man -m en/intro.1 -p manpagestest/target/intro.1.po -l intro.cs.1
    ...
    manpagestest/target/intro.1.po:134: (po4a::po)
    Strange line: --><--
    manpagestest/target/intro.1.po:165: (po4a::po)
    Strange line: -->msgstr B<knuth login: >I<aeb><--
    manpagestest/target/intro.1.po:166: (po4a::po)
    Strange line: -->B<Password: >I<********><--
    manpagestest/target/intro.1.po:167: (po4a::po)
    Strange line: -->B<% >I<date><--
    manpagestest/target/intro.1.po:168: (po4a::po)
    Strange line: -->Út Srp  6 23:50:44 CEST 2002<--
    manpagestest/target/intro.1.po:169: (po4a::po)
    Strange line: -->B<% >I<cal><--
    manpagestest/target/intro.1.po:170: (po4a::po)
    Strange line: -->     Srpen 2002<--
    manpagestest/target/intro.1.po:171: (po4a::po)
    Strange line: -->Ne Po Út St Čt Pá So<--
    manpagestest/target/intro.1.po:172: (po4a::po)
    Strange line: -->             1  2  3<--
    manpagestest/target/intro.1.po:173: (po4a::po)
    Strange line: --> 4  5  6  7  8  9 10<--
    manpagestest/target/intro.1.po:174: (po4a::po)
    Strange line: -->11 12 13 14 15 16 17<--
    manpagestest/target/intro.1.po:175: (po4a::po)
    Strange line: -->18 19 20 21 22 23 24<--
    manpagestest/target/intro.1.po:176: (po4a::po)
    Strange line: -->25 26 27 28 29 30 31<--
    manpagestest/target/intro.1.po:236: (po4a::po)
    Strange line: --><--
    manpagestest/target/intro.1.po:309: (po4a::po)
    Strange line: --><--
    ...
    
    as you can see, po4a complains about some extra blank lines in the file and also does not like at all the translated part. This is because po4a expects the message to have opening and closing doublequotes, and to have them on each line (a bug in OmegaT?). I fix that manually:
    $ cp manpagestest/target/intro.1.po manpagestest/target/intro.1.fixed.po
    $ vi manpagestest/target/intro.1.fixed.po
    $ cat manpagestest/target/intro.1.fixed.po
    ...
    # type: Plain text
    #: en/intro.1:106
    #, no-wrap
    msgid ""
    "B<knuth login: >I<aeb>\n"
    "B<Password: >I<********>\n"
    "B<% >I<date>\n"
    "Tue Aug  6 23:50:44 CEST 2002\n"
    "B<% >I<cal>\n"
    "     August 2002\n"
    "Su Mo Tu We Th Fr Sa\n"
    "             1  2  3\n"
    " 4  5  6  7  8  9 10\n"
    "11 12 13 14 15 16 17\n"
    "18 19 20 21 22 23 24\n"
    "25 26 27 28 29 30 31\n"
    msgstr "B<knuth login: >I<aeb>"
    "B<Password: >I<********>"
    "B<% >I<date>"
    "Út Srp  6 23:50:44 CEST 2002"
    "B<% >I<cal>"
    "     Srpen 2002"
    "Ne Po Út St Čt Pá So"
    "             1  2  3"
    " 4  5  6  7  8  9 10"
    "11 12 13 14 15 16 17"
    "18 19 20 21 22 23 24"
    "25 26 27 28 29 30 31"
    
    ...
    
    and retry:
    $ po4a-translate -f man -m en/intro.1 -p manpagestest/target/intro.1.fixed.po -l intro.cs.1
    
    The important part of the created intro.cs.1 looks like this:
    ...
    \fBknuth login: \fP\fIaeb\fP\fBPassword: \fP\fI********\fP\fB% \fP\fIdate\fPÚt Srp  6 23:50:44 CEST 2002\fB% \fP\fIcal\fP     Srpen 2002Ne Po Út St Čt Pá So             1  2  3 4  5  6  7  8  9 1011 12 13 14 15 16 1718 19 20 21 22 23 2425 26 27 28 29 30 31
    ...
    

    and this is how it looks when viewed with man ./intro.cs.1, i.e. badly:

    All the mentioned files are attached.

           

    Hodnocení: 40 %

            špatnédobré        

    Obrázky

    man2po2tmx2po2man \n bug, obrázek 1 man2po2tmx2po2man \n bug, obrázek 2 man2po2tmx2po2man \n bug, obrázek 3 man2po2tmx2po2man \n bug, obrázek 4 man2po2tmx2po2man \n bug, obrázek 5

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    hajma avatar 16.8.2008 17:49 hajma | skóre: 27 | blog: hajma | Říčany
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    Příloha:
    All the mentioned files are in the attachment.
    21 promarněných znaků
    16.8.2008 17:58 sssssssss | skóre: 15 | blog: cotoje
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    A ty si to nemůžeš uložit jinam než na abíčko? :-)
    hmm
    Limoto avatar 16.8.2008 18:05 Limoto | skóre: 32 | blog: Limotův blog
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    Třeba do bugzilly ábíčka :-D
    hajma avatar 16.8.2008 18:17 hajma | skóre: 27 | blog: hajma | Říčany
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    nó, ábíčko je pro mě nejpohodlnější ;-)

    samozřejmě jsem měl radši napsat něco o ruské invazi, ale být offtopic mi občas vyhovuje :-D
    21 promarněných znaků
    pavlix avatar 16.8.2008 19:27 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    No comment, chci být slušný :).
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    kotyz avatar 16.8.2008 19:26 kotyz | skóre: 25 | blog: kotyzblog | Plzeň
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    Nejde udelat aby tejden zacinal pondelim?
    Hrdý člen KERNEL ULTRAS. | Furry/Brony/Otaku | Nemám čas ztrácet čas. | In 'pacman -Syu' we trust!
    hajma avatar 16.8.2008 19:39 hajma | skóre: 27 | blog: hajma | Říčany
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    všechno jde. Manuálová stránka nicméně odráží skutečný stav věcí. Zkus nahlásit bug v util-linux-ng, kam příkaz cal patří.
    21 promarněných znaků
    16.8.2008 19:43 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    cal -m
    hajma avatar 16.8.2008 19:51 hajma | skóre: 27 | blog: hajma | Říčany
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    ale bylo by fajn, kdyby si to cal našel podle locale sám
    21 promarněných znaků
    16.8.2008 19:59 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    neviem o ziadnom LC_DATE
    David Watzke avatar 16.8.2008 20:01 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    AFAIK k tomu slouží LC_TIME.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
    16.8.2008 20:03 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    cas sa formatuje oddelene, datum sa formatuje oddelene a toto je este nieco uplne ine

    co by si nastavil, keby si chcel 24h cas a americke datumy?
    16.8.2008 20:01 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    a vobec, do toho by som to ani ja nezahrnul, s formatom datumu to tiez nema nic
    16.8.2008 21:05 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    Jde, dokonce to ve zdrojích je zakomentované. Jenže vyšší místa rozhodla, že by chování podle locale bylo v rozporu s manuálem a, co je horší, údajně i s POSIXem.

    Kdyby to někoho zajímalo, můžu sem hodit patch. Někde se mi válí na disku.
    16.8.2008 21:12 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: man2po2tmx2po2man \n bug
    Výborně. Konečně rozumný způsob, jak překládat manuál.

    Nicméně spárování originálu a překladu umí i po4a. Je přínosné se zlobit s OmegouT?

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.