abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 18:00 | Nová verze

    VirtualBox, tj. multiplatformní virtualizační software, byl vydán v nové verzi 7.2. Přehled novinek v Changelogu. Vypíchnou lze vylepšené GUI.

    Ladislav Hagara | Komentářů: 0
    včera 14:11 | IT novinky

    Eric Migicovsky, zakladatel společnosti Pebble, v lednu oznámil, že má v plánu spustit výrobu nových hodinek Pebble s již open source PebbleOS. V březnu spustil předprodej hodinek Pebble Time 2 (tenkrát ještě pod názvem Core Time 2) za 225 dolarů s dodáním v prosinci. Včera představil jejich konečný vzhled (YouTube).

    Ladislav Hagara | Komentářů: 2
    včera 12:44 | Zajímavý software

    Byla oznámena nativní podpora protokolu ACME (Automated Certificate Management Environment) ve webovém serveru a reverzní proxy NGINX. Modul nginx-acme je zatím v preview verzi.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Nová verze

    Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.08. Přehled novinek i s náhledy a videi v oficiálním oznámení.

    Ladislav Hagara | Komentářů: 0
    13.8. 11:55 | IT novinky

    Společnost Perplexity AI působící v oblasti umělé inteligence (AI) podala nevyžádanou nabídku na převzetí webového prohlížeče Chrome internetové firmy Google za 34,5 miliardy dolarů (zhruba 723 miliard Kč). Informovala o tom včera agentura Reuters. Upozornila, že výše nabídky výrazně převyšuje hodnotu firmy Perplexity. Společnost Google se podle ní k nabídce zatím nevyjádřila.

    Ladislav Hagara | Komentářů: 5
    13.8. 04:33 | Bezpečnostní upozornění

    Intel vydal 34 upozornění na bezpečnostní chyby ve svých produktech. Současně vydal verzi 20250812 mikrokódů pro své procesory řešící 6 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    13.8. 04:22 | Nová verze

    Byla vydána nová verze 1.25 programovacího jazyka Go (Wikipedie). Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 1
    12.8. 13:44 | Nová verze

    Byla vydána beta verze Linux Mintu 22.2 s kódovým jménem Zara. Podrobnosti v přehledu novinek a poznámkách k vydání. Vypíchnout lze novou XApp aplikaci Fingwit pro autentizaci pomocí otisků prstů nebo vlastní fork knihovny libAdwaita s názvem libAdapta podporující grafická témata. Linux Mint 22.2 bude podporován do roku 2029.

    Ladislav Hagara | Komentářů: 0
    12.8. 13:00 | IT novinky

    Provozovatel internetové encyklopedie Wikipedie prohrál v Británii soudní spor týkající se některých částí nového zákona o on-line bezpečnosti. Soud ale varoval britského regulátora Ofcom i odpovědné ministerstvo před zaváděním přílišných omezení. Legislativa zpřísňuje požadavky na on-line platformy, ale zároveň čelí kritice za možné omezování svobody slova. Společnost Wikimedia Foundation, která je zodpovědná za fungování

    … více »
    Ladislav Hagara | Komentářů: 2
    12.8. 12:55 | Nová verze

    Byla vydána verze 2.0.0 nástroje pro synchronizaci dat mezi vícero počítači bez centrálního serveru Syncthing (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 3
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (52%)
     (19%)
     (4%)
     (5%)
     (3%)
     (1%)
     (1%)
     (17%)
    Celkem 393 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Dotaz: RTF→TXT konvertor s podporou češtiny

    30.1.2012 13:14 redinsect
    RTF→TXT konvertor s podporou češtiny
    Přečteno: 656×
    Potřeboval bych nějaký konzolový program pro Linux, který by uměl převést RTF soubor na prostý TXT soubor, přičemž musí umět zpracovat i české znaky. Narazil jsem na unrtf, ale některé české znaky během konverze vynechává, podobně další programy, které jsem zkoušel.

    Máte prosím někdo tip na něco spolehlivého? Ta RTF, která budu zpracovávat, jsou z externích zdrojů a nemůžu je před samotným zpracováním nijak upravit.

    Odpovědi

    30.1.2012 17:01 Radovan Garabík
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    catdoc -scp1250 subor.rtf
    30.1.2012 23:54 Ondřej
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    Díky, ale nedaří se mi to zprovoznit. Mám stejný problém, který je popsaný na této stránce: http://forums.knowledgetree.org/viewtopic.php?f=6&t=1014 Uspokojivé řešení tam není (root nemám). Háže mi to chybu „Cannot load charset cp1251 - file not found”, předpokládám, že to vůbec nezná cestu ke složce charsets, s jiným kódováním to vyhodí stejnou chybu, jen se změní dané kódování.
    31.1.2012 13:50 Radovan Garabík
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    Používam catdoc z distribúcie, tam sú také veci vyriešené...
    30.1.2012 17:06 chrono
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    S unrtf som zatiaľ problémy nemal, a bez problémov som ním teraz do čistého textu previedol niekoľko rtf dokumentov v slovenčine a češtine.
    31.1.2012 00:02 Ondřej
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    Příloha:
    A můžeš prosím zkusit převést tenhle RTF soubor? http://leteckaposta.cz/445808888 (mě by být i v příloze) Já z toho dostanu „Přliš žluťčý ků pě ďbelské ódy”
    Josef Kufner avatar 31.1.2012 00:07 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    $ lowriter --nologo --convert-to html *.rtf 
    convert .../rich.rtf -> .../rich.html using XHTML Writer File
    $ lynx -dump *.html 
       Příliš žluťoučký kůň pěl ďábelské ódy
    $
    Hello world ! Segmentation fault (core dumped)
    31.1.2012 11:16 Ondřej
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    Díky, to jsem rád, že to aspoň někde funguje. Nicméně bych byl rád, pokud bych nemusel na server instalovat celý LibreOffice jen kvůli RTF konverzi. Ale asi to tak dopadne, jak to vidím…
    31.1.2012 18:41 chrono
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    Problém je, že unrtf vkladá znaky, ktoré sú v rtf súbore vložené ako unicode sekvencie (a teda \uxx), len do niektorých formátov (konkrétne len do html a rtf formátu). Netuším, prečo tam také obmedzenie je, pretože skonvertovať to do utf-8 nie je zložité a so znakmi vloženými pomocou sekvencie '\XX sa to tam tak robí.

    Ak by tam nebol ďalší problém, tak by fungovalo vygenerovanie html súboru s následným dump-om cez lynx. Problém ale je, že to nie celkom funguje.

    Zaujímavá časť kódu, pre tento problém je v súbore convert.c vo funkcii cmd_u. Tam je na konci poznámka, že ak vieme, ako interpretovať unicode znak, vo výstupnom formáte, preskočíme nasledujúce slovo. A presne to spôsobuje, že, minimálne pri tom priloženom rtf súbore, sa potom preskočia znaky, ktoré nasledujú za tými unicode znakmi (dokumentáciu k rtf formátu som nečítal, tekže netuším, či je problém unrtf, alebo program, ktorý ten rtf súbor vygeneroval).
    1.2.2012 13:03 Ondřej
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    Díky za objasnění :-). Já jsem to RTF vytvářel a ukládal na Macu, když jsem zkusil stáhnout nějaké RTF, které bylo nejspíš vytvořené na Windows, tak to fungovalo. Alespoň přes tu konverzi do HTML, když jsem tam rovnou dal —text, tak mi to zase místo některých znaků naházelo otazníky.
    31.1.2012 15:03 ikarr
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    asi v nich nebylo "ř" :-)

    možná by stačilo doplnit /usr/lib/unrtf/SYMBOL.charmap
    31.1.2012 15:14 ikarr
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    odpovím si sám, nestačilo.
    Josef Kufner avatar 30.1.2012 23:58 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny
    Pokud nenajdeš nic lepšího, tak použij LibreOffice:
    loffice --convert-to ...
    Nezkoušel jsem to, ale pokud to bude produkovat divně formátovaný text, tak to vem ještě skrz html a lynx.
    Hello world ! Segmentation fault (core dumped)
    31.1.2012 13:50 poko | skóre: 9
    Rozbalit Rozbalit vše Re: RTF→TXT konvertor s podporou češtiny

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.