abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 03:11 | Nová verze

    Poštovní klient Thunderbird byl vydán v nové verzi 145.0. Podporuje DNS přes HTTPS nebo Microsoft Exchange skrze Exchange Web Services. Ukončena byla podpora 32bitového Thunderbirdu pro Linux.

    Ladislav Hagara | Komentářů: 0
    dnes 02:33 | IT novinky

    U příležitosti státního svátku 17. listopadu probíhá na Steamu i GOG.com již šestý ročník Czech & Slovak Games Week aneb týdenní oslava a také slevová akce českých a slovenských počítačových her.

    Ladislav Hagara | Komentářů: 0
    včera 19:33 | Nová verze

    Byla vydána nová verze 9.19 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Vypíchnout lze například nový balíček BirdNET-Go, tj. AI řešení pro nepřetržité monitorování a identifikaci ptáků.

    Ladislav Hagara | Komentářů: 0
    včera 02:22 | Nová verze

    Byla vydána nová verze 3.38 frameworku Flutter (Wikipedie) pro vývoj mobilních, webových i desktopových aplikací a nová verze 3.10 souvisejícího programovacího jazyka Dart (Wikipedie).

    Ladislav Hagara | Komentářů: 0
    včera 01:33 | Nová verze

    Organizace Apache Software Foundation (ASF) vydala verzi 28 integrovaného vývojového prostředí a vývojové platformy napsané v Javě NetBeans (Wikipedie). Přehled novinek na GitHubu. Instalovat lze také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 0
    15.11. 16:11 | Nová verze

    Byl vydán Debian 13.2, tj. druhá opravná verze Debianu 13 s kódovým názvem Trixie. Řešeny jsou především bezpečnostní problémy, ale také několik vážných chyb. Instalační média Debianu 13 lze samozřejmě nadále k instalaci používat. Po instalaci stačí systém aktualizovat.

    Ladislav Hagara | Komentářů: 0
    15.11. 12:11 | IT novinky

    Google představil platformu Code Wiki pro rychlejší porozumění existujícímu kódu. Code Wiki pomocí AI Gemini udržuje průběžně aktualizovanou strukturovanou wiki pro softwarové repozitáře. Zatím jenom pro veřejné. V plánu je rozšíření Gemini CLI také pro soukromé a interní repozitáře.

    Ladislav Hagara | Komentářů: 5
    14.11. 14:22 | Bezpečnostní upozornění

    V přihlašovací obrazovce LightDM KDE (lightdm-kde-greeter) byla nalezena a již opravena eskalace práv (CVE-2025-62876). Detaily v příspěvku na blogu SUSE Security.

    Ladislav Hagara | Komentářů: 5
    14.11. 13:22 | Nová verze

    Byla vydána nová verze 7.2 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Tor Browser byl povýšen na verzi 15.0.1. Další novinky v příslušném seznamu.

    Ladislav Hagara | Komentářů: 0
    14.11. 10:33 | IT novinky

    Česká národní banka (ČNB) nakoupila digitální aktiva založená na blockchainu za milion dolarů (20,9 milionu korun). Na vytvořeném testovacím portfoliu, jehož součástí jsou bitcoin, stablecoiny navázané na dolar a tokenizované depozitum, chce získat praktickou zkušenost s držením digitálních aktiv. Portfolio nebude součástí devizových rezerv, uvedla dnes ČNB v tiskové zprávě.

    Ladislav Hagara | Komentářů: 50
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (46%)
     (18%)
     (18%)
     (23%)
     (15%)
     (23%)
     (16%)
     (16%)
    Celkem 358 hlasů
     Komentářů: 16, poslední 12.11. 18:21
    Rozcestník

    Dotaz: Konverze PDF -> text

    29.11.2004 15:59 Ondra
    Konverze PDF -> text
    Přečteno: 841×
    Ahoj, potreboval bych zkonvertovat pdf na plaintext, vcetne cestiny v cp1250. Nevite nekdo, jak na to?

    Odpovědi

    29.11.2004 16:04 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Jak bylo PDF vytvořeno? Obecná odpověď totiž je, že to nejde. Doporučuji prohledat archive konference cstex, kde se to nejednou řešilo.
    29.11.2004 18:22 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Mimo jiné jsem se ptal i já a v praxi jsem si ověřil, že to nejde tak, aby byl výsledek reprezentativní. Pro pochopení textu ano, ale nepočítejte s tím, že by se tak daly chrlit txt verze pdf dokumentů.
    Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
    29.11.2004 16:47 misterlister | skóre: 12 | blog: aiyyo
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Zdravim,
    spolecne s xpdf je dodavan pdftotext, muzete jej zkusit. Nicmene pokud jste mel na mysli konvertovani dokumentu, u nichz autor zakazal tisk, ci podobne veci, tak Vam asi nepomuze.
    29.11.2004 18:14 finn | skóre: 43 | blog: finnlandia | 49° 44´/13° 22´
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    …nehledě na to, že si nedokáže poradit s českými znaky.
    Užívej dne – možná je tvůj poslední.
    29.11.2004 18:36 misterlister | skóre: 12 | blog: aiyyo
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Pri dobre konstelaci hvezd si s ceskymi znaky poradi (resp. podle me zkusenosti s pouzivanim tohoto programu, mam pocit, ze to souvisi se strukturou toho konkretniho pdf. Fundovane o tom mluvit nemohu.). Musite pouzit parametr -enc UTF-8. Vystupni soubor samozrejme bude kodovan v UTF-8, ale pokud je toto kodovani nezadouci, nemel by byt problem jej prekonvertovat.
    29.11.2004 19:02 finn | skóre: 43 | blog: finnlandia | 49° 44´/13° 22´
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Pravda, s parametrem -layout jeví dokonce i snahu o zachování struktury dokumentu :)
    Užívej dne – možná je tvůj poslední.
    Valoun avatar 30.11.2004 02:54 Valoun | skóre: 30 | blog: Psavec | Středočeský kraj
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Jako nahledovy rezim do midnighcommanderu je to idealni; napsal jsem si na to malinky skriptik.

    #!/bin/sh
    INFO=`pdfinfo "$1" 2>/dev/null`
    FONTS=`pdffonts "$1" 2>/dev/null`
    TEXT=`pdftotext -eol unix -layout "$1" - 2>/dev/null`
    echo -e "$INFO\n\n$FONTS\n\n$TEXT"

    Ten mi ve vysledku o predanem pdf vypise informace typu autor, verze pdf, vlozene fonty a vlastni obsah. Cestina je samozrejme problematicka.
    29.11.2004 20:15 Jan Martinek | skóre: 43 | blog: johny | Brno
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Jojo, když jsou u pdf ty věci zakázané, tak všechny programy, co jsou součástí xpdf tyto zákazy respektují, protože autor chce mít čisté svědomí. Nicméně lze stáhnout zdrojáky a v nich vyhledat něco jako

    // check for print permission
    if (!doc->okToPrint()) {
    error(-1, "Printing this document is not allowed.");
    exitCode = 3;
    goto err1;
    }

    zakomentovat či smazat a překompilovat. A stydět se.
    29.11.2004 20:24 Ondra
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Tak uz to mam: pdftotext samo me zakazalo to pdfko zkonvertovat, tak jednoduse stacilo (mam gentoo) USE="nodrm" emerge xpdf a vsechno funguje. No, ten kdo delal ten ebuild se asi moc nestydel.
    11.2.2005 12:56 © | skóre: 37 | blog: escaped
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Ten zakaz tisku se da u xpdf obejit pri kompilaci. Je to tam primo od autora, nekde se to da vypnout, ale podrobnosti neznam.
    11.2.2005 12:58 © | skóre: 37 | blog: escaped
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Jejda, on už to sem někdo napsal :-) BTW: To s tím XPDF a zákazem tisku by možná patřilo do rubriky "Na co se často ptáme"...
    30.11.2004 08:28 Tomáš | skóre: 31 | blog: Tomik
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Jako alternativu k uvedeným vychytávkám bych uvedl balík pdftools. Je napsaný v javě. Nemám přesný odkaz, dávejte do Googlu hesla: Multivalent Document Tools (nadpis stránky), Extract Text v1.1, java tool.pdf.Extract [options] PDF-file(s). Snad něco vypadne.
    11.2.2005 10:39 eirik
    Rozbalit Rozbalit vše Re: Konverze PDF -> text
    Zkousel nekdo skript tvaru xpdf soubor.pbf | nocr >soubor.txt :-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.