abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 16:00 | IT novinky

Dnes v 19:00 začíná třídenní vývojářská konference Google I/O 2021. Na programu je řada zajímavých přednášek a workshopů. Sledovat je lze online. Záznamy budou k dispozici na YouTube na kanálu Google Developers. Dění na konferenci lze sledovat také na Twitteru.

Ladislav Hagara | Komentářů: 0
dnes 09:00 | Komunita

Google zveřejnil seznam 1 292 studentů přijatých do letošního, již sedmnáctého, Google Summer of Code. Přehled projektů, studentů, 199 organizací (Debian, openSUSE Project, Gentoo Foundation, Linux Foundation, GNOME Foundation, KDE Community, …) a mentorů je k dispozici na stránkách GSoC.

Ladislav Hagara | Komentářů: 0
dnes 08:00 | IT novinky

Byl spuštěn prodej vývojové desky Arduino Nano RP2040 Connect. Jedná se o Arduino Nano s mikrokontrolérem RP2040 z Raspberry Pi Pico, Wi-Fi, Bluetooth, IMU (Inertial Measurement Unit) a zabudovaným mikrofonem. Cena je 21 nebo 22 eur.

Ladislav Hagara | Komentářů: 1
včera 23:33 | IT novinky

Na Startovači běží kampaň Bulánci se vrací aneb kampaň na podporu vývoje nové verze 2.0 dnes již dvacetileté počítačové hry Bulánci (Wikipedie, YouTube). Požadováno je 500 000 Kč. Aktuálně je vybráno 1 205 835 Kč.

Ladislav Hagara | Komentářů: 10
včera 22:22 | IT novinky

Humble Bundle nabízí balík knih o programování v Pythonu od vydavatelství No Starch Press v digitální podobě bez DRM, a to za zvýhodněnou cenu aspoň 1-15 eur. Akce Humble Book Bundle: Learn You More Python by No Starch Press trvá do 7. června. Znovu je možné rozdělit cenu mezi vydavatele, provozovatele a charitu dle vlastního výběru poté, co se zvedla vlna nevole, když provozovatel tuto možnost omezil.

… více »
Fluttershy, yay! | Komentářů: 0
včera 16:33 | Nová verze

Byla vydána verze 9.2 open source unixového operačního systému NetBSD (Wikipedie). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
včera 16:11 | Zajímavý článek

V dubnu loňského roku přešla společnost Cloudflare z reCAPTCHA na hCAPTCHA. Dalším krokem by mělo být úplné zrušení CAPTCHA. Dle aktuálního příspěvku Lidstvo promrhá na CAPTCHA zhruba 500 let denně. Je čas toto šílenství ukončit na blogu Cloudflare by řešením mělo být použití kryptografických tokenů (YubiKey) nebo například rozšíření webových prohlížečů Privacy Pass a systému "Cryptographic Attestation of Personhood" vycházejícího z Web Authentication (WebAuthn) Attestation. Vyzkoušet lze na stránce Cloudflare Challenge.

Ladislav Hagara | Komentářů: 25
včera 13:33 | Zajímavý software

Byl představen projekt Lima aneb Linux-on-Mac ("macOS subsystem for Linux", "containerd for Mac"). Cílem projektu je přinést možnosti WSL (Windows Subsystem for Linux) na macOS [Hacker News].

Ladislav Hagara | Komentářů: 12
15.5. 17:44 | Nová verze

Společnost PINE64 stojící za telefonem PinePhone, notebooky Pinebook a Pinebook Pro, IP kamerou PineCube, hodinkami PineTime, páječkou (pájecím perem) Pinecil, zdroji PinePower nebo RISC-V vývojovou deskou PineCone publikovala na svém blogu květnový souhrn novinek (YouTube). Zmínit lze například prototyp klávesnice k PinePhonu, vybraný název PineDio pro PINE64 LoRA ekosystém nebo Fedora Linux na Pinebooku Pro.

Ladislav Hagara | Komentářů: 18
15.5. 16:33 | Zajímavý software

V prosinci loňského roku byl představen Rizin, fork frameworku pro reverzní inženýrství a analýzu binárních souborů radare2 (r2). Vývojáři Rizinu si vzali s sebou Cutter, do té doby grafickou nadstavbu nad radare2 (r2). Vývojáři radare2 (r2) tedy přejmenovali svou nadstavbu na r2cutter. Dnes je to už ale iaito. Vývojáři se vrátili ke jménu projektu (iaito), ze kterého vznikl Cutter.

Ladislav Hagara | Komentářů: 0
Transakční aktualizace
 (19%)
 (4%)
 (5%)
 (4%)
 (9%)
 (59%)
Celkem 191 hlasů
 Komentářů: 0
Rozcestník

Dotaz: Konverze PDF -> text

29.11.2004 15:59 Ondra
Konverze PDF -> text
Přečteno: 775×
Ahoj, potreboval bych zkonvertovat pdf na plaintext, vcetne cestiny v cp1250. Nevite nekdo, jak na to?

Odpovědi

29.11.2004 16:04 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jak bylo PDF vytvořeno? Obecná odpověď totiž je, že to nejde. Doporučuji prohledat archive konference cstex, kde se to nejednou řešilo.
29.11.2004 18:22 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Mimo jiné jsem se ptal i já a v praxi jsem si ověřil, že to nejde tak, aby byl výsledek reprezentativní. Pro pochopení textu ano, ale nepočítejte s tím, že by se tak daly chrlit txt verze pdf dokumentů.
Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
29.11.2004 16:47 misterlister | skóre: 12 | blog: aiyyo
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Zdravim,
spolecne s xpdf je dodavan pdftotext, muzete jej zkusit. Nicmene pokud jste mel na mysli konvertovani dokumentu, u nichz autor zakazal tisk, ci podobne veci, tak Vam asi nepomuze.
29.11.2004 18:14 finn | skóre: 43 | blog: finnlandia | 49° 44´/13° 22´
Rozbalit Rozbalit vše Re: Konverze PDF -> text
…nehledě na to, že si nedokáže poradit s českými znaky.
Užívej dne – možná je tvůj poslední.
29.11.2004 18:36 misterlister | skóre: 12 | blog: aiyyo
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Pri dobre konstelaci hvezd si s ceskymi znaky poradi (resp. podle me zkusenosti s pouzivanim tohoto programu, mam pocit, ze to souvisi se strukturou toho konkretniho pdf. Fundovane o tom mluvit nemohu.). Musite pouzit parametr -enc UTF-8. Vystupni soubor samozrejme bude kodovan v UTF-8, ale pokud je toto kodovani nezadouci, nemel by byt problem jej prekonvertovat.
29.11.2004 19:02 finn | skóre: 43 | blog: finnlandia | 49° 44´/13° 22´
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Pravda, s parametrem -layout jeví dokonce i snahu o zachování struktury dokumentu :)
Užívej dne – možná je tvůj poslední.
Valoun avatar 30.11.2004 02:54 Valoun | skóre: 30 | blog: Psavec | Středočeský kraj
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jako nahledovy rezim do midnighcommanderu je to idealni; napsal jsem si na to malinky skriptik.

#!/bin/sh
INFO=`pdfinfo "$1" 2>/dev/null`
FONTS=`pdffonts "$1" 2>/dev/null`
TEXT=`pdftotext -eol unix -layout "$1" - 2>/dev/null`
echo -e "$INFO\n\n$FONTS\n\n$TEXT"

Ten mi ve vysledku o predanem pdf vypise informace typu autor, verze pdf, vlozene fonty a vlastni obsah. Cestina je samozrejme problematicka.
29.11.2004 20:15 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jojo, když jsou u pdf ty věci zakázané, tak všechny programy, co jsou součástí xpdf tyto zákazy respektují, protože autor chce mít čisté svědomí. Nicméně lze stáhnout zdrojáky a v nich vyhledat něco jako

// check for print permission
if (!doc->okToPrint()) {
error(-1, "Printing this document is not allowed.");
exitCode = 3;
goto err1;
}

zakomentovat či smazat a překompilovat. A stydět se.
29.11.2004 20:24 Ondra
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Tak uz to mam: pdftotext samo me zakazalo to pdfko zkonvertovat, tak jednoduse stacilo (mam gentoo) USE="nodrm" emerge xpdf a vsechno funguje. No, ten kdo delal ten ebuild se asi moc nestydel.
11.2.2005 12:56 © | skóre: 37 | blog: escaped
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Ten zakaz tisku se da u xpdf obejit pri kompilaci. Je to tam primo od autora, nekde se to da vypnout, ale podrobnosti neznam.
11.2.2005 12:58 © | skóre: 37 | blog: escaped
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jejda, on už to sem někdo napsal :-) BTW: To s tím XPDF a zákazem tisku by možná patřilo do rubriky "Na co se často ptáme"...
30.11.2004 08:28 Tomáš | skóre: 30 | blog: Tomik
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jako alternativu k uvedeným vychytávkám bych uvedl balík pdftools. Je napsaný v javě. Nemám přesný odkaz, dávejte do Googlu hesla: Multivalent Document Tools (nadpis stránky), Extract Text v1.1, java tool.pdf.Extract [options] PDF-file(s). Snad něco vypadne.
11.2.2005 10:39 eirik
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Zkousel nekdo skript tvaru xpdf soubor.pbf | nocr >soubor.txt :-)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.