abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 17:50 | Komunita

Nadace The Document Foundation (TDF) zastřešující vývoj svobodného kancelářského balíku LibreOffice slaví 5 let od svého oficiálního vzniku. Nadace byla představena 28. září 2010. Formálně byla založena ale až 17. února 2012.

Ladislav Hagara | Komentářů: 0
dnes 12:50 | Komunita

Mozilla.cz informuje, že dosud experimentální funkce Page Shot z programu Firefox Test Pilot (zprávička) se stane součástí Firefoxu. Page Shot je nástroj pro vytváření snímků webových stránek. Umí výběr oblasti, prvku stránky (např. odstavce), nebo uložení snímku celé stránky. Snímky lze ukládat na disk nebo nahrávat na server Mozilly. Nedávno bylo oznámeno, že se součástí Firefoxu stane Activity Stream.

Ladislav Hagara | Komentářů: 2
dnes 04:10 | Nová verze

Po 10 týdnech vývoje od vydání Linuxu 4.9 (zprávička) oznámil Linus Torvalds, mj. již 20 let žijící v USA, vydání Linuxu 4.10 (LKML). Přehled nových vlastností a vylepšení například na Kernel Newbies a v Jaderných novinách (1, 2 a 3). Kódové jméno Linuxu 4.10 je Fearless Coyote.

Ladislav Hagara | Komentářů: 1
včera 15:55 | Zajímavý projekt

Vyzkoušet si příkazy a vyřešit několik úkolů lze na stránkách Commandline Challenge (CMD Challenge). Úkoly lze řešit různými způsoby, důležitý je výsledek. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

Ladislav Hagara | Komentářů: 16
18.2. 17:35 | Bezpečnostní upozornění

Německá Bundesnetzagentur (obdoba českého ČTU) zakázala na německém území prodej panenky Cayla kvůli „špionáži“ dětí. Tato elektronická hračka obsahuje mikrofon, reproduktor a kameru a bezdrátové komunikační rozhraní, pomocí kterého se hračka připojuje na servery výrobce. Takovýmto způsobem může hračka pomocí umělé inteligence „odpovídat“ na dotazy dítěte. Hlavní problém bude ale asi někde jinde, podle prvotních zpráv může

… více »
Petr Tomášek | Komentářů: 28
17.2. 15:30 | Bezpečnostní upozornění

CSIRT.CZ upozorňuje, že bezpečnostní experti objevili nový typ malwaru, jenž cílí na open source e-commerce platformu Magento. Malware je zajímavý tím, že se jedná o první svého druhu, jehož kód zůstává skrytý v SQL databázi zasaženého e-shopu. Škodlivý kód je volán pomocí tzv. SQL trigerru, který je spouštěn při každém vytvoření objednávky v systému.

Ladislav Hagara | Komentářů: 3
17.2. 09:00 | Nová verze

Bylo vydáno Ubuntu 16.04.2 LTS, tj. druhé opravné vydání Ubuntu 16.04 LTS s kódovým názvem Xenial Xerus. Přehled novinek v poznámkách k vydání a v přehledu změn.

Ladislav Hagara | Komentářů: 56
17.2. 06:00 | Zajímavý článek

Pavel Tišnovský se v dvoudílném článku na MojeFedora.cz věnuje tvorbě pluginů (modulů) pro bitmapový grafický editor GIMP. Pomocí pluginů lze GIMP rozšiřovat o další funkce. Implementovat lze například nové filtry nebo pomocné utility pro tvorbu animací či poloautomatickou retuš snímků.

Ladislav Hagara | Komentářů: 6
16.2. 23:32 | Komunita

Do 30. března se lze přihlásit do dalšího kola programu Outreachy, jehož cílem je přitáhnout do světa svobodného a otevřeného softwaru lidi ze skupin, jež jsou ve světě svobodného a otevřeného softwaru málo zastoupeny. Za 3 měsíce práce, od 30. května do 30. srpna 2017, v participujících organizacích lze vydělat 5 500 USD. Jedná se již o 14. kolo tohoto programu.

Ladislav Hagara | Komentářů: 11
16.2. 23:13 | Nová verze

Byla vydána verze 0.92.1 svobodného multiplatformního vektorového grafického editoru Inkscape. Přehled novinek v poznámkách k vydání. Řešen je mimo jiné problém s verzí 0.92, jež rozbíjí dokumenty vytvořené v předchozích verzích Inkscape. Více v příspěvku na blogu Davida Revoye, autora open source webového komiksu Pepper&Carrot nebo portrétu GNU/Linuxu.

Ladislav Hagara | Komentářů: 0
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (13%)
 (2%)
 (72%)
 (3%)
 (10%)
Celkem 666 hlasů
 Komentářů: 53, poslední dnes 18:38
Rozcestník
Reklama

Dotaz: Konverze PDF -> text

29.11.2004 15:59 Ondra
Konverze PDF -> text
Přečteno: 754×
Ahoj, potreboval bych zkonvertovat pdf na plaintext, vcetne cestiny v cp1250. Nevite nekdo, jak na to?

Odpovědi

29.11.2004 16:04 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jak bylo PDF vytvořeno? Obecná odpověď totiž je, že to nejde. Doporučuji prohledat archive konference cstex, kde se to nejednou řešilo.
29.11.2004 18:22 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Mimo jiné jsem se ptal i já a v praxi jsem si ověřil, že to nejde tak, aby byl výsledek reprezentativní. Pro pochopení textu ano, ale nepočítejte s tím, že by se tak daly chrlit txt verze pdf dokumentů.
Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
29.11.2004 16:47 Marek Hnilica | skóre: 12 | blog: aiyyo | Říčany
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Zdravim,
spolecne s xpdf je dodavan pdftotext, muzete jej zkusit. Nicmene pokud jste mel na mysli konvertovani dokumentu, u nichz autor zakazal tisk, ci podobne veci, tak Vam asi nepomuze.
29.11.2004 18:14 finn | skóre: 42 | blog: finnlandia | 49° 44´/13° 22´
Rozbalit Rozbalit vše Re: Konverze PDF -> text
…nehledě na to, že si nedokáže poradit s českými znaky.
Užívej dne – možná je tvůj poslední.
29.11.2004 18:36 Marek Hnilica | skóre: 12 | blog: aiyyo | Říčany
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Pri dobre konstelaci hvezd si s ceskymi znaky poradi (resp. podle me zkusenosti s pouzivanim tohoto programu, mam pocit, ze to souvisi se strukturou toho konkretniho pdf. Fundovane o tom mluvit nemohu.). Musite pouzit parametr -enc UTF-8. Vystupni soubor samozrejme bude kodovan v UTF-8, ale pokud je toto kodovani nezadouci, nemel by byt problem jej prekonvertovat.
29.11.2004 19:02 finn | skóre: 42 | blog: finnlandia | 49° 44´/13° 22´
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Pravda, s parametrem -layout jeví dokonce i snahu o zachování struktury dokumentu :)
Užívej dne – možná je tvůj poslední.
Valoun avatar 30.11.2004 02:54 Valoun | skóre: 30 | blog: Psavec | Středočeský kraj
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jako nahledovy rezim do midnighcommanderu je to idealni; napsal jsem si na to malinky skriptik.

#!/bin/sh
INFO=`pdfinfo "$1" 2>/dev/null`
FONTS=`pdffonts "$1" 2>/dev/null`
TEXT=`pdftotext -eol unix -layout "$1" - 2>/dev/null`
echo -e "$INFO\n\n$FONTS\n\n$TEXT"

Ten mi ve vysledku o predanem pdf vypise informace typu autor, verze pdf, vlozene fonty a vlastni obsah. Cestina je samozrejme problematicka.
29.11.2004 20:15 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jojo, když jsou u pdf ty věci zakázané, tak všechny programy, co jsou součástí xpdf tyto zákazy respektují, protože autor chce mít čisté svědomí. Nicméně lze stáhnout zdrojáky a v nich vyhledat něco jako

// check for print permission
if (!doc->okToPrint()) {
error(-1, "Printing this document is not allowed.");
exitCode = 3;
goto err1;
}

zakomentovat či smazat a překompilovat. A stydět se.
29.11.2004 20:24 Ondra
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Tak uz to mam: pdftotext samo me zakazalo to pdfko zkonvertovat, tak jednoduse stacilo (mam gentoo) USE="nodrm" emerge xpdf a vsechno funguje. No, ten kdo delal ten ebuild se asi moc nestydel.
11.2.2005 12:56 © | skóre: 37 | blog: escaped
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Ten zakaz tisku se da u xpdf obejit pri kompilaci. Je to tam primo od autora, nekde se to da vypnout, ale podrobnosti neznam.
11.2.2005 12:58 © | skóre: 37 | blog: escaped
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jejda, on už to sem někdo napsal :-) BTW: To s tím XPDF a zákazem tisku by možná patřilo do rubriky "Na co se často ptáme"...
30.11.2004 08:28 Tomáš | skóre: 29 | blog: Tomik
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jako alternativu k uvedeným vychytávkám bych uvedl balík pdftools. Je napsaný v javě. Nemám přesný odkaz, dávejte do Googlu hesla: Multivalent Document Tools (nadpis stránky), Extract Text v1.1, java tool.pdf.Extract [options] PDF-file(s). Snad něco vypadne.
11.2.2005 10:39 eirik
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Zkousel nekdo skript tvaru xpdf soubor.pbf | nocr >soubor.txt :-)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.