abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 11:00 | Humor

Před týdnem byly zveřejněny informace o bezpečnostní chybě CVE-2018-10933 v knihovně libssh implementující protokol SSH. Autentizaci bylo možné jednoduše obejít odesláním zprávy SSH2_MSG_USERAUTH_SUCCESS. Chyba byla opravena v upstream verzích libssh 0.8.4 a 0.7.6. Chris Lamb, vedoucí projektu Debian, zveřejnil na Twitteru upravený komiks Cyanide & Happiness věnovaný této bezpečnostní chybě.

Ladislav Hagara | Komentářů: 0
dnes 10:22 | Komunita

Mozilla na svém blogu Future Releases oznámila spolupráci se švýcarskou společností Proton Technologies stojící za šifrovanou poštou ProtonMail a virtuální privátní sítí ProtonVPN. Právě službu ProtonVPN v ceně 10 dolarů měsíčně začne Mozilla od zítra postupně nabízet uživatelům Firefoxu v USA. Část peněz bude použita na další rozvoj Firefoxu.

Ladislav Hagara | Komentářů: 0
dnes 00:22 | Nová verze

Byla vydána verze 11.4 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab (Wikipedie). Představení nových vlastností i s náhledy v příspěvku na blogu.

Ladislav Hagara | Komentářů: 0
dnes 00:11 | Zajímavý článek

Jiří Eischmann se v příspěvku Datovka na Flathubu na svém blogu věnuje aplikaci Datovka, tj. multiplatformní desktopové aplikaci pro přístup k datovým schránkám a k trvalému uchovávání datových zpráv v lokální databázi, ve formátu Flatpak. Instalovat ji lze přímo z Flathubu.

Ladislav Hagara | Komentářů: 0
včera 22:55 | Komunita

Richard Stallman představil první verzi dokumentu s názvem GNU Kind Communication Guidelines s doporučeními pro přispěvatele do projektu GNU. Cílem doporučení je udržovat v komunitě přátelskou atmosféru.

Ladislav Hagara | Komentářů: 4
včera 22:22 | Nová verze

Byl vydán Linux 4.19. Jeho vývoj dokončil a vydání oficiálně oznámil Greg Kroah-Hartman, poněvadž si Linus Torvalds vzal před pěti týdny volno a rozhodl se zapracovat na svém chování. Ke kontroverznímu dokumentu Contributor Covenant Code of Conduct přibyla jeho interpretace Linux Kernel Contributor Covenant Code of Conduct Interpretation. Přehled nových vlastností a vylepšení Linuxu 4.19 na stránce Linux Kernel Newbies a samozřejmě v Jaderných novinách. Kódové jméno Linuxu bylo změněno z Merciless Moray na People's Front.

Ladislav Hagara | Komentářů: 5
včera 02:00 | Pozvánky

Konference OpenAlt 2018 (dříve LinuxAlt a Openmobility) proběhne již o víkendu 3. a 4. listopadu na FIT VUT v Brně. Motto konference je "Otevřeným přístupem k otevřené společnosti". Připraveno je 8 tracků přednášek a workshopů. Pořadatelé připravili výběr toho nejzajímavějšího.

Ladislav Hagara | Komentářů: 0
21.10. 01:00 | IT novinky

Bylo vydáno RFC 8484 řešící posílání DNS dotazů a získávání DNS odpovědí přes protokol HTTPS (DoH, DNS over HTTPS). V aktuálních verzích Firefoxu je DoH ve výchozím nastavení zakázáno. Povolit jej lze v about:config změnou hodnoty network.trr.mode (Trusted Recursive Resolver). V srpnu zveřejnila Mozilla výsledky experimentu s DNS přes HTTPS ve Firefoxu Nightly.

Ladislav Hagara | Komentářů: 50
19.10. 13:00 | Komunita

Při prvním spuštění Ubuntu 18.04 LTS (Bionic Beaver) je spuštěn nástroj Ubuntu Report. Pokud uživatel souhlasí, jsou pomocí tohoto nástroje odeslány do Canonicalu informace o daném počítači (doba instalace, počet procesorů, rozlišení displeje, velikost paměti, časová zóna, ...). V červnu byly zveřejněny první statistiky. Podrobnější statistiky jsou nově k dispozici na samostatné stránce.

Ladislav Hagara | Komentářů: 12
19.10. 01:00 | Pozvánky

O víkendu probíhá v Košicích pravidelné setkání příznivců otevřených technologií OSS Víkend. Na programu je řada zajímavých přednášek a workshopů.

Ladislav Hagara | Komentářů: 0
Přispíváte osobně k vývoji svobodného softwaru?
 (40%)
 (42%)
 (24%)
 (23%)
 (12%)
 (36%)
Celkem 286 hlasů
 Komentářů: 17, poslední včera 22:11
Rozcestník

Dotaz: Konverze PDF -> text

29.11.2004 15:59 Ondra
Konverze PDF -> text
Přečteno: 759×
Ahoj, potreboval bych zkonvertovat pdf na plaintext, vcetne cestiny v cp1250. Nevite nekdo, jak na to?

Odpovědi

29.11.2004 16:04 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jak bylo PDF vytvořeno? Obecná odpověď totiž je, že to nejde. Doporučuji prohledat archive konference cstex, kde se to nejednou řešilo.
29.11.2004 18:22 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Mimo jiné jsem se ptal i já a v praxi jsem si ověřil, že to nejde tak, aby byl výsledek reprezentativní. Pro pochopení textu ano, ale nepočítejte s tím, že by se tak daly chrlit txt verze pdf dokumentů.
Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
29.11.2004 16:47 misterlister | skóre: 12 | blog: aiyyo
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Zdravim,
spolecne s xpdf je dodavan pdftotext, muzete jej zkusit. Nicmene pokud jste mel na mysli konvertovani dokumentu, u nichz autor zakazal tisk, ci podobne veci, tak Vam asi nepomuze.
29.11.2004 18:14 finn | skóre: 42 | blog: finnlandia | 49° 44´/13° 22´
Rozbalit Rozbalit vše Re: Konverze PDF -> text
…nehledě na to, že si nedokáže poradit s českými znaky.
Užívej dne – možná je tvůj poslední.
29.11.2004 18:36 misterlister | skóre: 12 | blog: aiyyo
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Pri dobre konstelaci hvezd si s ceskymi znaky poradi (resp. podle me zkusenosti s pouzivanim tohoto programu, mam pocit, ze to souvisi se strukturou toho konkretniho pdf. Fundovane o tom mluvit nemohu.). Musite pouzit parametr -enc UTF-8. Vystupni soubor samozrejme bude kodovan v UTF-8, ale pokud je toto kodovani nezadouci, nemel by byt problem jej prekonvertovat.
29.11.2004 19:02 finn | skóre: 42 | blog: finnlandia | 49° 44´/13° 22´
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Pravda, s parametrem -layout jeví dokonce i snahu o zachování struktury dokumentu :)
Užívej dne – možná je tvůj poslední.
Valoun avatar 30.11.2004 02:54 Valoun | skóre: 30 | blog: Psavec | Středočeský kraj
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jako nahledovy rezim do midnighcommanderu je to idealni; napsal jsem si na to malinky skriptik.

#!/bin/sh
INFO=`pdfinfo "$1" 2>/dev/null`
FONTS=`pdffonts "$1" 2>/dev/null`
TEXT=`pdftotext -eol unix -layout "$1" - 2>/dev/null`
echo -e "$INFO\n\n$FONTS\n\n$TEXT"

Ten mi ve vysledku o predanem pdf vypise informace typu autor, verze pdf, vlozene fonty a vlastni obsah. Cestina je samozrejme problematicka.
29.11.2004 20:15 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jojo, když jsou u pdf ty věci zakázané, tak všechny programy, co jsou součástí xpdf tyto zákazy respektují, protože autor chce mít čisté svědomí. Nicméně lze stáhnout zdrojáky a v nich vyhledat něco jako

// check for print permission
if (!doc->okToPrint()) {
error(-1, "Printing this document is not allowed.");
exitCode = 3;
goto err1;
}

zakomentovat či smazat a překompilovat. A stydět se.
29.11.2004 20:24 Ondra
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Tak uz to mam: pdftotext samo me zakazalo to pdfko zkonvertovat, tak jednoduse stacilo (mam gentoo) USE="nodrm" emerge xpdf a vsechno funguje. No, ten kdo delal ten ebuild se asi moc nestydel.
11.2.2005 12:56 © | skóre: 37 | blog: escaped
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Ten zakaz tisku se da u xpdf obejit pri kompilaci. Je to tam primo od autora, nekde se to da vypnout, ale podrobnosti neznam.
11.2.2005 12:58 © | skóre: 37 | blog: escaped
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jejda, on už to sem někdo napsal :-) BTW: To s tím XPDF a zákazem tisku by možná patřilo do rubriky "Na co se často ptáme"...
30.11.2004 08:28 Tomáš | skóre: 30 | blog: Tomik
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Jako alternativu k uvedeným vychytávkám bych uvedl balík pdftools. Je napsaný v javě. Nemám přesný odkaz, dávejte do Googlu hesla: Multivalent Document Tools (nadpis stránky), Extract Text v1.1, java tool.pdf.Extract [options] PDF-file(s). Snad něco vypadne.
11.2.2005 10:39 eirik
Rozbalit Rozbalit vše Re: Konverze PDF -> text
Zkousel nekdo skript tvaru xpdf soubor.pbf | nocr >soubor.txt :-)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.