Portál AbcLinuxu, 14. května 2025 04:06

Dotaz: PDF do textu

5.4.2006 14:03 JFK
PDF do textu
Přečteno: 373×
Odpovědět | Admin
Ahoj, chtel bych se zeptat jestli nekdo nevi o nakem sikovnem programku, ktery by byl schopny z PDF-ka vytvorit textak a vystrihat z toho samostatne nekam obrazky. Uplne idealni by bylo kdyby to zvladl prekonvertovat rovnou do OO, ale to bych chtel uz asi moc ;-).

Zatim se mi nic podobneho nepovedlo sehnat.

Dik
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

5.4.2006 14:12 wlofy
Rozbalit Rozbalit vše Re: PDF do textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Existuje program pdf2txt ale je jenom pod windows ale funguje i pod wine. Dal existuje program se stejnym nazvem pro DOS ale ted na nej nemuzu najit odkaz. Pro linux o nicem nevim. Samozrejme taky zalezi co presne chces protoze muzes treba acrobatreaderu oznacit text a zkopirovat kam potrebujes, muze se ale stat ze pdf je zaheslovane a ktextu se takhle jednoduse nedostanes. Pak ti pomuze leda rozpoznavani textu treba finereader
5.4.2006 14:22 JFK
Rozbalit Rozbalit vše Re: PDF do textu
No ja potrebuju proste nak rychle a bezbolestne prekonvertovat normalni nezaheslovany PDFko do textaku, problem je v tom, ze tam je spousta grafu a tak, tak by bylo fajn, kdyby to umelo nak i ty obrazky nekam vystrihnout. Je toho fakt dost a vystrihovat v AcroR se mi to fakt nechce. pdf2txt jsem mel na svojem starem RadHat 7, ale ted to nemuzu jaksi najit a tusim, ze to neumelo pracovat s tema obrazkama.

Uplne idealni by bylo kdyby to umelo obraceny postup jako se v OO tvori PDF-ko z textu, tak opacne, aby tam bylo zachovano i neco z formatovani, ale jak rikam, tohle je asi sci-fi a bude mi bohate stacit jen kdyz to zvladne ty obrazky nak rozumne vytahnout ven.
5.4.2006 14:28 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: PDF do textu
Já jsem na tohle celkem úspěšně použil kwrite. I když výsledek nebyl přesně totéž, dalo se to zpracovat a použít.
5.4.2006 14:30 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: PDF do textu
Zasr.. doplňování formulářů...
5.4.2006 14:15 #Tom
Rozbalit Rozbalit vše Re: PDF do textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Z balíku XPDF lze použít pdftotext, i když jeho výstup bude s vysokou pravděpodobností na nic. No a na obrázky je pdfimages, okopíruje zevnítř JPEG a ostatní převede na PNM.
5.4.2006 14:17 Kníže Ignor | skóre: 19 | blog: stoupa
Rozbalit Rozbalit vše Re: PDF do textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Součástí xpdf je utilitka pdftotext, která pdf převede na textový soubor. Jak z pdf dostat obrázky nevím. Možná pomocí pdftohtml.
Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
5.4.2006 14:37 xkesh | skóre: 46 | blog: eXtempore
Rozbalit Rozbalit vše Re: PDF do textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Mam dojem, ze PDF je z principu format, ktery ma prave toto kopirovani a nasledne pouzivani v novem dokumentu ponekud ztizit, nebot ucelem je, aby prijemce (a jeho aplikace) co nejmene zobrazeni dokumentu ovlivnily, je nejjednodussi, pokud delate neco legalniho, pozadat autora dokumentu, aby vam poskytl podklady, z ktery PDF vytvarel, ve zpracovatelnem formatu.

Je mi jasne, ze nekdy to mozne neni, je podle me ale taky kravina, vymenovat ci zalohovat si dokumenty jako PDF, kdyz jsou urceny k dalsimu zpracovani. Casto takhle clovek vezme cizi PDF a doslova si to okopiruje do svoji prace... nevim, proc by tohle melo byt usnadnovano :P
5.4.2006 14:44 Kníže Ignor | skóre: 19 | blog: stoupa
Rozbalit Rozbalit vše Re: PDF do textu
Nemyslím, že by se tohle mělo řešit v diskuzích. Měly by tu být věcné odpovědi na věcné otázky. Morální/právní aspekt nechme vyřešit tazatele.

Zbraně nezabíjejí, zabíjejí lidé.
Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
5.4.2006 15:03 xkesh | skóre: 46 | blog: eXtempore
Rozbalit Rozbalit vše Re: PDF do textu
Nejde o moralku, jde o vhodne pouziti vhodnych prostredku ke stanovenemu cili. Aneb kdyz nekdo bude zadat radu, jake auto si poridit na cestu 1x za mesic, tak mu taky poradim, aby zapremyslel o taxiku. Alternativy k pozadovanemu reseni jsou taky odpovedi - a mnohdy z nich clovek profituje vic nez z vyreseni sve puvodni otazky ;)

Tak to aspon vidim ja.
5.4.2006 16:15 JFK
Rozbalit Rozbalit vše Re: PDF do textu
Ja mam zase dojem, ze PDF je ceneny predevsim kvuli sve prenositelnosti mezi operacnimi systemy a nemeni se jeho verze tak jako napriklas v MS Office. Ten kdo chce branit prenosu textu to jeste vetsinou zahesluje.

Ja konkretne resim problem, ze moje snoubenka dela ve statni sprave a ma pro naky zviratko napsat a zkompletovat do jedne zpravy nekolik dilcich sprav z ruznych resortu. Jenze jak uz to tak bejva, tak urednici jsou hovadka a kazdej tu svoji praci poslal v jinym formatu (necekane i v PDF). Bohuzel vyzadat si text v pouzitelne forme neni nekdy uplne mozne, kdo nekdy byl neco resit na uradu, tak urcite chape proc :-). To zviratko to chce v elektronicke forme a to v jednom dokumentu. Tak se snazim ji s tim nak pomoc aby se po vecerech mohla venovat i necemu jinemu ;-)

Tak to jen tak na vysvetlenou, abych nevypadal jako nakej zlodejicek. Jinak dik za vsechny odpovedi. To pdfimages jak se zdi si neumi poradit s PNG.
5.4.2006 15:00 Frankie
Rozbalit Rozbalit vše Re: PDF do textu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pdf2txt umí krásně součást XPDF http://www.foolabs.com/xpdf/ - utilitka pdf2text. Funguje pod windows i pod linuxem. Umí správně převádět i češtinu - narozdíl od množství win-shareware programů. XPDF má ještě pdfimages, která z pdf vyhází obrázky. Bohužel ale ne všechny. Myslím, že u vektorových obrázků to nezabírá. PS: K té češtině je potřeba ftp://ftp.foolabs.com/pub/xpdf/xpdf-latin2.tar.gz

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.