Portál AbcLinuxu, 12. května 2025 09:03

Dotaz: pdf -> odt/doc

24.7.2009 13:31 aafwer
pdf -> odt/doc
Přečteno: 637×
Odpovědět | Admin

ahojte, potrebujem pod ubuntu prekonvertovat PDF dokument do ODT alebo DOC formatu. Nic som na to nevyhladal v repozitaroch, co by ste odporucili?

 

dakujem

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Pavel Stárek avatar 24.7.2009 14:46 Pavel Stárek | skóre: 44 | blog: Tady bloguju já :-) | Kolín
Rozbalit Rozbalit vše Re: pdf -> odt/doc
Odpovědět | | Sbalit | Link | Blokovat | Admin
No pokud jde o to dostat z pdf jen text, tak je asi nejlepší nainstalovat balíček poppler-utils, který obsahuje prográmky pdftotext nebo pdftohtml. Jeho výstup pak nějak podvrhnout oowriteru.
Kdo chce, hledá způsob; kdo nechce, hledá důvod.
24.7.2009 15:14 aafwer
Rozbalit Rozbalit vše Re: pdf -> odt/doc

ano, to som nasiel ale mam tam problem s nasimi znakmi ščťž...diakritika.

25.7.2009 01:12 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: pdf -> odt/doc
No tak převést potom kodování recode ?
Pavel Stárek avatar 25.7.2009 09:45 Pavel Stárek | skóre: 44 | blog: Tady bloguju já :-) | Kolín
Rozbalit Rozbalit vše Re: pdf -> odt/doc
No já jsem to dělal nějak takhle pdftotext soubor.pdf soubor.txt -enc UTF-8 a výsledný txt soubor byl v kódování utf8. Ten pak lze dále pomocí recode nebo iconv zkonvertovat do jakéhokoliv jiného kódování.
Kdo chce, hledá způsob; kdo nechce, hledá důvod.
24.7.2009 15:31 xkesh | skóre: 46 | blog: eXtempore
Rozbalit Rozbalit vše Re: pdf -> odt/doc
Odpovědět | | Sbalit | Link | Blokovat | Admin
potrebujem pod ubuntu prekonvertovat PDF dokument do ODT alebo DOC
Jelikož jde o pseudoproblém (váš hlavní problém je sehnat si zdrojový dokument), tak doporučuju copy&paste ;-)
24.7.2009 22:44 marbu | skóre: 31 | blog: hromada | Brno
Rozbalit Rozbalit vše Re: pdf -> odt/doc
Odpovědět | | Sbalit | Link | Blokovat | Admin
Tak ciste teoreticky by mohlo pomoct neco jako unoconv, ale nezkousel jsem.
There is no point in being so cool in a cold world.
25.7.2009 10:08 Radovan Garabík
Rozbalit Rozbalit vše Re: pdf -> odt/doc
Odpovědět | | Sbalit | Link | Blokovat | Admin

Novšie (relatívne, pekných pár rokov) PDFká idú previesť na text bez problémov, ako to už bolo spomínané (±layout). V openoffice 3 sa dajú aj otvoriť (s istými omedzeniami).

Niekedy sa treba pohrať s kódovaním ligatúr (obzvlášť, ak prišli z TeXu), alebo s celou kódovou stránkou (TeX+azbuka).

Staršie PDF riešili písmená s diakritikou "po svojom" a tam je asi najjednoduchšie OCR.... 

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.