Portál AbcLinuxu, 12. května 2025 09:03
ahojte, potrebujem pod ubuntu prekonvertovat PDF dokument do ODT alebo DOC formatu. Nic som na to nevyhladal v repozitaroch, co by ste odporucili?
dakujem
ano, to som nasiel ale mam tam problem s nasimi znakmi ščťž...diakritika.
pdftotext soubor.pdf soubor.txt -enc UTF-8
a výsledný txt soubor byl v kódování utf8. Ten pak lze dále pomocí recode nebo iconv zkonvertovat do jakéhokoliv jiného kódování.
potrebujem pod ubuntu prekonvertovat PDF dokument do ODT alebo DOCJelikož jde o pseudoproblém (váš hlavní problém je sehnat si zdrojový dokument), tak doporučuju copy&paste
Novšie (relatívne, pekných pár rokov) PDFká idú previesť na text bez problémov, ako to už bolo spomínané (±layout). V openoffice 3 sa dajú aj otvoriť (s istými omedzeniami).
Niekedy sa treba pohrať s kódovaním ligatúr (obzvlášť, ak prišli z TeXu), alebo s celou kódovou stránkou (TeX+azbuka).
Staršie PDF riešili písmená s diakritikou "po svojom" a tam je asi najjednoduchšie OCR....
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.