abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 21:11 | Nová verze

Byla vydána nová major verze 3.0.0 open source dokumentově orientované NoSQL databáze Apache CouchDB (Wikipedie). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
včera 17:33 | Komunita

Sketchfab, tj. platforma pro publikování, sdílení, objevování, nákup i prodej 3D modelů, ve spolupráci s 27 kulturními organizacemi z 13 různých zemí, oznámil spuštění programu na uchování 3D modelů předmětů kulturního dědictví jako volných děl (Public Domain). Organizace nahrávající své 3D modely na Sketchfab mohou nově použít licenci CC0 1.0 Univerzální (CC0 1.0) a tím potvrdit status volného díla. Podrobnosti v diskusním fóru. Aktuálně je na Sketchfabu pod CC0 cca 1700 modelů.

Ladislav Hagara | Komentářů: 1
včera 16:00 | Nová verze

Byla vydána nová verze 1.4.95 webového prohlížeče Brave (Wikipedie, GitHub). Vychází z Chromia 80.0.3987.122 a nově při nenalezení webové stránky nabídne její kopii z Wayback Machine. Podrobnosti v příspěvku na blogu Internet Archive.

Ladislav Hagara | Komentářů: 1
včera 13:33 | Zajímavý článek

Mozilla.cz informuje o veselých i smutných zprávách o WebThings Gateway. Před necelými dvěma týdny spatřila světlo světa WebThings Gateway 0.11 s oficiální českou lokalizací. Pravděpodobně v návaznosti na horší finanční výsledky za minulý rok, které vyústily i v docela velké propouštění, se Mozilla rozhodla v roce 2020 necílit na vydání žádného komerčního produktu, který by z WebThings vycházel. S okamžitou platností byla ukončena

… více »
Ladislav Hagara | Komentářů: 2
včera 06:00 | Nová verze

Po půl roce vývoje od vydání verze 1.13 byla vydána nová verze 1.14 programovacího jazyka Go (Wikipedie). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
25.2. 22:33 | IT novinky

Mozilla na svém blogu oznámila, že dnešním dnem postupně zapíná uživatelům Firefoxu v USA DNS přes HTTPS (DoH). Jedná se o výchozí nastavení. Odpovědi na otázky v infografice.

Ladislav Hagara | Komentářů: 12
25.2. 21:33 | Komunita

Dalším open source projektem, který byl finančně podpořen z programu Epic MegaGrants společnosti Epic Games je 3D PBR software pro malování textur ArmorPaint (GitHub). Získal 25 000 dolarů.

Ladislav Hagara | Komentářů: 1
25.2. 18:11 | Zajímavý projekt

Firma vyvíjející distribuci CoreOS/Container Linux byla před dvěma lety převzata Red Hatem, v jehož portfoliu vznikla redundance: Fedora CoreOS cílí na podobná nasazení. Krátce poté vznikl fork nazvaný Flatcar Container Linux. Aktuálně je ukončení podpory CoreOS/Container Linuxu plánováno na 26. května a odstranění instalačních obrazů z distribučních kanálů na 1. září. Firma Kinvolk udržující Flatcar Linux oznamuje, že se věnuje usnadnění přechodu stávajících uživatelů CoreOS.

Fluttershy, yay! | Komentářů: 0
25.2. 17:00 | Nová verze

Byla vydána verze 19.0 z Arch Linuxu vycházející linuxové distribuce Manjaro (Wikipedie). Její kódové jméno ne Kyria. Přehled novinek v oznámení v diskusním fóru. Manjaro je ke stažení v edicích XFCE, KDE Plasma a GNOME. K dispozici je také síťová instalace Architect. Vývoj Manjara lze podpořit také zakoupením počítače z předinstalovaným Manjarem.

Ladislav Hagara | Komentářů: 0
25.2. 12:22 | Zajímavý projekt

Dne 19. února 2020 pan Kyle Finlay zahájil na Kickstarteru kampaň s názvem GamePad, jejímž cílem je získat prostředky na zprovoznění nové open source platformy pro digitální distribuci her, čistě pro OS Linux. Nová herní platforma je inspirována GOG.com a autoři slibují plnou podporu her bez ohledu na konkrétní distribuci, ale hlavně bez DRM. GamePad by měl být plně otevřený, včetně API, takže bude možné upravovat klienta, nebo si vytvořit

… více »
D.A.Tiger | Komentářů: 8
Vydržela vám novoroční předsevzetí?
 (10%)
 (5%)
 (3%)
 (82%)
Celkem 202 hlasů
 Komentářů: 0
Rozcestník

Možnosti editace textu u PDF v linuxovém prostředí

17.1. 17:11 | Přečteno: 2007× | Za vším hledej Linux | poslední úprava: 17.1. 17:11

Před rokem, kdy jsem měl – stejně jako letos – vyplnit všobecně známý "růžový papír" ohledně daní, poprvé dorazil formulář ve formě PDF. Nakonec jsem ho vyplnil pomocí aplikace Master PDF Pro, který má oproti Acrobatu Pro DC, od Adobe také linuxovou verzi. Zvládla totéž co plnotučný Acrobat, který pro linux není. Navíc má normální licenční politiku – nehodlám platit Adobe měsíční výpalné za cloudové služby o které nestojím.

Podruhé jsem použil Master PDF Pro včera, když mne kolega požádal, zda-li bych neupravil třístránkový článek dodaný v PDF formátu tak, aby ho bylo možné vytisknout jako poster. Mohl jsem to udělat i přes Inkscape, ale zvolil jsem Master PDF Pro abych si ho vyzkoušel. Demo verze je plně funkční, pokud vám nevadí vodoznak na pozadí uloženého PDF. Výsledek můžete vidět na přiloženém screenshotu.

Odstranění vodoznaku je triviální, když si uvědomíte jak vypadá PDF uvnitř. Ale o tom psát nechci. Chci se pouze zmínit o možnostech a limitech editace PDF souborů v linuxovém prostředí.

Vše záleží na tom, jakým způsobem je PDF vytvořeno, a má-li vůbec editovatelný obsah. Je to v podstatě snůška objektů, takže pokud jste masochisté, můžete dokumenty editovat i prostřednictvím textového editoru – pak se můžete velice triviálně zbavit i zmíněného vodoznaku. Ovšem většina jedinců při přehazování objektů PDF souboru upřednostňuje wysiwyg editaci. Kromě již zmíněného Master PDF editoru tak v linuxovém prostředí použít např. Inkscape nebo Libreoffice – pokud vám nevadí, že se dokument při editaci rozhodí.

Zajímá vás proč se při editaci PDF dokument rozhodí?

Je to prosté. Protože PDF (Portable Document Format – přenositelný formát dokumentu) vzniklo primárně za účelem výměny elektronických dokumentů, podporuje několik diametrálně odlišných forem pro uložení textového obsahu, které vznikaly jak šel čas.

Jeho základem se stal PostScript — programovací jazyk z poloviny 80. let, kterým komunikoval software od firmy Adobe s některými tiskárnami. Těm bylo možné posílat text různými způsoby. Buď jako jednotlivé znaky, jejichž vizualizace záležela na fontech tiskárny. Nebo jako obrázky. A to buď vektorové, nebo bitmapové. U těch vektorových byl výsledek lepší, protože je bylo možné podle potřeby škálovat. Nicméně podoba výsledného dokumentu závisela na tom, zdali byl na stroji, ze kterého se dokument tisknul, dostupný font s nímž se počítalo v tištěném souboru. Což u přenášených dokumentů většinou nebyl. Proto se u raných PDF dokumentů místo textu vygenerovala sada obrazových objektů, a místo znaku se pak uvedly jen souřadnice příslušného objektu. Jenže tohle uměl jen placený software od Adobe.

Většina generátorů PDF dokumentů, spoléhala na lokálně instalované fonty. Pokud použitý font nebyl k dispozici tak se při zobrazení takového PDF souboru objevily pouze čtverečky. Dokument z Acrobatu s vygenerovanými písmeny, se však zobrazoval všude stejně. Pokud PDF dokument pracoval jen se standardními fonty MS Windows, trápil tento problém jen málokterého BFU. Ostatně, existovala ještě jedna možnost – vyexportovat do PDF celou stránku jako bitmapový obrázek. Pochopitelně výsledný soubor byl pak mnohem větší, což ale 99,99% uživatelů PDF nepociťovalo jako problém.

Ovšem já byl v té setině uživatelů.

Netrápilo mě tehdy ani tak to, že textový obsah PDF nebylo možné opravit pouhou editací, jako spíš velikost výsledného souboru. Placený Acrobat jsem k dispozici neměl a jako student jsem měl k dispozici pouze 50MB úložného prostoru, do kterého bylo možné umístit obsah sdílený přes web. Takže jsem byl nucen, abych srazil velikost výsledného PDF, jít při zpracování naskenovaných knih až na dřeň. Na jeden takový soubor, kde se mi podařilo zmáčkout 182 strojopisných stránek do 21 MB souboru, se můžete podívat zde. Bohužel pro aplikaci OCR je ten soubor nepoužitelný. Pokud se někdy dostanu k tomu abych tuhle knihu zpracoval znovu, tak už jedině do DjVu – protože výsledný soubor pak bude mít poloviční velikost, a to včetně textové vrstvy.

Nicméně, omezená kapacita webového prostoru nebyla jediným důvodem, proč jsem se již tehdy zajímal o možnosti editace PDF.

Pracoval jsem tenkrát při studiu jako "konzultant" pro překladatelskou firmu Skřivánek s.r.o. Klient dodal elektronický dokument k překladu, já ho prozkoumal. Zjistil, co se dá s jeho obsahem dělat a na mém posudku pak záleželo, kolik to bude klienta stát. Háček byl v tom, že mě za tohle nikdo neplatil. Já byl placen za zpracování výsledného dokumentu, tak aby klient dostal dokument ve stejném formátu, jaký dodal, ale přeložený. Takže když později najali chytráka, co realizace zakázek (za které bych inkasoval nějaké peníze) začal dohazovat svým kamrádům, naše spolupráce skončila.

Ale zpět k PDF. Zkrátka bylo nutné řešit otázku editace PDF. A právě tehdy jsem narazil na to, že textový obsah nelze opravit pouhou editací ani s využitím Adobe Acrobatu, pokud není k dispozici originální font. Autory dodaného PDF to netrápilo, protože měli originální fonty k dispozici jenže ty neměly českou lokalizaci. Naštěstí šlo o technický manuál, takže nebyl problém použít jiný font a udělat defakto nový PDF dokument s využitím původních obrázků.

Postupem času PDF zamořilo svět, a protože se začalo používat i pro věci ke kterým se původně moc nehodilo, začaly se postupně také rozšiřovat možnosti původního formátu. Takže dnes už můžete mít i PDF se skrytou textovou vrstvou a tak získat PDF, které se již dá upravit, protože obsahuje editovatelný text. Ovšem výsledek záleží na tom, jestli váš systém má k dispozici originální fonty, resp. zda-li vaše aplikace umí pracovat s textem podobně jako Adobe Acrobat. Což z těch pro linuxové prostředí umí jen Master PDF Pro.

Při importu do Inkscape, se PDF dokument zkonvertuje do SVG. Pokud zvolíte, že má text zůstat textem, tak se místo původního fontu použije příbuzný font, který je dostupný ve vašem systému ovšem pokud není stejný, jako ten co byl použitý v originálním PDF, tak se zobrazený obsah rozbije. Na druhou stranu Inkscape nabízí možnost naimportovat místo textu hromadu vektorových objektů, a dokument si pak můžete přesázet znak po znaku jak Guttenberg. Ale pro úkol jaký jsem dostal tenhle typ editace bohatě stačí.

U LibreOffice moc na výběr nemáte, text se z PDF importuje rovnou jako text. Na druhou stranu máte při editaci víc možností. Např. při tzv. konsolidaci textu, si můžete spojit vybrané řádky textu do standardního textového bloku, jehož obsah lze následně formátovat přes styly. Tuhle cestu bych nejspíš volil před těmi 19 lety u Skřivánka.

       

Hodnocení: 100 %

        špatnédobré        

Obrázky

Možnosti editace textu u PDF v linuxovém prostředí, obrázek 1

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Vložit další komentář

regine avatar 17.1. 23:18 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše česká diakritika

Master PDF Editor v Ubuntu užívám k vyplňování dokumentů. Nezvládá však plně českou diakritiku. Například misto Č vznikne C.

Moje verze 1.9.23 nevytváří vodoznak. Zatím jsem nepotřeboval, ale jak odstranit vodoznak na pozadí u PDF, kdybych někdy tuto znalost potřeboval? Když mi zašlou k vyplnění požadovaný dokument, klidně vyplním a vrátím s vodoznakem.

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
regine avatar 17.1. 23:21 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše podpis

Už jsme uložil, přidávám až teď. Pokud je potřeba podpis v PDF dokumentu, užívám Xournal a Wacom pen-tablet (lepší jak se podepisovat krysou).

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
19.1. 09:18 this0ne
Rozbalit Rozbalit vše Re: podpis
Podpis se da naskenovat z papiru a pak v Gimpu zpruhlednit pozadi. Master PDF i Adobe ma primo funkci na vkladani takoveho podpisu.
regine avatar 21.1. 08:26 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše nejistota

Vím, že Master PDF a Adobe Reader by měli umožnit podpis, ale většinou nefunkční. Asi je to dáno, jak je PDF dokument vygenerován.
S Xournal byl podpis vždy zdárný. Pomocí GIMP jde o složitější způsob.

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
18.1. 01:10 Want
Rozbalit Rozbalit vše Re: česká diakritika
PDF je složené z objektů a obvykle komprimované. K dekompresi lze použít pdftk, pak lze soubor editovat libovolným textovým editorem co neprasí kód - stačí třeba mcedit. Jelikož vodoznak může být udělaný mnoha způsoby, je třeba zjistit, který z objektů ho dělá a ten pak jednoduše vymazat.
18.1. 12:31 Luboš
Rozbalit Rozbalit vše Re: česká diakritika
taky by mě zajímalo jak triviálně odstranit vodoznak z pdf souboru
18.1. 10:31 volani.tk
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Zkoušel někdo treba Only Office pro editaci pdf?
18.1. 15:53 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
0,0001 % neni setina, ty duta hlavo. Je smutne videt, ze ve statem financovane instituci dnes muze pracovat i clovek, ktery nezna zakladni pocty. Takhle za moje penize spravujete i ty vase servery, pane Kapica?
18.1. 20:56 Want
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Celkem nepřekvapí, že se nula jako ty mezi těmi nulami ztratí.
19.1. 11:30 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To jsi vážně tak tupý že je nutné ti implicitně sdělit že je řeč o setinách procenta?
19.1. 12:56 %.
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To jsi vážně tak tupý, že neznáš význam slova implicitně?
19.1. 16:25 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To ti trvalo 14 hodin vymyslet tuhle vymluvu? :D :D Usmevne.
21.1. 15:18 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
A jak dlouho bude trvat tobě, než konečně umřeš?
21.1. 19:43 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Míň než tobě buřte vožralej masožravej.
21.1. 20:20 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Pošlu ti holuby na rozptylovou loučku, aby ti sedmikrásky líp kvetly.
21.1. 20:39 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Já ti pošlu PPLkem slovník cizích slov, ať pochopíš rozdíl slov implicitní a explicitní a nemáš vyjadřovací schopnosti dělníka na stavbě. S IQ lopaty ti nepomohu, ale to už je tvůj boj, dědku plešatej.
21.1. 20:47 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Tos fakt pobavil. Ty nejsi schopný vyplnit ani přihlašovací formulář na abclinuxu, natož poslat něco přes PPL.
21.1. 23:07 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Alespoň si dokážu rukou prohrábnout vlasy, implicitní geronte xD
22.1. 07:15 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To je dost slabé, nemyslíš? Takových inteligentů je plná noclehárna Naděje.
22.1. 11:12 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Sorry, neorientuji se v gay klubech.
22.1. 12:10 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Je mi ukradené, kde všude ti natrhli prdel. Nejspíš to bude tím, v jaké společnosti se pohybuješ, ale co naplat, když ti imponují bujné kštice.

Založit nové vláknoNahoru

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.