abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 18:44 | Bezpečnostní upozornění

Twitter upozornil, že pokud se uživatel Twitteru přihlašoval ve Firefoxu na sdíleném nebo veřejném počítači, tak po odhlášení se z Twitteru mohla na disku zůstat nakešovaná citlivá data, a proto toto kešování pro Firefox zakázal. Reakce Mozilly: Twitter by měl prostě dodržovat standardy.

Ladislav Hagara | Komentářů: 2
včera 17:44 | Zajímavý článek

Článek na Jitsi je věnován bezpečnosti a soukromí uživatelů při používání videokonferenčního softwaru Jitsi Meet. Doporučuje se zamyslet nad názvem místnosti. Upozorňuje, že místnost existuje, pouze pokud se v ní někdo nachází. V případě nastavení hesla, je toto heslo s ukončením místnosti zapomenuto a při opětovném použití místnosti je nutno jej opět zadat.

Ladislav Hagara | Komentářů: 2
včera 06:00 | IT novinky

Na Indiegogo byla spuštěna kampaň na podporu chytrého telefonu a kapesního počítače Astro Slide 5G Transformer od společnosti Planet Computers. Požadovaná částka 180 000 eur byla vybrána během 4 hodin. Stejně jako u předchozích zařízení Gemini PDA a Cosmo Communicator od této společnosti je slíbená podpora Linuxu.

Ladislav Hagara | Komentářů: 16
3.4. 19:22 | Zajímavý software

CryptPad je svobodný online kancelářský balík. Zdrojové kódy jsou k dispozici na GitHubu pod licencí AGPL-3.0. Oficiální instance nově nabízí 1 GB prostoru. Mozilla Foundation tento týden věnovala projektu 10 000 $.

Ladislav Hagara | Komentářů: 2
3.4. 18:22 | Nová verze

Byla vydána finální beta verze Ubuntu 20.04 LTS s kódovým názvem Focal Fossa. Přehled novinek v poznámkách k vydání. Dle plánu by Ubuntu 20.04 mělo vyjít 23. dubna 2020.

Ladislav Hagara | Komentářů: 4
3.4. 17:22 | Nová verze

Vyšel XCP-ng 8.1 (seznam změn), alternativní sestavení Citrix Hypervisor (dříve XenServer), tedy serverová distribuce hypervizoru Xen (4.13), toolstacku XAPI a systému CentOS v privilegované doméně. XCP-ng na rozdíl od bezplatné verze Citrix Hypervisoru nemá četná omezení funkcionality, vývojáři ale nabízejí i komerční podporu. Novinkou (zatím) pouze v XCP-ng je možnost zálohovat VM včetně aktuálního stavu jejich paměti; funkce je integrována také v administračním nástroji Xen Orchestra.

Fluttershy, yay! | Komentářů: 0
2.4. 17:55 | Nová verze

Byl vydán LineageOS ve verzi 17.1. LineageOS (Wikipedie) je svobodný operační systém pro chytré telefony, tablety a set-top boxy založený na Androidu. Jedná se o nástupce CyanogenModu. LineageOS 17.1 je založený na Androidu 10.

Ladislav Hagara | Komentářů: 11
2.4. 17:22 | Zajímavý projekt

Lukasz Erecinski na blogu Pine64 oznámil možnost předobjednání telefonu PinePhone v edici UBports Community Edition. Telefon bude mít speciální kryt s logem a nápisem UBports Edition. Základní deska bude podle nového schématu (v1.2) vylepšená podle zpětné vazby od majitelů BraveHeart edice. Bude mít FCC i CE certifikace.

joejoe | Komentářů: 3
2.4. 15:33 | IT novinky

Společnost Cloudflare před dvěma lety spustila DNS resolver 1.1.1.1. Včera spustila 1.1.1.1 pro rodiny aneb nové resolvery 1.1.1.2 (2606:4700:4700::1112) a 1.1.1.3 (2606:4700:4700::1113) blokující stránky s malwarem a obsahem pro dospělé. Dnes se omluvila, že nechtěně blokovala také LGBTQIA+ stránky.

Ladislav Hagara | Komentářů: 42
2.4. 14:55 | Nová verze

Společnost Red Hat oznámila vydání Red Hat Enterprise Linuxu 7.8, který přináší vedle nových vlastností a oprav chyb také aktualizaci ovladačů a předběžné ukázky budoucích technologií. Podrobnosti v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
Chodíte do práce?
 (28%)
 (2%)
 (4%)
 (2%)
 (47%)
 (13%)
 (4%)
Celkem 112 hlasů
 Komentářů: 4, poslední 2.4. 14:20
Rozcestník

Možnosti editace textu u PDF v linuxovém prostředí

17.1. 17:11 | Přečteno: 2078× | Za vším hledej Linux | poslední úprava: 17.1. 17:11

Před rokem, kdy jsem měl – stejně jako letos – vyplnit všobecně známý "růžový papír" ohledně daní, poprvé dorazil formulář ve formě PDF. Nakonec jsem ho vyplnil pomocí aplikace Master PDF Pro, který má oproti Acrobatu Pro DC, od Adobe také linuxovou verzi. Zvládla totéž co plnotučný Acrobat, který pro linux není. Navíc má normální licenční politiku – nehodlám platit Adobe měsíční výpalné za cloudové služby o které nestojím.

Podruhé jsem použil Master PDF Pro včera, když mne kolega požádal, zda-li bych neupravil třístránkový článek dodaný v PDF formátu tak, aby ho bylo možné vytisknout jako poster. Mohl jsem to udělat i přes Inkscape, ale zvolil jsem Master PDF Pro abych si ho vyzkoušel. Demo verze je plně funkční, pokud vám nevadí vodoznak na pozadí uloženého PDF. Výsledek můžete vidět na přiloženém screenshotu.

Odstranění vodoznaku je triviální, když si uvědomíte jak vypadá PDF uvnitř. Ale o tom psát nechci. Chci se pouze zmínit o možnostech a limitech editace PDF souborů v linuxovém prostředí.

Vše záleží na tom, jakým způsobem je PDF vytvořeno, a má-li vůbec editovatelný obsah. Je to v podstatě snůška objektů, takže pokud jste masochisté, můžete dokumenty editovat i prostřednictvím textového editoru – pak se můžete velice triviálně zbavit i zmíněného vodoznaku. Ovšem většina jedinců při přehazování objektů PDF souboru upřednostňuje wysiwyg editaci. Kromě již zmíněného Master PDF editoru tak v linuxovém prostředí použít např. Inkscape nebo Libreoffice – pokud vám nevadí, že se dokument při editaci rozhodí.

Zajímá vás proč se při editaci PDF dokument rozhodí?

Je to prosté. Protože PDF (Portable Document Format – přenositelný formát dokumentu) vzniklo primárně za účelem výměny elektronických dokumentů, podporuje několik diametrálně odlišných forem pro uložení textového obsahu, které vznikaly jak šel čas.

Jeho základem se stal PostScript — programovací jazyk z poloviny 80. let, kterým komunikoval software od firmy Adobe s některými tiskárnami. Těm bylo možné posílat text různými způsoby. Buď jako jednotlivé znaky, jejichž vizualizace záležela na fontech tiskárny. Nebo jako obrázky. A to buď vektorové, nebo bitmapové. U těch vektorových byl výsledek lepší, protože je bylo možné podle potřeby škálovat. Nicméně podoba výsledného dokumentu závisela na tom, zdali byl na stroji, ze kterého se dokument tisknul, dostupný font s nímž se počítalo v tištěném souboru. Což u přenášených dokumentů většinou nebyl. Proto se u raných PDF dokumentů místo textu vygenerovala sada obrazových objektů, a místo znaku se pak uvedly jen souřadnice příslušného objektu. Jenže tohle uměl jen placený software od Adobe.

Většina generátorů PDF dokumentů, spoléhala na lokálně instalované fonty. Pokud použitý font nebyl k dispozici tak se při zobrazení takového PDF souboru objevily pouze čtverečky. Dokument z Acrobatu s vygenerovanými písmeny, se však zobrazoval všude stejně. Pokud PDF dokument pracoval jen se standardními fonty MS Windows, trápil tento problém jen málokterého BFU. Ostatně, existovala ještě jedna možnost – vyexportovat do PDF celou stránku jako bitmapový obrázek. Pochopitelně výsledný soubor byl pak mnohem větší, což ale 99,99% uživatelů PDF nepociťovalo jako problém.

Ovšem já byl v té setině uživatelů.

Netrápilo mě tehdy ani tak to, že textový obsah PDF nebylo možné opravit pouhou editací, jako spíš velikost výsledného souboru. Placený Acrobat jsem k dispozici neměl a jako student jsem měl k dispozici pouze 50MB úložného prostoru, do kterého bylo možné umístit obsah sdílený přes web. Takže jsem byl nucen, abych srazil velikost výsledného PDF, jít při zpracování naskenovaných knih až na dřeň. Na jeden takový soubor, kde se mi podařilo zmáčkout 182 strojopisných stránek do 21 MB souboru, se můžete podívat zde. Bohužel pro aplikaci OCR je ten soubor nepoužitelný. Pokud se někdy dostanu k tomu abych tuhle knihu zpracoval znovu, tak už jedině do DjVu – protože výsledný soubor pak bude mít poloviční velikost, a to včetně textové vrstvy.

Nicméně, omezená kapacita webového prostoru nebyla jediným důvodem, proč jsem se již tehdy zajímal o možnosti editace PDF.

Pracoval jsem tenkrát při studiu jako "konzultant" pro překladatelskou firmu Skřivánek s.r.o. Klient dodal elektronický dokument k překladu, já ho prozkoumal. Zjistil, co se dá s jeho obsahem dělat a na mém posudku pak záleželo, kolik to bude klienta stát. Háček byl v tom, že mě za tohle nikdo neplatil. Já byl placen za zpracování výsledného dokumentu, tak aby klient dostal dokument ve stejném formátu, jaký dodal, ale přeložený. Takže když později najali chytráka, co realizace zakázek (za které bych inkasoval nějaké peníze) začal dohazovat svým kamrádům, naše spolupráce skončila.

Ale zpět k PDF. Zkrátka bylo nutné řešit otázku editace PDF. A právě tehdy jsem narazil na to, že textový obsah nelze opravit pouhou editací ani s využitím Adobe Acrobatu, pokud není k dispozici originální font. Autory dodaného PDF to netrápilo, protože měli originální fonty k dispozici jenže ty neměly českou lokalizaci. Naštěstí šlo o technický manuál, takže nebyl problém použít jiný font a udělat defakto nový PDF dokument s využitím původních obrázků.

Postupem času PDF zamořilo svět, a protože se začalo používat i pro věci ke kterým se původně moc nehodilo, začaly se postupně také rozšiřovat možnosti původního formátu. Takže dnes už můžete mít i PDF se skrytou textovou vrstvou a tak získat PDF, které se již dá upravit, protože obsahuje editovatelný text. Ovšem výsledek záleží na tom, jestli váš systém má k dispozici originální fonty, resp. zda-li vaše aplikace umí pracovat s textem podobně jako Adobe Acrobat. Což z těch pro linuxové prostředí umí jen Master PDF Pro.

Při importu do Inkscape, se PDF dokument zkonvertuje do SVG. Pokud zvolíte, že má text zůstat textem, tak se místo původního fontu použije příbuzný font, který je dostupný ve vašem systému ovšem pokud není stejný, jako ten co byl použitý v originálním PDF, tak se zobrazený obsah rozbije. Na druhou stranu Inkscape nabízí možnost naimportovat místo textu hromadu vektorových objektů, a dokument si pak můžete přesázet znak po znaku jak Guttenberg. Ale pro úkol jaký jsem dostal tenhle typ editace bohatě stačí.

U LibreOffice moc na výběr nemáte, text se z PDF importuje rovnou jako text. Na druhou stranu máte při editaci víc možností. Např. při tzv. konsolidaci textu, si můžete spojit vybrané řádky textu do standardního textového bloku, jehož obsah lze následně formátovat přes styly. Tuhle cestu bych nejspíš volil před těmi 19 lety u Skřivánka.

       

Hodnocení: 100 %

        špatnédobré        

Obrázky

Možnosti editace textu u PDF v linuxovém prostředí, obrázek 1

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Vložit další komentář

regine avatar 17.1. 23:18 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše česká diakritika

Master PDF Editor v Ubuntu užívám k vyplňování dokumentů. Nezvládá však plně českou diakritiku. Například misto Č vznikne C.

Moje verze 1.9.23 nevytváří vodoznak. Zatím jsem nepotřeboval, ale jak odstranit vodoznak na pozadí u PDF, kdybych někdy tuto znalost potřeboval? Když mi zašlou k vyplnění požadovaný dokument, klidně vyplním a vrátím s vodoznakem.

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
regine avatar 17.1. 23:21 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše podpis

Už jsme uložil, přidávám až teď. Pokud je potřeba podpis v PDF dokumentu, užívám Xournal a Wacom pen-tablet (lepší jak se podepisovat krysou).

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
19.1. 09:18 this0ne
Rozbalit Rozbalit vše Re: podpis
Podpis se da naskenovat z papiru a pak v Gimpu zpruhlednit pozadi. Master PDF i Adobe ma primo funkci na vkladani takoveho podpisu.
regine avatar 21.1. 08:26 regine | skóre: 22 | blog: regine
Rozbalit Rozbalit vše nejistota

Vím, že Master PDF a Adobe Reader by měli umožnit podpis, ale většinou nefunkční. Asi je to dáno, jak je PDF dokument vygenerován.
S Xournal byl podpis vždy zdárný. Pomocí GIMP jde o složitější způsob.

Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
18.1. 01:10 Want
Rozbalit Rozbalit vše Re: česká diakritika
PDF je složené z objektů a obvykle komprimované. K dekompresi lze použít pdftk, pak lze soubor editovat libovolným textovým editorem co neprasí kód - stačí třeba mcedit. Jelikož vodoznak může být udělaný mnoha způsoby, je třeba zjistit, který z objektů ho dělá a ten pak jednoduše vymazat.
18.1. 12:31 Luboš
Rozbalit Rozbalit vše Re: česká diakritika
taky by mě zajímalo jak triviálně odstranit vodoznak z pdf souboru
18.1. 10:31 volani.tk
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Zkoušel někdo treba Only Office pro editaci pdf?
18.1. 15:53 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
0,0001 % neni setina, ty duta hlavo. Je smutne videt, ze ve statem financovane instituci dnes muze pracovat i clovek, ktery nezna zakladni pocty. Takhle za moje penize spravujete i ty vase servery, pane Kapica?
18.1. 20:56 Want
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Celkem nepřekvapí, že se nula jako ty mezi těmi nulami ztratí.
19.1. 11:30 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To jsi vážně tak tupý že je nutné ti implicitně sdělit že je řeč o setinách procenta?
19.1. 12:56 %.
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To jsi vážně tak tupý, že neznáš význam slova implicitně?
19.1. 16:25 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To ti trvalo 14 hodin vymyslet tuhle vymluvu? :D :D Usmevne.
21.1. 15:18 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
A jak dlouho bude trvat tobě, než konečně umřeš?
21.1. 19:43 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Míň než tobě buřte vožralej masožravej.
21.1. 20:20 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Pošlu ti holuby na rozptylovou loučku, aby ti sedmikrásky líp kvetly.
21.1. 20:39 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Já ti pošlu PPLkem slovník cizích slov, ať pochopíš rozdíl slov implicitní a explicitní a nemáš vyjadřovací schopnosti dělníka na stavbě. S IQ lopaty ti nepomohu, ale to už je tvůj boj, dědku plešatej.
21.1. 20:47 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Tos fakt pobavil. Ty nejsi schopný vyplnit ani přihlašovací formulář na abclinuxu, natož poslat něco přes PPL.
21.1. 23:07 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Alespoň si dokážu rukou prohrábnout vlasy, implicitní geronte xD
22.1. 07:15 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
To je dost slabé, nemyslíš? Takových inteligentů je plná noclehárna Naděje.
22.1. 11:12 %
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Sorry, neorientuji se v gay klubech.
22.1. 12:10 Aleš Kapica | skóre: 49 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
Je mi ukradené, kde všude ti natrhli prdel. Nejspíš to bude tím, v jaké společnosti se pohybuješ, ale co naplat, když ti imponují bujné kštice.

Založit nové vláknoNahoru

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.