abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 18:11 | IT novinky

    Dnes a zítra probíhá vývojářská konference Google I/O 2025. Sledovat lze na YouTube a na síti 𝕏 (#GoogleIO).

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | Komunita

    V Bostonu probíhá konference Red Hat Summit 2025. Vybrané přednášky lze sledovat na YouTube. Dění lze sledovat na síti 𝕏 (#RHSummit).

    Ladislav Hagara | Komentářů: 0
    včera 15:00 | Nová verze

    Společnost Red Hat oficiálně oznámila vydání Red Hat Enterprise Linuxu 10. Vedle nových vlastností přináší také aktualizaci ovladačů a předběžné ukázky budoucích technologií. Podrobnosti v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 4
    včera 12:22 | Pozvánky

    Tuto sobotu 24. května se koná historicky první komunitní den projektu Home Assistant. Zváni jsou všichni příznivci, nadšenci a uživatelé tohoto projektu. Pro účast je potřebná registrace. Odkazy na akce v Praze a v Bratislavě.

    jose17 | Komentářů: 0
    včera 04:44 | IT novinky

    Troy Hunt představil Have I Been Pwned 2.0, tj. nový vylepšený web služby, kde si uživatelé mohou zkontrolovat, zda se jejich hesla a osobní údaje neobjevily v únicích dat a případně se nechat na další úniky upozorňovat.

    Ladislav Hagara | Komentářů: 16
    19.5. 23:22 | Zajímavý software

    Microsoft představil open source textový editor Edit bežící v terminálu. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 8
    19.5. 22:22 | Zajímavý software

    V Seattlu a také online probíhá konference Microsoft Build 2025. Microsoft představuje své novinky. Windows Subsystem for Linux je nově open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 1
    19.5. 13:11 | Zajímavý článek

    Z příspěvku Turris Sentinel – co přinesl rok 2024 na blogu CZ.NIC: "Za poslední rok (únor 2024 – únor 2025) jsme zachytili 8,3 miliardy incidentů a to z 232 zemí a z jejich závislých území. Tyto útoky přišly od 6,2 milionu útočníků (respektive unikátních adres). SMTP minipot je stále nejlákavější pastí, zhruba 79 % útoků bylo směřováno na tento minipot, 16 % útoků směřovalo na minipot Telnet, 3 % útoků směřovaly na minipot HTTP a 2 % na minipot FTP. Dále jsme zaznamenali 3,2 milionu unikátních hesel a 318 tisíc unikátních loginů, které útočníci zkoušeli."

    Ladislav Hagara | Komentářů: 1
    19.5. 12:44 | Nová verze

    Byla vydána (Mastodon, 𝕏) nová verze 3.0.4 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP je již k dispozici také na Flathubu.

    Ladislav Hagara | Komentářů: 0
    19.5. 12:33 | Nová verze

    Byla vydána nová stabilní verze 7.4 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 136. Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (62%)
     (23%)
     (8%)
     (2%)
     (0%)
     (0%)
     (6%)
    Celkem 52 hlasů
     Komentářů: 5, poslední včera 20:57
    Rozcestník

    Možnosti editace textu u PDF v linuxovém prostředí

    17.1.2020 17:11 | Přečteno: 2981× | Za vším hledej Linux | poslední úprava: 17.1.2020 17:11

    Před rokem, kdy jsem měl – stejně jako letos – vyplnit všobecně známý "růžový papír" ohledně daní, poprvé dorazil formulář ve formě PDF. Nakonec jsem ho vyplnil pomocí aplikace Master PDF Pro, který má oproti Acrobatu Pro DC, od Adobe také linuxovou verzi. Zvládla totéž co plnotučný Acrobat, který pro linux není. Navíc má normální licenční politiku – nehodlám platit Adobe měsíční výpalné za cloudové služby o které nestojím.

    Podruhé jsem použil Master PDF Pro včera, když mne kolega požádal, zda-li bych neupravil třístránkový článek dodaný v PDF formátu tak, aby ho bylo možné vytisknout jako poster. Mohl jsem to udělat i přes Inkscape, ale zvolil jsem Master PDF Pro abych si ho vyzkoušel. Demo verze je plně funkční, pokud vám nevadí vodoznak na pozadí uloženého PDF. Výsledek můžete vidět na přiloženém screenshotu.

    Odstranění vodoznaku je triviální, když si uvědomíte jak vypadá PDF uvnitř. Ale o tom psát nechci. Chci se pouze zmínit o možnostech a limitech editace PDF souborů v linuxovém prostředí.

    Vše záleží na tom, jakým způsobem je PDF vytvořeno, a má-li vůbec editovatelný obsah. Je to v podstatě snůška objektů, takže pokud jste masochisté, můžete dokumenty editovat i prostřednictvím textového editoru – pak se můžete velice triviálně zbavit i zmíněného vodoznaku. Ovšem většina jedinců při přehazování objektů PDF souboru upřednostňuje wysiwyg editaci. Kromě již zmíněného Master PDF editoru tak v linuxovém prostředí použít např. Inkscape nebo Libreoffice – pokud vám nevadí, že se dokument při editaci rozhodí.

    Zajímá vás proč se při editaci PDF dokument rozhodí?

    Je to prosté. Protože PDF (Portable Document Format – přenositelný formát dokumentu) vzniklo primárně za účelem výměny elektronických dokumentů, podporuje několik diametrálně odlišných forem pro uložení textového obsahu, které vznikaly jak šel čas.

    Jeho základem se stal PostScript — programovací jazyk z poloviny 80. let, kterým komunikoval software od firmy Adobe s některými tiskárnami. Těm bylo možné posílat text různými způsoby. Buď jako jednotlivé znaky, jejichž vizualizace záležela na fontech tiskárny. Nebo jako obrázky. A to buď vektorové, nebo bitmapové. U těch vektorových byl výsledek lepší, protože je bylo možné podle potřeby škálovat. Nicméně podoba výsledného dokumentu závisela na tom, zdali byl na stroji, ze kterého se dokument tisknul, dostupný font s nímž se počítalo v tištěném souboru. Což u přenášených dokumentů většinou nebyl. Proto se u raných PDF dokumentů místo textu vygenerovala sada obrazových objektů, a místo znaku se pak uvedly jen souřadnice příslušného objektu. Jenže tohle uměl jen placený software od Adobe.

    Většina generátorů PDF dokumentů, spoléhala na lokálně instalované fonty. Pokud použitý font nebyl k dispozici tak se při zobrazení takového PDF souboru objevily pouze čtverečky. Dokument z Acrobatu s vygenerovanými písmeny, se však zobrazoval všude stejně. Pokud PDF dokument pracoval jen se standardními fonty MS Windows, trápil tento problém jen málokterého BFU. Ostatně, existovala ještě jedna možnost – vyexportovat do PDF celou stránku jako bitmapový obrázek. Pochopitelně výsledný soubor byl pak mnohem větší, což ale 99,99% uživatelů PDF nepociťovalo jako problém.

    Ovšem já byl v té setině uživatelů.

    Netrápilo mě tehdy ani tak to, že textový obsah PDF nebylo možné opravit pouhou editací, jako spíš velikost výsledného souboru. Placený Acrobat jsem k dispozici neměl a jako student jsem měl k dispozici pouze 50MB úložného prostoru, do kterého bylo možné umístit obsah sdílený přes web. Takže jsem byl nucen, abych srazil velikost výsledného PDF, jít při zpracování naskenovaných knih až na dřeň. Na jeden takový soubor, kde se mi podařilo zmáčkout 182 strojopisných stránek do 21 MB souboru, se můžete podívat zde. Bohužel pro aplikaci OCR je ten soubor nepoužitelný. Pokud se někdy dostanu k tomu abych tuhle knihu zpracoval znovu, tak už jedině do DjVu – protože výsledný soubor pak bude mít poloviční velikost, a to včetně textové vrstvy.

    Nicméně, omezená kapacita webového prostoru nebyla jediným důvodem, proč jsem se již tehdy zajímal o možnosti editace PDF.

    Pracoval jsem tenkrát při studiu jako "konzultant" pro překladatelskou firmu Skřivánek s.r.o. Klient dodal elektronický dokument k překladu, já ho prozkoumal. Zjistil, co se dá s jeho obsahem dělat a na mém posudku pak záleželo, kolik to bude klienta stát. Háček byl v tom, že mě za tohle nikdo neplatil. Já byl placen za zpracování výsledného dokumentu, tak aby klient dostal dokument ve stejném formátu, jaký dodal, ale přeložený. Takže když později najali chytráka, co realizace zakázek (za které bych inkasoval nějaké peníze) začal dohazovat svým kamrádům, naše spolupráce skončila.

    Ale zpět k PDF. Zkrátka bylo nutné řešit otázku editace PDF. A právě tehdy jsem narazil na to, že textový obsah nelze opravit pouhou editací ani s využitím Adobe Acrobatu, pokud není k dispozici originální font. Autory dodaného PDF to netrápilo, protože měli originální fonty k dispozici jenže ty neměly českou lokalizaci. Naštěstí šlo o technický manuál, takže nebyl problém použít jiný font a udělat defakto nový PDF dokument s využitím původních obrázků.

    Postupem času PDF zamořilo svět, a protože se začalo používat i pro věci ke kterým se původně moc nehodilo, začaly se postupně také rozšiřovat možnosti původního formátu. Takže dnes už můžete mít i PDF se skrytou textovou vrstvou a tak získat PDF, které se již dá upravit, protože obsahuje editovatelný text. Ovšem výsledek záleží na tom, jestli váš systém má k dispozici originální fonty, resp. zda-li vaše aplikace umí pracovat s textem podobně jako Adobe Acrobat. Což z těch pro linuxové prostředí umí jen Master PDF Pro.

    Při importu do Inkscape, se PDF dokument zkonvertuje do SVG. Pokud zvolíte, že má text zůstat textem, tak se místo původního fontu použije příbuzný font, který je dostupný ve vašem systému ovšem pokud není stejný, jako ten co byl použitý v originálním PDF, tak se zobrazený obsah rozbije. Na druhou stranu Inkscape nabízí možnost naimportovat místo textu hromadu vektorových objektů, a dokument si pak můžete přesázet znak po znaku jak Guttenberg. Ale pro úkol jaký jsem dostal tenhle typ editace bohatě stačí.

    U LibreOffice moc na výběr nemáte, text se z PDF importuje rovnou jako text. Na druhou stranu máte při editaci víc možností. Např. při tzv. konsolidaci textu, si můžete spojit vybrané řádky textu do standardního textového bloku, jehož obsah lze následně formátovat přes styly. Tuhle cestu bych nejspíš volil před těmi 19 lety u Skřivánka.

           

    Hodnocení: 100 %

            špatnédobré        

    Obrázky

    Možnosti editace textu u PDF v linuxovém prostředí, obrázek 1

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    regine avatar 17.1.2020 23:18 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše česká diakritika

    Master PDF Editor v Ubuntu užívám k vyplňování dokumentů. Nezvládá však plně českou diakritiku. Například misto Č vznikne C.

    Moje verze 1.9.23 nevytváří vodoznak. Zatím jsem nepotřeboval, ale jak odstranit vodoznak na pozadí u PDF, kdybych někdy tuto znalost potřeboval? Když mi zašlou k vyplnění požadovaný dokument, klidně vyplním a vrátím s vodoznakem.

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    regine avatar 17.1.2020 23:21 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše podpis

    Už jsme uložil, přidávám až teď. Pokud je potřeba podpis v PDF dokumentu, užívám Xournal a Wacom pen-tablet (lepší jak se podepisovat krysou).

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    19.1.2020 09:18 this0ne
    Rozbalit Rozbalit vše Re: podpis
    Podpis se da naskenovat z papiru a pak v Gimpu zpruhlednit pozadi. Master PDF i Adobe ma primo funkci na vkladani takoveho podpisu.
    regine avatar 21.1.2020 08:26 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše nejistota

    Vím, že Master PDF a Adobe Reader by měli umožnit podpis, ale většinou nefunkční. Asi je to dáno, jak je PDF dokument vygenerován.
    S Xournal byl podpis vždy zdárný. Pomocí GIMP jde o složitější způsob.

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    18.1.2020 01:10 Want
    Rozbalit Rozbalit vše Re: česká diakritika
    PDF je složené z objektů a obvykle komprimované. K dekompresi lze použít pdftk, pak lze soubor editovat libovolným textovým editorem co neprasí kód - stačí třeba mcedit. Jelikož vodoznak může být udělaný mnoha způsoby, je třeba zjistit, který z objektů ho dělá a ten pak jednoduše vymazat.
    18.1.2020 12:31 Luboš
    Rozbalit Rozbalit vše Re: česká diakritika
    taky by mě zajímalo jak triviálně odstranit vodoznak z pdf souboru
    18.1.2020 10:31 volani.tk
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Zkoušel někdo treba Only Office pro editaci pdf?
    18.1.2020 15:53 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    0,0001 % neni setina, ty duta hlavo. Je smutne videt, ze ve statem financovane instituci dnes muze pracovat i clovek, ktery nezna zakladni pocty. Takhle za moje penize spravujete i ty vase servery, pane Kapica?
    18.1.2020 20:56 Want
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Celkem nepřekvapí, že se nula jako ty mezi těmi nulami ztratí.
    19.1.2020 11:30 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To jsi vážně tak tupý že je nutné ti implicitně sdělit že je řeč o setinách procenta?
    19.1.2020 12:56 %.
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To jsi vážně tak tupý, že neznáš význam slova implicitně?
    19.1.2020 16:25 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To ti trvalo 14 hodin vymyslet tuhle vymluvu? :D :D Usmevne.
    21.1.2020 15:18 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    A jak dlouho bude trvat tobě, než konečně umřeš?
    21.1.2020 19:43 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Míň než tobě buřte vožralej masožravej.
    21.1.2020 20:20 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Pošlu ti holuby na rozptylovou loučku, aby ti sedmikrásky líp kvetly.
    21.1.2020 20:39 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Já ti pošlu PPLkem slovník cizích slov, ať pochopíš rozdíl slov implicitní a explicitní a nemáš vyjadřovací schopnosti dělníka na stavbě. S IQ lopaty ti nepomohu, ale to už je tvůj boj, dědku plešatej.
    21.1.2020 20:47 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Tos fakt pobavil. Ty nejsi schopný vyplnit ani přihlašovací formulář na abclinuxu, natož poslat něco přes PPL.
    21.1.2020 23:07 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Alespoň si dokážu rukou prohrábnout vlasy, implicitní geronte xD
    22.1.2020 07:15 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To je dost slabé, nemyslíš? Takových inteligentů je plná noclehárna Naděje.
    22.1.2020 11:12 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Sorry, neorientuji se v gay klubech.
    22.1.2020 12:10 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Je mi ukradené, kde všude ti natrhli prdel. Nejspíš to bude tím, v jaké společnosti se pohybuješ, ale co naplat, když ti imponují bujné kštice.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.