abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 18:00 | IT novinky

    DuckDuckGo AI Chat umožňuje "pokecat si" s GPT-3.5 Turbo od OpenAI nebo Claude 1.2 Instant od Anthropic. Bez vytváření účtu. Všechny chaty jsou soukromé. DuckDuckGo je neukládá ani nepoužívá k trénování modelů umělé inteligence.

    Ladislav Hagara | Komentářů: 1
    včera 14:22 | IT novinky

    VASA-1, výzkumný projekt Microsoftu. Na vstupu stačí jediná fotka a zvukový záznam. Na výstupu je dokonalá mluvící nebo zpívající hlava. Prý si technologii nechá jenom pro sebe. Žádné demo, API nebo placená služba. Zatím.

    Ladislav Hagara | Komentářů: 2
    včera 04:44 | Nová verze

    Nová čísla časopisů od nakladatelství Raspberry Pi: MagPi 140 (pdf) a HackSpace 77 (pdf).

    Ladislav Hagara | Komentářů: 0
    včera 01:00 | Nová verze

    ESPHome, tj. open source systém umožňující nastavovat zařízení s čipy ESP (i dalšími) pomocí konfiguračních souborů a připojit je do domácí automatizace, například do Home Assistantu, byl vydán ve verzi 2024.4.0.

    Ladislav Hagara | Komentářů: 0
    18.4. 22:11 | IT novinky Ladislav Hagara | Komentářů: 0
    18.4. 20:55 | Nová verze

    Neziskové průmyslové konsorcium Khronos Group vydalo verzi 1.1 specifikace OpenXR (Wikipedie), tj. standardu specifikujícího přístup k platformám a zařízením pro XR, tj. platformám a zařízením pro AR (rozšířenou realitu) a VR (virtuální realitu). Do základu se z rozšíření dostalo XR_EXT_local_floor. Společnost Collabora implementuje novou verzi specifikace do platformy Monado, tj. open source implementace OpenXR.

    Ladislav Hagara | Komentářů: 2
    18.4. 17:22 | Nová verze

    Byla vydána nová verze 0.38.0 multimediálního přehrávače mpv (Wikipedie) vycházejícího z přehrávačů MPlayer a mplayer2. Přehled novinek, změn a oprav na GitHubu. Požadován je FFmpeg 4.4 nebo novější a také libplacebo 6.338.2 nebo novější.

    Ladislav Hagara | Komentářů: 13
    18.4. 17:11 | Nová verze

    ClamAV (Wikipedie), tj. multiplatformní antivirový engine s otevřeným zdrojovým kódem pro detekci trojských koní, virů, malwaru a dalších škodlivých hrozeb, byl vydán ve verzích 1.3.1, 1.2.3 a 1.0.6. Ve verzi 1.3.1 je mimo jiné řešena bezpečnostní chyba CVE-2024-20380.

    Ladislav Hagara | Komentářů: 2
    18.4. 12:11 | IT novinky

    Digitální a informační agentura (DIA) oznámila (PDF, X a Facebook), že mobilní aplikace Portál občana je ode dneška oficiálně venku.

    Ladislav Hagara | Komentářů: 10
    18.4. 05:11 | Komunita

    #HACKUJBRNO 2024, byly zveřejněny výsledky a výstupy hackathonu města Brna nad otevřenými městskými daty, který se konal 13. a 14. dubna 2024.

    Ladislav Hagara | Komentářů: 2
    KDE Plasma 6
     (68%)
     (11%)
     (2%)
     (20%)
    Celkem 566 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    Možnosti editace textu u PDF v linuxovém prostředí

    17.1.2020 17:11 | Přečteno: 2843× | Za vším hledej Linux | poslední úprava: 17.1.2020 17:11

    Před rokem, kdy jsem měl – stejně jako letos – vyplnit všobecně známý "růžový papír" ohledně daní, poprvé dorazil formulář ve formě PDF. Nakonec jsem ho vyplnil pomocí aplikace Master PDF Pro, který má oproti Acrobatu Pro DC, od Adobe také linuxovou verzi. Zvládla totéž co plnotučný Acrobat, který pro linux není. Navíc má normální licenční politiku – nehodlám platit Adobe měsíční výpalné za cloudové služby o které nestojím.

    Podruhé jsem použil Master PDF Pro včera, když mne kolega požádal, zda-li bych neupravil třístránkový článek dodaný v PDF formátu tak, aby ho bylo možné vytisknout jako poster. Mohl jsem to udělat i přes Inkscape, ale zvolil jsem Master PDF Pro abych si ho vyzkoušel. Demo verze je plně funkční, pokud vám nevadí vodoznak na pozadí uloženého PDF. Výsledek můžete vidět na přiloženém screenshotu.

    Odstranění vodoznaku je triviální, když si uvědomíte jak vypadá PDF uvnitř. Ale o tom psát nechci. Chci se pouze zmínit o možnostech a limitech editace PDF souborů v linuxovém prostředí.

    Vše záleží na tom, jakým způsobem je PDF vytvořeno, a má-li vůbec editovatelný obsah. Je to v podstatě snůška objektů, takže pokud jste masochisté, můžete dokumenty editovat i prostřednictvím textového editoru – pak se můžete velice triviálně zbavit i zmíněného vodoznaku. Ovšem většina jedinců při přehazování objektů PDF souboru upřednostňuje wysiwyg editaci. Kromě již zmíněného Master PDF editoru tak v linuxovém prostředí použít např. Inkscape nebo Libreoffice – pokud vám nevadí, že se dokument při editaci rozhodí.

    Zajímá vás proč se při editaci PDF dokument rozhodí?

    Je to prosté. Protože PDF (Portable Document Format – přenositelný formát dokumentu) vzniklo primárně za účelem výměny elektronických dokumentů, podporuje několik diametrálně odlišných forem pro uložení textového obsahu, které vznikaly jak šel čas.

    Jeho základem se stal PostScript — programovací jazyk z poloviny 80. let, kterým komunikoval software od firmy Adobe s některými tiskárnami. Těm bylo možné posílat text různými způsoby. Buď jako jednotlivé znaky, jejichž vizualizace záležela na fontech tiskárny. Nebo jako obrázky. A to buď vektorové, nebo bitmapové. U těch vektorových byl výsledek lepší, protože je bylo možné podle potřeby škálovat. Nicméně podoba výsledného dokumentu závisela na tom, zdali byl na stroji, ze kterého se dokument tisknul, dostupný font s nímž se počítalo v tištěném souboru. Což u přenášených dokumentů většinou nebyl. Proto se u raných PDF dokumentů místo textu vygenerovala sada obrazových objektů, a místo znaku se pak uvedly jen souřadnice příslušného objektu. Jenže tohle uměl jen placený software od Adobe.

    Většina generátorů PDF dokumentů, spoléhala na lokálně instalované fonty. Pokud použitý font nebyl k dispozici tak se při zobrazení takového PDF souboru objevily pouze čtverečky. Dokument z Acrobatu s vygenerovanými písmeny, se však zobrazoval všude stejně. Pokud PDF dokument pracoval jen se standardními fonty MS Windows, trápil tento problém jen málokterého BFU. Ostatně, existovala ještě jedna možnost – vyexportovat do PDF celou stránku jako bitmapový obrázek. Pochopitelně výsledný soubor byl pak mnohem větší, což ale 99,99% uživatelů PDF nepociťovalo jako problém.

    Ovšem já byl v té setině uživatelů.

    Netrápilo mě tehdy ani tak to, že textový obsah PDF nebylo možné opravit pouhou editací, jako spíš velikost výsledného souboru. Placený Acrobat jsem k dispozici neměl a jako student jsem měl k dispozici pouze 50MB úložného prostoru, do kterého bylo možné umístit obsah sdílený přes web. Takže jsem byl nucen, abych srazil velikost výsledného PDF, jít při zpracování naskenovaných knih až na dřeň. Na jeden takový soubor, kde se mi podařilo zmáčkout 182 strojopisných stránek do 21 MB souboru, se můžete podívat zde. Bohužel pro aplikaci OCR je ten soubor nepoužitelný. Pokud se někdy dostanu k tomu abych tuhle knihu zpracoval znovu, tak už jedině do DjVu – protože výsledný soubor pak bude mít poloviční velikost, a to včetně textové vrstvy.

    Nicméně, omezená kapacita webového prostoru nebyla jediným důvodem, proč jsem se již tehdy zajímal o možnosti editace PDF.

    Pracoval jsem tenkrát při studiu jako "konzultant" pro překladatelskou firmu Skřivánek s.r.o. Klient dodal elektronický dokument k překladu, já ho prozkoumal. Zjistil, co se dá s jeho obsahem dělat a na mém posudku pak záleželo, kolik to bude klienta stát. Háček byl v tom, že mě za tohle nikdo neplatil. Já byl placen za zpracování výsledného dokumentu, tak aby klient dostal dokument ve stejném formátu, jaký dodal, ale přeložený. Takže když později najali chytráka, co realizace zakázek (za které bych inkasoval nějaké peníze) začal dohazovat svým kamrádům, naše spolupráce skončila.

    Ale zpět k PDF. Zkrátka bylo nutné řešit otázku editace PDF. A právě tehdy jsem narazil na to, že textový obsah nelze opravit pouhou editací ani s využitím Adobe Acrobatu, pokud není k dispozici originální font. Autory dodaného PDF to netrápilo, protože měli originální fonty k dispozici jenže ty neměly českou lokalizaci. Naštěstí šlo o technický manuál, takže nebyl problém použít jiný font a udělat defakto nový PDF dokument s využitím původních obrázků.

    Postupem času PDF zamořilo svět, a protože se začalo používat i pro věci ke kterým se původně moc nehodilo, začaly se postupně také rozšiřovat možnosti původního formátu. Takže dnes už můžete mít i PDF se skrytou textovou vrstvou a tak získat PDF, které se již dá upravit, protože obsahuje editovatelný text. Ovšem výsledek záleží na tom, jestli váš systém má k dispozici originální fonty, resp. zda-li vaše aplikace umí pracovat s textem podobně jako Adobe Acrobat. Což z těch pro linuxové prostředí umí jen Master PDF Pro.

    Při importu do Inkscape, se PDF dokument zkonvertuje do SVG. Pokud zvolíte, že má text zůstat textem, tak se místo původního fontu použije příbuzný font, který je dostupný ve vašem systému ovšem pokud není stejný, jako ten co byl použitý v originálním PDF, tak se zobrazený obsah rozbije. Na druhou stranu Inkscape nabízí možnost naimportovat místo textu hromadu vektorových objektů, a dokument si pak můžete přesázet znak po znaku jak Guttenberg. Ale pro úkol jaký jsem dostal tenhle typ editace bohatě stačí.

    U LibreOffice moc na výběr nemáte, text se z PDF importuje rovnou jako text. Na druhou stranu máte při editaci víc možností. Např. při tzv. konsolidaci textu, si můžete spojit vybrané řádky textu do standardního textového bloku, jehož obsah lze následně formátovat přes styly. Tuhle cestu bych nejspíš volil před těmi 19 lety u Skřivánka.

           

    Hodnocení: 100 %

            špatnédobré        

    Obrázky

    Možnosti editace textu u PDF v linuxovém prostředí, obrázek 1

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    regine avatar 17.1.2020 23:18 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše česká diakritika

    Master PDF Editor v Ubuntu užívám k vyplňování dokumentů. Nezvládá však plně českou diakritiku. Například misto Č vznikne C.

    Moje verze 1.9.23 nevytváří vodoznak. Zatím jsem nepotřeboval, ale jak odstranit vodoznak na pozadí u PDF, kdybych někdy tuto znalost potřeboval? Když mi zašlou k vyplnění požadovaný dokument, klidně vyplním a vrátím s vodoznakem.

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    regine avatar 17.1.2020 23:21 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše podpis

    Už jsme uložil, přidávám až teď. Pokud je potřeba podpis v PDF dokumentu, užívám Xournal a Wacom pen-tablet (lepší jak se podepisovat krysou).

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    19.1.2020 09:18 this0ne
    Rozbalit Rozbalit vše Re: podpis
    Podpis se da naskenovat z papiru a pak v Gimpu zpruhlednit pozadi. Master PDF i Adobe ma primo funkci na vkladani takoveho podpisu.
    regine avatar 21.1.2020 08:26 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše nejistota

    Vím, že Master PDF a Adobe Reader by měli umožnit podpis, ale většinou nefunkční. Asi je to dáno, jak je PDF dokument vygenerován.
    S Xournal byl podpis vždy zdárný. Pomocí GIMP jde o složitější způsob.

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    18.1.2020 01:10 Want
    Rozbalit Rozbalit vše Re: česká diakritika
    PDF je složené z objektů a obvykle komprimované. K dekompresi lze použít pdftk, pak lze soubor editovat libovolným textovým editorem co neprasí kód - stačí třeba mcedit. Jelikož vodoznak může být udělaný mnoha způsoby, je třeba zjistit, který z objektů ho dělá a ten pak jednoduše vymazat.
    18.1.2020 12:31 Luboš
    Rozbalit Rozbalit vše Re: česká diakritika
    taky by mě zajímalo jak triviálně odstranit vodoznak z pdf souboru
    18.1.2020 10:31 volani.tk
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Zkoušel někdo treba Only Office pro editaci pdf?
    18.1.2020 15:53 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    0,0001 % neni setina, ty duta hlavo. Je smutne videt, ze ve statem financovane instituci dnes muze pracovat i clovek, ktery nezna zakladni pocty. Takhle za moje penize spravujete i ty vase servery, pane Kapica?
    18.1.2020 20:56 Want
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Celkem nepřekvapí, že se nula jako ty mezi těmi nulami ztratí.
    19.1.2020 11:30 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To jsi vážně tak tupý že je nutné ti implicitně sdělit že je řeč o setinách procenta?
    19.1.2020 12:56 %.
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To jsi vážně tak tupý, že neznáš význam slova implicitně?
    19.1.2020 16:25 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To ti trvalo 14 hodin vymyslet tuhle vymluvu? :D :D Usmevne.
    21.1.2020 15:18 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    A jak dlouho bude trvat tobě, než konečně umřeš?
    21.1.2020 19:43 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Míň než tobě buřte vožralej masožravej.
    21.1.2020 20:20 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Pošlu ti holuby na rozptylovou loučku, aby ti sedmikrásky líp kvetly.
    21.1.2020 20:39 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Já ti pošlu PPLkem slovník cizích slov, ať pochopíš rozdíl slov implicitní a explicitní a nemáš vyjadřovací schopnosti dělníka na stavbě. S IQ lopaty ti nepomohu, ale to už je tvůj boj, dědku plešatej.
    21.1.2020 20:47 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Tos fakt pobavil. Ty nejsi schopný vyplnit ani přihlašovací formulář na abclinuxu, natož poslat něco přes PPL.
    21.1.2020 23:07 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Alespoň si dokážu rukou prohrábnout vlasy, implicitní geronte xD
    22.1.2020 07:15 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To je dost slabé, nemyslíš? Takových inteligentů je plná noclehárna Naděje.
    22.1.2020 11:12 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Sorry, neorientuji se v gay klubech.
    22.1.2020 12:10 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Je mi ukradené, kde všude ti natrhli prdel. Nejspíš to bude tím, v jaké společnosti se pohybuješ, ale co naplat, když ti imponují bujné kštice.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.