abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:11 | Nová verze

    Coppwr, tj. GUI nástroj pro nízkoúrovňové ovládání PipeWire, byl vydán v nové verzi 1.6.0. Zdrojové kódy jsou k dispozici na GitHubu. Instalovat lze také z Flathubu.

    Ladislav Hagara | Komentářů: 0
    včera 22:33 | Nová verze

    Byla vydána dubnová aktualizace aneb nová verze 1.89 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a animovanými gify v poznámkách k vydání. Vypíchnout lze, že v terminálu lze nově povolit vkládání kopírovaného textu stisknutím středního tlačítka myši. Ve verzi 1.89 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 6
    včera 21:22 | Nová verze

    Proton, tj. fork Wine integrovaný v Steam Play a umožňující v Linuxu přímo ze Steamu hrát hry určené pouze pro Windows, byl vydán ve verzi 9.0-1 (𝕏). Přehled novinek se seznamem nově podporovaných her na GitHubu. Aktuální přehled her pro Windows běžících díky Protonu také na Linuxu na stránkách ProtonDB.

    Ladislav Hagara | Komentářů: 2
    včera 19:33 | Nová verze

    Byla vydána verze 1.78.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání na GitHubu. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    včera 11:22 | Bezpečnostní upozornění

    Služba Dropbox Sign (původně HelloSign) pro elektronické podepisování smluv byla hacknuta.

    Ladislav Hagara | Komentářů: 2
    včera 11:00 | Nová verze

    Byla vydána nová major verze 8.0 textového editoru GNU nano (Wikipedie). Podrobný přehled novinek a oprav v oznámení v diskusním listu info-nano nebo v souboru ChangeLog na Savannah. Volbou --modernbindings (-/) lze povolit "moderní" klávesové zkratky: ^C kopírování, ^V vložení, ^Z vrácení zpět, … Tato volba je aktivována také pokud binárka s nano nebo link na ni začíná písmenem "e".

    Ladislav Hagara | Komentářů: 3
    1.5. 23:22 | IT novinky

    Před 60 lety, 1. května 1964, byl představen programovací jazyk BASIC (Beginners' All-purpose Symbolic Instruction Code).

    Ladislav Hagara | Komentářů: 16
    1.5. 22:22 | Nová verze

    Byla vydána nová verze 12.0 minimalistické linuxové distribuce (JeOS, Just enough Operating System) pro Kodi (dříve XBMC) a multimediálního centra LibreELEC (Libre Embedded Linux Entertainment Center). Jedná se o fork linuxové distribuce OpenELEC (Open Embedded Linux Entertainment Center). LibreELEC 12.0 přichází s Kodi 21.0 "Omega".

    Ladislav Hagara | Komentářů: 0
    1.5. 12:55 | Nová verze

    Microsoft vydal novou velkou aktualizaci 2404.23 v září 2019 pod licencí SIL Open Font License (OFL) zveřejněné rodiny písma Cascadia Code pro zobrazování textu v emulátorech terminálu a vývojových prostředích.

    Ladislav Hagara | Komentářů: 0
    1.5. 05:33 | Nová verze

    OpenTofu, tj. svobodný a otevřený fork Terraformu vzniknuvší jako reakce na přelicencování Terraformu z MPL na BSL (Business Source License) společností HashiCorp, bylo vydáno ve verzi 1.7.0. Přehled novinek v aktualizované dokumentaci. Vypíchnout lze State encryption.

    Ladislav Hagara | Komentářů: 0
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (13%)
     (29%)
     (38%)
     (21%)
    Celkem 24 hlasů
     Komentářů: 5, poslední dnes 12:22
    Rozcestník

    Možnosti editace textu u PDF v linuxovém prostředí

    17.1.2020 17:11 | Přečteno: 2846× | Za vším hledej Linux | poslední úprava: 17.1.2020 17:11

    Před rokem, kdy jsem měl – stejně jako letos – vyplnit všobecně známý "růžový papír" ohledně daní, poprvé dorazil formulář ve formě PDF. Nakonec jsem ho vyplnil pomocí aplikace Master PDF Pro, který má oproti Acrobatu Pro DC, od Adobe také linuxovou verzi. Zvládla totéž co plnotučný Acrobat, který pro linux není. Navíc má normální licenční politiku – nehodlám platit Adobe měsíční výpalné za cloudové služby o které nestojím.

    Podruhé jsem použil Master PDF Pro včera, když mne kolega požádal, zda-li bych neupravil třístránkový článek dodaný v PDF formátu tak, aby ho bylo možné vytisknout jako poster. Mohl jsem to udělat i přes Inkscape, ale zvolil jsem Master PDF Pro abych si ho vyzkoušel. Demo verze je plně funkční, pokud vám nevadí vodoznak na pozadí uloženého PDF. Výsledek můžete vidět na přiloženém screenshotu.

    Odstranění vodoznaku je triviální, když si uvědomíte jak vypadá PDF uvnitř. Ale o tom psát nechci. Chci se pouze zmínit o možnostech a limitech editace PDF souborů v linuxovém prostředí.

    Vše záleží na tom, jakým způsobem je PDF vytvořeno, a má-li vůbec editovatelný obsah. Je to v podstatě snůška objektů, takže pokud jste masochisté, můžete dokumenty editovat i prostřednictvím textového editoru – pak se můžete velice triviálně zbavit i zmíněného vodoznaku. Ovšem většina jedinců při přehazování objektů PDF souboru upřednostňuje wysiwyg editaci. Kromě již zmíněného Master PDF editoru tak v linuxovém prostředí použít např. Inkscape nebo Libreoffice – pokud vám nevadí, že se dokument při editaci rozhodí.

    Zajímá vás proč se při editaci PDF dokument rozhodí?

    Je to prosté. Protože PDF (Portable Document Format – přenositelný formát dokumentu) vzniklo primárně za účelem výměny elektronických dokumentů, podporuje několik diametrálně odlišných forem pro uložení textového obsahu, které vznikaly jak šel čas.

    Jeho základem se stal PostScript — programovací jazyk z poloviny 80. let, kterým komunikoval software od firmy Adobe s některými tiskárnami. Těm bylo možné posílat text různými způsoby. Buď jako jednotlivé znaky, jejichž vizualizace záležela na fontech tiskárny. Nebo jako obrázky. A to buď vektorové, nebo bitmapové. U těch vektorových byl výsledek lepší, protože je bylo možné podle potřeby škálovat. Nicméně podoba výsledného dokumentu závisela na tom, zdali byl na stroji, ze kterého se dokument tisknul, dostupný font s nímž se počítalo v tištěném souboru. Což u přenášených dokumentů většinou nebyl. Proto se u raných PDF dokumentů místo textu vygenerovala sada obrazových objektů, a místo znaku se pak uvedly jen souřadnice příslušného objektu. Jenže tohle uměl jen placený software od Adobe.

    Většina generátorů PDF dokumentů, spoléhala na lokálně instalované fonty. Pokud použitý font nebyl k dispozici tak se při zobrazení takového PDF souboru objevily pouze čtverečky. Dokument z Acrobatu s vygenerovanými písmeny, se však zobrazoval všude stejně. Pokud PDF dokument pracoval jen se standardními fonty MS Windows, trápil tento problém jen málokterého BFU. Ostatně, existovala ještě jedna možnost – vyexportovat do PDF celou stránku jako bitmapový obrázek. Pochopitelně výsledný soubor byl pak mnohem větší, což ale 99,99% uživatelů PDF nepociťovalo jako problém.

    Ovšem já byl v té setině uživatelů.

    Netrápilo mě tehdy ani tak to, že textový obsah PDF nebylo možné opravit pouhou editací, jako spíš velikost výsledného souboru. Placený Acrobat jsem k dispozici neměl a jako student jsem měl k dispozici pouze 50MB úložného prostoru, do kterého bylo možné umístit obsah sdílený přes web. Takže jsem byl nucen, abych srazil velikost výsledného PDF, jít při zpracování naskenovaných knih až na dřeň. Na jeden takový soubor, kde se mi podařilo zmáčkout 182 strojopisných stránek do 21 MB souboru, se můžete podívat zde. Bohužel pro aplikaci OCR je ten soubor nepoužitelný. Pokud se někdy dostanu k tomu abych tuhle knihu zpracoval znovu, tak už jedině do DjVu – protože výsledný soubor pak bude mít poloviční velikost, a to včetně textové vrstvy.

    Nicméně, omezená kapacita webového prostoru nebyla jediným důvodem, proč jsem se již tehdy zajímal o možnosti editace PDF.

    Pracoval jsem tenkrát při studiu jako "konzultant" pro překladatelskou firmu Skřivánek s.r.o. Klient dodal elektronický dokument k překladu, já ho prozkoumal. Zjistil, co se dá s jeho obsahem dělat a na mém posudku pak záleželo, kolik to bude klienta stát. Háček byl v tom, že mě za tohle nikdo neplatil. Já byl placen za zpracování výsledného dokumentu, tak aby klient dostal dokument ve stejném formátu, jaký dodal, ale přeložený. Takže když později najali chytráka, co realizace zakázek (za které bych inkasoval nějaké peníze) začal dohazovat svým kamrádům, naše spolupráce skončila.

    Ale zpět k PDF. Zkrátka bylo nutné řešit otázku editace PDF. A právě tehdy jsem narazil na to, že textový obsah nelze opravit pouhou editací ani s využitím Adobe Acrobatu, pokud není k dispozici originální font. Autory dodaného PDF to netrápilo, protože měli originální fonty k dispozici jenže ty neměly českou lokalizaci. Naštěstí šlo o technický manuál, takže nebyl problém použít jiný font a udělat defakto nový PDF dokument s využitím původních obrázků.

    Postupem času PDF zamořilo svět, a protože se začalo používat i pro věci ke kterým se původně moc nehodilo, začaly se postupně také rozšiřovat možnosti původního formátu. Takže dnes už můžete mít i PDF se skrytou textovou vrstvou a tak získat PDF, které se již dá upravit, protože obsahuje editovatelný text. Ovšem výsledek záleží na tom, jestli váš systém má k dispozici originální fonty, resp. zda-li vaše aplikace umí pracovat s textem podobně jako Adobe Acrobat. Což z těch pro linuxové prostředí umí jen Master PDF Pro.

    Při importu do Inkscape, se PDF dokument zkonvertuje do SVG. Pokud zvolíte, že má text zůstat textem, tak se místo původního fontu použije příbuzný font, který je dostupný ve vašem systému ovšem pokud není stejný, jako ten co byl použitý v originálním PDF, tak se zobrazený obsah rozbije. Na druhou stranu Inkscape nabízí možnost naimportovat místo textu hromadu vektorových objektů, a dokument si pak můžete přesázet znak po znaku jak Guttenberg. Ale pro úkol jaký jsem dostal tenhle typ editace bohatě stačí.

    U LibreOffice moc na výběr nemáte, text se z PDF importuje rovnou jako text. Na druhou stranu máte při editaci víc možností. Např. při tzv. konsolidaci textu, si můžete spojit vybrané řádky textu do standardního textového bloku, jehož obsah lze následně formátovat přes styly. Tuhle cestu bych nejspíš volil před těmi 19 lety u Skřivánka.

           

    Hodnocení: 100 %

            špatnédobré        

    Obrázky

    Možnosti editace textu u PDF v linuxovém prostředí, obrázek 1

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    regine avatar 17.1.2020 23:18 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše česká diakritika

    Master PDF Editor v Ubuntu užívám k vyplňování dokumentů. Nezvládá však plně českou diakritiku. Například misto Č vznikne C.

    Moje verze 1.9.23 nevytváří vodoznak. Zatím jsem nepotřeboval, ale jak odstranit vodoznak na pozadí u PDF, kdybych někdy tuto znalost potřeboval? Když mi zašlou k vyplnění požadovaný dokument, klidně vyplním a vrátím s vodoznakem.

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    regine avatar 17.1.2020 23:21 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše podpis

    Už jsme uložil, přidávám až teď. Pokud je potřeba podpis v PDF dokumentu, užívám Xournal a Wacom pen-tablet (lepší jak se podepisovat krysou).

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    19.1.2020 09:18 this0ne
    Rozbalit Rozbalit vše Re: podpis
    Podpis se da naskenovat z papiru a pak v Gimpu zpruhlednit pozadi. Master PDF i Adobe ma primo funkci na vkladani takoveho podpisu.
    regine avatar 21.1.2020 08:26 regine | skóre: 22 | blog: regine
    Rozbalit Rozbalit vše nejistota

    Vím, že Master PDF a Adobe Reader by měli umožnit podpis, ale většinou nefunkční. Asi je to dáno, jak je PDF dokument vygenerován.
    S Xournal byl podpis vždy zdárný. Pomocí GIMP jde o složitější způsob.

    Cigareta krátí život o 1 minutu, láhev koňaku o 5 minut a pracovní den krátí život o 8 hodin.
    18.1.2020 01:10 Want
    Rozbalit Rozbalit vše Re: česká diakritika
    PDF je složené z objektů a obvykle komprimované. K dekompresi lze použít pdftk, pak lze soubor editovat libovolným textovým editorem co neprasí kód - stačí třeba mcedit. Jelikož vodoznak může být udělaný mnoha způsoby, je třeba zjistit, který z objektů ho dělá a ten pak jednoduše vymazat.
    18.1.2020 12:31 Luboš
    Rozbalit Rozbalit vše Re: česká diakritika
    taky by mě zajímalo jak triviálně odstranit vodoznak z pdf souboru
    18.1.2020 10:31 volani.tk
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Zkoušel někdo treba Only Office pro editaci pdf?
    18.1.2020 15:53 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    0,0001 % neni setina, ty duta hlavo. Je smutne videt, ze ve statem financovane instituci dnes muze pracovat i clovek, ktery nezna zakladni pocty. Takhle za moje penize spravujete i ty vase servery, pane Kapica?
    18.1.2020 20:56 Want
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Celkem nepřekvapí, že se nula jako ty mezi těmi nulami ztratí.
    19.1.2020 11:30 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To jsi vážně tak tupý že je nutné ti implicitně sdělit že je řeč o setinách procenta?
    19.1.2020 12:56 %.
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To jsi vážně tak tupý, že neznáš význam slova implicitně?
    19.1.2020 16:25 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To ti trvalo 14 hodin vymyslet tuhle vymluvu? :D :D Usmevne.
    21.1.2020 15:18 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    A jak dlouho bude trvat tobě, než konečně umřeš?
    21.1.2020 19:43 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Míň než tobě buřte vožralej masožravej.
    21.1.2020 20:20 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Pošlu ti holuby na rozptylovou loučku, aby ti sedmikrásky líp kvetly.
    21.1.2020 20:39 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Já ti pošlu PPLkem slovník cizích slov, ať pochopíš rozdíl slov implicitní a explicitní a nemáš vyjadřovací schopnosti dělníka na stavbě. S IQ lopaty ti nepomohu, ale to už je tvůj boj, dědku plešatej.
    21.1.2020 20:47 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Tos fakt pobavil. Ty nejsi schopný vyplnit ani přihlašovací formulář na abclinuxu, natož poslat něco přes PPL.
    21.1.2020 23:07 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Alespoň si dokážu rukou prohrábnout vlasy, implicitní geronte xD
    22.1.2020 07:15 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    To je dost slabé, nemyslíš? Takových inteligentů je plná noclehárna Naděje.
    22.1.2020 11:12 %
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Sorry, neorientuji se v gay klubech.
    22.1.2020 12:10 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Možnosti editace textu u PDF v linuxovém prostředí
    Je mi ukradené, kde všude ti natrhli prdel. Nejspíš to bude tím, v jaké společnosti se pohybuješ, ale co naplat, když ti imponují bujné kštice.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.