abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 20:00 | Komunita

    V březnu loňského roku přestal být Redis svobodný. Společnost Redis Labs jej přelicencovala z licence BSD na nesvobodné licence Redis Source Available License (RSALv2) a Server Side Public License (SSPLv1). Hned o pár dní později vznikly svobodné forky Redisu s názvy Valkey a Redict. Dnes bylo oznámeno, že Redis je opět svobodný. S nejnovější verzí 8 je k dispozici také pod licencí AGPLv3.

    Ladislav Hagara | Komentářů: 0
    dnes 19:22 | IT novinky

    Oficiální ceny Raspberry Pi Compute Modulů 4 klesly o 5 dolarů (4 GB varianty), respektive o 10 dolarů (8 GB varianty).

    Ladislav Hagara | Komentářů: 0
    včera 22:33 | Nová verze

    Byla vydána beta verze openSUSE Leap 16. Ve výchozím nastavení s novým instalátorem Agama.

    Ladislav Hagara | Komentářů: 0
    včera 17:44 | Zajímavý článek

    Devadesátková hra Brány Skeldalu prošla portací a je dostupná na platformě Steam. Vyšel i parádní blog autora o portaci na moderní systémy a platformy včetně Linuxu.

    karkar | Komentářů: 0
    včera 12:11 | Humor

    Lidi dělají divné věci. Například spouští Linux v Excelu. Využít je emulátor RISC-V mini-rv32ima sestavený jako knihovna DLL, která je volaná z makra VBA (Visual Basic for Applications).

    Ladislav Hagara | Komentářů: 7
    včera 10:44 | IT novinky

    Revolut nabídne neomezený mobilní tarif za 12,50 eur (312 Kč). Aktuálně startuje ve Velké Británii a Německu.

    Ladislav Hagara | Komentářů: 28
    včera 09:55 | IT novinky

    Společnost Amazon miliardáře Jeffa Bezose vypustila na oběžnou dráhu první várku družic svého projektu Kuiper, který má z vesmíru poskytovat vysokorychlostní internetové připojení po celém světě a snažit se konkurovat nyní dominantnímu Starlinku nejbohatšího muže planety Elona Muska.

    Ladislav Hagara | Komentářů: 6
    včera 09:33 | IT novinky

    Poslední aktualizací začal model GPT-4o uživatelům příliš podlézat. OpenAI jej tak vrátila k předchozí verzi.

    Ladislav Hagara | Komentářů: 0
    včera 08:11 | Nová verze

    Google Chrome 136 byl prohlášen za stabilní. Nejnovější stabilní verze 136.0.7103.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 8 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    29.4. 20:55 | Nová verze

    Homebrew (Wikipedie), správce balíčků pro macOS a od verze 2.0.0 také pro Linux, byl vydán ve verzi 4.5.0. Na stránce Homebrew Formulae lze procházet seznamem balíčků. K dispozici jsou také různé statistiky.

    Ladislav Hagara | Komentářů: 0
    Jaký filesystém primárně používáte?
     (58%)
     (1%)
     (9%)
     (21%)
     (4%)
     (1%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 497 hlasů
     Komentářů: 19, poslední včera 11:32
    Rozcestník

    DJVU versus PDF

    19.7.2006 15:53 | Přečteno: 6508× | Za vším hledej Linux

    Ve svém minulém příspěvku jsem se pokusil upozornit na možnost konverze postscriptových dokumentů do formátu DJVU a jen velice zběžně jej představil jako formát podobný co do funkčnosti formátu PDF. Shodou náhod kolega obdržel k připomínkování návrh direktivy o doporučených formátech pro výměnu dat, která doporučuje ODT formát pro dokumenty které nemají konečnou revizi a PDF pro dokumenty které jsou již uzavřené.

    Vzhledem k tomu, že PDF dokumenty lze bez problému převést na DJVU vcelku o nic nejde, ale proč ještě převádět PDF do nějakého DJVU? Podotýkám že smyslem zápisu není pohanět formát PDF, spíše zdůraznit přednosti formátu DJVU tam, kde má PDF slabiny.

    Kde kulhá PDF

    I když dva dělají totéž, není to totéž. Rozdíl mezi PDF a DJVU je kromě struktury dokumentu také v typu použité komprese. PDF má podobně jako postscript lineární zápis tj. prohlížeč čte dokument a postupně vykresluje objekty specifikované pomocí souřadnic a atributů na stránku. Text je renderován podle použité znakové sady a případných dalších nastavení. Ovšem obrázky jsou vloženy v kvalitě odpovídající určení dokumentu. Využívá se např. toho, že v případě dokumentu určeného pro čtení z monitoru je zbytečné pro ně nastavovat vyšší rozlišení než 100dpi. Vnitřní struktura PDF dokumentu se může lišit také v závislosti na tom jak byl vytvořen, přesto že na první pohled vypadá pokaždé v prohlížeči stejně.

    Například dokument uložený přímo do PDF např. z OpenOffice, nebo vytištěný přes CUPS-PDF bude malý, protože text není uložen jako vyrenderovaný obrázek, ale přímo jako text. Má to však jeden háček. Pokud si tento dokument otevře na svém stroji někdo, kdo nemá nainstalované písmo, jaké bylo použito při generování PDF dokumentu, tak se může stát, že místo textu uvidí jen hromadu čtverečků. Tomu lze zabránit tím, že se do PDF dokumentu vloží i font. Ovšem tím jeho velikost poněkud nabobtná.

    Další možností je, text renderovat jako grafiku, to má ale háček v tom, že jej nelze dále editovat, ani prohledávat. Poslední možností je vložit celý dokument do PDF jako obrázek. Casto se to tak dělá, pokud obsahuje nějaké podpisy, razítka, atp. soubor tím ale řádně nakyne - možnost jeho fulltextového prohledávání může být zachovaná pokud do něj OCR aplikace vloží rozpoznaný text. Možnost takto zpracovat PDF nabízí většina moderních OCR aplikací - bohužel většina z nich je "only for MS Windows"

    V DJVU dokumentu je každá stránka samostatným objektem, který na rozdíl od PDF rovnou pracuje s několika vrstvami. Základem je obrazová vrstva, která je přítomna vždy. Kromě ní mohou být přítomny i další textové vrstvy s metadaty, hyperlinky, skrytým textem obsahu stránky a poznámkami. Díky wavelet kompresi je však taková stránka co do objemu dat vždy menší než u PDF. Naopak čím vyšší rozlišení měl výchozí dokument, o to lepší výsledek komprese.

    Komprese grafických objektů

    Zatím co DJVU používá ke kompresi obrázků primárně vlastní wavelet kompresi IW44, Wavelet kompresi JPEG-2000 začalo do PDF Adobe implementovat až od Acrobata verze 6, ovšem kvůli zachování kompatibility se staršími prohlížeči se stejně používají u PDF dokumentů klasické komprese na bázi LZW a JPEG.

    Práce s poznámkami a vloženým textem

    Vezměte prosím v úvahu, že toto téma zpracovávám z hlediska open source a Linuxu zvlášt, tudíž komerční aplikace pro jiné systémy zcela opomíjím. Ba troufám si říct, že v Linuxu lze kupříkladu pro práci s DJVU nalézt nástroje lepší. Pokud jde ale o možnost práce s poznámkami a textem ve vytvořeném PDF, tak mi to spíš připomínalo procházku slzavým údolím.

    Už, už jsem se chystal naříkat, že žádná z volně dostupných aplikací pro linux neumožnuje u PDF práci s poznámkami a pak jsem ji našel! Multivalent ale má několik pih na kráse. Je napsán v Javě, tudíž vyžaduje nainstalovanou javu od Sunu a.. ..je pomalý jako všechny aplikace v javě. Prakticky totéž ovšem lze vytknout i čtečce djvu dokumentů Java DjVu Viewer. Výhodou je ale fakt, že je lze použít všude tam kde se dá java od Sunu nainstalovat. Druhou pihou na kráse je že nepracuje s unicode, takže na diakritiku s klidem zapomente, i když se domnívám že to bude spíš problém poznámek v PDF.

    U DJVU dokumentů není problém k editaci textových údajů a poznámek použít nástroje které jsou součástí DjVuLibre, co bohužel prozatím schází je nějaký grafický nástroj, který by usnadnil orientaci v textové vrstvě a zjednodušil vkládání hypertextových odkazů a poznámek, ale třeba se toho někdo chytí jako zajímavého a užitečného projektu.

    Doporučené stránky

    Pro vás, co máte hlubší zájem o srovnání možností formátu DJVU mám dva odkazy na práce Adolfa Knolla, obé ovšem v jazyce anglickém:
    Efektivnost wavelet komprese
    Testování nových obrazových formátů

           

    Hodnocení: 92 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    19.7.2006 16:31 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Je to sice v příspěvku obsažené, ale chtěl bych zdůraznit, že djvu opravdu nelze považovat za náhradu pdf. PDF toho umí mnohem víc, je daleko univerzálnější. DjVu si sice vede lépe v naskenovaných dokumentech, ale pro jiné věci se už zas tak moc nehodí.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    19.7.2006 16:38 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Když už tak napiš které. Mě teda napadá především příprava dokumentů k tisku atp. Jak už jsem napsal DjVu je vhodné především k elektronické konzervaci dokumentů, tak aby bylo možno s nimi dále pracovat (ve smyslu studovat je).
    19.7.2006 17:09 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    No jaký má smysl do djvu převádět pdfka, které obsahují především text (třeba matematický text)? Že se mi někdy zmenší velikost je celkem dost nezajímavé oproti nevýhodám, které znamená převedení na obrázek (ve kterém lze díky přítomnosti textové vrstvy vyhledávat :-)). Je to podobné jako převádět vektorovou grafiku do bitmapy.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    19.7.2006 17:58 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Třeba takový..
    user@stroj:~/djvutesty$ ls -alh epilog*
    -rw-r--r-- 1 user users 157K 2006-07-19 17:48 epilogue.djvu
    -rw-r--r-- 1 user users 2,6M 2006-07-19 17:47 epilogue.ps
    -rw-r--r-- 1 user users 282K 2006-07-19 17:47 epilogue.pdf
    
    Do DJVU převedeno přes djvudigital včetně textové vrsty rovnou z postscriptu (Zkusil jsem namátkou první matematickou věc na kterou jsem narazil)
    19.7.2006 18:01 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    A že nekecám, tak tady máš vytažených prvních pár řádek rovnou z toho djvu souboru:
    The association between mathematics and graphics is ancient. Indeed, as the scholar of Greek mathematics T. L. Heath has observed, the Greek root of the word 'graphics' seems to mean in places 'to prove'. But the association is far
    19.7.2006 18:11 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Však říkám, co je mi do velikosti? Doma mám třeba aktuálně volno 1,2 TB. Tohle je prostě příklad naprosto nesmyslného převodu, při kterém jsem navíc něco ztratil (udělal z toho obrázek). Při některých příležitostech se mi může hodit, že si to můžu převést do djvu a využít jeho výhod, ale nevidím jediný důvod, proč to v djvu skladovat.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    20.7.2006 07:57 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    No nevím, ale jak se vyjádřil kolega, pokud máš na svém stroji doma volných 1,2TB tak si už samo o sobě pěkný úchyl, že tam necháváš válet volný diskový prostor, který představuje minimálně 3 půlgigové disky které stojí bratru á 7 litrů Kč kus.
    20.7.2006 09:56 VícNežNic | skóre: 42 | blog: Spáleniště | Ne dost daleko
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    No, stejnou metodou jako on bych taky pár set mega nasčítal. A to kdekdo, myslím.
    Copak toho není dost?
    20.7.2006 14:40 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Půl gigové disky - to je nostalgie. Pamatuji si, jak jsem si do PC namontoval krásný a pekelně drahý 1,2GB Seagate. To mi přišlo, že tolik prostoru ani nedokážu zaplnit :-D
    When your hammer is C++, everything begins to look like a thumb.
    20.7.2006 16:23 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Ach,.. trapný překlep.. mělo být 500GB.. ;-)
    19.7.2006 18:45 VícNežNic | skóre: 42 | blog: Spáleniště | Ne dost daleko
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    No, zrovna těch sto kilo oproti PDF je mi celkem ukradených, i ty tři mega postscriptu nejsou nic co by mě případně trápilo.
    Copak toho není dost?
    21.7.2006 00:06 Jiří (BoodOk) Kadeřávek | skóre: 19 | blog: BoodOk | Brno
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Nesmis mit ale tech dokumentu statisice a vice.
    Věda má v sobě určitou zpupnost, že čím dokonalejší techniku vyvineme, čím více se dozvíme, tím lepší budou naše životy.
    19.7.2006 23:37 #Tom | skóre: 32 | blog: Inspirace, aneb co jsem kde vyhrabal
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Možná se to někdy může hodit, ale v této podobě je převod z PostScriptu či PDF do DJVU jednoznačně ztrátový. Nebo snad lze vytvořit takové DJVU, kde by text nebyl v podobě obrázků, ale tak, jako v PDF?
    20.7.2006 07:49 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Nevím, možná jsem to nenapsal dost srozumitelně, ale v DJVU je text vždy jako skrytá samostatná vrstva, tzn je tam přítomen jak obrázek celé stránky, tak text (pokud ho autor dokumentu nechá vložit)

    Ad předchozí příspěvky. Jasně sto kilo je ukradených, ale povšimli si pánové jaký to udělalo rozdíl?! Oproti PDF téměř 50% DJVU je vhodné především ke sdílení původně tištěných dat po síti - dokumentace, archívy knih atp. Jestli stahuji 50MB dokument nebo 2MB je sakrarozdíl. A stejně tak mám-li s takovým dokumentem pracovat. DJVU je úplně jedno, je-li dokument v rukopise, protože i tak lze vložit textovou vrstvu - dokonce i rovnou s překladem, pokud je originál třeba arabsky, nebo čínsky. Já vím, že podobné věci umí Acrobat taky. Až na jednu mouchu, je only MS Win a navíc ještě za prachy.

    A zcela na závěr. Na Ignorově pracovní stanici se možná na nějaký ten megabajtík nehledí, ale už vidím jak si vesele tahá do svého telefonu 3MB PDF dokument z úřadu, aby si ho přečetl a frká nad tím "že to nějak neleze"
    20.7.2006 09:28 Kníže Ignor | skóre: 19 | blog: stoupa
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Ale ta textová vrstva se nevyužívá k renderování! Prostě DjVu je hlavně obrázek. Na pracovní stanici samozřejmě 1,2 TB volných nemám, je to prostor, který vznikl součtem neobsazeného místa na všech počítačích (kromě notebooků), které máme doma.

    Úchyl ale jsem, to je jasné.

    Pokud jde o naskenované věci, pro které bylo djvu vytvořeno, tak je OK, o tom žádná. Ale když někdo připraví třeba skripta v TeXu, dá je k dispozici v ps nebo pdf, tak v uchovávání v djvu nevidím smysl.
    Jestli máš zálohu mého blogu, tak mi ji pošli. Nějak jsem si ho smazal :-)
    20.7.2006 11:57 #Tom | skóre: 32 | blog: Inspirace, aneb co jsem kde vyhrabal
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Asi tak nějak, zajímalo mě, jestli se dá udělat DJVU tak, aby se písmenka vykreslovala vektorově, ale to asi nejde. Obrázek stránky v 300 DPI skoro vždy stačí, je pěkný, DJVU je pak menší a pracuje se mi s ním rychleji než s PDF. Na naskenované věci už asi rok nic jiného nepoužívám. :-) Ale jinak jedině PDF – není nad kvalitu. :-)
    20.7.2006 13:44 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    A proč by také měla když se to renderuje celé? Opravdu nějak nechápeš o čem ten formát je. Proč by se ti proboha měl ten text ještě nějak extra renderovat? Pro vyhledání ti stačí asci (které nevidíš, ale můžeš z dokumentu vykopírovat) a jinak vidíš vyrenderovaný obrázek se vším všudy, třebas včetně fleku od kafe co sis na originál vylil.
    20.7.2006 14:14 #Tom | skóre: 32 | blog: Inspirace, aneb co jsem kde vyhrabal
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Když budu mít rastrový obrázek, nemůžu jej roztahovat donekonečna, u vektorového to jde.
    20.7.2006 16:24 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Přečti si prosím nejdřív ty články na které odkazuji, ano?
    20.7.2006 16:35 #Tom | skóre: 32 | blog: Inspirace, aneb co jsem kde vyhrabal
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    DJVU má prostě jiné využití než PDF.
    20.7.2006 17:03 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Objevně jsi konstatoval co je napsáno hned zkraje. Jasně že má jiné využití než PDF, háček je v tom, že se dnes administrativně prosazuje PDF i tam, kde má jednoznačně navrch DJVU, a to jen proto, že tento formát a jeho možnosti není moc znám.
    20.7.2006 17:21 #Tom | skóre: 32 | blog: Inspirace, aneb co jsem kde vyhrabal
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Původně mě tento zápisek navnadil, že by se dalo DJVU použít i místo PDF. Pokud by umělo vykreslovat písmo vektorově a rastrově zobrazovat jen obrázky, bylo by to skvělé. Nebo kdyby tak linuxové PDF prohlížeče zvládaly JPEG-2000. :-)
    20.7.2006 17:36 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
    Rozbalit Rozbalit vše Re: DJVU versus PDF
    Ne oni raději budou v rámci Google Summer of Code implementovat jaderný modul, který zrychlí KDE. :-) (Viz LinuxEXPRES a článek v něm otisknutý.)

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.