abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 06:00 | Nová verze

Po necelém roce od vydání verze 0.67 byla vydána verze 0.68 populárního telnet a ssh klienta PuTTY. Podrobnosti v přehledu změn. Řešeny jsou také bezpečnostní chyby.

Ladislav Hagara | Komentářů: 0
včera 21:32 | Nasazení Linuxu

Canonical představuje nejnovější verzi chytré helmy DAQRI s Ubuntu pro rozšířenou realitu. K vidění bude příští týden v Barceloně na veletrhu Mobile World Congress 2017.

Ladislav Hagara | Komentářů: 0
včera 21:31 | Pozvánky

Pro zájemce o hlubší znalosti fungování operačních systémů připravila MFF UK nový předmět Pokročilé operační systémy, v rámci něhož se vystřídají přednášející nejen z řad pracovníků fakulty, ale dorazí také odborníci ze společností AVAST, Oracle, Red Hat a SUSE. Tento předmět volně navazuje na kurz Operační systémy ze zimního semestru, ale pokud máte praktické zkušenosti odjinud (například z přispívání do jádra Linuxu) a chcete si

… více »
Martin Děcký | Komentářů: 6
včera 21:30 | Pozvánky

Czech JBoss User Group Vás srdečně zve na setkání JBUG v Brně, které se koná ve středu 1. března 2017 v prostorách Fakulty Informatiky Masarykovy Univerzity v místnosti A318 od 18:00. Přednáší Tomáš Remeš a Matěj Novotný na téma CDI 2.0 - New and Noteworthy. Více informací na Facebooku a na Twitteru #jbugcz.

mjedlick | Komentářů: 0
20.2. 23:45 | Zajímavý software

Na blogu Qt bylo představeno Qt 3D Studio. Jedná se o produkt dosud známý pod názvem NVIDIA DRIVE™ Design Studio. NVIDIA jej věnovala Qt. Jedná se o několik set tisíc řádků zdrojového kódu. Qt 3D Studio bude stejně jako Qt k dispozici jak pod open source, tak pod komerční licencí. Ukázka práce s Qt 3D Studiem na YouTube.

Ladislav Hagara | Komentářů: 10
20.2. 17:50 | Komunita

Nadace The Document Foundation (TDF) zastřešující vývoj svobodného kancelářského balíku LibreOffice slaví 5 let od svého oficiálního vzniku. Nadace byla představena 28. září 2010. Formálně byla založena ale až 17. února 2012.

Ladislav Hagara | Komentářů: 0
20.2. 12:50 | Komunita

Mozilla.cz informuje, že dosud experimentální funkce Page Shot z programu Firefox Test Pilot (zprávička) se stane součástí Firefoxu. Page Shot je nástroj pro vytváření snímků webových stránek. Umí výběr oblasti, prvku stránky (např. odstavce), nebo uložení snímku celé stránky. Snímky lze ukládat na disk nebo nahrávat na server Mozilly. Nedávno bylo oznámeno, že se součástí Firefoxu stane Activity Stream.

Ladislav Hagara | Komentářů: 33
20.2. 04:10 | Nová verze

Po 10 týdnech vývoje od vydání Linuxu 4.9 (zprávička) oznámil Linus Torvalds, mj. již 20 let žijící v USA, vydání Linuxu 4.10 (LKML). Přehled nových vlastností a vylepšení například na Kernel Newbies a v Jaderných novinách (1, 2 a 3). Kódové jméno Linuxu 4.10 je Fearless Coyote.

Ladislav Hagara | Komentářů: 27
19.2. 15:55 | Zajímavý projekt

Vyzkoušet si příkazy a vyřešit několik úkolů lze na stránkách Commandline Challenge (CMD Challenge). Úkoly lze řešit různými způsoby, důležitý je výsledek. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

Ladislav Hagara | Komentářů: 19
18.2. 17:35 | Bezpečnostní upozornění

Německá Bundesnetzagentur (obdoba českého ČTU) zakázala na německém území prodej panenky Cayla kvůli „špionáži“ dětí. Tato elektronická hračka obsahuje mikrofon, reproduktor a kameru a bezdrátové komunikační rozhraní, pomocí kterého se hračka připojuje na servery výrobce. Takovýmto způsobem může hračka pomocí umělé inteligence „odpovídat“ na dotazy dítěte. Hlavní problém bude ale asi někde jinde, podle prvotních zpráv může

… více »
Petr Tomášek | Komentářů: 34
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (14%)
 (2%)
 (71%)
 (3%)
 (10%)
Celkem 680 hlasů
 Komentářů: 63, poslední dnes 11:29
Rozcestník

Dotaz: Analýza obrazu pro vytvoření úsporného PDFka

6.5.2015 09:07 JanM | skóre: 28
Analýza obrazu pro vytvoření úsporného PDFka
Přečteno: 619×
Dobré dopoledne,

zaujala mne metoda scanneru Canon MF8450 (multifunkce), jak dosahuje malých souborů u naskenovaných kancelářských dokumentů - obraz prostě rozloží na části bitonální (CCITT) a plnobarevné (JPEG). V PDFku to naskládá přes sebe.

Výsledkem je čistý, dobře čitelný dokument.

Oproti tomu proklatě drahá skenovací stanice Kodak či ještě hůře kopírka Kodaku vždy vytvoří pouze jednu RGB bitmapu, takže chci-li alespoň trochu zmenšit soubor, tak nastupuje brutální JPEG komprese - čitelnost mizerná.
$ pdfimages -list Canon\ MF8450\ 300dpi.pdf   
page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio 
-------------------------------------------------------------------------------------------- 
  1     0 image    1232  1728  rgb     3   8  jpeg   no         4  0   151   150 39.5K 0.6% 
  1     1 stencil  2352  2924  -       1   1  ccitt  no         5  0   300   300 37.6K 4.5% 
  1     2 stencil   648   236  -       1   1  ccitt  no         6  0   300   300 3300B  17% 
  1     3 stencil   320   136  -       1   1  ccitt  no         7  0   300   300  424B 7.8% 
$ pdfimages -list Kodak\ scanner\ 300dpi\ text-graphics\ good-quality\ no-ocr.pdf  
page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio 
-------------------------------------------------------------------------------------------- 
  1     0 image    1232  1749  rgb     3   8  jpeg   yes       13  0   151   150  132K 2.1%
Neznáte někdo linuxový nástroj, který by dokázal analyzovat a rozložit dokument podobně jako ten Canon?

Odpovědi

6.5.2015 09:18 #Tom | skóre: 32 | blog: Inspirace, aneb co jsem kde vyhrabal
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Před několika lety jsem totéž řešil pro účely scanování do DJVU. Napsal jsem si scheme skript pro Gimp, který postupoval přibližně tak, že vybral vše černé oddělil to do samostatné vrstvy, a tyto dvě vrstvy odděleně uložil do souborů. Potom následoval převod do DJVU vrstev a jejich složení do výsledné stránky. Ve výsledku vypadal dobře, text, obrázky byly oddělením černé složky mírně poškozeny, protože i jich se týkalo skládání vrstev.

CCITT Group 4 umí určitě ImageMagick pro TIFF formát, jestli to dokáže i pro PDF, to nevím, ale obyčejné PNG by taky stačilo. Na barvy by šel možná i JPEG-2000. Dvě složky v oddělených PDF souborech lze spojit třeba pomocí PDFTK, kde jedna poslouží jako pozadí a druhá jako popředí.

Skript pro Gimp (snad 2.2) ještě někde mám, ale vím, že v novějších verzích nefunguje.
6.5.2015 09:57 JanM | skóre: 28
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Kdybyste jej našel, to byste mne potěšil.
15.5.2015 23:34 #Tom | skóre: 32 | blog: Inspirace, aneb co jsem kde vyhrabal
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Příloha:
Nakonec jsem to našel, a funguje to zcela bez úprav za předpokladu, že se doplní chybějící funkce strcspn. Aby byl výsledek rozumný, je třeba správně předvolit práh pro převod na černobílou složku. Pro zajímavost přikládám i skripty pro převod PNG na dvouvrstvé DJVU.

Skripty SCM je třeba nahrát do $HOME/.gimp-2.X/scripts. Oddělovač barevných vrstev lze použít nejenom dávkově, ale lze jej vyvolat i z nabídky Filters. Pracuje však jen se soubory na disku, ne s otevřenými obrázky.
4.6.2015 23:44 JanM | skóre: 28
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Funguje. Najdu-li čas, zkusím si s tím pohrát.
6.5.2015 09:53 JanM | skóre: 28
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Příloha:
Ještě přikládám ukázku.
16.5.2015 09:47 Radovan Garabik
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Neznáte někdo linuxový nástroj, který by dokázal analyzovat a rozložit dokument podobně jako ten Canon?
didjvu

len, pravda, je to na prevod do djvu...
4.6.2015 23:25 JanM | skóre: 28
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Zajímavé. Pro vlastní použití je djvu v pohodě, ale pro sdílení přece jen PDF kraluje.

Zkoušel jsem separovat následný djvu produkt, pomocí djvuextract se mi podařilo získat monochromatickou masku (text + desaturovaná barevná grafika), pozadí (které zahodím) a popředí (které nese informaci o barvě).

Potíž s popředím je, že je ve formátu IW44, a nepřišel jsem na to, jak to rozumně zkombinovat s maskou a vytvořit samostatné bitmapy pro čistě černobílý text a barevnou grafiku, abych to poté mohl ve vrstvách složit do PDF.

Poslední krok by šel provést jako složení černobílého textu z masky a navrch barevné vrstvy pomocí pdftk (pdf + stamp). Asi by to nebylo tak dobré, jako to zvládá skener Canon, ale mohlo by stačit.
2.10.2015 22:32 JanM | skóre: 28
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Zatím jsem moc nepokročil (protože: není čas), raději skenuji na té správné mašině ;-)

Nicméně dnes mne zaujalo, že v LibreOffice (který jinak moc nepoužívám) lze pracovat s průhledností obrázků (tj. skládat je přes sebe) a jeho přímý export do PDF funguje obdobně jako výše popsaný skener Canon, tj. kombinuje JPEG, PNG a CCITT vč. masek pro průhlednost. To by byla vícevrstvá alternativa k pdftk.

export přes libreoffice.

Jen ještě dořešit potíž s kvalitním rozkladem obrazu.
16.5.2015 21:54 safs
Rozbalit Rozbalit vše Re: Analýza obrazu pro vytvoření úsporného PDFka
Zajimavy trik.

Pri tomhle se pouziva vlastnost lidskeho oka, ktere vnima podstatne vetsi rozliseni v cernobile a mnohem hure v barvach. Proto maji cernobile tiskarny rozliseni 600dpi a vic (u 400 dpi je to opravdu videt), kdezto barevne snimky maji klidne 120dpi a nikdo si toho ani nevsimne.

Rada je asi jasna, rozlozit snimek na intensitu a barevne kanaly, barve zmensit rozliseni a zkopresovat. Nezvladnul by to ImageMagick?

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.