abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 14:22 | IT novinky

    VASA-1, výzkumný projekt Microsoftu. Na vstupu stačí jediná fotka a zvukový záznam. Na výstupu je dokonalá mluvící nebo zpívající hlava. Prý si technologii nechá jenom pro sebe. Žádné demo, API nebo placená služba. Zatím.

    Ladislav Hagara | Komentářů: 0
    dnes 04:44 | Nová verze

    Nová čísla časopisů od nakladatelství Raspberry Pi: MagPi 140 (pdf) a HackSpace 77 (pdf).

    Ladislav Hagara | Komentářů: 0
    dnes 01:00 | Nová verze

    ESPHome, tj. open source systém umožňující nastavovat zařízení s čipy ESP (i dalšími) pomocí konfiguračních souborů a připojit je do domácí automatizace, například do Home Assistantu, byl vydán ve verzi 2024.4.0.

    Ladislav Hagara | Komentářů: 0
    včera 22:11 | IT novinky Ladislav Hagara | Komentářů: 0
    včera 20:55 | Nová verze

    Neziskové průmyslové konsorcium Khronos Group vydalo verzi 1.1 specifikace OpenXR (Wikipedie), tj. standardu specifikujícího přístup k platformám a zařízením pro XR, tj. platformám a zařízením pro AR (rozšířenou realitu) a VR (virtuální realitu). Do základu se z rozšíření dostalo XR_EXT_local_floor. Společnost Collabora implementuje novou verzi specifikace do platformy Monado, tj. open source implementace OpenXR.

    Ladislav Hagara | Komentářů: 2
    včera 17:22 | Nová verze

    Byla vydána nová verze 0.38.0 multimediálního přehrávače mpv (Wikipedie) vycházejícího z přehrávačů MPlayer a mplayer2. Přehled novinek, změn a oprav na GitHubu. Požadován je FFmpeg 4.4 nebo novější a také libplacebo 6.338.2 nebo novější.

    Ladislav Hagara | Komentářů: 13
    včera 17:11 | Nová verze

    ClamAV (Wikipedie), tj. multiplatformní antivirový engine s otevřeným zdrojovým kódem pro detekci trojských koní, virů, malwaru a dalších škodlivých hrozeb, byl vydán ve verzích 1.3.1, 1.2.3 a 1.0.6. Ve verzi 1.3.1 je mimo jiné řešena bezpečnostní chyba CVE-2024-20380.

    Ladislav Hagara | Komentářů: 2
    včera 12:11 | IT novinky

    Digitální a informační agentura (DIA) oznámila (PDF, X a Facebook), že mobilní aplikace Portál občana je ode dneška oficiálně venku.

    Ladislav Hagara | Komentářů: 10
    včera 05:11 | Komunita

    #HACKUJBRNO 2024, byly zveřejněny výsledky a výstupy hackathonu města Brna nad otevřenými městskými daty, který se konal 13. a 14. dubna 2024.

    Ladislav Hagara | Komentářů: 2
    17.4. 17:55 | IT novinky

    Společnost Volla Systeme stojící za telefony Volla spustila na Kickstarteru kampaň na podporu tabletu Volla Tablet s Volla OS nebo Ubuntu Touch.

    Ladislav Hagara | Komentářů: 3
    KDE Plasma 6
     (68%)
     (10%)
     (2%)
     (20%)
    Celkem 563 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    Soubor CHM na Kindle

    5.12.2012 11:04 | Přečteno: 1484× | varia | Výběrový blog

    Microsoft vymyslel "geniální" formát nápovědy, který někteří zneužívájí pro tvorbu elektronických knih, které ale například na Kindle nejdou otevřít. Tento zápisek popisuje jedno z možných řešení tohoto problému.

    Proč ?

    Zejména v zemích na východ od zemí sousedících s východní hranicí EU jsou lidé, kteří převedení knížky do .CHM považují za dobrý nápad. Tyto knížky pak mají třeba 700 MB, což přináší další výhody, o kterých se zmíním dále. Prohlížeče CHM by se pro Linux nakonec našly, ale elektronická knížka patří do čtečky, ne ? Tak co s tím ...

    Jak ?

    Ve Windows mají jasno - existují komerční aplikace, které by to měly převést. Linuxáci máme Calibre, která by to měla umět taky. Možná taky umí. Každopádně když jsem jí předvrhnul 700MB CHM soubor, tak po chvíli zdechla s tím, že už to trvá moc dlouho a už jí to nebaví. Hmm.Nastavení tohoto času jsem nějak nenašel :-(. Takže pěkně ručně stručně

    CHM -> MHT

    Nejdřív uděláme z CHM soubory formátu MHT. K tomu poslouží program archmage, který by měl být ve většině dobrých distribucí. Jednoduchý příkaz archmage soubor.chm nám vygeneruje plný adresář menších mht souborů, nějaký index html s krásným javascriptem atd. Knihu jsme tedy rozsekali na kapitoly a z ošklivého Win formátu převedli na jiný ošlivý Win formát. Hurá.

    MHT -> HTML

    V dalším kroku uděláme z MHT HTML+obrázky.K tomu zneužijeme program mhonarc, který též žádejte u vašich distributorů (v Debianu je). Příkaz mhonarc -add <file.mht vygeneruje soubor msg*.html a pomocné indexy, které nebudeme potřebovat. Pokud máte extrémní štěstí, máte HTML soubor i s obrázky, zvonečky a pískátky. Život ale nebývá tak jednoduchý a tak pravděpodobně nějaký Vasil použil software, který prozřetelně ukládá soubory s absolutní cestou. V tom případě vás mhonarc obšťastní chybovou hláškou typu: Warning: Invalid base url, "file:///C:/6EC79145/" to apply to file/image073.jpg" a obrázky vyskládá na konec dokumentu, což není zrovna praktické.

    Pokud se nám něco takového tedy stane, tak se musíme obtěžovat a přečíst si chybovou hlášku a problém vyřešit například takhle: sed -e s/"file:\/\/\/C:\/6EC79145\/"//g -e s/"file_files\/"//g file.mht >file_fixed.mht a file_fixed.mht znovu prohlat mhonarcem. Obrázky pak jsou nejen na konci, ale i průběžně tam, kam patří. Toto řešení sice není nejelegantnější, ale mít ještě jednou zopakované obrázky na konci dokumentu může být někdy i užitečné. V tento okamžik tedy máme validní HTML z CHM souboru. Mimochodem - touto operací se knížka zázračně scvrkla o 37%. Tak ještě ho narvat do mobi a jsme hotovi.

    HTML -> MOBI

    Pokud nemáme čas a potřebujeme jen jednu kapitolu (což bude mít bonus, že se v Kindle bude rychleji otevírat), můžeme použít můj návod na knížky-rychlokvašky - protože je cover povinný, buď použijeme obrázek z knížky nebo něco najdeme na netu a převedeme na potřebnou velikost (třeba convert books.jpeg -geometry x800 cover.jpg). Do headu html přidáme metadata (<metadata><meta name="cover" content="cover.jpg" /></metadata>), případně upravíme title a přeložíme pomocí kindlegen. Pokud jsme puntičkáři tak ještě předtím vyhodíme navigační menu vygenerované mhonarcem, které má z pohledu kindlu rozbité odkazy.

    Kindlegen vyzvracel tohle:

    **************************************************
    * Amazon.com kindlegen(Linux)   V1.2 build 33307 *
    * A command line e-book compiler                 *
    * Copyright Amazon.com 2011                      *
    **************************************************
    
    Info(prcgen): Added metadata dc:Title        "Moje Knizka"
    Info(prcgen): Parsing files  0000002
    Info(prcgen): Resolving hyperlinks
    Warning(prcgen): Hyperlink not resolved:  /cesta/maillist.html#00000
    Warning(prcgen): Hyperlink not resolved:  /cesta/threads.html#00000
    Warning(prcgen): Hyperlink not resolved:  /cesta/threads.html#00000
    Warning(prcgen): Some hyperlinks could not be resolved.
    Info(pagemap): No Page map found in the book
    Warning(SA): SA failed
    Info(prcgen): Computing UNICODE ranges used in the book
    Info(prcgen): Found UNICODE range: Basic Latin [20..7E]
    Info(prcgen): Found UNICODE range: Latin-1 Supplement [A0..FF]
    Info(prcgen): Found UNICODE range: General Punctuation - Windows 1252 [2013..2014]
    Info(prcgen): Found UNICODE range: Geometric Shapes [25A0..25FF]
    Info(prcgen): Building MOBI file, record count:   0000270
    Info(prcgen): Final stats - text compressed to (in % of original size):  000.00%
    Info(prcgen): The document identifier is: "Moje_Knizka"
    Info(prcgen): The file format version is V5
    Info(prcgen): Saving MOBI file
    Info(prcgen): MOBI File generated with WARNINGS!
    

    Vznklý mobi ale nejde otevřít. Hmmm. Zkouším starší kindlegen (V1.0 build 85), který SA failed nepíše.Knížka jde normálně otevřít, obrázky jsou pochopitelně černobílé, ale kvality vyhovující (tedy až na ten přebal :-D).

    Porovnání velikostí a doslov

    Jak jsme na tom s velikostí výsledného souboru ? U druhé kapitoly se "rozbalením" MHT do html+jpg+png ušetřilo "jen" 27% velikosti, výsledný mobi soubor ale zabírá jen 19% původní velikosti MHT (t.j. úspora 81% !!).I když přihlédnu k faktu, že převodem všech kapitol z CHM do MHT data nabobtnala zhruba o 10%, nechápu proč se ty soubory s nápovědou používají !

           

    Hodnocení: 80 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    5.12.2012 11:10 chrono
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Program calibre nevygeneruje použiteľný súbor?
    5.12.2012 11:11 Georgius | skóre: 24 | blog: jirka
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Program calibre spadne po několika minutách protože konverze trvá moc dlouho (import). Manuální postup je u 150 MB souboru tak na 2 minuty se vším všudy ;-)
    5.12.2012 11:29 Franta
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    MHT není až tak „ošklivý win formát“ – je to vlastně standardní multipart/related MIME – tzn. jako když pošleš (X)HTML e-mail s vloženými obrázky. Nárůst velikosti je daný opět MIME – zakódováním binárky obrázku do Base 64.
    5.12.2012 12:13 chrono
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Ako štandard to prijaté (pokiaľ viem) zatiaľ nebolo.
    5.12.2012 12:45 Franta
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    RFC je sice jen PROPOSED STANDARD v kategorii Standards Track, ale .mht soubor si můžeš otevřít třeba Thunderbirdem stejně jako normální uloženou MIME zprávu (.eml).
    5.12.2012 12:47 Georgius | skóre: 24 | blog: jirka
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    To je sice hezký, ale člověk by tak nějak očekával, že když si uloží webovou stránku, tak půjde otevřít ve webovém prohlížeči (čest světlé výjimce jménem Opera) a bez pluginů (zdravíme Mozilla foundation). Otevírat webovou stránku mailovým klientem je takové ... trošku ... ehmmm ... nestandardní.
    5.12.2012 13:16 chrono
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Webový prehliadač, ktorý dokáže ukladať do .mht dokáže ten .mht súbor aj otvoriť.
    5.12.2012 13:22 Petr
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    ebook-convert book.chm book.mobi
    Zdroj
    5.12.2012 13:38 chrono
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Calibre pre ten súbor nefunguje. :)
    5.12.2012 17:04 Miloslav Ponkrác
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Já jsem nevěděl, že CHM na Kindle nejde otevřít a tak jsem ho otevřel.

    Nainstaloval jsem si fbreader na Kindle a otevřel jsem přímo nejenom CHM, ale i řadu dalších formátů včetně EPUB, HTML a RTF.

    Dreit avatar 5.12.2012 18:54 Dreit | skóre: 15 | blog: Dreit a jeho dračí postřehy | Královehradecký kraj
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle

    Já jsem nevěděl, že CHM na Kindle nejde otevřít a tak jsem ho otevřel.

    Tak teď už to víš a ani si neškrtneš :-D

    Nope
    6.12.2012 08:01 Georgius | skóre: 24 | blog: jirka
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Jéé, jak se instaluje fbreader na Kindle DX (odpovídá Kindle 2) ??
    5.12.2012 17:12 Miloslav Ponkrác
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle
    Jo a jinak, když si stáhnete Microsoft Help HTML Workshop, tak to je nástroj, který umí CHM nejenom vytvářet, ale rovnou jej i zpětně konvertovat do HTML + projektových souborů. Ale funguje jen na Windows.

    Soubory CHM se používají proto, že je to soubor nápovědy, nikoli knížky. Takže mnoho obsahu jsou také různé seznamy kapitol, fulltext indexy, definice oken a další. To se při konverzi do ebook samozřejmě ztratí.

    Jak CHM, tak MOBI je komprimovaným souborem. V MOBI samozřejmě odpadnou všechny ty fulltext indexy, definice fontů, oken. Stejně tak se zruší CSS styly, které MOBI umí asi tak jak Internet Explorer verze 1.

    Ona taková MySQL databáze, když jí vyexportujete jen do čistého textu bez struktury, indexů a dalších také pokrátí v zabraném místě – jen se ztratí kontext, relace, struktovanost dat a 99 % práce s dat už půjde ztuha.

    MOBI je prostě hloupý formát (i když ne tak hloupý jako EPUB), který si prostě zkomprimuje každou stránku zvlášť a slouží toliko a pouze ke čtení eknih. Nikoli jako nápověda. Jak CHM, tak EPUB, tak MOBI jsou jen komprimovanými HTML soubory plus nějaká malá omáčka definic. Ale CHM obsahuje řadu informací a indexů navíc.
    saman2 avatar 11.12.2012 08:24 saman2 | skóre: 4
    Rozbalit Rozbalit vše Re: Soubor CHM na Kindle

    Jen bych dodal, že CHM soubor umí do HTML struktury rozpakovat také 7zip (alespoň jeho Win verze ano, až budu doma, zkusím případně i to, zda toto podporuje i p7z či nadstavba K7Z, ale předpokládám, že by to mohlo umět obecně).

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.