abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 03:33 | IT novinky

    Dle plánu certifikační autorita Let's Encrypt nově vydává také certifikáty s šestidenní platností (160 hodin) s možností vystavit je na IP adresu.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | Nová verze

    V programovacím jazyce Go naprogramovaná webová aplikace pro spolupráci na zdrojových kódech pomocí gitu Forgejo byla vydána ve verzi 14.0 (Mastodon). Forgejo je fork Gitei.

    Ladislav Hagara | Komentářů: 2
    včera 13:11 | Zajímavý projekt

    Just the Browser je projekt, 'který vám pomůže v internetovém prohlížeči deaktivovat funkce umělé inteligence, telemetrii, sponzorovaný obsah, integraci produktů a další nepříjemnosti' (repozitář na GitHubu). Využívá k tomu skrytá nastavení ve webových prohlížečích, určená původně pro firmy a organizace ('enterprise policies'). Pod linuxem je skriptem pro automatickou úpravu nastavení prozatím podporován pouze prohlížeč Firefox.

    NUKE GAZA! 🎆 | Komentářů: 2
    16.1. 16:44 | Nová verze

    Svobodný multiplatformní herní engine Bevy napsaný v Rustu byl vydán ve verzi 0.18. Díky 174 přispěvatelům.

    Ladislav Hagara | Komentářů: 2
    16.1. 15:11 | IT novinky

    Miliardy korun na digitalizaci služeb státu nestačily. Stát do ní v letech 2020 až 2024 vložil víc než 50 miliard korun, ale původní cíl se nepodařilo splnit. Od loňského února měly být služby státu plně digitalizované a občané měli mít právo komunikovat se státem digitálně. Do tohoto data se povedlo plně digitalizovat 18 procent agendových služeb státu. Dnes to uvedl Nejvyšší kontrolní úřad (NKÚ) v souhrnné zprávě o stavu digitalizace v Česku. Zpráva vychází z výsledků víc než 50 kontrol, které NKÚ v posledních pěti letech v tomto oboru uskutečnil.

    Ladislav Hagara | Komentářů: 15
    16.1. 13:55 | IT novinky

    Nadace Wikimedia, která je provozovatelem internetové encyklopedie Wikipedia, oznámila u příležitosti 25. výročí vzniku encyklopedie nové licenční dohody s firmami vyvíjejícími umělou inteligenci (AI). Mezi partnery encyklopedie tak nově patří Microsoft, Amazon a Meta Platforms, ale také start-up Perplexity a francouzská společnost Mistral AI. Wikimedia má podobnou dohodu od roku 2022 také se společností Google ze skupiny

    … více »
    Ladislav Hagara | Komentářů: 0
    16.1. 02:22 | Nová verze

    D7VK byl vydán ve verzi 1.2. Jedná se o fork DXVK implementující překlad volání Direct3D 5, 6 a 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.

    Ladislav Hagara | Komentářů: 0
    16.1. 02:00 | Nová verze

    Byla vydána verze 12.0.0 knihovny libvirt (Wikipedie) zastřešující různé virtualizační technologie a vytvářející jednotné rozhraní pro správu virtuálních strojů. Současně byl ve verzi 12.0.0 vydán související modul pro Python libvirt-python. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    15.1. 19:22 | Humor

    CreepyLink.com je nový zkracovač URL adres, 'díky kterému budou vaše odkazy vypadat tak podezřele, jak je to jen možné'. Například odkaz na abclinuxu.cz tento zkracovač převádí do podoby 'https://netflix.web-safe.link/logger_8oIlgs_free_money.php'. Dle prohlášení autora je CreepyLink alternativou ke zkracovači ShadyURL (repozitář na githubu), který dnes již bohužel není v provozu.

    NUKE GAZA! 🎆 | Komentářů: 3
    15.1. 12:33 | IT novinky

    Na blogu Raspberry Pi byla představena rozšiřující deska Raspberry Pi AI HAT+ 2 s akcelerátorem Hailo-10 a 8 GB RAM. Na rozdíl od předchozí Raspberry Pi AI HAT+ podporuje generativní AI. Cena desky je 130 dolarů.

    Ladislav Hagara | Komentářů: 3
    Které desktopové prostředí na Linuxu používáte?
     (15%)
     (5%)
     (0%)
     (10%)
     (19%)
     (3%)
     (6%)
     (2%)
     (11%)
     (41%)
    Celkem 484 hlasů
     Komentářů: 12, poslední 14.1. 21:12
    Rozcestník

    Import e-knih do Calibre

    24.5.2012 21:57 | Přečteno: 2869× | Různé

    Nedávno jsem dělal trošku pořádek ve sbírce e-knih, které se mi válely na disku (všechny jsem získal pochopitelně v souladu se zákonem, žádná levota), tak jsem to vzal pořádně a zrovna jsem je naimportoval do programu Calibre. Tímto zápiskem se chci podělit o zkušenosti.

    Zcela záměrně se vyhnu popisu programu Calibre. Jenom v nutných případech vypíchnu některé vlastnosti nebo schopnosti, které stojí za zdůraznění. Návodů ke Calibre je hodně, stačí pohledat. Pokud umíte anglicky, nejlepší je podívat se přímo na stránkách projektu [Calibre]. Aby vám moje zkušenosti k něčemu byly, měli byste trochu znát možnosti programu a trochu se pohrabat v nastavení.

    Začínáme v situaci, kdy máme na disku plno e-knih a chceme si v nich udělat pořádek tak, aby v nich šlo vyhledávat (pohodlněji než pomocí find a grep). K takovému účelu existuje spousta programů. Já jsem si vybral Calibre [Calibre], protože 1) toho docela hodně umí, 2) je zdarma a 3) je open source (dokonce GPL, což je víc, než potřebuji, stačí mi, že se vyznám v datech v databázi a můžu data exportovat ven, pokud na to nemyslel autor aplikace, ale zrovna u této aplikace na to myslel).

    Knihy jsem získal z různých zdrojů, takže byl docela bor..., no nepořádek v konvenci pojmenování souborů. Většinou byly soubory umístěné v adresářích podle jména autora a nazvané podle schématu autor-název, někdy ale název-autor, případně jenom název. Dále v případě sérií to bývalo autor-série-název, případně ještě s pořadím v sérii ve všemožných variacích. Dál člověk zápasí s formátem jména autora, nejčastějí je schéma Příjmení, Křestní, ale objeví se i Příjmení Křestní a zejména pak Křestní Příjmení a to vše ve variantě s diakritikou i bez ní, což velice snadno vede k duplicitám a obzvlášť u málo známých autorů to člověk neprohlédne. No a pak jsou ještě lahůdky, že název adresáře je podle série a autora člověk dohledá při troše štěstí z názvu souboru.

    Jak jsem psal výše, vybral jsem program Calibre a začal zkoumat, co všechno umí. Kromě grafického rozhraní (GUI) má i ovládání z příkazové řádky, což se mi zdálo být vhodné pro dávkové zpracování dat. Nakonec jsem ovšem zjistil, že z příkazové řádky je import dat hrozně pomalý (aplikace se opakovaně startuje, protože jsem ji volal pro každý soubor zvlášť) a pro moje experimenty nepoužitelný.

    Příprava před importem

    Kvalita dat

    Nejdřív je třeba si zkontrolovat, jak kvalitně jsou knihy označeny. Většinou jde z názvu souboru poznat autora a název díla. Většina elektronicých formátů umožňuje (nejen) tyto položky specifikovat i přímo v souboru, což má výhodu, že není třeba omezovat se na znaky, které zvládne filesystém. Bohužel většina mých knížek neměla vyplněno nic, takže jsem se musel spoléhat na název souboru jako jediný zdroj informací. V Calibre je třeba nastavit, že se informace získávají z názvu souboru.

    Po zkušenostech můžu říct, že asi nemá cenu zalamovat se s duplicitními adresáři (například Čapek, Capek a Karel Capek), Calibre má plugin na hledání duplicit a (ten plugin) je docela rychlý. Navíc jméno autora se bere až z názvu souboru, což se může lišit od názvu adresáře. Původně jsem si myslel, že pustím import z příkazového řádku a nastavím autora všech knih podle názvu adresáře. Tehdy to Calibre ještě neuměl (uměl to jenom pro prázdné knížky), tak jsem vytvořil požadavek (k bug trackeru se dá doklikat z [Calibre]) a autor tuto možnost poměrně rychle přidal. Po zkušebních testech jsem ale zjistil, že můj naivní přístup je velice pomalý (pro každý soubor jedno volání, takže se aplikace pořád startovala a vypínalal), takže tudy cesta nevede.

    U velmi rozsáhlých sbírek pomůže najít soubory, které jsou binárně duplicitní (čili stejné) a trochu to promáznout. Někdy to jsou třeba jenom stejné obrázky k HTML stránkám (třeba navigační šipky) nebo nějaké přílohy ke knížkám. Takže mazat s rozmyslem. Trochu se s tím odlehčí programu Calibre.

    Nutné úpravy

    Po krachu první cesty jsem hledal jiný způsob, jak rychle importovat množství knížek a nevymyslel jsem nic lepšího, než nějakým skriptem detekovat knížky, které mají "rozumný" název a půjdou tak importovat bez problémů. Kontroloval jsem tedy, že název soubor obsahuje právě jednu pomlčku, přičemž před ní je řetězec, který obsahuje příjmení autora, tím pádem za pomlčkou je asi název díla (skript asi ještě někde mám, ale stydím se za něj). Takové soubory jsem přesunul (nekopírovat!) někam bokem, a pak jsem je naimportoval z GUI. Tímto způsobem se dá vyřídit třeba i půlka knížek. Mezi zbylými knížkami se dají hledat jiné "rozumné" názvy a pak je zase importovat hromadně. Calibre má bohaté možnosti, jak z názvu souboru načíst jméno autora a název díla, takže není problém ho nějak nastavit a pak naimportovat hromadu knížek.

    Neposlušné knížky

    Po první části importu, kdy se podařilo zbavit se rozumně nazvaných souborů přichází na řadu ta horší část, kdy člověk musí prohlédnout názvy souborů a rozhodnout, co s tím. Může jít o soubory, kde je překlep ve jméně, nebo soubory se zmršenou diakritikou v názvu (oblíbené po cestování souboru mezi různými systémy). Docela příjemný je ještě případ, kdy nějaký adresář obsahuje knížky z jedné série a názvy obsahují kompletní informace (jméno autora, název knihy, pořadí v sérii, série se dá dopsat všem najednou). To ale není pravidlem a většinou má pár knížek špatné názvy souboru.

    Další import je potom většinou ruční práce, kdy člověk musí importovat knížky vyloženě po kusech a opravovat údaje. Je to docela piplačka a zabere to hodně času. Docela se hodí občas promazat prázdné zdrojové adresáře (vzniknou pokud se podaří naimportovat strojově všechny knížky uvnitř), za prvé to člověka povzbudí, že jich není 220 ale jenom 180, za druhé to urychlí práci.

    Po importu

    Duplicity

    Po importu je vhodné začít s hledáním duplicit. K tomuto účelu se hodí plugin, ke kterému se dá doklikat z [Calibre] (Help - calibre forum - Plugins - Index of plugins - Find Duplicates).

    Úplně nejdřív je dobré vyřadit binární duplicity. Funguje to překvapivě rychle, protože plugin si velikost souborů asi čte z databáze.

    Dále je třeba vyřídit autory. Je třeba dát pozor, aby člověk nesloučil různé osoby pod jedno jméno (připomínám, že Karel a Josef Čapek jsou bráchové a Strugackij taky nebyl jednom jeden).

    Po vyřízení autorů se můžete pustit do vlastních knížek. To může být docela dlouhá a nudná práce. Pokud je knížka ve sbírce dvakrát v různých formátech, stačí ji sloučit pod jeden záznam, pokud jsou formáty stejné, je asi vhodné jeden exemplář vyhodit (s výběrem neporadím).

    Opravy jmen a názvů

    U autorů, kteří se u nás píší s diakritikou (obecně Slované), je vhodné opravit jména na správná. Vzhledem k tomu, že to je na dlouho, tak to je opravdu jenom pro puntičkáře. Calibre má speciální okno na správu autorů, tak ho použijte, je to rychlejší. Pozor!, změny se uloží až kliknutím na OK.

    Když máme každou knížku jenom jednou, dá se pustit do oprav názvů. Vzhledem k množství to asi nebude žádný med.

    Poznámky

    V zájmu čtivosti textu nahoře, jsem některé věci vynechal, tak je doplním sem

    Odkazy

    [Calibre] http://calibre-ebook.com/        

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    25.5.2012 08:10 neal_cz | skóre: 29
    Rozbalit Rozbalit vše Re: Import e-knih do Calibre
    Ad poslední bod (neúplný seznam autorů, chybný název) - v případě beletrie to řeším pluginem, který tyto údaje načítá z databazeknih.cz.
    25.5.2012 21:14 Tomáš | skóre: 31 | blog: Tomik
    Rozbalit Rozbalit vše Re: Import e-knih do Calibre
    O tom pluginu vím, je výborný na doplnění metadat a obálky. Ale hodí se spíš na doplnění metadat k pár knížkám, řekněme do 100, jinak to taky zabere moc času. V praxi to stačí, protože 100 knížek člověk přečte za hodně dlouho.

    Stalo se mi ale, že knížka byla úplně špatně zařazená. Někdy to člověk odhalí podle obsahu souboru (obsahuje jména autora a název knížky), ale taky jsou exempláře, kde soubor začíná přímo textem kapitoly a není tam ani jméno autora, ani název knížky. Taky jsem viděl záměnu, kdy se stejně jmenovala kniha a povídka od jiného autora. Možných chyb je hodně a určitě se někde objeví.
    Pavel Stárek avatar 28.5.2012 16:01 Pavel Stárek | skóre: 43 | blog: Tady bloguju já :-) | Kolín
    Rozbalit Rozbalit vše Re: Import e-knih do Calibre
    Pěkný zápisek. Jen se zeptám, jde tedy nějak v GUI k jedné knížce dát dva autory. Píšeš cosi o ampersandu. Znamená to tedy, že do políčka autor napíšu třeba
     Karel Čapek & Josef Čapek
    ?
    Kdo chce, hledá způsob; kdo nechce, hledá důvod.
    28.5.2012 20:59 Tomáš | skóre: 31 | blog: Tomik
    Rozbalit Rozbalit vše Re: Import e-knih do Calibre
    Přesně tak. A při troše dobré vůle to ořeže i ty mezery před a za jménem.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.