Portál AbcLinuxu, 21. května 2025 20:33
Dneska si ukážeme, jak jednoduše převést obyčejné TXT do mobi, které zchroustá náš Kindle. Jako ukázka nám poslouží zákon ze stránek portal.gov.cz
Stáhli jsme si zákon, v našem případě autorský, a teď se půjdeme podívat, cože to vlastně je.
# file 121_2000_Sb.txt 121_2000_Sb.txt: Non-ISO extended-ASCII Pascal program text, with CRLF line terminators
Což nám zase tak moc neřekne, takže si seženeme nějaký editor, který to dokáže otevřít - v našem případě to byl poznámkový blok z wine, ale bylo to způsobeno především nechutí hledat, co za kódování soudruzi použili. Soubor tedy uložíme jako utf-8, nejlépe s unixovým ukončením řádku a vrhneme se do dalšího zkoumání.
HLAVA I PRÁVO AUTORSKÉ DÍL 1 Předmět práva autorského § 2 Autorské dílo (1) Předmětem práva autorského je dílo literární a jiné dílo umělecké a dílo vědecké, které je jedinečným výsledkem tvůrčí činnosti autora a je vyjádřeno v jakékoli objektivně vnímatelné podobě včetně podoby elektronické, trvale nebo dočasně, bez ohledu na jeho rozsah, účel nebo význam (dále jen "dílo"). Dílem je zejména dílo slovesné vyjádřené řečí nebo písmem, dílo hudební, dílo dramatické a dílo hudebně dramatické, dílo choreografické a dílo pantomimické, dílo fotografické a dílo vyjádřené postupem podobným fotografii, dílo audiovizuální, jako je
Čeho si člověk všimne na první pohled je zvláštní odsazení celého textu mezerami od začátku, takže je vimem hezky vezmeme a umažeme. Čeho už si člověk na první pohled nevšimne, a co může způsobit nemalé problémy je to, že soudruzi někdy mezi slovy použijí mezeru jednu, někdy dvě a výjimečně i tři - kindle má úžasnou vlastnost, že dvě mezery nahradí žádnou, což vypadá asi takto: "dílochoreografickéadílopantomimické". Jakmile máme soubor bez zbytečných mezer a ve správném kódování, pustíme se do analýzy pro TOC. TOC může mít tři úrovně, takže první klíčové slovo bude HLAVA, druhé dáme DÍL a třetí není z ukázky patrné, ale věřte mi, že je to ODDÍL.
Takže už víme členění, tak můžeme přejít k samotnému převodu pomocí programu calibre.
ebook-convert 121-2000.txt zakon-autorsky-121-2000-sb.mobi --chapter="//*[re:test(., '^(HLAVA|DÍL|ODDÍL)', '')]" --enable-heuristics --level1-toc="//*[re:test(., '^HLAVA', '')]" --level2-toc="//*[re:test(., '^DÍL', '')]" --level3-toc="//*[re:test(., '^ODDÍL', '')]"
Takže máme vytvořené mobi, jediné co bychom ještě chtěli je, aby mělo meta tagy, což zařídí tradičně calibre.
ebook-meta zakon-autorsky-121-2000-sb.mobi -a "Parlament České republiky" -t 'Autorský zákon'
Zde bych chtěl poděkovat lidem, kteří zveřejňují zákony, za jejich skvělou práci, díky které má člověk po večerech co dělat.
Tiskni
Sdílej:
Pekny navod.
>>> díky která má člověk po večerech co dělat.
Takze se dockame archivu zakonu v .mobi ???
Clovece Vy ve svem volnem case vytvorite to co zainteresovana firma dela roky za mnoho milionu.
Prvni a jedine co jsem si tipnul co to bude za kodovani tak windows-1250 a ejhle je to tak.
V podstate je to jasny neb si staci spojit pojmy statni sprava a microsoft.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.