Portál AbcLinuxu, 1. května 2025 06:53
Plugin do Calibre - oprava kódování
3.2.2012 22:38
| Přečteno: 2375×
| Linux
Jsem si trochu hrál s Calibre a zjistil jsem, že některé soubory ve formátu PDF mají nějaké debilní kódování a po převodu do textu se to moc nedá číst, některé znaky jsou prostě blbě.
Zjistil jsem, že v rámci souboru je každý konkrétní znak kódován stále stejnou sekvencí 2 bytů, takže teoreticky je problém opravy vyřešen a po trošce práce s Find&Replace se to zase hodí do cajku. Nicméně by bylo záhodno mít k tomu trochu komfortnější nástroje, což je přesně důvod, proč jsem napsal plugin Correct Encoding. Člověk prostě napíše, co která sekvence znamená a pak už jenom kliká na knížky, které potřebuje opravit. Při troše štěstí jsou všechny rozbité knížky kódovány stejně blbě.
Plugin hodím do přílohy prvního komentáře, jak je tady zvykem. Dělejte si s ním co chcete, třeba s ním topte v kamnech. Můžete ho i hodit i do oficiálního fóra Calibre, já tam nejsem registrovaný a nechce se mi tak činit. Veškerá dokumentace je v balíčku (anglicky).
Tiskni
Sdílej:
Komentáře
Vložit další komentář
3.2.2012 22:41
Tomáš | skóre: 31
| blog:
Tomik
Re: Plugin do Calibre - oprava kódování
11.5.2018 12:19
play
game
23.6.2018 23:26
buyutasi
Re: Plugin do Calibre - oprava kódování
Založit nové vlákno •
Nahoru
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.