Portál AbcLinuxu, 1. května 2025 11:33
Občas se mi stane, že potřebuji vyextrahovat z DJVU souboru několik (souvislých) stránek do zvláštního souboru. Typicky se jedná o situaci, když mám naskenováno několik článků z jednoho sborníku v jediném souboru a potřebuji je „rozsekat“ tak, aby každý článek byl v jednom souboru. Dnes jsem se konečně rozhodl, že už to nebudu šolíchat ručně, překonal vrozenou lenost a vytvořil si na to jednoduchý skriptík.
Tady je (djvu_extract_range.sh):
#!/bin/sh # $1 - IN.djvu # $2 - OUT [basename] # $3 - from # $4 - to if test $# -le 3; then echo "djvu_extract_range.sh <IN.djvu> <OUT_base_name> from to" 1>&2 exit -1 fi if test $4 -lt $3; then echo "invalid range!" 1>&2 exit -1 fi I=$3; J=1 while test $I -le $4 ; do echo "$2 [$I] >> $2-$J.djvu" 1>&2 djvused $1 -e "select $I; save-page $2-$J.djvu" if test $J -eq 1; then djvm -c $2.djvu $2-1.djvu else djvm -i $2.djvu $2-$J.djvu $J fi rm -f $2-$J.djvu I=$(($I+1)) J=$(($J+1)) done
Užití je jednoduché: 1. parametrem je jméno souboru, ze kterého extrahujeme (včetně přípony), 2. parametrem basename vytvářeného souboru (tj. bez přípony .djvu; jednotlivé stránky se pak budou jmenovat $lt;basename$gt;-$lt;page$gt;.djvu) a poslední dva parametry udávají první a poslední extrahovanou stránku. Příklad:
djvu_extract_range.sh sbornik.djvu clanek 3 15
vybere ze souboru sbornik.djvu stranky 3 až 15 a vytvoří z nich soubor clanek.djvu. BACHA, skript neřeší spoustu věcí a zapisuje si pomocné soubory do aktuálního adresáře (takže např. přepíše a následně smaže soubor clanek-1.djvu etc.)
Tiskni
Sdílej:
A jak převádíte scan do DeJaVu? Jste spokojen s formátem DeJaVu?
A jak převádíte scan do DeJaVu?
Mám na to několik takovýchto udělátek jeden na převod pdf → djvu, další na přímé skenování a další na převod mailů s naskenovanými TIFF-y z kopírky. Ale to by asi stálo za nějaký článek (a znamenalo by to ty skriptíky trochu vyčistit, aby byly publikovatelné). Už se na to chystám pár let
Jste spokojen s formátem DeJaVu?
Jsem. Pro mé účely ideální, soubory jsou malé (a mj. důsledkem toho) zobrazování velmi rychlé...
Nejlepe pomoci gscan2pdf ... Umi toho opravdu hodne!
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.