Portál AbcLinuxu, 7. května 2025 01:14

Dotaz: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam

2.4.2018 10:28 Jirka
Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Přečteno: 694×
Odpovědět | Admin
Ahoj, potřeboval bych projít všechny soubory ze zadaného adresáře a jeho podadresářů a pokud v obsahu souboru (ne v názvu) je zadané klíčové slovo, tak soubor přesunout do jiného umístění.
Nedaří se mi to, pokud název souboru obsahuje diakritiku, pomlčky nebo jiné nestandardní znaky, tak ho to vůbec nezpracuje.
Jak by se to mělo udělat správně, aby to procházelo všechny soubory nezávisle na jejich názvu a bylo to co nejrychlejší?
Díky
Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

2.4.2018 11:58 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zřejmě jsi zapomněl dát uvozovky kolem názvů proměnných.
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
2.4.2018 13:40 NN
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Odpovědět | | Sbalit | Link | Blokovat | Admin
No a jak to teda mas ted?
2.4.2018 19:34 Jirka
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Ted to mam takhle - nefunguje:

searchFolder="$1"

destinationFolder="$2"

if [ -d "$searchFolder" ] && [ -d "$destinationFolder" ] ; then

cd "$searchFolder"

for f in $(find $searchFolder -type f) ; do

echo -e " \e[31mProcessing: $f\e[39m"

if grep -q "KLICOVE SLOVO" "$f" ; then

echo -e "\e[32m Found: $f\e[39m"

echo "===========mv=============="

mkdir --parents "$(dirname "$destinationFolder${f/$searchFolder}")"

mv "$f" "$(dirname "$destinationFolder${f/$searchFolder}")"

fi

done

else

echo "Bad arguments"

fi
2.4.2018 20:44 NN
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Par poznamek. Kdyz se presunes do searchFolder, tak find nic nenajde pokud nebude searchfolder uvedene celou cestou:
cd "$searchFolder"
for f in $(find $searchFolder -type f) ; do 
Ten mkdir by asi slo napsat jednoduseji:
mkdir --parents "$(dirname $destinationFolder/$f/$searchFolder)" 
Zase vystup $f u find je bez leading /, ale searchFolder muze byt s / nazacatku nebo bez a potom to bude problem. Takze toto nemusi uplne fungovat a to puvodni ma problem i u destinationFolder bez koncoveho /:
$destinationFolder/$f/$searchFolder
Pokud se nepletu tak tento grep bude fungovat na cely vystup find = celou cestu, ne jen na nazev souboru jako takovy, takze by to chtelo asi udelat jinak:
if grep -q "KLICOVE SLOVO" "$f" ; then
No a konecne napriklad rsync by to cele mohl zvladnout s dobrym filtrem na jeden radek..
rsync --include [regexp] /A /B
3.4.2018 14:32 Jirka
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
To cd je tam zbytecne (pozustatek ze starsi verze), oba dva argumenty budou zadavany jako plna cesta, script se bude volat pres ssh z GUI rozhrani. Z toho duvodu nebude potreba resit osetreni uzivatelskych vstupu na serveru, kde script pobezi, to udela obsluzny program u klienta.

Nemuzu pouzit rsync, protoze ten neumi soubory jen presunout (Kopirovani a nasledne mazani je nekolikanasobne pomalejsi). Pri presunuti je take potreba zachovat adresarovou strukturu.

Cilem je, aby byl script co nejrychlejsi (bude prochazet cca 10TB dat) a nemel problemy s diakritikou a nazvy souboru/slozek zacinajicich "--".
wamba avatar 3.4.2018 21:45 wamba | skóre: 38 | blog: wamba
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Tak můžeš zkusit něco takového
rg -wl 'slovo' .|parallel mkdir -p ../jine_umisteni/{//}\; mv -t ../jine_umisteni/{//} -- {}
ale při 10TB to bude vždycky pomalé. Používá to ripgrep.
This would have been so hard to fix when you don't know that there is in fact an easy fix.
4.4.2018 15:25 Jirka
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Neudela to tu adresarovou strukturu v kazdem pripade? Potrebuju ji vytvorit jen u presunutych souboru, ne celou.
wamba avatar 4.4.2018 20:32 wamba | skóre: 38 | blog: wamba
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
ne, udělá ji jen u těch, co se budou přesouvat
This would have been so hard to fix when you don't know that there is in fact an easy fix.
3.4.2018 23:35 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Zkus místo
for f in $(find $searchFolder -type f) ; do
...
done 
použít
find "$searchFolder" -type f -name "*.sh" -exec \
    grep -l 'KLICOVE SLOVO' '{}' + |
    while read f; do
        echo -e "\e[32m Found: $f\e[39m"
        destination="$(dirname "$destinationFolder${f/$searchFolder}")"
        mkdir --parents "$destination"
        mv "$f" "$destination"
    done
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
4.4.2018 15:42 Jirka
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Dekuji, zda se, ze to funguje. Pro uplnost cely kod:
searchFolder="$1"
destinationFolder="$2"
if [ -d "$searchFolder" ] && [ -d "$destinationFolder" ] ; then
  find "$searchFolder" -type f -exec \
    grep -l 'KLICOVE SLOVO' '{}' + |
    while read f; do
        echo -e "\e[32m Found: $f\e[39m"
        destination="$(dirname "$destinationFolder${f/$searchFolder}")"
        mkdir --parents "$destination"
        mv "$f" "$destination"
    done
else
  echo "Bad arguments"
fi
Jen mi prijdou zvlastni ty uvozovky na radku 8:

destination="$(dirname "$destinationFolder${f/$searchFolder}")"

Neni potom v uvozovkach jen dirname a zavorka na konci?
4.4.2018 17:10 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
To jsem normálně opsal od tebe, protože to funguje podle předpokladu. Symbol $( přepíná kontext, takže dirname v uvozovkách není, ale za příslušnou ) už zase je - proto se musí na konci uvozovkou uzavřít.
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
6.4.2018 15:31 Jirka
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Omlovam se, zmatl me zvyraznovac syntaxe.
4.4.2018 20:50 RM
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
Odpovědět | | Sbalit | Link | Blokovat | Admin
Dá se to udělat i v pajpě pomocí find, grep a xargs. Jen je trochu problém s tím vytvářením adresářů. No, já jsem to nakonec vymyslet takhle:
mkdirstdin(){ while read f; do mkdir --parents -- "$1${f%/*}"; printf "%s\n%s\n" "$f" "$1${f%/*}"; done; }
find  ./sourcedir -name "*.txt" -type f -exec grep -l 'najdivzor' {} \; | mkdirstdin /tmp/targetdir/ | xargs -P4 -L2 -d"\n" mv --
a zdá se že je to rychlejší, než zde uváděný skriptík. S ripgrep jsem to neporovnával (nemám zatím nainstalovaný rust).
wamba avatar 4.4.2018 22:00 wamba | skóre: 38 | blog: wamba
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
U mě na adresáři z dokumenty je rozdíl výrazný. Přinejmenším bych nahradil, pokud jde o rychlost, kombinaci find, grep za grep -r.
[wamba@wamba-X220 Dokumentujo]$ time rg -uul 'slovo' | wc -l
19

real    0m0,162s
user    0m0,254s
sys     0m0,276s
[wamba@wamba-X220 Dokumentujo]$ time find  . -type f -exec grep -l 'slovo' {} \;|wc -l
19

real    0m55,467s
user    0m37,120s
sys     0m17,049s
[wamba@wamba-X220 Dokumentujo]$ time grep -rl 'slovo' |wc -l
19

real    0m0,512s
user    0m0,314s
sys     0m0,196s
This would have been so hard to fix when you don't know that there is in fact an easy fix.
4.4.2018 22:08 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
grep -r je nepoužitelný, pokud nechceš prohledávat všechy soubory, např. chceš jen soubory s určitou příponou.

Také jsem si všiml, že jsi na konec příkazu find nedal +, ale \; , což je řádově pomalejší.
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
6.4.2018 15:29 Jirka
Rozbalit Rozbalit vše Re: Bash - projit vsechny soubory v podadresarich a pokud obsahuji klic. slovo, presunout jinam
To by nevadilo, potrebuji prohledat vsechny soubory. Nakonec jsem zjistil, ze NAS, na kterem to chci spoustet, je malo vykonny, takze je rychlejsi prohledavat data vzdalene SMB pristupem z vykonnejsiho PC. V pripade vyrazneho zrychleni by se to ale pouzit dalo.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.