Portál AbcLinuxu, 1. května 2025 14:13

Blbinky (6) - Sťahujeme obrázky z googlu

3.6.2009 01:05 | Přečteno: 963× | linux

#!/bin/bash
[ -z "$1" ] && exit 1
SLOVO=`echo $1 | sed 'y/ /+/'` # akoze urlencode
START=0
IMG=0
while true; do
  START=$((START+20))
  wget -q -O - --user-agent="Mozilla Firefox" "http://images.google.sk/images?um=1&hl=sk&q=$SLOVO&start=$START&sa=N" | \
    sed 's/<a/\n<a/g;s/<\/a>/<\/a>\n\n/g' | grep 'imgres' | \
    sed 's/imgurl=/\nimgurl=/g;s/&imgrefurl/\n/g' | grep '^imgurl' | sed 's/imgurl=//' | \
  while read i; do
    echo $i
    wget -q --timeout=60 --user-agent="Mozilla Firefox" "`echo $i | sed 's/%2520/ /g'`" || echo chyba
  done
  sleep 1
done

Nedávno ma mama požiadala aby som jej zohnal nejaké obrázky jesenných stromov, nahral ich na USB kľúč, že si ich na chate pozrie a nejaký vyberie ako predlohu pre maliara ktorý potom podla neho nakreslí obraz. Spustil som ten skript a po pár hodinách už som mal niekoľko sto mega obrázkov jesenných stromov.

$ googleimages "autumn tree"
http://www.studiolo.org/pix/Gallery/2005-11-06-16-54-39_b-shp-bg01-pix.jpg
http://www.why-not-art.com/autumn-tree-sm.jpg
http://www.lanimilbus.com/naturephotos19/Autumn_tree.jpeg
http://www.momorialcards.com/images/golden_autumn_tree.jpg
http://www.lucaschristopherross.net/Graphics/AutumnTree.gif
http://www.beresfords.org.uk/images/DSCN1150-3005.jpg
...
       

Hodnocení: 100 %

        špatnédobré        

Anketa

Chcete pokračovanie tohoto mini seriálu?
 (100 %)
 (0 %)
Celkem 36 hlasů

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Vložit další komentář

David Ježek avatar 3.6.2009 10:13 David Ježek | skóre: 83 | blog: Mostly_IMDB
Rozbalit Rozbalit vše Re: Blbinky (6) - Sťahujeme obrázky z googlu
Odpovědět | Sbalit | Link | Blokovat | Admin
dobré je zkusit i další kombinace jako forest, fall, také zabírají slova s přímými lokacemi jako maine, new england, british columbia atd atd atd, občas se tam člověk dobere daleko lepších výsledků. jinak díky za tenhle tip.
3.6.2009 15:43 12345 | skóre: 41 | blog:
Rozbalit Rozbalit vše Re: Blbinky (6) - Sťahujeme obrázky z googlu
Odpovědět | Sbalit | Link | Blokovat | Admin
Jak na takový „útok” Google reaguje? Kdysi jsem se seznámil (Goolag Scanner) s jejich ochranou proti automatizovaným dotazům a připadala mi docela citlivá…
geon avatar 3.6.2009 17:49 geon | skóre: 18 | blog: bavaria
Rozbalit Rozbalit vše Re: Blbinky (6) - Sťahujeme obrázky z googlu
Odpovědět | Sbalit | Link | Blokovat | Admin

Jak předat parametr, když bych chtěl soubory někam hned přesouvat? Co napsat místo pomlčky u mv?:

 

 wget -q --timeout=60 --user-agent="Mozilla Firefox" "`echo $i | sed 's/%2520/ /g'`" | mv - /var/samba/neco || echo chyba


hikikomori82 avatar 3.6.2009 21:19 hikikomori82 | skóre: 18 | blog: foobar | Košice
Rozbalit Rozbalit vše Re: Blbinky (6) - Sťahujeme obrázky z googlu
Myslis toto:

wget -O - ..... > /var/samba/menosuboru
geon avatar 4.6.2009 20:54 geon | skóre: 18 | blog: bavaria
Rozbalit Rozbalit vše Re: Blbinky (6) - Sťahujeme obrázky z googlu

nee, myslím toto:

TO=/var/samba/sdileni/pics
mkdir $TO
....
wget -q --timeout=60 --user-agent="Mozilla Firefox" "$NAME"  -P $TO || echo chyba

 

Založit nové vláknoNahoru

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.