Portál AbcLinuxu, 11. května 2024 00:29


Dotaz: stáhnutí celého webu přes wget

15.6.2013 14:29 typicky linuxak
stáhnutí celého webu přes wget
Přečteno: 1296×
Odpovědět | Admin
Zdravím, předpokládám, že se neubráním narážkám v komentářích ohledně zvoleného nicku a webu, který chci stáhnout, ale doufám, že mi někdo i poradí.

Snažím se stáhnout www.qark.net pomocí wget jako celého webu (mirror). Pokud stáhnu web takto, nebo i jinak (rekurzivně se zvolenou možností převodu linků) apod., vždy se mi stáhne web bez grafické formy (zkoušel jsem hodněkrát na spoustu způsobů a nebyl jsem zatím úspěšný...).

Poraďte mi prosím příkaz, který stáhne web tak, že pak půjde otevřít z disku a bude vypadat jako ten na webu. Nemusí to být wget, stáhnu to čímkoliv. Je to pro vlastní potřebu, bojím se, že ten web jednou zmizí :)

Děkuji :) podle zvoleného nicku jistě chápete, že tento web potřebuji...
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

15.6.2013 14:33 typicky linuxak
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
Odpovědět | | Sbalit | Link | Blokovat | Admin
no, tou poslední větou jsem to možná zabil...
15.6.2013 14:56 michi
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
…touhle už úplně :-)
15.6.2013 14:59 Suso
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
Odpovědět | | Sbalit | Link | Blokovat | Admin
skus vyskusat httrack funguje aj v console spusti webovy port na ktorom si naklikas stranku hlbku a kopu dalsieho a mozno ho najdes aj v balickoch

apt-get install webhttrack

http://www.httrack.com/
15.6.2013 22:38 typicky linuxak
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
mno, tohle je zatím největší úspěch, vypadá to skoro jak má, linky jsou přeložené, chybí akorát nějaké obrázky, ale s tím se myslím dá žít...
15.6.2013 18:44 Petr | skóre: 29
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
Odpovědět | | Sbalit | Link | Blokovat | Admin
wget -m? pokud tedy chapu zadani...
15.6.2013 18:48 typicky linuxak
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
wget -m jsem zkusil jako prvni, tvarilo se to, ze to stahlo cely web, ale pri otevreni webu v prohlizeci byl videt jen zvlastne formatovany text, grafika tam vubec nebyla.
15.6.2013 18:48 MadCatX
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
Odpovědět | | Sbalit | Link | Blokovat | Admin
wget -r -l inf --domains qark.net -k -p -nc -T 3 -w 1 -t 1 www.qark.net 
15.6.2013 22:32 typicky linuxak
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
tohle mi nepřevedlo část odkazů na lokalní adresy, míří stále na původní web. Konkrétně jednotlivé články na hlavní stránce. Lišta menu umístěná nahoře je v pořádku.

Grafika je už ok, jdu luštit jednotlivé parametry příkazu, abych pochopil, proč :)
16.6.2013 00:57 MadCatX
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
Ty linky se nepřevedou IMHO proto, že jsou napsány jako http://www.qark.net/clanek/... a s tím si wget neporadí. Možné řešení je utilizovat sed a ty odkazy převést ručně, např. tímto nechutným hackem:
#!/bin/sh

for f in $(find ./ -maxdepth 1 -not -name "pdf.php?*" -not -name "*.pdf" -not -name "*.png" -not -name "*.jpg" -not -name "*.ico")
do
  echo "Processing ${f}"
  sed -i 's/href="http:\/\/www.qark.net\//href="/g' ${f}
done

for dir in clanek kategorie
do
  for f in $(find ./${dir} -maxdepth 1 -not -name "pdf.php?*" -not -name "*.pdf" -not -name "*.png" -not -name "*.jpg" -not -name "*.ico")
  do
    echo "Processing ${f}"
    sed -i 's/href="http:\/\/www.qark.net\//href="..\//g' ${f}
  done
done
Než to budete zkoušet, udělejte si kopii toho staženého webu!

Jinak část těch parametrů wgetu, co jsem navrhoval měly pouze urychlovací charakter. Ten web očividně linkuje kde co a část těch odkazů je mrtvých.

15.6.2013 22:15 moudry linuxak
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
Odpovědět | | Sbalit | Link | Blokovat | Admin
napadlo tě někdy, že bys byl pro ženy atraktivnější, když by sis ho nehonil?

jinak samozřejmě stačí nebýt líný, a vydělávat hodně peněz. uvidíš, že se pak ženy přetrhnou o to, která tě může obrat o tvé těžce vydělané peníze. dotlačí tě k svatbě, následně rozvod, a dělení tvého těžce vydělaného majetku + výživné. jenom se usměje, a začneš tancovat jako pejsek na vodítku. bude tě ovládat pohybem obočí. to jenom abys věděl, do čeho jdeš.

nemysli si, že tě znalost linuxu zachrání.
15.6.2013 22:36 typicky linuxak
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
:)

když jsem se rozhodl zeptat se na způsob stáhnutí toho webu tady, na abclinuxu, docela se nabízelo to napsat trošku ironicky a v nadsázce...

Ale díky za shrnutí :)
15.6.2013 22:55 Ash | skóre: 53
Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
Správně, a za svou osobu prosím neúspěšné zkrachovalce, aby už neradili ;), protože bod číslo jedna na cestě k úspěchu je, zbavit se jich.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.