Portál AbcLinuxu, 13. července 2025 04:52


Dotaz: wget - zabránění/omezení vstupu jen na určité stránky

21.9.2010 17:53 imploder | skóre: 11
wget - zabránění/omezení vstupu jen na určité stránky
Přečteno: 188×
Odpovědět | Admin
Stahuju wgetem PHPBB fórum a potřebuju stáhnout jenom určité stránky. Takže omezím názvy souborů - např. takto:
wget -r -p -k -E -l inf -A "index.php,viewforum.php*,viewtopic.php*" http://forum.com/index.php
Problém mám s chováním wgetu zmíněným tady - to znamená, že wget postahuje všechny stránky a všechny stránky z nich odkazované atd., jenom vždycky když jméno není na seznamu, tak staženou stránku smaže. To vede k tomu, že stahuje spoustu balastu, který nepotřebuju, jak web prolézá. Potřebuju zařídit, aby na stránky s neodpovídajícím názvem vůbec nevstupoval. Tj. když nějaký odkaz vede např. na "houba.html" a wget pouštím s -A "index.php,viewforum.php*,viewtopic.php*", tak aby na tu stránku vůbec nechodil a rozhodně z ní nepokračoval dál na stránky, na které tam najde odkazy. Dá se to nějak zařídit?

Díky

P.S.: Další problém je, že neopraví odkazy na soubory s názvem obsahujícím v URL zakázané znaky jako '&' nebo '?' (takové soubory vzniknou když se stahuje výstup skriptů s parametry předávanými v URL - třeba "forum.php?neco=bla&dalsiparametr=x"). V URL jsou tyhle znaky vyhrazené jako speciaální, takže pokud se vyskytují v názvu statického souboru, musí se převést na hex kódy (%XX). Už jsem si na to napsal skript, ale zajímalo by mně, jestli tohle wget taky umí (jestli jsem nepsal ten skript zbytečně).
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Na otázku zatím nikdo bohužel neodpověděl.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.