abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 01:00 | Komunita

    Z upstreamu GNOME Mutter byl zcela odstraněn backend X11. GNOME 50 tedy poběží už pouze nad Waylandem. Aplikace pro X11 budou využívat XWayland.

    Ladislav Hagara | Komentářů: 0
    dnes 00:00 | IT novinky

    Byl publikován plán na odstranění XSLT z webových prohlížečů Chrome a Chromium. S odstraněním XSLT souhlasí také vývojáři Firefoxu a WebKit. Důvodem jsou bezpečnostní rizika a klesající využití v moderním webovém vývoji.

    Ladislav Hagara | Komentářů: 0
    včera 15:55 | Nová verze

    Desktopové prostředí LXQt (Lightweight Qt Desktop Environment, Wikipedie) vzniklé sloučením projektů Razor-qt a LXDE bylo vydáno ve verzi 2.3.0. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 05:55 | IT novinky

    Organizace Open Container Initiative (OCI) (Wikipedie), projekt nadace Linux Foundation, vydala Runtime Specification 1.3 (pdf), tj. novou verzi specifikace kontejnerového běhového prostředí. Hlavní novinkou je podpora FreeBSD.

    Ladislav Hagara | Komentářů: 0
    4.11. 11:33 | IT novinky

    Nový open source router Turris Omnia NG je v prodeji. Aktuálně na Allegro, Alternetivo, Discomp, i4wifi a WiFiShop.

    Ladislav Hagara | Komentářů: 22
    4.11. 05:44 | Komunita

    Na YouTube a nově také na VHSky byly zveřejněny sestříhané videozáznamy přednášek z letošního OpenAltu.

    Ladislav Hagara | Komentářů: 0
    4.11. 04:33 | Komunita

    Jednou za rok otevírá společnost SUSE dveře svých kanceláří široké veřejnosti. Letos je pro vás otevře 26. listopadu v 16 hodin v pražském Karlíně. Vítáni jsou všichni, kdo se chtějí dozvědět více o práci vývojářů, prostředí ve kterém pracují a o místní firemní kultuře. Můžete se těšit na krátké prezentace, které vám přiblíží, na čem inženýři v Praze pracují, jak spolupracují se zákazníky, partnery i studenty, proč mají rádi open source a co

    … více »
    SUSEMAS | Komentářů: 2
    4.11. 04:22 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za říjen (YouTube).

    Ladislav Hagara | Komentářů: 0
    4.11. 04:11 | Zajímavý článek

    Jeff Quast otestoval současné emulátory terminálu. Zaměřil se na podporu Unicode a výkon. Vítězným emulátorem terminálu je Ghostty.

    Ladislav Hagara | Komentářů: 11
    3.11. 22:55 | IT novinky

    Amazon bude poskytovat cloudové služby OpenAI. Cloudová divize Amazon Web Services (AWS) uzavřela s OpenAI víceletou smlouvu za 38 miliard USD (803,1 miliardy Kč), která poskytne majiteli chatovacího robota s umělou inteligencí (AI) ChatGPT přístup ke stovkám tisíc grafických procesů Nvidia. Ty bude moci využívat k trénování a provozování svých modelů AI. Firmy to oznámily v dnešní tiskové zprávě. Společnost OpenAI také nedávno

    … více »
    Ladislav Hagara | Komentářů: 8
    Jaké řešení používáte k vývoji / práci?
     (36%)
     (48%)
     (18%)
     (17%)
     (22%)
     (15%)
     (21%)
     (16%)
     (16%)
    Celkem 316 hlasů
     Komentářů: 15, poslední 2.11. 08:25
    Rozcestník

    Dotaz: stáhnutí celého webu přes wget

    15.6.2013 14:29 typicky linuxak
    stáhnutí celého webu přes wget
    Přečteno: 1334×
    Zdravím, předpokládám, že se neubráním narážkám v komentářích ohledně zvoleného nicku a webu, který chci stáhnout, ale doufám, že mi někdo i poradí.

    Snažím se stáhnout www.qark.net pomocí wget jako celého webu (mirror). Pokud stáhnu web takto, nebo i jinak (rekurzivně se zvolenou možností převodu linků) apod., vždy se mi stáhne web bez grafické formy (zkoušel jsem hodněkrát na spoustu způsobů a nebyl jsem zatím úspěšný...).

    Poraďte mi prosím příkaz, který stáhne web tak, že pak půjde otevřít z disku a bude vypadat jako ten na webu. Nemusí to být wget, stáhnu to čímkoliv. Je to pro vlastní potřebu, bojím se, že ten web jednou zmizí :)

    Děkuji :) podle zvoleného nicku jistě chápete, že tento web potřebuji...

    Odpovědi

    15.6.2013 14:33 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    no, tou poslední větou jsem to možná zabil...
    15.6.2013 14:56 michi
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    …touhle už úplně :-)
    15.6.2013 14:59 Suso
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    skus vyskusat httrack funguje aj v console spusti webovy port na ktorom si naklikas stranku hlbku a kopu dalsieho a mozno ho najdes aj v balickoch

    apt-get install webhttrack

    http://www.httrack.com/
    15.6.2013 22:38 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    mno, tohle je zatím největší úspěch, vypadá to skoro jak má, linky jsou přeložené, chybí akorát nějaké obrázky, ale s tím se myslím dá žít...
    15.6.2013 18:44 Petr | skóre: 29
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    wget -m? pokud tedy chapu zadani...
    15.6.2013 18:48 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    wget -m jsem zkusil jako prvni, tvarilo se to, ze to stahlo cely web, ale pri otevreni webu v prohlizeci byl videt jen zvlastne formatovany text, grafika tam vubec nebyla.
    15.6.2013 18:48 MadCatX
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    wget -r -l inf --domains qark.net -k -p -nc -T 3 -w 1 -t 1 www.qark.net 
    
    15.6.2013 22:32 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    tohle mi nepřevedlo část odkazů na lokalní adresy, míří stále na původní web. Konkrétně jednotlivé články na hlavní stránce. Lišta menu umístěná nahoře je v pořádku.

    Grafika je už ok, jdu luštit jednotlivé parametry příkazu, abych pochopil, proč :)
    16.6.2013 00:57 MadCatX
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    Ty linky se nepřevedou IMHO proto, že jsou napsány jako http://www.qark.net/clanek/... a s tím si wget neporadí. Možné řešení je utilizovat sed a ty odkazy převést ručně, např. tímto nechutným hackem:
    #!/bin/sh
    
    for f in $(find ./ -maxdepth 1 -not -name "pdf.php?*" -not -name "*.pdf" -not -name "*.png" -not -name "*.jpg" -not -name "*.ico")
    do
      echo "Processing ${f}"
      sed -i 's/href="http:\/\/www.qark.net\//href="/g' ${f}
    done
    
    for dir in clanek kategorie
    do
      for f in $(find ./${dir} -maxdepth 1 -not -name "pdf.php?*" -not -name "*.pdf" -not -name "*.png" -not -name "*.jpg" -not -name "*.ico")
      do
        echo "Processing ${f}"
        sed -i 's/href="http:\/\/www.qark.net\//href="..\//g' ${f}
      done
    done
    
    Než to budete zkoušet, udělejte si kopii toho staženého webu!

    Jinak část těch parametrů wgetu, co jsem navrhoval měly pouze urychlovací charakter. Ten web očividně linkuje kde co a část těch odkazů je mrtvých.

    15.6.2013 22:15 moudry linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    napadlo tě někdy, že bys byl pro ženy atraktivnější, když by sis ho nehonil?

    jinak samozřejmě stačí nebýt líný, a vydělávat hodně peněz. uvidíš, že se pak ženy přetrhnou o to, která tě může obrat o tvé těžce vydělané peníze. dotlačí tě k svatbě, následně rozvod, a dělení tvého těžce vydělaného majetku + výživné. jenom se usměje, a začneš tancovat jako pejsek na vodítku. bude tě ovládat pohybem obočí. to jenom abys věděl, do čeho jdeš.

    nemysli si, že tě znalost linuxu zachrání.
    15.6.2013 22:36 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    :)

    když jsem se rozhodl zeptat se na způsob stáhnutí toho webu tady, na abclinuxu, docela se nabízelo to napsat trošku ironicky a v nadsázce...

    Ale díky za shrnutí :)
    15.6.2013 22:55 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    Správně, a za svou osobu prosím neúspěšné zkrachovalce, aby už neradili ;), protože bod číslo jedna na cestě k úspěchu je, zbavit se jich.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.