abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:55 | Komunita

    O víkendu (15:00 až 23:00) probíha EmacsConf 2025, tj. online konference vývojářů a uživatelů editoru GNU Emacs. Sledovat ji lze na stránkách konference. Záznamy budou k dispozici přímo z programu.

    Ladislav Hagara | Komentářů: 0
    dnes 15:44 | Komunita

    Provozovatel internetové encyklopedie Wikipedia jedná s velkými technologickými firmami o uzavření dohod podobných té, kterou má s Googlem. Snaží se tak zpeněžit rostoucí závislost firem zabývajících se umělou inteligencí (AI) na svém obsahu. Firmy využívají volně dostupná data z Wikipedie k trénování jazykových modelů, což zvyšuje náklady, které musí nezisková organizace provozující Wikipedii sama nést. Automatické programy

    … více »
    Ladislav Hagara | Komentářů: 5
    dnes 15:22 | IT novinky

    Evropská komise obvinila síť 𝕏 z porušení unijních pravidel, konkrétně nařízení Evropské unie o digitálních službách (DSA). Vyměřila jí za to pokutu 120 milionů eur (2,9 miliardy Kč). Pokuta je podle názoru amerického ministra zahraničí útokem zahraničních vlád na americký lid. K pokutě se vyjádřil i americký viceprezident: „EU by měla podporovat svobodu projevu, a ne útočit na americké společnosti kvůli nesmyslům“.

    Ladislav Hagara | Komentářů: 4
    včera 17:11 | IT novinky

    Společnost Jolla spustila kampaň na podporu svého nového telefonu Jolla Phone se Sailfish OS. Dodání je plánováno na první polovinu příštího roku. Pokud bude alespoň 2 000 zájemců. Záloha na telefon je 99 €. Cena telefonu v rámci kampaně je 499 €.

    Ladislav Hagara | Komentářů: 22
    včera 15:11 | IT novinky

    Netflix kupuje Warner Bros. včetně jejích filmových a televizních studií HBO Max a HBO. Za 72 miliard dolarů (asi 1,5 bilionu korun).

    Ladislav Hagara | Komentářů: 2
    včera 14:11 | IT novinky

    V Las Vegas dnes končí pětidenní konference AWS re:Invent 2025. Společnost Amazon Web Services (AWS) na ní představila celou řadu novinek. Vypíchnout lze 192jádrový CPU Graviton5 nebo AI chip Trainium3.

    Ladislav Hagara | Komentářů: 0
    včera 00:33 | Nová verze

    Firma Proxmox vydala novou serverovou distribuci Datacenter Manager ve verzi 1.0 (poznámky k vydání). Podobně jako Virtual Environment, Mail Gateway či Backup Server je založená na Debianu, k němuž přidává integraci ZFS, webové administrační rozhraní a další. Datacenter Manager je určený ke správě instalací právě ostatních distribucí Proxmox.

    |🇵🇸 | Komentářů: 8
    4.12. 23:44 | Nová verze

    Byla vydána nová verze 2.4.66 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 5 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    4.12. 14:00 | IT novinky

    Programovací jazyk JavaScript (Wikipedie) dnes slaví 30 let od svého oficiálního představení 4. prosince 1995.

    Ladislav Hagara | Komentářů: 0
    4.12. 04:22 | Bezpečnostní upozornění

    Byly zveřejněny informace o kritické zranitelnosti CVE-2025-55182 s CVSS 10.0 v React Server Components. Zranitelnost je opravena v Reactu 19.0.1, 19.1.2 a 19.2.1.

    Ladislav Hagara | Komentářů: 3
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (47%)
     (19%)
     (18%)
     (22%)
     (15%)
     (24%)
     (16%)
     (18%)
    Celkem 434 hlasů
     Komentářů: 18, poslední 2.12. 18:34
    Rozcestník

    Dotaz: stáhnutí celého webu přes wget

    15.6.2013 14:29 typicky linuxak
    stáhnutí celého webu přes wget
    Přečteno: 1362×
    Zdravím, předpokládám, že se neubráním narážkám v komentářích ohledně zvoleného nicku a webu, který chci stáhnout, ale doufám, že mi někdo i poradí.

    Snažím se stáhnout www.qark.net pomocí wget jako celého webu (mirror). Pokud stáhnu web takto, nebo i jinak (rekurzivně se zvolenou možností převodu linků) apod., vždy se mi stáhne web bez grafické formy (zkoušel jsem hodněkrát na spoustu způsobů a nebyl jsem zatím úspěšný...).

    Poraďte mi prosím příkaz, který stáhne web tak, že pak půjde otevřít z disku a bude vypadat jako ten na webu. Nemusí to být wget, stáhnu to čímkoliv. Je to pro vlastní potřebu, bojím se, že ten web jednou zmizí :)

    Děkuji :) podle zvoleného nicku jistě chápete, že tento web potřebuji...

    Odpovědi

    15.6.2013 14:33 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    no, tou poslední větou jsem to možná zabil...
    15.6.2013 14:56 michi
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    …touhle už úplně :-)
    15.6.2013 14:59 Suso
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    skus vyskusat httrack funguje aj v console spusti webovy port na ktorom si naklikas stranku hlbku a kopu dalsieho a mozno ho najdes aj v balickoch

    apt-get install webhttrack

    http://www.httrack.com/
    15.6.2013 22:38 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    mno, tohle je zatím největší úspěch, vypadá to skoro jak má, linky jsou přeložené, chybí akorát nějaké obrázky, ale s tím se myslím dá žít...
    15.6.2013 18:44 Petr | skóre: 29
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    wget -m? pokud tedy chapu zadani...
    15.6.2013 18:48 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    wget -m jsem zkusil jako prvni, tvarilo se to, ze to stahlo cely web, ale pri otevreni webu v prohlizeci byl videt jen zvlastne formatovany text, grafika tam vubec nebyla.
    15.6.2013 18:48 MadCatX
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    wget -r -l inf --domains qark.net -k -p -nc -T 3 -w 1 -t 1 www.qark.net 
    
    15.6.2013 22:32 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    tohle mi nepřevedlo část odkazů na lokalní adresy, míří stále na původní web. Konkrétně jednotlivé články na hlavní stránce. Lišta menu umístěná nahoře je v pořádku.

    Grafika je už ok, jdu luštit jednotlivé parametry příkazu, abych pochopil, proč :)
    16.6.2013 00:57 MadCatX
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    Ty linky se nepřevedou IMHO proto, že jsou napsány jako http://www.qark.net/clanek/... a s tím si wget neporadí. Možné řešení je utilizovat sed a ty odkazy převést ručně, např. tímto nechutným hackem:
    #!/bin/sh
    
    for f in $(find ./ -maxdepth 1 -not -name "pdf.php?*" -not -name "*.pdf" -not -name "*.png" -not -name "*.jpg" -not -name "*.ico")
    do
      echo "Processing ${f}"
      sed -i 's/href="http:\/\/www.qark.net\//href="/g' ${f}
    done
    
    for dir in clanek kategorie
    do
      for f in $(find ./${dir} -maxdepth 1 -not -name "pdf.php?*" -not -name "*.pdf" -not -name "*.png" -not -name "*.jpg" -not -name "*.ico")
      do
        echo "Processing ${f}"
        sed -i 's/href="http:\/\/www.qark.net\//href="..\//g' ${f}
      done
    done
    
    Než to budete zkoušet, udělejte si kopii toho staženého webu!

    Jinak část těch parametrů wgetu, co jsem navrhoval měly pouze urychlovací charakter. Ten web očividně linkuje kde co a část těch odkazů je mrtvých.

    15.6.2013 22:15 moudry linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    napadlo tě někdy, že bys byl pro ženy atraktivnější, když by sis ho nehonil?

    jinak samozřejmě stačí nebýt líný, a vydělávat hodně peněz. uvidíš, že se pak ženy přetrhnou o to, která tě může obrat o tvé těžce vydělané peníze. dotlačí tě k svatbě, následně rozvod, a dělení tvého těžce vydělaného majetku + výživné. jenom se usměje, a začneš tancovat jako pejsek na vodítku. bude tě ovládat pohybem obočí. to jenom abys věděl, do čeho jdeš.

    nemysli si, že tě znalost linuxu zachrání.
    15.6.2013 22:36 typicky linuxak
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    :)

    když jsem se rozhodl zeptat se na způsob stáhnutí toho webu tady, na abclinuxu, docela se nabízelo to napsat trošku ironicky a v nadsázce...

    Ale díky za shrnutí :)
    15.6.2013 22:55 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: stáhnutí celého webu přes wget
    Správně, a za svou osobu prosím neúspěšné zkrachovalce, aby už neradili ;), protože bod číslo jedna na cestě k úspěchu je, zbavit se jich.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.