abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

    včera 23:44 | Nová verze

    Rakudo (Wikipedie), tj. překladač programovacího jazyka Raku (Wikipedie), byl vydán ve verzi 2023.05. Programovací jazyk Raku byl dříve znám pod názvem Perl 6.

    Ladislav Hagara | Komentářů: 0
    včera 20:22 | IT novinky

    Linux Foundation Europe představila projekt RISE (RISC-V Software Ecosystem), jehož cílem je urychlit vývoj open source softwaru pro architekturu RISC-V.

    Ladislav Hagara | Komentářů: 0
    včera 14:55 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu pro jednodeskové počítače na platformě ARM, byl vydán ve verzi 23.05. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    včera 12:33 | Komunita

    Minulý týden proběhla openSUSE Conference 2023. Mimo jiné bylo oznámeno přejmenování systému MicroOS Desktop. MicroOS Desktop GNOME byl přejmenován na openSUSE Aeon a MicroOS Desktop Plasma na openSUSE Kalpa.

    Ladislav Hagara | Komentářů: 0
    včera 09:00 | Komunita

    Thom Holwerda z OSnews si všímá, že vývoj operačního systému MINIX je prakticky mrtvý. Jeho hlavní autor, Andrew Tanenbaum, formálně odešel do důchodu v roce 2014 a příspěvky do kódu v následujících letech vůbec ustaly. Stav projektu shrnuje diskuze z roku 2020. Sice vyšlo najevo, že Intel používal MINIX v Management Engine, ale změny nezveřejňoval.

    Fluttershy, yay! | Komentářů: 0
    včera 07:00 | Nová verze

    Google Chrome 114 byl prohlášen za stabilní. Nejnovější stabilní verze 114.0.5735.90 přináší řadu oprav a vylepšení (YouTube). Vypíchnut je CHIPS (Cookies Having Independent Partitioned State). Opraveno bylo 16 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    30.5. 17:33 | Komunita

    Byly zveřejněny prezentace a videozáznamy přednášek a fotografie z česko-slovenského setkání poskytovatelů přístupu k internetu, provozovatelů telekomunikačních sítí, registrátorů domén a provozovatelů počítačových sítí a technických nadšenců CSNOG 2023 (Czech and Slovak Network Operators Group) konaného 16. a 17. května ve Zlínu.

    Ladislav Hagara | Komentářů: 0
    30.5. 17:00 | Pozvánky

    Soutěž amatérských robotů Robotický den 2023 proběhne v neděli 4. června v Kongresovém centru Praha.

    Ladislav Hagara | Komentářů: 0
    30.5. 14:11 | IT novinky

    V Tchaj-peji probíhá počítačový veletrh COMPUTEX 2023. Firmy představují své novinky. Nvidia například superpočítač DGX GH200 AI.

    Ladislav Hagara | Komentářů: 2
    30.5. 12:11 | Nová verze

    Vyšla nová verze XMPP (Jabber) klienta Gajim. Nejvýznamnější novinkou je integrace OMEMO pluginu přímo do jádra aplikace, takže již není třeba plugin samostatně instalovat. Přehled dalších novinek je dostupný na oficiálních stránkách. Gajim je vytvořen v jazyce Python s využitím knihovny GTK a vedle Linuxu jej lze vyzkoušet i na platformách MacOS a Windows.

    sonicpp | Komentářů: 0
    Obnovovací frekvenci obrazovky (LCD) preferuji
     (74%)
     (20%)
     (4%)
     (2%)
    Celkem 845 hlasů
     Komentářů: 13, poslední 25.5. 07:25
    Rozcestník

    Dotaz: wget, rekurzivny download

    xxxs avatar 7.10.2008 17:50 xxxs | skóre: 24 | blog: vetvicky
    wget, rekurzivny download
    Přečteno: 916×
    zdravim. snazim sa stiahnut kompletny manual k excelom z http://office.microsoft.com/cs-cz/excel .

    predstava: offline prehliadatelny, s obrazkami, s jednym korenovym adresarom.

    problem: ked neurcim urovne, stahuje mi to cely web, co nechcem. ak znizim uroven, nestiahne cely strom manualu a prida nejake dalsie odbocky do vyssich struktur.

    predstavujem si to tak, ze by stahoval http://office.microsoft.com/cs-cz/excel/blabla kompletne cely, ale drzal by sa iba v urovni http://office.microsoft.com/cs-cz/excel. nesmie vyliezt ani do http://office.microsoft.com/cs-cz, ani do http://office.microsoft.com. zatial to proste funguje tak, ze asi najde v danej urovni nejake linky na vyssie urovne a postahuje aj tie.

    uz som dogoogleny na smrt, aspon mi napiste, ci sa to vobec da poriesit. dik.

    Odpovědi

    7.10.2008 18:01 Vojtěch Horký | skóre: 39 | blog: Vojtův zápisník | Praha
    Rozbalit Rozbalit vše Re: wget, rekurzivny download
    predstava: offline prehliadatelny, s obrazkami, s jednym korenovym adresarom.
    --page-requisites
    ale drzal by sa iba v urovni http://office.microsoft.com/cs-cz/excel
    --no-parent

    A pochopitelně spustit rekurzivně a asi i s --convert-links

    I am always ready to learn although I do not always like to be taught. (W. Churchill)
    xxxs avatar 7.10.2008 18:57 xxxs | skóre: 24 | blog: vetvicky
    Rozbalit Rozbalit vše Re: wget, rekurzivny download
    Příloha:

    nejako sa to brani. vytvoril mi robots.txt a stiahol iba jeden subor - default.aspx. skusil som sa zamaskovat pomocou navodu z wikipedie, ale stale stiahne iba jeden subor. pridavam parametre wgetu a log. robots.txt prikladam v prilohe, ak to pomoze.

    wget -r -t 7 -w 5 --waitretry=14 --random-wait --pa
    ge-requisites --no-parent --convert-links --user-agent="Mozilla/5.0(Win
    dows; U; Windows NT 5.1; en-US; rv:1.8.0.1.) Gecko/20060111 Firefox/1.5
    .0.1" -m -k -K -e robots=off http://office.microsoft.com/cs-cz/excel
    --18:35:53--  http://office.microsoft.com/cs-cz/excel
               => `office.microsoft.com/cs-cz/excel.1'
    Resolving office.microsoft.com... 64.4.52.30
    Connecting to office.microsoft.com|64.4.52.30|:80... connected.
    HTTP request sent, awaiting response... 302 Found
    Location: http://office.microsoft.com/cs-cz/excel/default.aspx [followi
    ng]
    --18:35:57--  http://office.microsoft.com/cs-cz/excel/default.aspx
               => `office.microsoft.com/cs-cz/excel/default.aspx'
    Reusing existing connection to office.microsoft.com:80.
    HTTP request sent, awaiting response... 200 OK
    Length: 3,874 (3.8K) [text/html]
    Last-modified header missing -- time-stamps turned off.
    --18:36:04--  http://office.microsoft.com/cs-cz/excel/default.aspx
               => `office.microsoft.com/cs-cz/excel/default.aspx'
    Reusing existing connection to office.microsoft.com:80.
    HTTP request sent, awaiting response... 200 OK
    Length: 3,872 (3.8K) [text/html]
    

    100%[===========================>] 3,872 --.--K/s

    18:36:04 (194.55 KB/s) - `office.microsoft.com/cs-cz/excel/default.aspx ' saved [3872/3872]

    FINISHED --18:36:04-- Downloaded: 3,872 bytes in 1 files Converting office.microsoft.com/cs-cz/excel/default.aspx... 0-1 Converted 1 files in 0.000 seconds.
    >
    7.10.2008 22:06 Vojtěch Horký | skóre: 39 | blog: Vojtův zápisník | Praha
    Rozbalit Rozbalit vše Re: wget, rekurzivny download

    Tak to vzdávám - díval jsem se na zdrojáky té stažené stránky (default.aspx) a vypadá to, že je tam nějaký JavaScript, který přesměrovává stránku jinam - a to wget nezvládne.

    Myslím, že rekurzivní stahovaní umožňovalo i nějaké rozšíření pro Firefox (ale nevím, kde jsem ho viděl).

    I am always ready to learn although I do not always like to be taught. (W. Churchill)
    xxxs avatar 7.10.2008 23:40 xxxs | skóre: 24 | blog: vetvicky
    Rozbalit Rozbalit vše Re: wget, rekurzivny download
    aj tak dakujem za pomoc.
    8.10.2008 02:19 VM
    Rozbalit Rozbalit vše Re: wget, rekurzivny download
    Navigace musi fungovat i bez JavaScriptu, jinak je webmaster prase. Zrovna u Microsoftu by to vedet mohli.
    Luboš Doležel (Doli) avatar 8.10.2008 00:00 Luboš Doležel (Doli) | skóre: 98 | blog: Doliho blog | Kladensko
    Rozbalit Rozbalit vše Re: wget, rekurzivny download
    Prosím, nepoužívejte PRE k psaní textu a dělání odstavců (k tomu slouží P) a nepoužívejte CODE pro blokové výpisy kódu (k tomu slouží PRE).
    16.3.2009 15:34 Uran | skóre: 9 | blog: uranit
    Rozbalit Rozbalit vše Re: wget, rekurzivny download

    V pripade robots.txt by mohl pomoct parametr "-e robots=off" nebo ekvivalent ve forme zapisu radku "robots=offů do ~/.wgetrc

    xxxs avatar 16.3.2009 16:32 xxxs | skóre: 24 | blog: vetvicky
    Rozbalit Rozbalit vše Re: wget, rekurzivny download
    ahoj, dakujem za zaujem a ozivenie starinky. vo vypise vidno, ze -e robots=off som, pouzil. stranka asi ale presahovala moznosti wgetu.
    16.3.2009 15:35 Uran | skóre: 9 | blog: uranit
    Rozbalit Rozbalit vše Re: wget, rekurzivny download

    V pripade robots.txt by mohl pomoct parametr "-e robots=off" nebo ekvivalent ve forme zapisu radku "robots=off" do ~/.wgetrc

    1.10.2011 19:35 KrataMil
    Rozbalit Rozbalit vše Re: wget, rekurzivny download
    Taky jsem se s tim zabyval a zjistil jsem, ze ve vasem pripade to bude asi podobne jako u mne. Zadal jsem volbu --no-parent ale stale stahoval vse a pak mne napadlo na konec dat jeste jedno lomitko a wget opravdu zustal tam kde mel a nesel vys. Ve vasem pripade bude dobre tedy nedavat adresu http://office.microsoft.com/cs-cz/excel ale dat adresu http://office.microsoft.com/cs-cz/excel/

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.