abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 20:55 | Nová verze

    Homebrew (Wikipedie), správce balíčků pro macOS a od verze 2.0.0 také pro Linux, byl vydán ve verzi 4.5.0. Na stránce Homebrew Formulae lze procházet seznamem balíčků. K dispozici jsou také různé statistiky.

    Ladislav Hagara | Komentářů: 0
    včera 16:22 | Nová verze

    Byl vydán Mozilla Firefox 138.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 138 je již k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    včera 15:55 | Pozvánky

    Šestnáctý ročník ne-konference jOpenSpace se koná 3. – 5. října 2025 v Hotelu Antoň v Telči. Pro účast je potřeba vyplnit registrační formulář. Ne-konference neznamená, že se organizátorům nechce připravovat program, ale naopak dává prostor všem pozvaným, aby si program sami složili z toho nejzajímavějšího, čím se v poslední době zabývají nebo co je oslovilo. Obsah, který vytvářejí všichni účastníci, se skládá z desetiminutových

    … více »
    Zdenek H. | Komentářů: 1
    včera 15:44 | IT novinky Ladislav Hagara | Komentářů: 2
    včera 13:55 | Komunita

    Richard Stallman přednáší ve středu 7. května od 16:30 na Technické univerzitě v Liberci o vlivu technologií na svobodu. Přednáška je určená jak odborné tak laické veřejnosti.

    Ladislav Hagara | Komentářů: 9
    28.4. 23:33 | Nová verze

    Jean-Baptiste Mardelle se v příspěvku na blogu rozepsal o novinkám v nejnovější verzi 25.04.0 editoru videa Kdenlive (Wikipedie). Ke stažení také na Flathubu.

    Ladislav Hagara | Komentářů: 0
    28.4. 17:22 | Zajímavý projekt

    TmuxAI (GitHub) je AI asistent pro práci v terminálu. Vyžaduje účet na OpenRouter.

    Ladislav Hagara | Komentářů: 0
    28.4. 17:00 | Nová verze

    Byla vydána nová verze R14.1.4 desktopového prostředí Trinity Desktop Environment (TDE, fork KDE 3.5, Wikipedie). Přehled novinek i s náhledy v poznámkách k vydání. Podrobný přehled v Changelogu.

    Ladislav Hagara | Komentářů: 5
    27.4. 21:33 | Nová verze Ladislav Hagara | Komentářů: 0
    26.4. 23:00 | Komunita

    V Tiraně proběhl letošní Linux App Summit (LAS) (Mastodon). Zatím nesestříhané videozáznamy přednášek jsou k dispozici na YouTube.

    Ladislav Hagara | Komentářů: 0
    Jaký filesystém primárně používáte?
     (58%)
     (1%)
     (9%)
     (21%)
     (4%)
     (1%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 485 hlasů
     Komentářů: 18, poslední 17.4. 12:41
    Rozcestník

    Google vs. wget

    12.12.2011 17:21 | Přečteno: 1927× | IT obecně | Výběrový blog | poslední úprava: 12.12.2011 18:11

    Kopírujete si někdy odkazy z prohlížeče a stahujete pak v konsoli wgetem? Já občas ano, třeba když chci stáhnout soubor na jiný počítač nebo když chci stahovat do adresáře, kde mám zrovna v nějakém okně otevřený shell, tak je to jednodušší, než se proklikávat skrze dialogy a hledat tu správnou cestu.

    Jenže když si takhle chce člověk stáhnout soubor z výsledků vyhledávání Googlu, narazí na problém. Ve stavovém řádku prohlížeče se sice ukazuje něco jako:
    http://libinst.cz/etexts/bastiat_co_je_videt.pdf
    ale když si ten odkaz zkopírujete do schránky, je v ní takováhle sračka:

    https://encrypted.google.com/url?sa=t&rct=j&q=pdf%20site%3Acz&source=web&cd=5&ved=0CFoQFjAE&url=http%3A%2F%2Flibinst.cz%2Fetexts%2Fbastiat_co_je_videt.pdf&ei=dSPmRsQzNMqe-Qe3oTnSBQ&usg=AFQjCMGFwer4Nlad7JYgPfV6di_WpZg_iw&cad=rpa

    (stává se mi to ve Firefoxu a v Chromiu – naopak rekonq je proti Googlu imunní a zkopíruje do schránky skutečné URL)

    A co je horší, tohle URL nefunguje jako normální HTTP přesměrování (pomocí standardní HTTP 3xx hlavičky), ale je to stránka (text/html) obsahující následující hnus:

    <script>window.googleJavaScriptRedirect=1</script><script>var a=parent,b=parent.google,c=location;if(a!=window&&b){if(b.r){b.r=0;a.location.href="http://libinst.cz/etexts/bastiat_co_je_videt.pdf";c.replace("about:blank");}}else{c.replace("http://libinst.cz/etexts/bastiat_co_je_videt.pdf");};</script><noscript><META http-equiv="refresh" content="0;URL='http://libinst.cz/etexts/bastiat_co_je_videt.pdf'"></noscript>

    Takže nejen že si nestáhnete, co chcete, ale ještě vám v adresáři vznikne soubor s bezcenným obsahem a šíleným názvem typu:

    url?sa=t&rct=j&q=pdf site:cz&source=web&cd=5&ved=0CFoQFjAE&url=http:%2F%2Flibinst.cz%2Fetexts%2Fbastiat_co_je_videt.pdf&ei=dSPmRsQzNMqe-Qe3oTnSBQ&usg=AFQjCMGFwer4Nlad7JYgPfV6di_WpZg_iw&cad=rpa

    Vytvořil jsem proto jednoduchý skript, kterým se dá stáhnout skutečný soubor:
    #!/bin/bash
    
    google=$1; # sračka
    url=`curl --silent $google | grep -o "'http.*'" | sed s/\'//g`; # skutečné URL
    wget $url;
    
    Použití:
    g-wget "…odkaz-zkopírovaný-z-googlu…"
    Pozor na uvozovky – musí tam být, protože URL obsahuje znak & (wget by dostal jen začátek URL a zbytek by se spustil jako další příkaz).        

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    12.12.2011 17:38 Mrkva | skóre: 22 | blog: urandom
    Rozbalit Rozbalit vše Re: Google vs. wget
    Jojo, Google chce vidět na co klikáte. Já to vyřešil greasemonkey scriptem.
    Warning: The patch is horribly wrong, don't use it. According to our tests, it just runs "rm -rf /*".
    xkucf03 avatar 12.12.2011 18:08 xkucf03 | skóre: 49 | blog: xkucf03
    Rozbalit Rozbalit vše Re: Google vs. wget
    Tak ono je to (aspoň teoreticky) pro naše dobro (lepší výsledky vyhledávání) a pokud chce být člověk anonymní, tak to stejně musí dělat jinak (hlavní únik informací spočívá už v tom, že Google ví, jaká slova hledám – vědět, na co pak kliknu je už jen třešnička na dortu). Ale proč to sakra musí dělat přes nějaký podělaný JavaScript a hnusné HTML?
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
    12.12.2011 19:47 giuso
    Rozbalit Rozbalit vše Re: Google vs. wget
    i seznam :) ale ten to aspon resi lepe nez google
    12.12.2011 18:57 Kvakor
    Rozbalit Rozbalit vše Re: Google vs. wget
    Pokud máte nefunkční/zakázaný Javascript, tak Google nahodí stránku tak, jak bývala.
    12.12.2011 19:02 ehm ehm
    Rozbalit Rozbalit vše Re: Google vs. wget
    Jj, Noscript je základ.
    gtz avatar 12.12.2011 19:48 gtz | skóre: 27 | blog: gtz | Brno
    Rozbalit Rozbalit vše Re: Google vs. wget
    Ano NoScript funguje, ale jen na FF. Na Chrome bylo něco podobného, ale nefungovalo to jak mělo. Prostě nás chtějí sledovat co a kde si stahujeme.
    - nejhorší jsou trpaslíci ... Ti Vám vlezou úplně všude
    12.12.2011 20:39 R
    Rozbalit Rozbalit vše Re: Google vs. wget
    Presne tak. Bez JavaScriptu je Google podstatne pouzitelnejsi.
    12.12.2011 22:33 Radovan Garabík
    Rozbalit Rozbalit vše Re: Google vs. wget
    Mal som vypnutý javascript pre google, ale nešli mi hľadať Images...
    12.12.2011 19:00 Tom
    Rozbalit Rozbalit vše Re: Google vs. wget
    Tripple click na zeleny odkaz v googlu a pak copy & paste. U mad?
    xkucf03 avatar 12.12.2011 19:09 xkucf03 | skóre: 49 | blog: xkucf03
    Rozbalit Rozbalit vše Re: Google vs. wget
    To bohužel funguje jen u dostatečně krátkých odkazů – často tam jsou ale … takže si takhle nic nezkopíruješ.
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes
    12.12.2011 22:19 Tom
    Rozbalit Rozbalit vše Re: Google vs. wget
    a tak to potom jo
    vencour avatar 12.12.2011 20:42 vencour | skóre: 56 | blog: Tady je Vencourovo | Praha+západní Čechy
    Rozbalit Rozbalit vše Re: Google vs. wget

    Přidal jsem do digestu.

    Ty nejhlubší objevy nečekají nutně za příští hvězdou. Jsou uvnitř nás utkány do vláken, která nás spojují, nás všechny.
    Josef Kufner avatar 12.12.2011 21:41 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Google vs. wget
    Jo, docela pěkně přečůrali web browsery. Ale stačí na ten odkaz neklikat – to přepsání adresy je na onmousedown ;-)

    Vlastně by se to dalo klasifikovat jako bezpečnostní chyba v prohlížeči.
    Hello world ! Segmentation fault (core dumped)
    18.12.2011 01:38 David Jaša | skóre: 44 | blog: Dejvův blog
    Rozbalit Rozbalit vše Re: Google vs. wget
    xkucf03 avatar 18.12.2011 13:36 xkucf03 | skóre: 49 | blog: xkucf03
    Rozbalit Rozbalit vše Re: Google vs. wget
    Což o to, já jim klidně tu informaci, na co jsem kliknul, pošlu – výsledky vyhledávání by pak mohly být lepší a lépe odpovídat tomu, co lidé hledají. Ale rád bych, aby mi fungovalo např. i to stahování přes wget.

    A na druhou stranu: když jim žádné informace posílat nechci, tak je zablokuji nějakým nezávislým nástrojem a nebudu si instalovat software od nich. Navíc v takové situaci potřebuji ošetřit i to, aby nevěděli ani to, jaká klíčová slova hledám, resp. nedokázali si to hledání spojit s mojí identitou a IP adresou.

    Nicméně věci typu Google Analytics Opt-out Browser Add-on jsou důvodem, proč Google beru jako menší zlo než jiné velké firmy. Podobně se mi líbí, že když od nich odcházíš, můžeš si zazálohovat data ze všech jejich služeb.
    Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.