abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:22 | Komunita

    Kalifornský zákon AB 1043 platný od 1. ledna 2027 vyžaduje, aby operační systémy požadovaly po uživatelích věk nebo datum narození a skrze API poskytovaly aplikacím informaci, zda je uživatel mladší 13 let, má 13 až 16 let, má 16 až 18 let nebo má alespoň 18 let. Vývojáři linuxových distribucí řeší, co s tím (Ubuntu, Fedora, …).

    Ladislav Hagara | Komentářů: 12
    dnes 11:44 | Pozvánky

    Konference LinuxDays 2026 proběhne o víkendu 3. a 4. října v Praze v areálu ČVUT v Dejvicích na FIT. Čekají vás desítky přednášek, workshopy, stánky a setkání se spoustou chytrých lidí.

    Petr Krčmář | Komentářů: 0
    dnes 00:44 | Humor

    Nové verze webových prohlížečů Chrome a Firefox jsou vydávány každé 4 týdny. Aktuální verze Chrome je 145. Aktuální verze Firefoxu je 148. Od září přejde Chrome na dvoutýdenní cyklus vydávání. V kterém týdnu bude mít Chrome větší číslo verze než Firefox? 😀

    Ladislav Hagara | Komentářů: 1
    včera 21:55 | IT novinky Ladislav Hagara | Komentářů: 2
    včera 13:44 | Komunita

    Bylo spuštěno hlasování o přednáškách a workshopech pro letošní Installfest, jenž proběhne o víkendu 28. a 29. března v Praze na Karlově náměstí 13.

    Ladislav Hagara | Komentářů: 2
    včera 04:33 | Nová verze

    Byla vydána (Mastodon, 𝕏) třetí RC verze GIMPu 3.2. Přehled novinek v oznámení o vydání. Podrobně v souboru NEWS na GitLabu.

    Ladislav Hagara | Komentářů: 0
    2.3. 21:44 | IT novinky

    Apple představil iPhone 17e a iPad Air s čipem M4.

    Ladislav Hagara | Komentářů: 15
    2.3. 21:11 | Zajímavý software

    Byla vydána verze 1.0 editoru kódů Gram. Jedná se o fork editoru Zed bez telemetrie a umělé inteligence.

    Ladislav Hagara | Komentářů: 0
    2.3. 20:33 | IT novinky

    Byla oznámena spolupráce GrapheneOS s Motorolou. Podrobnosti v tiskové zprávě. GrapheneOS (Wikpedie) je varianta Androidu zaměřující se na bezpečnost a soukromí.

    Ladislav Hagara | Komentářů: 0
    2.3. 02:22 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 26.2.1. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (17%)
     (6%)
     (0%)
     (11%)
     (28%)
     (2%)
     (5%)
     (1%)
     (13%)
     (25%)
    Celkem 1006 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: získání odkazu z HTML stránky

    12.5.2015 14:33 Bernye
    získání odkazu z HTML stránky
    Přečteno: 316×

    Ahoj,

    řeším problém se získáním obrázku z HTML stránky na základě výsledku hledání.

    Konkrétněji mám skript, který na základě proměnných vyhledá např. na google.com obrázek. Já pak přes curl stáhnu html s výsledky a potřebuji z něho dostat adresu obrázku, který je na prvním místě.

    Celé se to snažím koncipovat jako bash skript, ale na tomhle bodě jsem zamrzl. Tuším že by mohl pomoct nástroj xmllint, ale nemůžu na to přijít.

    Poradí mi prosím někdo?

    Odpovědi

    rADOn avatar 12.5.2015 15:14 rADOn | skóre: 44 | blog: bloK | Praha
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    Na to by melo stacit najit si ve strance "img src=". Cili egrem/awk/sed.
    "2^24 comments ought to be enough for anyone" -- CmdrTaco
    Tarmaq avatar 12.5.2015 15:30 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    Pokud to nechces resit jednoduchym grepovanim, jak naznacoval rADOn, ale najit si obrazek ve strukture, muzes na to vyuzit zmineny xmllint s pouzitim parametru --xpath. Tedy napr. xmllint --xpath 'string(//cesta/k/obrazkum/img[1]/@src)'
    Don't panic!
    12.5.2015 15:47 kolemjdoucí
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    1) grep na  "img " - vybere všechny řádky kde je v html vložený obrázek
    2) grep na "imgres" - bybere z nich ty, která má google jako vyhledané obrázky
    3) head -1 - vybere z nich první řádek
    4) sed - tady si musíš napsat regulární výraz pro vybrání toho, co je mezi uvozovkami v src="...." parametru html tagu img
    
    .. a máš svou adresu obrázku
    wamba avatar 12.5.2015 18:01 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    pokud nevadí použití Perl-u s příslušnou knihovnou, tak třeba
    perl -MHTML::TreeBuilder -E 'my $tree = HTML::TreeBuilder->new();$tree->parse_file(shift ); say $tree->look_down(q{_tag} => q{img})->attr(q{src}) ' /tmp/pok.htm
    
    This would have been so hard to fix when you don't know that there is in fact an easy fix.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.