abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:22 | Zajímavý software

    QStudio, tj. nástroj pro práci s SQL podporující více než 30 databází (MySQL, PostgreSQL, DuckDB, QuestDB, kdb+, …), se stal s vydáním verze 5.0 open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí Apache 2.0.

    Ladislav Hagara | Komentářů: 0
    dnes 04:55 | Nová verze

    Byla vydána nová verze 259 správce systému a služeb systemd (Wikipedie, GitHub).

    Ladislav Hagara | Komentářů: 0
    dnes 02:55 | Zajímavý článek

    Cloudflare Radar poskytuje aktuální informace o globálním internetovém provozu, útocích nebo trendech. Publikován byl celkový přehled za rok 2025. Globální internetový provoz vzrostl v roce 2025 o 19 %.

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | IT novinky

    Správní rada americké mediální skupiny Warner Bros. Discovery (WBD) podle očekávání odmítla nepřátelskou nabídku na převzetí od firmy Paramount Skydance za 108,4 miliardy dolarů (2,25 bilionu Kč). Paramount podle ní neposkytl dostatečné finanční záruky. Akcionářům proto doporučuje nabídku od Netflixu.

    Ladislav Hagara | Komentářů: 0
    včera 14:22 | Bezpečnostní upozornění

    Na WhatsAppu se šíří nový podvod, který ovšem vůbec nevypadá jako hackerský útok. Žádná krádež hesla. Žádné narušení zabezpečení. Žádné zjevné varovné signály. Místo toho jsou lidé trikem donuceni, aby útočníkům sami poskytli přístup, a to pouhým provedením toho, co vypadá jako běžný ověřovací krok. Bezpečnostní experti Avastu tento nový typ útoku nazývají ghostpairing, protože útočníci si při něm tiše vytvářejí „zařízení duchů“, které žije uvnitř vašeho účtu.

    Ladislav Hagara | Komentářů: 4
    včera 12:33 | Nová verze

    Český LibreOffice tým vydává aktualizaci překladu příručky LibreOffice Draw 25.8. Tato kniha se zabývá hlavními funkcemi programu Draw, vektorové grafické komponenty systému LibreOffice. Pomocí Draw lze vytvářet širokou škálu grafických obrázků. Příručka je ke stažení na stránce dokumentace a tým hledá dobrovolníky pro další překlady.

    ZCR | Komentářů: 0
    včera 04:00 | IT novinky

    Anthony Enzor-DeMeo je novým CEO Mozilla Corporation. Mozillu převzal po dočasné CEO Lauře Chambers. Vybudovat chce nejdůvěryhodnější softwarovou společnost na světě. Firefox by se měl vyvinout v moderní AI prohlížeč.

    Ladislav Hagara | Komentářů: 8
    16.12. 17:11 | Nová verze

    Byla vydána nová verze 9.20 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Vypíchnout lze například nový balíček RustDesk Server pro vzdálený přístup.

    Ladislav Hagara | Komentářů: 0
    16.12. 14:44 | Nová verze

    Jonathan Thomas oznámil vydání nové verze 3.4.0 video editoru OpenShot (Wikipedie). Představení novinek také na YouTube. Zdrojové kódy OpenShotu jsou k dispozici na GitHubu. Ke stažení je i balíček ve formátu AppImage. Stačí jej stáhnout, nastavit právo na spouštění a spustit.

    Ladislav Hagara | Komentářů: 0
    16.12. 14:22 | Nová verze

    Byla vydána nová verze 1.6 otevřeného, licenčními poplatky nezatíženého, univerzálního ztrátového formátu komprese zvuku Opus (Wikipedie) a jeho referenční implementace libopus. Podrobnosti na demo stránce.

    Ladislav Hagara | Komentářů: 3
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (48%)
     (20%)
     (17%)
     (23%)
     (15%)
     (24%)
     (16%)
     (18%)
    Celkem 480 hlasů
     Komentářů: 19, poslední 11.12. 20:04
    Rozcestník

    Dotaz: získání odkazu z HTML stránky

    12.5.2015 14:33 Bernye
    získání odkazu z HTML stránky
    Přečteno: 312×

    Ahoj,

    řeším problém se získáním obrázku z HTML stránky na základě výsledku hledání.

    Konkrétněji mám skript, který na základě proměnných vyhledá např. na google.com obrázek. Já pak přes curl stáhnu html s výsledky a potřebuji z něho dostat adresu obrázku, který je na prvním místě.

    Celé se to snažím koncipovat jako bash skript, ale na tomhle bodě jsem zamrzl. Tuším že by mohl pomoct nástroj xmllint, ale nemůžu na to přijít.

    Poradí mi prosím někdo?

    Odpovědi

    rADOn avatar 12.5.2015 15:14 rADOn | skóre: 44 | blog: bloK | Praha
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    Na to by melo stacit najit si ve strance "img src=". Cili egrem/awk/sed.
    "2^24 comments ought to be enough for anyone" -- CmdrTaco
    Tarmaq avatar 12.5.2015 15:30 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    Pokud to nechces resit jednoduchym grepovanim, jak naznacoval rADOn, ale najit si obrazek ve strukture, muzes na to vyuzit zmineny xmllint s pouzitim parametru --xpath. Tedy napr. xmllint --xpath 'string(//cesta/k/obrazkum/img[1]/@src)'
    Don't panic!
    12.5.2015 15:47 kolemjdoucí
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    1) grep na  "img " - vybere všechny řádky kde je v html vložený obrázek
    2) grep na "imgres" - bybere z nich ty, která má google jako vyhledané obrázky
    3) head -1 - vybere z nich první řádek
    4) sed - tady si musíš napsat regulární výraz pro vybrání toho, co je mezi uvozovkami v src="...." parametru html tagu img
    
    .. a máš svou adresu obrázku
    wamba avatar 12.5.2015 18:01 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    pokud nevadí použití Perl-u s příslušnou knihovnou, tak třeba
    perl -MHTML::TreeBuilder -E 'my $tree = HTML::TreeBuilder->new();$tree->parse_file(shift ); say $tree->look_down(q{_tag} => q{img})->attr(q{src}) ' /tmp/pok.htm
    
    This would have been so hard to fix when you don't know that there is in fact an easy fix.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.