abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 14:55 | Nová verze

    KiCad (Wikipedie), sada svobodných softwarových nástrojů pro počítačový návrh elektronických zařízení (EDA), byl vydán v nové major verzi 10.0.0 (𝕏). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | IT novinky

    Letošní Turingovou cenu (2025 ACM A.M. Turing Award, Nobelova cena informatiky) získali Charles H. Bennett a Gilles Brassard za základní přínosy do oboru kvantové informatiky, které převrátily pojetí bezpečné neprolomitelné komunikace a výpočetní techniky. Jejich protokol BB84 z roku 1984 umožnil fyzikálně zaručený bezpečný přenos šifrovacích klíčů, zatímco jejich práce o kvantové teleportaci položila teoretické základy pro budoucí kvantový internet. Jejich práce spojila fyziku s informatikou a ovlivnila celou generaci vědců.

    Ladislav Hagara | Komentářů: 3
    včera 04:44 | Zajímavý článek

    Firefox 149 dostupný od 24. března přinese bezplatnou vestavěnou VPN s 50 GB přenesených dat měsíčně (s CZ a SK se zatím nepočítá) a zobrazení dvou webových stránek vedle sebe v jednom panelu (split view). Firefox Labs 149 umožní přidat poznámky k panelům (tab notes, videoukázka).

    Ladislav Hagara | Komentářů: 2
    včera 00:33 | Nová verze

    Byla vydána nová stabilní verze 7.9 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 146. Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    včera 00:11 | Zajímavý software

    Dle plánu byla vydána Opera GX pro Linux. Ke stažení je .deb i .rpm. V plánu je flatpak. Opera GX je webový prohlížeč zaměřený na hráče počítačových her.

    Ladislav Hagara | Komentářů: 5
    19.3. 19:22 | Nová verze

    GNUnet (Wikipedie) byl vydán v nové major verzi 0.27.0. Jedná se o framework pro decentralizované peer-to-peer síťování, na kterém je postavena řada aplikací.

    Ladislav Hagara | Komentářů: 0
    19.3. 04:00 | Bezpečnostní upozornění

    Byly publikovány informace (technické detaily) o bezpečnostním problému Snapu. Jedná se o CVE-2026-3888. Neprivilegovaný lokální uživatel může s využitím snap-confine a systemd-tmpfiles získat práva roota.

    Ladislav Hagara | Komentářů: 4
    19.3. 03:33 | Zajímavý software

    Nightingale je open-source karaoke aplikace, která z jakékoliv písničky lokálního alba (včetně videí) dokáže oddělit vokály, získat text a vše přehrát se synchronizací na úrovni jednotlivých slov a hodnocením intonace. Pro separaci vokálů využívá UVR Karaoke model s Demucs od Mety, texty písní stahuje z lrclib.net (LRCLIB), případně extrahuje pomocí whisperX, který rovněž využívá k načasování slov. V případě audiosouborů aplikace na

    … více »
    NUKE GAZA! 🎆 | Komentářů: 2
    18.3. 18:22 | Nová verze

    Po půl roce vývoje od vydání verze 49 bylo vydáno GNOME 50 s kódovým názvem Tokyo (Mastodon). Podrobný přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře.

    Ladislav Hagara | Komentářů: 32
    18.3. 17:22 | Nová verze

    Článek na stránkách Fedora Magazinu informuje o vydání Fedora Asahi Remixu 43, tj. linuxové distribuce pro Apple Silicon vycházející z Fedora Linuxu 43.

    Ladislav Hagara | Komentářů: 4
    Které desktopové prostředí na Linuxu používáte?
     (15%)
     (7%)
     (1%)
     (11%)
     (29%)
     (2%)
     (5%)
     (1%)
     (13%)
     (24%)
    Celkem 1119 hlasů
     Komentářů: 27, poslední 17.3. 19:26
    Rozcestník

    Dotaz: získání odkazu z HTML stránky

    12.5.2015 14:33 Bernye
    získání odkazu z HTML stránky
    Přečteno: 316×

    Ahoj,

    řeším problém se získáním obrázku z HTML stránky na základě výsledku hledání.

    Konkrétněji mám skript, který na základě proměnných vyhledá např. na google.com obrázek. Já pak přes curl stáhnu html s výsledky a potřebuji z něho dostat adresu obrázku, který je na prvním místě.

    Celé se to snažím koncipovat jako bash skript, ale na tomhle bodě jsem zamrzl. Tuším že by mohl pomoct nástroj xmllint, ale nemůžu na to přijít.

    Poradí mi prosím někdo?

    Odpovědi

    rADOn avatar 12.5.2015 15:14 rADOn | skóre: 44 | blog: bloK | Praha
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    Na to by melo stacit najit si ve strance "img src=". Cili egrem/awk/sed.
    "2^24 comments ought to be enough for anyone" -- CmdrTaco
    Tarmaq avatar 12.5.2015 15:30 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    Pokud to nechces resit jednoduchym grepovanim, jak naznacoval rADOn, ale najit si obrazek ve strukture, muzes na to vyuzit zmineny xmllint s pouzitim parametru --xpath. Tedy napr. xmllint --xpath 'string(//cesta/k/obrazkum/img[1]/@src)'
    Don't panic!
    12.5.2015 15:47 kolemjdoucí
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    1) grep na  "img " - vybere všechny řádky kde je v html vložený obrázek
    2) grep na "imgres" - bybere z nich ty, která má google jako vyhledané obrázky
    3) head -1 - vybere z nich první řádek
    4) sed - tady si musíš napsat regulární výraz pro vybrání toho, co je mezi uvozovkami v src="...." parametru html tagu img
    
    .. a máš svou adresu obrázku
    wamba avatar 12.5.2015 18:01 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: získání odkazu z HTML stránky
    pokud nevadí použití Perl-u s příslušnou knihovnou, tak třeba
    perl -MHTML::TreeBuilder -E 'my $tree = HTML::TreeBuilder->new();$tree->parse_file(shift ); say $tree->look_down(q{_tag} => q{img})->attr(q{src}) ' /tmp/pok.htm
    
    This would have been so hard to fix when you don't know that there is in fact an easy fix.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.