abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 19:44 | Nová verze

    Byla vydána verze 9.1 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a informačním videu.

    Ladislav Hagara | Komentářů: 0
    dnes 17:44 | IT novinky

    Byl aktualizován seznam 500 nejvýkonnějších superpočítačů na světě TOP500. Nejvýkonnějším superpočítačem zůstává El Capitan od HPE (Cray) s výkonem 1,809 exaFLOPS. Druhý Frontier má výkon 1,353 exaFLOPS. Třetí Aurora má výkon 1,012 exaFLOPS. Nejvýkonnější superpočítač v Evropě JUPITER Booster s výkonem 1,000 exaFLOPS je na čtvrtém místě. Nejvýkonnější český superpočítač C24 klesl na 192. místo. Karolina, GPU partition klesla na 224. místo a Karolina, CPU partition na 450. místo. Další přehledy a statistiky na stránkách projektu.

    Ladislav Hagara | Komentářů: 1
    dnes 17:22 | IT novinky

    Microsoft představil Azure Cobalt 200, tj. svůj vlastní SoC (System-on-Chip) postavený na ARM a optimalizovaný pro cloud.

    Ladislav Hagara | Komentářů: 0
    dnes 12:00 | IT novinky

    Co způsobilo včerejší nejhorší výpadek Cloudflare od roku 2019? Nebyl to kybernetický útok. Vše začalo změnou oprávnění v jednom z databázových systémů a pokračovalo vygenerováním problém způsobujícího konfiguračního souboru a jeho distribucí na všechny počítače Cloudflare. Podrobně v příspěvku na blogu Cloudflare.

    Ladislav Hagara | Komentářů: 5
    včera 23:44 | Nová verze

    Byla vydána (Mastodon, 𝕏) první RC verze GIMPu 3.2. Přehled novinek v oznámení o vydání. Podrobně v souboru NEWS na GitLabu.

    Ladislav Hagara | Komentářů: 1
    včera 23:22 | Komunita

    Eugen Rochko, zakladatel Mastodonu, tj. sociální sítě, která není na prodej, oznámil, že po téměř 10 letech odstupuje z pozice CEO a převádí vlastnictví ochranné známky a dalších aktiv na neziskovou organizaci Mastodon.

    Ladislav Hagara | Komentářů: 0
    včera 19:44 | Nová verze

    Byla vydána nová major verze 5.0 svobodného 3D softwaru Blender. Přehled novinek i s náhledy a videi v obsáhlých poznámkách k vydání. Videopředstavení na YouTube.

    Ladislav Hagara | Komentářů: 0
    včera 14:00 | Upozornění

    Cloudflare, tj. společnost poskytující "cloudové služby, které zajišťují bezpečnost, výkon a spolehlivost internetových aplikací", má výpadek.

    Ladislav Hagara | Komentářů: 11
    včera 04:22 | Pozvánky

    Letos se uskuteční již 11. ročník soutěže v programování Kasiopea. Tato soutěž, (primárně) pro středoškoláky, nabízí skvělou příležitost procvičit logické myšlení a dozvědět se něco nového ze světa algoritmů – a to nejen pro zkušené programátory, ale i pro úplné začátečníky. Domácí kolo proběhne online od 22. 11. do 7. 12. 2025 a skládá se z 9 zajímavých úloh různé obtížnosti. Na výběru programovacího jazyka přitom nezáleží – úlohy jsou

    … více »
    SoutezKasiopea | Komentářů: 1
    včera 04:11 | Nová verze

    Byla vydána nová verze 2.52.0 distribuovaného systému správy verzí Git. Přispělo 94 vývojářů, z toho 33 nových. Přehled novinek v příspěvku na blogu GitHubu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (46%)
     (19%)
     (18%)
     (23%)
     (15%)
     (23%)
     (15%)
     (17%)
    Celkem 369 hlasů
     Komentářů: 16, poslední 12.11. 18:21
    Rozcestník

    Dotaz: zpracování textu v SEDu

    26.11.2009 10:51 Jaromír Šauer
    zpracování textu v SEDu
    Přečteno: 262×
    Dobrý den potřeboval bych poradit se zpracováním textu v konzoli pomocí SEDu . Pomocí curl stáhuji html soubor z kterého potřebuji vytáhnout určité informace . Tuším že to půjde pomocí sedu , ale nějak se mi nedaří pochopit jak to funguje .

    Konkrétně : stáhnu si html : http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920

    potřebuji vytáhnout datumu článku , čas , a titulek jako proměné s kterým budu poté dále pracovat .

    Děkuji za koukoliv radu .

    Šauer J.

    Řešení dotazu:


    Odpovědi

    26.11.2009 13:37 ams
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    SED na to neni dost dobre staveny, ostatne vytahovat data z html pomoci regexpu neni spravne i kdyz se to pomerne casto dela. Presto tady je neco, co by mohlo fungovat:
    url='http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920'
    wget -O clanek.html "$url"
    titulek=`grep -o '<h1 class="titulek-clanku">[^<]*' clanek.html | cut -c28-`
    cas_datum=`grep -o '<span class="cas">[^<]*' clanek.html | head -n1`
    cas=`echo "$cas_datum" | grep -Eo '[0-9]{2}:[0-9]{2}'`
    datum=`echo "$cas_datum" | grep -Eo '[0-9]{2}\.[0-9]{2}\.[0-9]{4}'`
    echo -e "Titulek: $titulek\nCas: $cas, Datum: $datum"
    
    27.11.2009 11:20 Jaromír Šauer
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    Děkuji , titulek mi ještě trošku zlobil, nicméně jsem to dal dohromady .
    27.11.2009 13:10 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    Opatrně na data a čas, ne vždy máte jistotu že třeba 1.12. bude zapsáno jako 01.12. V tom sedu by to bylo zbastleno třeba:
    url='http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920'
    wget -q -O - "$url" | iconv -f iso8859-2 -t utf-8 > clanek.html
    titulek=$(sed -n -e 's/.*<h1 class="titulek-clanku">\([^<]*\).*/\1/p' clanek.html)
    datum=$(sed -n -e 's/.*titulek-clanku.*<span class="cas">[^|]*|[^0-9\.]*\([0-9\.]*\).*/\1/p' clanek.html)
    cas=$(sed -n -e 's/.*titulek-clanku.*<span class="cas">\s*\([0-9:]*\).*$/\1/p' clanek.html)
    echo -e "Titulek: $titulek\nCas: $cas, Datum: $datum"
    
    Obecně lze kombinaci grep/head/cut omezit na sed.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.