abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:22 | Nová verze

    Raspberry Pi Connect, tj. oficiální služba Raspberry Pi pro vzdálený přístup k jednodeskovým počítačům Raspberry Pi z webového prohlížeče, byla vydána v nové verzi 2.5. Nejedná se už o beta verzi.

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | Komunita

    Google zveřejnil seznam 1272 projektů (vývojářů) od 185 organizací přijatých do letošního, již jednadvacátého, Google Summer of Code. Plánovaným vylepšením v grafických a multimediálních aplikacích se věnuje článek na Libre Arts.

    Ladislav Hagara | Komentářů: 0
    8.5. 19:22 | Nová verze

    Byla vydána (𝕏) dubnová aktualizace aneb nová verze 1.100 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.100 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    8.5. 18:00 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.5.

    Ladislav Hagara | Komentářů: 0
    8.5. 01:22 | Nová verze Ladislav Hagara | Komentářů: 0
    8.5. 00:55 | Zajímavý projekt

    PyXL je koncept procesora, ktorý dokáže priamo spúštat Python kód bez nutnosti prekladu ci Micropythonu. Podľa testov autora je pri 100 MHz približne 30x rýchlejší pri riadeni GPIO nez Micropython na Pyboard taktovanej na 168 MHz.

    vlk | Komentářů: 0
    7.5. 19:44 | Nová verze

    Grafana (Wikipedie), tj. open source nástroj pro vizualizaci různých metrik a s ní související dotazování, upozorňování a lepší porozumění, byla vydána ve verzi 12.0. Přehled novinek v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    7.5. 17:33 | Nová verze

    Raspberry Pi OS, oficiální operační systém pro Raspberry Pi, byl vydán v nové verzi 2025-05-06. Přehled novinek v příspěvku na blogu Raspberry Pi a poznámkách k vydání. Pravděpodobně se jedná o poslední verzi postavenou na Debianu 12 Bookworm. Následující verze by již měla být postavena na Debianu 13 Trixie.

    Ladislav Hagara | Komentářů: 0
    7.5. 05:33 | Komunita

    Richard Stallman dnes v Liberci přednáší o svobodném softwaru a svobodě v digitální společnosti. Od 16:30 v aule budovy G na Technické univerzitě v Liberci. V anglickém jazyce s automaticky generovanými českými titulky. Vstup je zdarma i pro širokou veřejnost.

    Ladislav Hagara | Komentářů: 17
    7.5. 03:55 | Komunita

    sudo-rs, tj. sudo a su přepsáné do programovacího jazyka Rust, nahradí v Ubuntu 25.10 klasické sudo. V plánu je také přechod od klasických coreutils k uutils coreutils napsaných v Rustu.

    Ladislav Hagara | Komentářů: 0
    Jaký filesystém primárně používáte?
     (57%)
     (1%)
     (8%)
     (21%)
     (4%)
     (2%)
     (2%)
     (1%)
     (1%)
     (3%)
    Celkem 568 hlasů
     Komentářů: 26, poslední 8.5. 09:58
    Rozcestník

    Dotaz: zpracování textu v SEDu

    26.11.2009 10:51 Jaromír Šauer
    zpracování textu v SEDu
    Přečteno: 257×
    Dobrý den potřeboval bych poradit se zpracováním textu v konzoli pomocí SEDu . Pomocí curl stáhuji html soubor z kterého potřebuji vytáhnout určité informace . Tuším že to půjde pomocí sedu , ale nějak se mi nedaří pochopit jak to funguje .

    Konkrétně : stáhnu si html : http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920

    potřebuji vytáhnout datumu článku , čas , a titulek jako proměné s kterým budu poté dále pracovat .

    Děkuji za koukoliv radu .

    Šauer J.

    Řešení dotazu:


    Odpovědi

    26.11.2009 13:37 ams
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    SED na to neni dost dobre staveny, ostatne vytahovat data z html pomoci regexpu neni spravne i kdyz se to pomerne casto dela. Presto tady je neco, co by mohlo fungovat:
    url='http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920'
    wget -O clanek.html "$url"
    titulek=`grep -o '<h1 class="titulek-clanku">[^<]*' clanek.html | cut -c28-`
    cas_datum=`grep -o '<span class="cas">[^<]*' clanek.html | head -n1`
    cas=`echo "$cas_datum" | grep -Eo '[0-9]{2}:[0-9]{2}'`
    datum=`echo "$cas_datum" | grep -Eo '[0-9]{2}\.[0-9]{2}\.[0-9]{4}'`
    echo -e "Titulek: $titulek\nCas: $cas, Datum: $datum"
    
    27.11.2009 11:20 Jaromír Šauer
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    Děkuji , titulek mi ještě trošku zlobil, nicméně jsem to dal dohromady .
    27.11.2009 13:10 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    Opatrně na data a čas, ne vždy máte jistotu že třeba 1.12. bude zapsáno jako 01.12. V tom sedu by to bylo zbastleno třeba:
    url='http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920'
    wget -q -O - "$url" | iconv -f iso8859-2 -t utf-8 > clanek.html
    titulek=$(sed -n -e 's/.*<h1 class="titulek-clanku">\([^<]*\).*/\1/p' clanek.html)
    datum=$(sed -n -e 's/.*titulek-clanku.*<span class="cas">[^|]*|[^0-9\.]*\([0-9\.]*\).*/\1/p' clanek.html)
    cas=$(sed -n -e 's/.*titulek-clanku.*<span class="cas">\s*\([0-9:]*\).*$/\1/p' clanek.html)
    echo -e "Titulek: $titulek\nCas: $cas, Datum: $datum"
    
    Obecně lze kombinaci grep/head/cut omezit na sed.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.