abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 03:55 | Nová verze

    Immich byl vydán v nové verzi 3.0.0. Jedná se o alternativu k výchozím aplikacím od Googlu a Applu pro správu fotografií a videí umožňující vlastní hosting serveru Immich. K vyzkoušení je demo. Immich je součástí balíčků open source aplikací FUTO. Zdrojové kódy jsou k dispozici na GitHubu pod licencí AGPL-3.0.

    Ladislav Hagara | Komentářů: 4
    včera 02:55 | IT novinky

    Společnost Juno Computers prodávající počítače s předinstalovaným Linuxem má nově v nabídce linuxový tablet Juno Tab 4 - WiFi. Na výběr je Debian, Ubuntu a Kubuntu. Předobjednat jej lze za 949 liber (26 500 korun).

    Ladislav Hagara | Komentářů: 0
    včera 01:22 | Nová verze

    Podman (Pod Manager), nástroj umožňující vytvářet a provozovat kontejnery, aniž by uživatel potřeboval práva roota, byl vydán v nové major verzi 6.0.0. Přehled novinek v poznámkách k vydání. Řešena je i vážná bezpečnostní chyba CVE-2026-57231.

    Ladislav Hagara | Komentářů: 0
    včera 00:11 | IT novinky

    Společnost Sony oznámila, že od ledna 2028 přestane vydávat nové hry pro PlayStation na fyzických discích. Všechny budoucí tituly budou dostupné výhradně v digitální podobě na PlayStation Store.

    Ladislav Hagara | Komentářů: 3
    2.7. 16:55 | Nová verze

    Google Chrome 150 byl prohlášen za stabilní. Nejnovější stabilní verze 150.0.7871.46 přináší řadu novinek. Podrobný přehled v poznámkách k vydání. Opraveno bylo 433 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    2.7. 13:00 | Nová verze

    Soudní dvůr Evropské unie potvrdil rekordní pokutu 4,125 miliardy eur (100 miliard Kč) americké technologické firmě Google ze skupiny Alphabet. Pokutu firmě v roce 2018 vyměřila Evropská komise (EK) za to, že Google podle ní zneužívá operačního systému Android k potlačení konkurence na trhu vyhledávacích služeb.

    Ladislav Hagara | Komentářů: 17
    2.7. 12:44 | IT novinky

    Administrativa amerického prezidenta Donalda Trumpa povolila firmě Anthropic obnovit plný přístup klientů k modelům umělé inteligence (AI) Fable 5 a Mythos 5. Ty byly nedostupné bezmála tři týdny kvůli bezpečnostním obavám vlády, třebaže americké ministerstvo obchodu minulý pátek povolilo omezený přístup k modelu Mythos 5 pro některé „důvěryhodné“ domácí organizace.

    Ladislav Hagara | Komentářů: 1
    2.7. 12:22 | Zajímavý článek

    Francúzska organizácia na ochranu spotrebiteľa, po viac než ôsmych rokoch skúmania, žaluje Epson za plánované zastarávanie tlačiarní. Súd sa začína dnes, 2. 7. 2026, vo francúzskom Nanterre.

    Vlado99 | Komentářů: 8
    2.7. 03:00 | Zajímavý software

    Erin Catto, autor open source 2D fyzikálního enginu Box2D (Wikipedie), představil nový 3D fyzikální engine Box3D. Engine je již používán ve hře The Legend of California.

    Ladislav Hagara | Komentářů: 0
    2.7. 01:00 | Nová verze

    Byla vydána nová verze 4.0.0 multiplatformního svobodného frameworku pro zpracování obrazu G'MIC (GREYC's Magic for Image Computing, Wikipedie). Přehled novinek i s náhledy nových filtrů na PIXLS.US.

    Ladislav Hagara | Komentářů: 1
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (17%)
     (31%)
     (4%)
     (6%)
     (2%)
     (16%)
     (26%)
    Celkem 2048 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: zpracování textu v SEDu

    26.11.2009 10:51 Jaromír Šauer
    zpracování textu v SEDu
    Přečteno: 283×
    Dobrý den potřeboval bych poradit se zpracováním textu v konzoli pomocí SEDu . Pomocí curl stáhuji html soubor z kterého potřebuji vytáhnout určité informace . Tuším že to půjde pomocí sedu , ale nějak se mi nedaří pochopit jak to funguje .

    Konkrétně : stáhnu si html : http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920

    potřebuji vytáhnout datumu článku , čas , a titulek jako proměné s kterým budu poté dále pracovat .

    Děkuji za koukoliv radu .

    Šauer J.

    Řešení dotazu:


    Odpovědi

    26.11.2009 13:37 ams
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    SED na to neni dost dobre staveny, ostatne vytahovat data z html pomoci regexpu neni spravne i kdyz se to pomerne casto dela. Presto tady je neco, co by mohlo fungovat:
    url='http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920'
    wget -O clanek.html "$url"
    titulek=`grep -o '<h1 class="titulek-clanku">[^<]*' clanek.html | cut -c28-`
    cas_datum=`grep -o '<span class="cas">[^<]*' clanek.html | head -n1`
    cas=`echo "$cas_datum" | grep -Eo '[0-9]{2}:[0-9]{2}'`
    datum=`echo "$cas_datum" | grep -Eo '[0-9]{2}\.[0-9]{2}\.[0-9]{4}'`
    echo -e "Titulek: $titulek\nCas: $cas, Datum: $datum"
    
    27.11.2009 11:20 Jaromír Šauer
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    Děkuji , titulek mi ještě trošku zlobil, nicméně jsem to dal dohromady .
    27.11.2009 13:10 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: zpracování textu v SEDu
    Opatrně na data a čas, ne vždy máte jistotu že třeba 1.12. bude zapsáno jako 01.12. V tom sedu by to bylo zbastleno třeba:
    url='http://aktualne.centrum.cz/zahranici/evropa/clanek.phtml?id=653920'
    wget -q -O - "$url" | iconv -f iso8859-2 -t utf-8 > clanek.html
    titulek=$(sed -n -e 's/.*<h1 class="titulek-clanku">\([^<]*\).*/\1/p' clanek.html)
    datum=$(sed -n -e 's/.*titulek-clanku.*<span class="cas">[^|]*|[^0-9\.]*\([0-9\.]*\).*/\1/p' clanek.html)
    cas=$(sed -n -e 's/.*titulek-clanku.*<span class="cas">\s*\([0-9:]*\).*$/\1/p' clanek.html)
    echo -e "Titulek: $titulek\nCas: $cas, Datum: $datum"
    
    Obecně lze kombinaci grep/head/cut omezit na sed.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.