abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 15:33 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.8.

    Ladislav Hagara | Komentářů: 2
    včera 14:22 | IT novinky

    Herní studio Hangar 13 vydalo novou Mafii. Mafia: Domovina je zasazena do krutého sicilského podsvětí na začátku 20. století. Na ProtonDB je zatím bez záznamu.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | IT novinky

    Operátor O2 má opět problémy. Jako omluvu za pondělní zhoršenou dostupnost služeb dal všem zákazníkům poukaz v hodnotě 300 Kč na nákup telefonu nebo příslušenství.

    Ladislav Hagara | Komentářů: 5
    včera 05:55 | IT novinky

    Společnost OpenAI představila GPT-5 (YouTube).

    Ladislav Hagara | Komentářů: 0
    včera 05:00 | Nová verze

    Byla vydána (𝕏) červencová aktualizace aneb nová verze 1.103 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.103 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    7.8. 17:33 | IT novinky

    Americký prezident Donald Trump vyzval nového generálního ředitele firmy na výrobu čipů Intel, aby odstoupil. Prezident to zdůvodnil vazbami nového šéfa Lip-Bu Tana na čínské firmy.

    Ladislav Hagara | Komentářů: 8
    7.8. 16:55 | Nová verze

    Bylo vydáno Ubuntu 24.04.3 LTS, tj. třetí opravné vydání Ubuntu 24.04 LTS s kódovým názvem Noble Numbat. Přehled novinek a oprav na Discourse.

    Ladislav Hagara | Komentářů: 0
    7.8. 16:44 | Nová verze

    Byla vydána verze 1.89.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    7.8. 12:22 | IT novinky

    Americká technologická společnost Apple uskuteční v USA další investice ve výši sta miliard dolarů (2,1 bilionu korun). Oznámil to ve středu šéf firmy Tim Cook při setkání v Bílém domě s americkým prezidentem Donaldem Trumpem. Trump zároveň oznámil záměr zavést stoprocentní clo na polovodiče z dovozu.

    Ladislav Hagara | Komentářů: 5
    7.8. 04:55 | Nová verze

    Zálohovací server Proxmox Backup Server byl vydán v nové stabilní verzi 4.0. Založen je na Debianu 13 Trixie.

    Ladislav Hagara | Komentářů: 0
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (47%)
     (20%)
     (4%)
     (5%)
     (3%)
     (1%)
     (1%)
     (18%)
    Celkem 313 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Dotaz: SED - extrakce retezce z html

    14.8.2007 15:03 Honza
    SED - extrakce retezce z html
    Přečteno: 346×
    Dobry den, uz 2 dny se trapim se sedem. Potrebuji z textu vytahnout urcite retezce, ktere jsou ohraniceny jinymi retezci. Dam priklad:
    -w ref='c1' click="video('XXX');" --img src='img.jpg'--/a>
    -w ref='c2' click="video('XXX');" --img src='img.jpg'--/a>
    -w ref='c3' click="video('XXX');" --img src='img.jpg'--/a>
    -w ref='c4' click="video('XXX');" --img src='img.jpg'--/a>
    kde XXX je zcela obecnej text, na kazdem radku jinej. Potrebuji do vysledneho souboru ulozit pouze retezce XXX Uz sem zkousel s/ /d ale ani jedno mi nechtelo fungovat Diky Jan Muller

    Odpovědi

    Zdeněk Molík avatar 14.8.2007 15:35 Zdeněk Molík | skóre: 14 | Znojmo - Oblekovice
    Rozbalit Rozbalit vše Re: SED - extrakce retezce z html
    No nevím zda jsem to přesně pochopil, ale pro uvedený příklad ( vstupní soubor in.html) by to mohlo býti následovně:

    sed -n -e "/video/p" < in.html | sed -e "s/.*video('\(.*\)').*/\1/ > out.txt

    Nejdříve si vyfiltruji pouze řádky s s textem video a pak vlastní obsah, který uložím do souboru out.txt
    14.8.2007 15:59 Honza
    Rozbalit Rozbalit vše Re: SED - extrakce retezce z html
    skvely...funguje to...moc moc diky Honza
    14.8.2007 17:33 qiRzT | skóre: 14 | blog: U_Marvina
    Rozbalit Rozbalit vše Re: SED - extrakce retezce z html
    Má to jeden drobnej nedostatek. Nebude to fungovat pokud na řádku za video(XXX) bude někde ). Ale na to už je, tuším, sed krátkej... Jinak jako dva zlepšováky doporučuju:

    1) sed -n -e "/video/p" < in.html | sed -e "s/.*video('\([^)]*\)').*/\1/ > out.txt , pokud v XXX nejsou závorky

    2) sed -n -e "/video/p" < in.html | sed -e "s/.*video('\(.*\)')\;.*/\1/ > out.txt pokud tam závorky jsou, řeší to aspoň trochu problém s další ) na řádku. Teď tam nesmí být );.
    Důležité je vědět jak problém vyřešit, zbytek zvládne i cvičená opice...
    14.8.2007 18:23 kirpike | skóre: 8 | Plzeň
    Rozbalit Rozbalit vše Re: SED - extrakce retezce z html
    Když už, tak proč ne takto:
    sed -n -e "/.*video('\([^']*\)');.*/{s//\1/;p}" <in.html >out.txt
    
    pak to zvládne i tento vstup:
    -w ref='c1' click="video('alpha');" --img src='img.jpg'--/a> neco('xxx');
    bla bla
    -w ref='c2' click="video('beta');" --img src='img.jpg'--/a> nic(xxx)
    Bla Bla Bla
    -w ref='c3' click="video('gama');" --img src='img.jpg'--/a;gt;
    To je prima video.
    
    14.8.2007 17:48 YYY | skóre: 29 | blog: martinek
    Rozbalit Rozbalit vše Re: SED - extrakce retezce z html
    Nejlepsi by bylo pouziti AWK :-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.