abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:11 | Nová verze

    KiCad (Wikipedie), sada svobodných softwarových nástrojů pro počítačový návrh elektronických zařízení (EDA), byl vydán v nové major verzi 8.0.0 (𝕏). Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    včera 16:55 | Nová verze

    Na čem aktuálně pracují vývojáři GNOME a KDE? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE.

    Ladislav Hagara | Komentářů: 0
    včera 12:33 | Nová verze

    Google zveřejnil seznam 195 organizací přijatých do letošního Google Summer of Code (GSoC). Dle plánu se zájemci přihlašují od 18. března do 2. dubna. Vydělat si mohou od 750 do 6600 dolarů. V Česku a na Slovensku je to 900 dolarů za malý, 1800 dolarů za střední a 3600 dolarů pro velký projekt. Další informace v často kladených otázkách (FAQ). K dispozici jsou také statistiky z minulých let.

    Ladislav Hagara | Komentářů: 0
    včera 08:00 | Nová verze

    Mixxx (Wikipedie), tj. svobodný software určený (nejenom) pro diskžokeje, byl vydán v nové major verzi 2.4.0. Přehled novinek i s videi v oficiálním oznámení. Aktualizována byla také uživatelská příručka. Oficiální flatpak je k dispozici na Flathubu.

    Ladislav Hagara | Komentářů: 0
    23.2. 18:44 | IT novinky

    Softwarová společnost Avast musí ve Spojených státech zaplatit pokutu 16,5 milionu dolarů (více než 386 milionů Kč) a přestat prodávat data o uživatelích k reklamním účelům. V tiskové zprávě to ve čtvrtek oznámila americká Federální obchodní komise (FTC). Společnost Avast se sídlem v Británii se podle FTC nedovoleného jednání dopouštěla přes svou českou součást Jumpshot.

    Ladislav Hagara | Komentářů: 13
    23.2. 14:33 | Zajímavý článek

    Andrey Konovalov popisuje, jak se mu podařilo na notebooku Lenovo ThinkPad X1 Carbon 6. generace povolit řadič xDCI, aby umožnil emulaci libovolných USB zařízení.

    Fluttershy, yay! | Komentářů: 1
    23.2. 10:00 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 24.2 Kereru. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    23.2. 09:00 | Nová verze

    MindForger, tj. poznámkový blok, markdown editor a nástroj pro management znalostí, byl vydán v nové major verzi 2.0.0. Přehled novinek na GitHubu. Hlavní novinkou je integrace s LLM (OpenAI).

    Ladislav Hagara | Komentářů: 0
    23.2. 08:00 | IT novinky Ladislav Hagara | Komentářů: 7
    22.2. 21:22 | Nová verze

    Bylo vydáno Ubuntu 22.04.4 LTS, tj. čtvrté opravné vydání Ubuntu 22.04 LTS s kódovým názvem Jammy Jellyfish. Stejně tak Kubuntu 22.04.4 LTS, Ubuntu Budgie 22.04.4 LTS, Ubuntu MATE 22.04.4 LTS, Lubuntu 22.04.4 LTS, Ubuntu Kylin 22.04.4 LTS, Ubuntu Studio 22.04.4 LTS a Xubuntu 22.04.4 LTS. Pro ARM servery je nově k dispozici ISO arm64+largemem.

    Ladislav Hagara | Komentářů: 0
    Kolik máte nálepek na víku notebooku?
     (17%)
     (60%)
     (5%)
     (4%)
     (5%)
     (9%)
    Celkem 381 hlasů
     Komentářů: 14, poslední včera 17:01
    Rozcestník

    Dotaz: skript vypreparovani bloku textu grep sed

    21.5.2009 13:39 Uran | skóre: 9 | blog: uranit
    skript vypreparovani bloku textu grep sed
    Přečteno: 296×

    Tak jsem potreboval vypreparovat z textovych souboru konkretni ohraniceny blok textu.

    Zdrojovy soubor:
    [code]
    .
    .
    .
    .
    [42]&nbsp;<a href="kniha/982">Netvoři z hlubin Wrecku</a><br />
    [43]&nbsp;<a href="kniha/429">Čarodejnice z bažin 1</a><br />
    [43]&nbsp;<a href="kniha/430">Čarodejnice z bažin 2</a><br />
    [44]&nbsp;<a href="kniha/984">Beznadějné pátrání</a><br />
    <p>Neřazené díly série</p><div class="dvouradek"><a href="kniha/1004">Adarhargský jed</a></div><div class="dvouradek"><a href="kniha/9549">Děti otroků</a></div><div class="dvouradek"><a href="kniha/1014">Dračí krev</a></div><div class="dvouradek"><a href="kniha/999">Charlungští bojoví obři</a></div><div class="dvouradek"><a href="kniha/1002">Jablka z Beltamoru</a></div><div class="dvouradek"><a href="kniha/1005">Kalužiny modré krve</a></div><div class="dvouradek"><a href="kniha/1012">Král posledního moře</a></div><div class="dvouradek"><a href="kniha/1015">Královský gambit</a></div><div class="dvouradek"><a href="kniha/10408">Krvavé arény</a></div><div class="dvouradek"><a href="kniha/1003">Meč proti sekeře</a></div><div class="dvouradek">Mise na Šámatu</div><div class="dvouradek"><a href="kniha/1010">Oheň v kapradí</a></div><div class="dvouradek"><a href="kniha/3995">První mise</a></div><div class="dvouradek"><a href="kniha/5460">Svatá válka</a></div><div class="dvouradek"><a href="kniha/1001">Šarlatové pláště</a></div><div class="dvouradek"><a href="kniha/1009">Ve stínu pravdy</a></div><div class="dvouradek"><a href="kniha/8345">Vládce hurikánů</a></div><div class="dvouradek"><a href="kniha/1013">Vnitřní záležitost</a></div><div class="dvouradek"><a href="kniha/6146">Zachraňte Titanic!</a></div><div class="dvouradek"><a href="kniha/1008">Zatykač na Stonea</a></div><div class="dvouradek"><a href="kniha/1011">Zkáza Tortugy</a></div><div class="dvouradek"><a href="kniha/5054">Zlato Alwogiry</a></div></div><div id="anotace">Informace / Anotace ke knize: <strong>Mise na Šámatu</strong>
    <p>Generál Khov poslal Marka Stona na rutinní inspekci na planetu Šámat.
    Takových inspekcí agenti SDPP vykonají za rok mnoho. Planeta je však velmi
    nepohostinná. I přes mistrovské pilotní umění androida Raye jsou
    sestřeleni. Opravit astronef je vzhledem k nedostatku náhradních dílů nad
    síly i takového odborníka, jakým je Ray. Na Šámatu se některé dají
    najít, ale…</p>

    <p>Přežít a splnit úkol, v tom je Mark Stone mistr. Podaří se mu to i na
    Šámatu?</p>

    <!-- by Texy2! --></div><hr style="clear: left;" class="nevid" /></div> <!-- div.detail -->

    </div> <!-- div.kniha_info -->


    <hr style="clear: right;" class="nevid" />
    <hr style="clear: left;" class="nevid" />


    </div> <!-- div.content -->

    <div id="footer">
    <div id="paticka">
    <div class="c">
      <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/3.0/" class="fl">
        <img alt="Creative Commons License" style="border-width:0" src="http://i.creativecommons.org/l/by-nc-sa/3.0/88x31.png" /></a>
        This <span xmlns:dc="http://purl.org/dc/elements/1.1/" href="http://purl.org/dc/dcmitype/InteractiveResource" rel="dc:type">d&#237;lo</span>
        is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/3.0/">Creative Commons Uve&#271;te autora-Neu&#382;&#237;vejte d&#237;lo komer&#269;n&#283;-Zachovejte licenci 3.0 Unported License</a>.
    </div>
    2005 - 2009 www.legie.info, <a href="http://www.3tecky.cz">Ladislav -Knedle- Ševcůj</a> - knedle[at]3tecky.cz |generováno 0.4105 sekund <a href="http://www.toplist.cz/zabava"><script type="text/javascript">
    <!--
    document.write ('<img src="http://toplist.cz/dot.asp?id=211177&amp;http='+escape(document.referrer)+'&amp;t='+escape(document.title)+'" width="1" height="1" border=0 alt="TOPlist" />');
    //--></script></a><noscript><div><img src="http://toplist.cz/dot.asp?id=211177" style="border:none;"
    alt="TOPlist" width="1" height="1" /></div></noscript>
    <a href="http://whosread.com/cs/show/1576fh" title="online counter"><img src="http://whosread.com/counter/1576fh.gif" alt="online counter" width="80" height="15" class="noborder" /></a>

    </div> <!-- div.paticka -->

    </div> <!-- div.footer -->

    </div> <!-- div.container -->

    </body>
    </html>

    [/code]

    Vzasade se mi jedna o vypreparovani teto sekce:

    [code]<p>Neřazené díly série</p><div class="dvouradek"><a href="kniha/1004">Adarhargský jed</a></div><div class="dvouradek"><a href="kniha/9549">Děti otroků</a></div><div class="dvouradek"><a href="kniha/1014">Dračí krev</a></div><div class="dvouradek"><a href="kniha/999">Charlungští bojoví obři</a></div><div class="dvouradek"><a href="kniha/1002">Jablka z Beltamoru</a></div><div class="dvouradek"><a href="kniha/1005">Kalužiny modré krve</a></div><div class="dvouradek"><a href="kniha/1012">Král posledního moře</a></div><div class="dvouradek"><a href="kniha/1015">Královský gambit</a></div><div class="dvouradek"><a href="kniha/10408">Krvavé arény</a></div><div class="dvouradek"><a href="kniha/1003">Meč proti sekeře</a></div><div class="dvouradek">Mise na Šámatu</div><div class="dvouradek"><a href="kniha/1010">Oheň v kapradí</a></div><div class="dvouradek"><a href="kniha/3995">První mise</a></div><div class="dvouradek"><a href="kniha/5460">Svatá válka</a></div><div class="dvouradek"><a href="kniha/1001">Šarlatové pláště</a></div><div class="dvouradek"><a href="kniha/1009">Ve stínu pravdy</a></div><div class="dvouradek"><a href="kniha/8345">Vládce hurikánů</a></div><div class="dvouradek"><a href="kniha/1013">Vnitřní záležitost</a></div><div class="dvouradek"><a href="kniha/6146">Zachraňte Titanic!</a></div><div class="dvouradek"><a href="kniha/1008">Zatykač na Stonea</a></div><div class="dvouradek"><a href="kniha/1011">Zkáza Tortugy</a></div><div class="dvouradek"><a href="kniha/5054">Zlato Alwogiry</a></div></div><div id="anotace">Informace / Anotace ke knize: <strong>Mise na Šámatu</strong>
    <p>Generál Khov poslal Marka Stona na rutinní inspekci na planetu Šámat.
    Takových inspekcí agenti SDPP vykonají za rok mnoho. Planeta je však velmi
    nepohostinná. I přes mistrovské pilotní umění androida Raye jsou
    sestřeleni. Opravit astronef je vzhledem k nedostatku náhradních dílů nad
    síly i takového odborníka, jakým je Ray. Na Šámatu se některé dají
    najít, ale…</p>

    <p>Přežít a splnit úkol, v tom je Mark Stone mistr. Podaří se mu to i na
    Šámatu?</p>

    <!-- by Texy2! --></div><hr style="clear: left;" class="nevid" /></div> <!-- div.detail -->
    [/code]

    Splichtil jsem tento skript, ktery funguje - $soub je nazev html souboru:

    [code]a=`cat $soub | grep -n anotace | sed s#[^0-9][0-9]*##g | tail`
    b=`cat $soub | wc -l`
    d=$(($b-$a))
    e=`$soub | tail --lines=$d`
    f=`$soub | tail --lines=$d | grep -n 'Texy2' | sed s#[^0-9][0-9]*##g | tail`
    cat $soub | tail --lines=$d | head --lines=$(($f-1))[/code]

    Problem nastal v okamziku, kdyz jsem to chtel dat do cyklu (tech souboru je cca 14000):

    [code]find . -iname '*' -type f | while read soub
    do
    a=`cat $soub | grep -n anotace | sed s#[^0-9][0-9]*##g | tail`
    b=`cat $soub | wc -l`
    d=$(($b-$a))
    e=`$soub | tail --lines=$d`
    f=`$soub | tail --lines=$d | grep -n 'Texy2' | sed s#[^0-9][0-9]*##g | tail`
    cat $soub | tail --lines=$d | head --lines=$(($f-1))
    done[/code]

    pak jiz to nefunguje:

    [code]ged@ged-laptop:~/data/prechodne/legie_data/anotace_test$ bash legie
    legie: line 5: 233-: syntax error: operand expected (error token is "-")[/code]

    Odpovědi

    21.5.2009 13:54 Semo | skóre: 45 | blog: Semo
    Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed
    Citat vieme? Pred odoslanim si urcite tukol na tlacitko "Nahled komentare", takze si si mal overit, ci to niekto po tebe aj precita. Posli este raz normalne.
    If you hold a Unix shell up to your ear, you can you hear the C.
    21.5.2009 14:29 Messa | skóre: 39 | blog: Messa
    Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed
    Tohle bych osobně řešil raději v Pythonu pomocí BeautifulSoup, než řešit v bashi, co kde escapovat a jestli to mám uzavřené v těch správných uvozovkách. Také doufám, že výsledek tvého snažení nebude porušovat autorský zákon ani dobré mravy.

    Podle čeho vlastně chceš získat ten kus textu? Zdá se mi, žes to tu trochu popletl.

    Ta chybová hláška bude způsobena nejspíš tím, že v jednom souboru prostě není anotace.
    21.5.2009 15:53 Uran | skóre: 9 | blog: uranit
    Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed

    Uznavam naformatoval jsem to jako cune. Uz jsem vsak za vydatne pomoci nasel reseni:

    #!/bin/bash
    find ./anotace_test -iname '*' -type f | while read file; do
        text="$(cat ${file} |sed -n '/anotace/,/Texy2/p'|head -n -2|tail -n +2)"
        if [ -n "${text}" ];then
            echo --------------------zacatek--------------------
            echo "${text}"
            echo --------------------konec--------------------
        fi
    done
    
    exit 0
    
    

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.