abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 23:45 | Zajímavý software

Na blogu Qt bylo představeno Qt 3D Studio. Jedná se o produkt dosud známý pod názvem NVIDIA DRIVE™ Design Studio. NVIDIA jej věnovala Qt. Jedná se o několik set tisíc řádků zdrojového kódu. Qt 3D Studio bude stejně jako Qt k dispozici jak pod open source, tak pod komerční licencí. Ukázka práce s Qt 3D Studiem na YouTube.

Ladislav Hagara | Komentářů: 6
včera 17:50 | Komunita

Nadace The Document Foundation (TDF) zastřešující vývoj svobodného kancelářského balíku LibreOffice slaví 5 let od svého oficiálního vzniku. Nadace byla představena 28. září 2010. Formálně byla založena ale až 17. února 2012.

Ladislav Hagara | Komentářů: 0
včera 12:50 | Komunita

Mozilla.cz informuje, že dosud experimentální funkce Page Shot z programu Firefox Test Pilot (zprávička) se stane součástí Firefoxu. Page Shot je nástroj pro vytváření snímků webových stránek. Umí výběr oblasti, prvku stránky (např. odstavce), nebo uložení snímku celé stránky. Snímky lze ukládat na disk nebo nahrávat na server Mozilly. Nedávno bylo oznámeno, že se součástí Firefoxu stane Activity Stream.

Ladislav Hagara | Komentářů: 26
včera 04:10 | Nová verze

Po 10 týdnech vývoje od vydání Linuxu 4.9 (zprávička) oznámil Linus Torvalds, mj. již 20 let žijící v USA, vydání Linuxu 4.10 (LKML). Přehled nových vlastností a vylepšení například na Kernel Newbies a v Jaderných novinách (1, 2 a 3). Kódové jméno Linuxu 4.10 je Fearless Coyote.

Ladislav Hagara | Komentářů: 12
19.2. 15:55 | Zajímavý projekt

Vyzkoušet si příkazy a vyřešit několik úkolů lze na stránkách Commandline Challenge (CMD Challenge). Úkoly lze řešit různými způsoby, důležitý je výsledek. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

Ladislav Hagara | Komentářů: 18
18.2. 17:35 | Bezpečnostní upozornění

Německá Bundesnetzagentur (obdoba českého ČTU) zakázala na německém území prodej panenky Cayla kvůli „špionáži“ dětí. Tato elektronická hračka obsahuje mikrofon, reproduktor a kameru a bezdrátové komunikační rozhraní, pomocí kterého se hračka připojuje na servery výrobce. Takovýmto způsobem může hračka pomocí umělé inteligence „odpovídat“ na dotazy dítěte. Hlavní problém bude ale asi někde jinde, podle prvotních zpráv může

… více »
Petr Tomášek | Komentářů: 34
17.2. 15:30 | Bezpečnostní upozornění

CSIRT.CZ upozorňuje, že bezpečnostní experti objevili nový typ malwaru, jenž cílí na open source e-commerce platformu Magento. Malware je zajímavý tím, že se jedná o první svého druhu, jehož kód zůstává skrytý v SQL databázi zasaženého e-shopu. Škodlivý kód je volán pomocí tzv. SQL trigerru, který je spouštěn při každém vytvoření objednávky v systému.

Ladislav Hagara | Komentářů: 5
17.2. 09:00 | Nová verze

Bylo vydáno Ubuntu 16.04.2 LTS, tj. druhé opravné vydání Ubuntu 16.04 LTS s kódovým názvem Xenial Xerus. Přehled novinek v poznámkách k vydání a v přehledu změn.

Ladislav Hagara | Komentářů: 60
17.2. 06:00 | Zajímavý článek

Pavel Tišnovský se v dvoudílném článku na MojeFedora.cz věnuje tvorbě pluginů (modulů) pro bitmapový grafický editor GIMP. Pomocí pluginů lze GIMP rozšiřovat o další funkce. Implementovat lze například nové filtry nebo pomocné utility pro tvorbu animací či poloautomatickou retuš snímků.

Ladislav Hagara | Komentářů: 6
16.2. 23:32 | Komunita

Do 30. března se lze přihlásit do dalšího kola programu Outreachy, jehož cílem je přitáhnout do světa svobodného a otevřeného softwaru lidi ze skupin, jež jsou ve světě svobodného a otevřeného softwaru málo zastoupeny. Za 3 měsíce práce, od 30. května do 30. srpna 2017, v participujících organizacích lze vydělat 5 500 USD. Jedná se již o 14. kolo tohoto programu.

Ladislav Hagara | Komentářů: 11
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (13%)
 (2%)
 (72%)
 (3%)
 (10%)
Celkem 675 hlasů
 Komentářů: 61, poslední dnes 13:06
Rozcestník
Reklama

Dotaz: skript vypreparovani bloku textu grep sed

21.5.2009 13:39 Uran | skóre: 9 | blog: uranit
skript vypreparovani bloku textu grep sed
Přečteno: 273×

Tak jsem potreboval vypreparovat z textovych souboru konkretni ohraniceny blok textu.

Zdrojovy soubor:
[code]
.
.
.
.
[42]&nbsp;<a href="kniha/982">Netvoři z hlubin Wrecku</a><br />
[43]&nbsp;<a href="kniha/429">Čarodejnice z bažin 1</a><br />
[43]&nbsp;<a href="kniha/430">Čarodejnice z bažin 2</a><br />
[44]&nbsp;<a href="kniha/984">Beznadějné pátrání</a><br />
<p>Neřazené díly série</p><div class="dvouradek"><a href="kniha/1004">Adarhargský jed</a></div><div class="dvouradek"><a href="kniha/9549">Děti otroků</a></div><div class="dvouradek"><a href="kniha/1014">Dračí krev</a></div><div class="dvouradek"><a href="kniha/999">Charlungští bojoví obři</a></div><div class="dvouradek"><a href="kniha/1002">Jablka z Beltamoru</a></div><div class="dvouradek"><a href="kniha/1005">Kalužiny modré krve</a></div><div class="dvouradek"><a href="kniha/1012">Král posledního moře</a></div><div class="dvouradek"><a href="kniha/1015">Královský gambit</a></div><div class="dvouradek"><a href="kniha/10408">Krvavé arény</a></div><div class="dvouradek"><a href="kniha/1003">Meč proti sekeře</a></div><div class="dvouradek">Mise na Šámatu</div><div class="dvouradek"><a href="kniha/1010">Oheň v kapradí</a></div><div class="dvouradek"><a href="kniha/3995">První mise</a></div><div class="dvouradek"><a href="kniha/5460">Svatá válka</a></div><div class="dvouradek"><a href="kniha/1001">Šarlatové pláště</a></div><div class="dvouradek"><a href="kniha/1009">Ve stínu pravdy</a></div><div class="dvouradek"><a href="kniha/8345">Vládce hurikánů</a></div><div class="dvouradek"><a href="kniha/1013">Vnitřní záležitost</a></div><div class="dvouradek"><a href="kniha/6146">Zachraňte Titanic!</a></div><div class="dvouradek"><a href="kniha/1008">Zatykač na Stonea</a></div><div class="dvouradek"><a href="kniha/1011">Zkáza Tortugy</a></div><div class="dvouradek"><a href="kniha/5054">Zlato Alwogiry</a></div></div><div id="anotace">Informace / Anotace ke knize: <strong>Mise na Šámatu</strong>
<p>Generál Khov poslal Marka Stona na rutinní inspekci na planetu Šámat.
Takových inspekcí agenti SDPP vykonají za rok mnoho. Planeta je však velmi
nepohostinná. I přes mistrovské pilotní umění androida Raye jsou
sestřeleni. Opravit astronef je vzhledem k nedostatku náhradních dílů nad
síly i takového odborníka, jakým je Ray. Na Šámatu se některé dají
najít, ale…</p>

<p>Přežít a splnit úkol, v tom je Mark Stone mistr. Podaří se mu to i na
Šámatu?</p>

<!-- by Texy2! --></div><hr style="clear: left;" class="nevid" /></div> <!-- div.detail -->

</div> <!-- div.kniha_info -->


<hr style="clear: right;" class="nevid" />
<hr style="clear: left;" class="nevid" />


</div> <!-- div.content -->

<div id="footer">
<div id="paticka">
<div class="c">
  <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/3.0/" class="fl">
    <img alt="Creative Commons License" style="border-width:0" src="http://i.creativecommons.org/l/by-nc-sa/3.0/88x31.png" /></a>
    This <span xmlns:dc="http://purl.org/dc/elements/1.1/" href="http://purl.org/dc/dcmitype/InteractiveResource" rel="dc:type">d&#237;lo</span>
    is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/3.0/">Creative Commons Uve&#271;te autora-Neu&#382;&#237;vejte d&#237;lo komer&#269;n&#283;-Zachovejte licenci 3.0 Unported License</a>.
</div>
2005 - 2009 www.legie.info, <a href="http://www.3tecky.cz">Ladislav -Knedle- Ševcůj</a> - knedle[at]3tecky.cz |generováno 0.4105 sekund <a href="http://www.toplist.cz/zabava"><script type="text/javascript">
<!--
document.write ('<img src="http://toplist.cz/dot.asp?id=211177&amp;http='+escape(document.referrer)+'&amp;t='+escape(document.title)+'" width="1" height="1" border=0 alt="TOPlist" />');
//--></script></a><noscript><div><img src="http://toplist.cz/dot.asp?id=211177" style="border:none;"
alt="TOPlist" width="1" height="1" /></div></noscript>
<a href="http://whosread.com/cs/show/1576fh" title="online counter"><img src="http://whosread.com/counter/1576fh.gif" alt="online counter" width="80" height="15" class="noborder" /></a>

</div> <!-- div.paticka -->

</div> <!-- div.footer -->

</div> <!-- div.container -->

</body>
</html>

[/code]

Vzasade se mi jedna o vypreparovani teto sekce:

[code]<p>Neřazené díly série</p><div class="dvouradek"><a href="kniha/1004">Adarhargský jed</a></div><div class="dvouradek"><a href="kniha/9549">Děti otroků</a></div><div class="dvouradek"><a href="kniha/1014">Dračí krev</a></div><div class="dvouradek"><a href="kniha/999">Charlungští bojoví obři</a></div><div class="dvouradek"><a href="kniha/1002">Jablka z Beltamoru</a></div><div class="dvouradek"><a href="kniha/1005">Kalužiny modré krve</a></div><div class="dvouradek"><a href="kniha/1012">Král posledního moře</a></div><div class="dvouradek"><a href="kniha/1015">Královský gambit</a></div><div class="dvouradek"><a href="kniha/10408">Krvavé arény</a></div><div class="dvouradek"><a href="kniha/1003">Meč proti sekeře</a></div><div class="dvouradek">Mise na Šámatu</div><div class="dvouradek"><a href="kniha/1010">Oheň v kapradí</a></div><div class="dvouradek"><a href="kniha/3995">První mise</a></div><div class="dvouradek"><a href="kniha/5460">Svatá válka</a></div><div class="dvouradek"><a href="kniha/1001">Šarlatové pláště</a></div><div class="dvouradek"><a href="kniha/1009">Ve stínu pravdy</a></div><div class="dvouradek"><a href="kniha/8345">Vládce hurikánů</a></div><div class="dvouradek"><a href="kniha/1013">Vnitřní záležitost</a></div><div class="dvouradek"><a href="kniha/6146">Zachraňte Titanic!</a></div><div class="dvouradek"><a href="kniha/1008">Zatykač na Stonea</a></div><div class="dvouradek"><a href="kniha/1011">Zkáza Tortugy</a></div><div class="dvouradek"><a href="kniha/5054">Zlato Alwogiry</a></div></div><div id="anotace">Informace / Anotace ke knize: <strong>Mise na Šámatu</strong>
<p>Generál Khov poslal Marka Stona na rutinní inspekci na planetu Šámat.
Takových inspekcí agenti SDPP vykonají za rok mnoho. Planeta je však velmi
nepohostinná. I přes mistrovské pilotní umění androida Raye jsou
sestřeleni. Opravit astronef je vzhledem k nedostatku náhradních dílů nad
síly i takového odborníka, jakým je Ray. Na Šámatu se některé dají
najít, ale…</p>

<p>Přežít a splnit úkol, v tom je Mark Stone mistr. Podaří se mu to i na
Šámatu?</p>

<!-- by Texy2! --></div><hr style="clear: left;" class="nevid" /></div> <!-- div.detail -->
[/code]

Splichtil jsem tento skript, ktery funguje - $soub je nazev html souboru:

[code]a=`cat $soub | grep -n anotace | sed s#[^0-9][0-9]*##g | tail`
b=`cat $soub | wc -l`
d=$(($b-$a))
e=`$soub | tail --lines=$d`
f=`$soub | tail --lines=$d | grep -n 'Texy2' | sed s#[^0-9][0-9]*##g | tail`
cat $soub | tail --lines=$d | head --lines=$(($f-1))[/code]

Problem nastal v okamziku, kdyz jsem to chtel dat do cyklu (tech souboru je cca 14000):

[code]find . -iname '*' -type f | while read soub
do
a=`cat $soub | grep -n anotace | sed s#[^0-9][0-9]*##g | tail`
b=`cat $soub | wc -l`
d=$(($b-$a))
e=`$soub | tail --lines=$d`
f=`$soub | tail --lines=$d | grep -n 'Texy2' | sed s#[^0-9][0-9]*##g | tail`
cat $soub | tail --lines=$d | head --lines=$(($f-1))
done[/code]

pak jiz to nefunguje:

[code]ged@ged-laptop:~/data/prechodne/legie_data/anotace_test$ bash legie
legie: line 5: 233-: syntax error: operand expected (error token is "-")[/code]

Odpovědi

21.5.2009 13:54 Semo | skóre: 44 | blog: Semo
Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed
Citat vieme? Pred odoslanim si urcite tukol na tlacitko "Nahled komentare", takze si si mal overit, ci to niekto po tebe aj precita. Posli este raz normalne.
If you hold a Unix shell up to your ear, you can you hear the C.
21.5.2009 14:29 Messa | skóre: 39 | blog: Messa
Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed
Tohle bych osobně řešil raději v Pythonu pomocí BeautifulSoup, než řešit v bashi, co kde escapovat a jestli to mám uzavřené v těch správných uvozovkách. Také doufám, že výsledek tvého snažení nebude porušovat autorský zákon ani dobré mravy.

Podle čeho vlastně chceš získat ten kus textu? Zdá se mi, žes to tu trochu popletl.

Ta chybová hláška bude způsobena nejspíš tím, že v jednom souboru prostě není anotace.
21.5.2009 15:53 Uran | skóre: 9 | blog: uranit
Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed

Uznavam naformatoval jsem to jako cune. Uz jsem vsak za vydatne pomoci nasel reseni:

#!/bin/bash
find ./anotace_test -iname '*' -type f | while read file; do
    text="$(cat ${file} |sed -n '/anotace/,/Texy2/p'|head -n -2|tail -n +2)"
    if [ -n "${text}" ];then
        echo --------------------zacatek--------------------
        echo "${text}"
        echo --------------------konec--------------------
    fi
done

exit 0

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.