abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
dnes 16:00 | Nová verze

Byla vydána verze 0.98 svobodného nelineárního video editoru Pitivi. Z novinek lze zmínit například přizpůsobitelné klávesové zkratky. Videoukázka práce s nejnovější verzí Pitivi na YouTube.

Ladislav Hagara | Komentářů: 0
dnes 15:00 | Zajímavý software

Stop motion je technika animace, při níž je reálný objekt mezi jednotlivými snímky ručně upravován a posouván o malé úseky, tak aby po spojení vyvolala animace dojem spojitosti. Jaký software lze pro stop motion použít na Linuxu? Článek na OMG! Ubuntu! představuje Heron Animation. Ten bohužel podporuje pouze webové kamery. Podpora digitálních zrcadlovek je začleněna například v programu qStopMotion.

Ladislav Hagara | Komentářů: 1
včera 21:21 | Nová verze Ladislav Hagara | Komentářů: 0
včera 11:44 | Zajímavý projekt

Na Indiegogo byla spuštěna kampaň na podporu herní mini konzole a multimediálního centra RetroEngine Sigma od Doyodo. Předobjednat ji lze již od 49 dolarů. Požadovaná částka 20 000 dolarů byla překonána již 6 krát. Majitelé mini konzole si budou moci zahrát hry pro Atari VCS 2600, Sega Genesis nebo NES. Předinstalováno bude multimediální centrum Kodi.

Ladislav Hagara | Komentářů: 0
včera 00:10 | Nová verze

Byla vydána verze 4.7 redakčního systému WordPress. Kódové označením Vaughan bylo vybráno na počest americké jazzové zpěvačky Sarah "Sassy" Vaughan. Z novinek lze zmínit například novou výchozí šablonu Twenty Seventeen, náhledy pdf souborů nebo WordPress REST API.

Ladislav Hagara | Komentářů: 4
6.12. 12:00 | Zajímavý projekt

Projekt Termbox umožňuje vyzkoušet si linuxové distribuce Ubuntu, Debian, Fedora, CentOS a Arch Linux ve webovém prohlížeči. Řešení je postaveno na projektu HyperContainer. Podrobnosti v často kladených dotazech (FAQ). Zdrojové kódy jsou k dispozici na GitHubu [reddit].

Ladislav Hagara | Komentářů: 27
6.12. 11:00 | Bezpečnostní upozornění

Byly zveřejněny informace o bezpečnostní chybě CVE-2016-8655 v Linuxu zneužitelné k lokální eskalaci práv. Chyba se dostala do linuxového jádra v srpnu 2011. V upstreamu byla opravena minulý týden [Hacker News].

Ladislav Hagara | Komentářů: 2
5.12. 22:00 | Komunita

Přibližně před měsícem bylo oznámeno, že linuxová distribuce SUSE Linux Enterprise Server (SLES) běží nově také Raspberry Pi 3 (dokumentace). Obraz verze 12 SP2 pro Raspberry Pi 3 je ke stažení zdarma. Pro registrované jsou po dobu jednoho roku zdarma také aktualizace. Dnes bylo oznámeno, že pro Raspberry Pi 3 je k dispozici také nové openSUSE Leap 42.2 (zprávička). K dispozici je hned několik obrazů.

Ladislav Hagara | Komentářů: 6
5.12. 06:00 | Zajímavý software

OMG! Ubuntu! představuje emulátor terminálu Hyper (GitHub) postavený na webových technologiích (HTML, CSS a JavaScript). V diskusi k článku je zmíněn podobný emulátor terminálu Black Screen. Hyper i Black Screen používají framework Electron, stejně jako editor Atom nebo vývojové prostředí Visual Studio Code.

Ladislav Hagara | Komentářů: 50
5.12. 06:00 | Zajímavý článek

I letos vychází řada ajťáckých adventních kalendářů. QEMU Advent Calendar 2016 přináší každý den nový obraz disku pro QEMU. Programátoři se mohou potrápit při řešení úloh z kalendáře Advent of Code 2016. Kalendáře Perl Advent Calendar 2016 a Perl 6 Advent Calendar přinášejí každý den zajímavé informace o programovacím jazyce Perl. Stranou nezůstává ani programovací jazyk Go.

Ladislav Hagara | Komentářů: 10
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 796 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: skript vypreparovani bloku textu grep sed

21.5.2009 13:39 Uran | skóre: 9 | blog: uranit
skript vypreparovani bloku textu grep sed
Přečteno: 267×

Tak jsem potreboval vypreparovat z textovych souboru konkretni ohraniceny blok textu.

Zdrojovy soubor:
[code]
.
.
.
.
[42]&nbsp;<a href="kniha/982">Netvoři z hlubin Wrecku</a><br />
[43]&nbsp;<a href="kniha/429">Čarodejnice z bažin 1</a><br />
[43]&nbsp;<a href="kniha/430">Čarodejnice z bažin 2</a><br />
[44]&nbsp;<a href="kniha/984">Beznadějné pátrání</a><br />
<p>Neřazené díly série</p><div class="dvouradek"><a href="kniha/1004">Adarhargský jed</a></div><div class="dvouradek"><a href="kniha/9549">Děti otroků</a></div><div class="dvouradek"><a href="kniha/1014">Dračí krev</a></div><div class="dvouradek"><a href="kniha/999">Charlungští bojoví obři</a></div><div class="dvouradek"><a href="kniha/1002">Jablka z Beltamoru</a></div><div class="dvouradek"><a href="kniha/1005">Kalužiny modré krve</a></div><div class="dvouradek"><a href="kniha/1012">Král posledního moře</a></div><div class="dvouradek"><a href="kniha/1015">Královský gambit</a></div><div class="dvouradek"><a href="kniha/10408">Krvavé arény</a></div><div class="dvouradek"><a href="kniha/1003">Meč proti sekeře</a></div><div class="dvouradek">Mise na Šámatu</div><div class="dvouradek"><a href="kniha/1010">Oheň v kapradí</a></div><div class="dvouradek"><a href="kniha/3995">První mise</a></div><div class="dvouradek"><a href="kniha/5460">Svatá válka</a></div><div class="dvouradek"><a href="kniha/1001">Šarlatové pláště</a></div><div class="dvouradek"><a href="kniha/1009">Ve stínu pravdy</a></div><div class="dvouradek"><a href="kniha/8345">Vládce hurikánů</a></div><div class="dvouradek"><a href="kniha/1013">Vnitřní záležitost</a></div><div class="dvouradek"><a href="kniha/6146">Zachraňte Titanic!</a></div><div class="dvouradek"><a href="kniha/1008">Zatykač na Stonea</a></div><div class="dvouradek"><a href="kniha/1011">Zkáza Tortugy</a></div><div class="dvouradek"><a href="kniha/5054">Zlato Alwogiry</a></div></div><div id="anotace">Informace / Anotace ke knize: <strong>Mise na Šámatu</strong>
<p>Generál Khov poslal Marka Stona na rutinní inspekci na planetu Šámat.
Takových inspekcí agenti SDPP vykonají za rok mnoho. Planeta je však velmi
nepohostinná. I přes mistrovské pilotní umění androida Raye jsou
sestřeleni. Opravit astronef je vzhledem k nedostatku náhradních dílů nad
síly i takového odborníka, jakým je Ray. Na Šámatu se některé dají
najít, ale…</p>

<p>Přežít a splnit úkol, v tom je Mark Stone mistr. Podaří se mu to i na
Šámatu?</p>

<!-- by Texy2! --></div><hr style="clear: left;" class="nevid" /></div> <!-- div.detail -->

</div> <!-- div.kniha_info -->


<hr style="clear: right;" class="nevid" />
<hr style="clear: left;" class="nevid" />


</div> <!-- div.content -->

<div id="footer">
<div id="paticka">
<div class="c">
  <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/3.0/" class="fl">
    <img alt="Creative Commons License" style="border-width:0" src="http://i.creativecommons.org/l/by-nc-sa/3.0/88x31.png" /></a>
    This <span xmlns:dc="http://purl.org/dc/elements/1.1/" href="http://purl.org/dc/dcmitype/InteractiveResource" rel="dc:type">d&#237;lo</span>
    is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/3.0/">Creative Commons Uve&#271;te autora-Neu&#382;&#237;vejte d&#237;lo komer&#269;n&#283;-Zachovejte licenci 3.0 Unported License</a>.
</div>
2005 - 2009 www.legie.info, <a href="http://www.3tecky.cz">Ladislav -Knedle- Ševcůj</a> - knedle[at]3tecky.cz |generováno 0.4105 sekund <a href="http://www.toplist.cz/zabava"><script type="text/javascript">
<!--
document.write ('<img src="http://toplist.cz/dot.asp?id=211177&amp;http='+escape(document.referrer)+'&amp;t='+escape(document.title)+'" width="1" height="1" border=0 alt="TOPlist" />');
//--></script></a><noscript><div><img src="http://toplist.cz/dot.asp?id=211177" style="border:none;"
alt="TOPlist" width="1" height="1" /></div></noscript>
<a href="http://whosread.com/cs/show/1576fh" title="online counter"><img src="http://whosread.com/counter/1576fh.gif" alt="online counter" width="80" height="15" class="noborder" /></a>

</div> <!-- div.paticka -->

</div> <!-- div.footer -->

</div> <!-- div.container -->

</body>
</html>

[/code]

Vzasade se mi jedna o vypreparovani teto sekce:

[code]<p>Neřazené díly série</p><div class="dvouradek"><a href="kniha/1004">Adarhargský jed</a></div><div class="dvouradek"><a href="kniha/9549">Děti otroků</a></div><div class="dvouradek"><a href="kniha/1014">Dračí krev</a></div><div class="dvouradek"><a href="kniha/999">Charlungští bojoví obři</a></div><div class="dvouradek"><a href="kniha/1002">Jablka z Beltamoru</a></div><div class="dvouradek"><a href="kniha/1005">Kalužiny modré krve</a></div><div class="dvouradek"><a href="kniha/1012">Král posledního moře</a></div><div class="dvouradek"><a href="kniha/1015">Královský gambit</a></div><div class="dvouradek"><a href="kniha/10408">Krvavé arény</a></div><div class="dvouradek"><a href="kniha/1003">Meč proti sekeře</a></div><div class="dvouradek">Mise na Šámatu</div><div class="dvouradek"><a href="kniha/1010">Oheň v kapradí</a></div><div class="dvouradek"><a href="kniha/3995">První mise</a></div><div class="dvouradek"><a href="kniha/5460">Svatá válka</a></div><div class="dvouradek"><a href="kniha/1001">Šarlatové pláště</a></div><div class="dvouradek"><a href="kniha/1009">Ve stínu pravdy</a></div><div class="dvouradek"><a href="kniha/8345">Vládce hurikánů</a></div><div class="dvouradek"><a href="kniha/1013">Vnitřní záležitost</a></div><div class="dvouradek"><a href="kniha/6146">Zachraňte Titanic!</a></div><div class="dvouradek"><a href="kniha/1008">Zatykač na Stonea</a></div><div class="dvouradek"><a href="kniha/1011">Zkáza Tortugy</a></div><div class="dvouradek"><a href="kniha/5054">Zlato Alwogiry</a></div></div><div id="anotace">Informace / Anotace ke knize: <strong>Mise na Šámatu</strong>
<p>Generál Khov poslal Marka Stona na rutinní inspekci na planetu Šámat.
Takových inspekcí agenti SDPP vykonají za rok mnoho. Planeta je však velmi
nepohostinná. I přes mistrovské pilotní umění androida Raye jsou
sestřeleni. Opravit astronef je vzhledem k nedostatku náhradních dílů nad
síly i takového odborníka, jakým je Ray. Na Šámatu se některé dají
najít, ale…</p>

<p>Přežít a splnit úkol, v tom je Mark Stone mistr. Podaří se mu to i na
Šámatu?</p>

<!-- by Texy2! --></div><hr style="clear: left;" class="nevid" /></div> <!-- div.detail -->
[/code]

Splichtil jsem tento skript, ktery funguje - $soub je nazev html souboru:

[code]a=`cat $soub | grep -n anotace | sed s#[^0-9][0-9]*##g | tail`
b=`cat $soub | wc -l`
d=$(($b-$a))
e=`$soub | tail --lines=$d`
f=`$soub | tail --lines=$d | grep -n 'Texy2' | sed s#[^0-9][0-9]*##g | tail`
cat $soub | tail --lines=$d | head --lines=$(($f-1))[/code]

Problem nastal v okamziku, kdyz jsem to chtel dat do cyklu (tech souboru je cca 14000):

[code]find . -iname '*' -type f | while read soub
do
a=`cat $soub | grep -n anotace | sed s#[^0-9][0-9]*##g | tail`
b=`cat $soub | wc -l`
d=$(($b-$a))
e=`$soub | tail --lines=$d`
f=`$soub | tail --lines=$d | grep -n 'Texy2' | sed s#[^0-9][0-9]*##g | tail`
cat $soub | tail --lines=$d | head --lines=$(($f-1))
done[/code]

pak jiz to nefunguje:

[code]ged@ged-laptop:~/data/prechodne/legie_data/anotace_test$ bash legie
legie: line 5: 233-: syntax error: operand expected (error token is "-")[/code]

Odpovědi

21.5.2009 13:54 Semo | skóre: 44 | blog: Semo
Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed
Citat vieme? Pred odoslanim si urcite tukol na tlacitko "Nahled komentare", takze si si mal overit, ci to niekto po tebe aj precita. Posli este raz normalne.
If you hold a Unix shell up to your ear, you can you hear the C.
21.5.2009 14:29 Messa | skóre: 39 | blog: Messa
Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed
Tohle bych osobně řešil raději v Pythonu pomocí BeautifulSoup, než řešit v bashi, co kde escapovat a jestli to mám uzavřené v těch správných uvozovkách. Také doufám, že výsledek tvého snažení nebude porušovat autorský zákon ani dobré mravy.

Podle čeho vlastně chceš získat ten kus textu? Zdá se mi, žes to tu trochu popletl.

Ta chybová hláška bude způsobena nejspíš tím, že v jednom souboru prostě není anotace.
21.5.2009 15:53 Uran | skóre: 9 | blog: uranit
Rozbalit Rozbalit vše Re: skript vypreparovani bloku textu grep sed

Uznavam naformatoval jsem to jako cune. Uz jsem vsak za vydatne pomoci nasel reseni:

#!/bin/bash
find ./anotace_test -iname '*' -type f | while read file; do
    text="$(cat ${file} |sed -n '/anotace/,/Texy2/p'|head -n -2|tail -n +2)"
    if [ -n "${text}" ];then
        echo --------------------zacatek--------------------
        echo "${text}"
        echo --------------------konec--------------------
    fi
done

exit 0

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.