Přihlášení | Registrace

napište » Zprávičky

Firefox 145.0

včera 16:44 | Nová verze

Byl vydán Mozilla Firefox 145.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Ukončena byla podpora 32bitového Firefoxu pro Linux. Přidána byla podpora Matrosky. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 145 bude brzy k dispozici také na Flathubu a Snapcraftu.

Ladislav Hagara | Komentářů: 0

Lidé.cz jsou zpět jako sociální síť

včera 13:33 | IT novinky

Lidé.cz (Wikipedie) jsou zpět jako sociální síť s "ambicí stát se místem pro kultivované debaty a bezpečným online prostředím".

Ladislav Hagara | Komentářů: 36

Lazarus 4.4

včera 10:33 | Nová verze

Byla vydána nová verze 4.4 multiplatformního integrovaného vývojového prostředí (IDE) pro rychlý vývoj aplikaci (RAD) ve Free Pascalu Lazarus (Wikipedie). Využíván je Free Pascal Compiler (FPC) 3.2.2.

Ladislav Hagara | Komentářů: 0

ASUS Ascent GX10

včera 04:00 | IT novinky

ASUS má v nabídce komplexní řešení pro vývoj a nasazení AI: kompaktní stolní AI superpočítač ASUS Ascent GX10 poháněný superčipem NVIDIA GB10 Grace Blackwell a platformou NVIDIA DGX Spark. S operačním systémem NVIDIA DGX založeném na Ubuntu.

Ladislav Hagara | Komentářů: 3

TDE R14.1.5

včera 03:11 | Nová verze

Desktopové prostredie Trinity Desktop vyšlo vo verzii R14.1.5. Je tu opravená chyba v tqt komponente spôsobujúca 100% vyťaženie cpu, dlaždice pre viac monitorov a nemenej dôležité su dizajnové zmeny v podobe ikon, pozadí atď. Pridaná bola podpora distribúcií Debian Trixie, Ubuntu Questing, RHEL 10 a OpenSUSE Leap 16.

lukve | Komentářů: 8

Easy Effects 8.0.0

10.11. 22:11 | Nová verze

Grafická aplikace Easy Effects (Flathub), původně PulseEffects, umožňující snadno povolovat a zakazovat různé audio efekty v aplikacích používajících multimediální server PipeWire, byla vydána ve verzi 8.0.0. Místo GTK 4 je nově postavená nad Qt, QML a Kirigami.

Ladislav Hagara | Komentářů: 0

Godot Engine – 2025 Showreel

10.11. 12:22 | Komunita

Na YouTube lze zhlédnout Godot Engine – 2025 Showreel s ukázkami toho nejlepšího letos vytvořeného v multiplatformním open source herním enginu Godot.

Ladislav Hagara | Komentářů: 0

Slova roku 2025: vibe coding, 6-7, …

10.11. 10:00 | Humor

Blíží se konec roku a tím i všemožná vyhlášení slov roku 2025. Dle Collins English Dictionary je slovem roku vibe coding, dle Dictionary.com je to 6-7, …

Ladislav Hagara | Komentářů: 6

Cloudflare Radar: podíl Linuxu na desktopu dosáhl v listopadu 6,2 %

10.11. 09:55 | IT novinky

Cloudflare Radar: podíl Linuxu na desktopu dosáhl v listopadu 6,2 %.

Ladislav Hagara | Komentářů: 4

Virtuální Bastlírna vol. 56: Už jste si objednali novou tiskárnu?

9.11. 19:22 | Pozvánky

Chcete vědět, co se odehrálo ve světě techniky za poslední měsíc? Nebo si popovídat o tom, co zrovna bastlíte? Pak doražte na listopadovou Virtuální Bastlírnu s mikrofonem a kamerou, nalijte si něco k pití a ponořte se s strahovskými bastlíři do diskuze u virtuálního piva o technice i všem možném okolo. Mezi nejvýznamnější novinky patří Průšovo oznámení Core One L, zavedení RFID na filamentech, tisk silikonu nebo nový slicer. Dozvíte se ale i

… více »

bkralik | Komentářů: 6

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (35%)

Gitlab (47%)

Atlassian (18%)

Bitbucket (17%)

Gitea (23%)

Mercurial (15%)

jen git (22%)

jen svn (16%)

Jiné (uvedu v diskusi) (16%)

Celkem 341 hlasů

Komentářů: 15, poslední 2.11. 08:25

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Náhrada za grep -o v sedu

Štítky: AWK, GNU, KDE, Perl, programování, Python, sed, textové editory, Vim

Dotaz: Náhrada za grep -o v sedu

21.4.2006 03:25 Mikos | skóre: 34 | blog: Jaderný blog | Praha
Náhrada za grep -o v sedu

Přečteno: 293×

Odpovědět | Admin

Oblíbil jsem si parametr grepu -o (only matching). Je to nesmírně užitečná věc a často hodně zjednodušuje práci. Nicméně jsem se dozvěděl, že je to v grepu vcelku novinka (maximálně pár let) a že je obsažena pouze v GNU grepu. Zajímá mě tedy, jak bych jí mohl nahradit sedem (ale nějak skutečně jednoduše, né sed skript na několik řádků ;-)

), kdybych se někdy dostal k systému kde grep volbu -o nepodporuje.

Malý příklad, mám soubor test.txt, který obsahuje:

bla <a href="bla">bla</a> bla <a href="bla">bla</a>
<a href="bla">bla</a>
bla <a href="bla">bla</a> bla <a href="bla">bla</a>

Chci vypsat všechny odkazy v něm (tedy adresy, to je jedno). S použitím grep -o je to jednoduché:

[mikos@tauri ~]$ grep -o '<a [^>]*>' test.txt
<a href="bla">
<a href="bla">
<a href="bla">
<a href="bla">
<a href="bla">

Ovšem jak na to se sedem? Zkoušel jsem toto:

[mikos@tauri ~]$ sed -n 's/.*\(<a [^>]*>\).*/\1/gp' test.txt
<a href="bla">
<a href="bla">
<a href="bla">

Jenže jak je vidět, to vypíše pouze jeden výskyt odkazu na řádku, jelikož ona .* sežere ty ostatní výskyty.

Je tu nějaký sed-guru, který by poradil co s tím? ;-)

Upozorňuju, že to s těmi odkazy je jen příklad, jde mi prostě o obecnou náhradu za grep -o (fungující naprosto stejně jako grep -o, tedy nestojím o žádné hacky jen pro konkrétní příklad).

CETERUM CENSEO DRM ESSE DELENDAM Ostatně soudím, že DRM musí být zničeno!

Nástroje: Začni sledovat (1) ?

Odpovědi

21.4.2006 03:30 Mikos | skóre: 34 | blog: Jaderný blog | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Ještě doplnění - také nestojím o žádný ekvivalent v awk nebo dokonce perlu :-)

Prostě chci sed, a to pokud možno jednoduše (viděl jsem už řešení, ale byl to ošklivý sed skript na několik řádek, to nechci).

Neexistuje v sedu prostě příkaz jako "vypiš pouze matching regexp"? Print (tedy 'p') vypisuje celý řádek co jsem tak zkoušel :-(

CETERUM CENSEO DRM ESSE DELENDAM Ostatně soudím, že DRM musí být zničeno!

21.4.2006 04:47 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

david@amd64 ~ $ cat lol
bla <a href="bla">bla</a> bla <a href="bla">bla</a>
<a href="bla">bla</a>
bla <a href="bla">bla</a> bla <a href="bla">bla</a>

david@amd64 ~ $ sed -e 's/.*\(<a [^>]*>\).*/\1/gp' lol
<a href="bla">
<a href="bla">
<a href="bla">
<a href="bla">
<a href="bla">
<a href="bla">

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

21.4.2006 04:58 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

A pokud nejsou odkazy na každém řádku, tak použij toto:

sed -e '/<a/ s/.*\(<a [^>]*>\).*/\1/gp' lol

vyhledává to jen řádky s "<a" a vyjde to prý mnohem rychleji.

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

21.4.2006 05:46 Mikos | skóre: 34 | blog: Jaderný blog | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Spočítej si kolikrát ti to vyhodí ten výsdledek - ten prostřední řádek to vyhodí 2x. Tzn. tohle není řešení...

CETERUM CENSEO DRM ESSE DELENDAM Ostatně soudím, že DRM musí být zničeno!

21.4.2006 05:50 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Máš recht... toho jsem si nevšim' :-(

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

21.4.2006 05:54 Mikos | skóre: 34 | blog: Jaderný blog | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

No i tak díky, snaha se cení ;-)

Jen doufam že se nějaké skutečné řešení najde (hlavně jednoduché... jak říkam už jsem řešení viděl, ale to byl sed skript na několik řádek a o to fakt nestojim).

CETERUM CENSEO DRM ESSE DELENDAM Ostatně soudím, že DRM musí být zničeno!

21.4.2006 09:12 Jan Zahornadsky | skóre: 22 | blog: hans_blog
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Nene... To ti pouze namečuje poslední výskyt hyperrefu na řádku a ten vypíše dvakrát :-(

Actually, I was half an hour into the pointer scripting documentation when she got dressed and left.

21.4.2006 08:43 Jan Zahornadsky | skóre: 22 | blog: hans_blog
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Napadlo mě následující řešení: nejdříve si rozsekáme soubor tak, že na jednom řádku bude maximálně jeden hyperref. To zařídíme například tak, že před každý znak "<" a za každý znak ">" vložíme newline. A na to už jde aplikovat docela jednoduchý regexp. Takže konkrétně tvůj případ:

john@turion ~ $ cat test
<a href="1"> xxx <a href="2">
dsjhfsk <a href="3">\bla
mame tu link <a href="4"> a tady taky <a href="5">
john@turion ~ $ cat test | sed 's/>/>\n</g; s/</\n</g' | sed -n '/^<a href=".*">/p'
<a href="1">
<a href="2">
<a href="3">
<a href="4">
<a href="5">

A nebo abys netvrdil, že je to jednorázový konkrétní hack, tak lze si zařídit jednoduchoučký skriptík grep-o:

#! /bin/sh
sed "s/\($1\)/\n\1\n/g" $2 | sed -n "/$1/p"

a teď:

john@turion ~ $ ./grep-o '<a [^>]*>' test
<a href="1">
<a href="2">
<a href="3">
<a href="4">
<a href="5">
john@turion ~ $ echo "<a hhhh> <b jjjj> <a xxx>" | ./grep-o '<a [^>]*>' -
<a hhhh>
<a xxx>

Actually, I was half an hour into the pointer scripting documentation when she got dressed and left.

21.4.2006 09:19 David Watzke
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

sed -e "s/\($1\)/\n\1\n/g" -ne "/$1/p" soubor

je kratší (a doufám, že funguje, hehe... zrovna to nemůžu ověřit. ale řekl bych, že jo).

21.4.2006 09:48 Jan Zahornadsky | skóre: 22 | blog: hans_blog
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

No, tohle natáhne řádek do bufferu (například "Ahoj, <a href="test">, jak se vede?" )rozseká řádek tak, že před a za regexp vloží newliny (v bufferu je teď "Ahoj, \n<a href="test">\n, jak se vede?") a na tento buffer aplikuje druhý regexp a tentokrát se ten regexp porovnává v podstatě se třema řádky najednou. Takže se to mine účinkem :-(

Ale jo, určitě to moje jde napsat i nějak jinak, jen tak mě napadá

sed -e "s/\($1\)/\n\1\n/g" "$2" | grep "$1"

Actually, I was half an hour into the pointer scripting documentation when she got dressed and left.

21.4.2006 15:21 Mikos | skóre: 34 | blog: Jaderný blog | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Díky, tohle funguje :-)

Ale pořád to není řešení problému, rpotože to funguje jen a pouze pokud vím, co najdu. Tedy abych to upřesnil - mohl bych např. chtít hledat ne celý odkaz, ale jen to co je v href="". Tedy něco takového:

sed 's/<a [^>]*href="\([^"]*\)"[^>]*>/\n\1\n/g' test.txt

To sice krásně funguje, ale pak už nedokážu sestavit ten druhý sed (či grep), protože prostě nemůžu vědět co v tom href="" bude uloženo. Tedy i když právě si uvědomuju, že tohle bych asi neudělal ani s grep - o :-)

Každopádně je nějaké řešení i pro tento případ? Ono by to tedy samozřejmě šlo udělat více sedy v koloně, ale neexistuje i nějaké hezší/čistší/jednodušší řešení? Prostě něco jako příkaz print v sedu, ale aby vypsal vždy pouze třeba \1 a ne celý řádek.

CETERUM CENSEO DRM ESSE DELENDAM Ostatně soudím, že DRM musí být zničeno!

21.4.2006 16:54 Mikos | skóre: 34 | blog: Jaderný blog | Praha
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Hmm, já už snad v tomhle na sed rezignuju. Pokud tedy někoho nenapadá ak to elegantně a jednoduše udělat v sedu, napadá aspoň někoho jak to udělat v awk?

Zkoušel jsem toto:

[mikos@tauri ~]$ awk '{match($0, /<a [^>]*href="([^"]*)"[^>]*>/, arr); print arr[1]}' test.txt
bla1a
bla2
bla3a

Jenže jak je vidět, příkaz "match" bere vždy jen první výskyt daného regexpu (tedy jako sed 's/pattern//', prostě bez onoho obligátního 'g'). Navíc co jsem tak koukal, je onen třetí argument u příkazu match také jen GNU rozšířením (tedy pouze v gawku).

To to opravdu není v sedu ani v awku nějak elegantně a jednoduše řešitelné? To bych opravdu na takovou blbost musel používat python (nebo nedejbože perl, fuj :-P)?

CETERUM CENSEO DRM ESSE DELENDAM Ostatně soudím, že DRM musí být zničeno!

21.4.2006 17:25 Pavel1 | skóre: 33
Rozbalit Rozbalit vše Re: Náhrada za grep -o v sedu

Pravděpodobně náhrada za grep -o bude vycházet trošku složitěji, proto asi grep tuto volbu má. Tak už to většinou bývá, že náhrada za něco bývá komplikovanější.

Nejjednodužší, nejpřehlednější a funkční řešení zadaného úkolu grep -o mi připadá (viz. výše) udělat si jednořádkový miniskriptík s obsahem :

sed -e "s/\($1\)/\n\1\n/g" "$2" | grep "$1"

a pak ten miniskriptík volat s parametry :

# miniskriptik hledany_retezec v_souboru

Ale určitě k zadanému cíli vede cest více.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje