Portál AbcLinuxu, 9. května 2025 06:17

Dotaz: Filtrování slov v souboru

19.3.2013 13:37 Makr
Filtrování slov v souboru
Přečteno: 352×
Odpovědět | Admin
Mám textový soubor, který obsahuje konfigurační řádky. Na jednotlivých řádcích se nachází buď relativní/absolutní cesta, nebo název souboru, před nímž je slovo ignore (př.: ignore readme nebo ignore ../*) Chtěla bych vyfiltrovat pouze ignore a následně z nich názvy jednotlivých souborů a s nimi dál pracovat. Zkoušela jsem to řešit pomocí grepu a sedu (grep -v '^ignore .*' sed 's/^*/d/' > soubor), ale to mi shell bohužel nesežral. Nemáte někdo nápad, jak to řešit?

Předem díky za reakce.

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

19.3.2013 13:54 Kit
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
Ta hvězdička v parametrech sedu má patřit k "^"? Zřejmě tam něco chybí. Nebo jsi nepochopila, co ta hvězdička v regulárních výrazech znamená.

Mělo by to jít i bez toho grepu.
19.3.2013 13:55 rastos | skóre: 63 | blog: rastos
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
awk '/ignore/ { print $2 }'
19.3.2013 14:11 Kit
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Jestli jsem správně pochopil dotaz z pokusu o řešení, tak by to mohlo být spíš
awk '! /^ignore/ { print $1 }'
Řešení 1× (Makr (tazatel))
19.3.2013 15:11 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
grep -v '^ignore .*' sed 's/^*/d/' > soubor
^--příkaz            ^---další příkaz
...ale příkazy se v shellu musí oddělovat nečím víc než mezerou, např. rourou |
grep -v '^ignore .*' sed 's/^*/d/' > soubor
      ^--- chcete vybrat pouze řádky, kde je ignore? Ale -v znamená "vyjma..."
           čili to vybere řádky, kde *není* na začátku ignore.
grep '^ignore .*' soubor | sed 's/^*/d/' > soubor
                  ^      ^        ^  ^--- d (ale v jiném kontextu) maže celý řádek, ne jen slovo, nedejte tam nic a slovo bude nahrazeno mezerou (=vymazáno)
                  |      |        `-- zde má být regulární výraz (regexp), ne wildcard!!!
                  |      `-- to je ta roura
                  `--- grep potřebuje jako parametr soubor, který má zpracovávat
Takže jste asi chtěla napsat něco takového:
grep '^ignore' soubor | sed -e 's/^[^\s]\+\s\+//'
Což lze rovnou v sedu udělat takto:
sed -n -e "s/^ignore\s\+\(.*\)$/\1/p" soubor
19.3.2013 17:08 Makr
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Omlouvám se, o rouře samozřejmě vím, jen mi vypadla.

Ano, původně jsem zamýšlela, že nejdřív si vyfiltruji ty řádky, kde není ignore a ty pak smažu a dál s tím dál budu pracovat. Prosím Vás, vysvětlil bystě mi, co za tím ignore vše značí? Nemůžu si to dát do souvislosti.
20.3.2013 23:56 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Ano, původně jsem zamýšlela, že nejdřív si vyfiltruji ty řádky, kde není ignore a ty pak smažu a dál s tím dál budu pracovat.

To by šlo příkazem:
sed -e "/^ignore/d" soubor.txt > soubor_bez_ignore.txt
existuje i parametr -i kterým přepíšete původní soubor.txt.

Pokud byste to chtěla pomocí grep tak:
grep -v "^ignore" soubor.txt > soubor_bez_ignore.txt
a dál pak pracovat s novým souborem.

co za tím ignore vše značí?
sed -n -e "s/^ignore\s\+\(.*\)$/\1/p" soubor
Je to především regulární výraz, regular expression, regexp.
\s = bílý znak, zpravidla mezera, tabulátor apod.
\+ = opakující se alespoň jednou
\(.*\) = jakýkoliv řetězec, v závorkách je to proto, abych ten text mohl následně použít zápisem \1
$ = konec řádku

\1 = zde bude vložen text z první (výše uvedené) závorky, a protože tam toho víc není,
celý výraz vlevo bude nahrazen jen "obsahem" té závorky, což by měl být ten
název souboru.
Před znaky + ( ) jsou obrácená lomítka, protože je nutné je v uvedeném kontextu escapovat, jinak by byly považovány prostě za znak plus, závorka apod. a neměly by zvláštní význam. Sed umí i perlovskou notaci regulárních výrazů, kde je escapování méně.

20.3.2013 23:57 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Omlouvám se ten první sed filtruje naopak řádky kde ignore je.
21.3.2013 09:10 Makr
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Děkuji, moc mi to pomohlo.
21.3.2013 14:10 #
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Osobne preferuji prepinac -r mist -e clovek pak nemusi vsude cpat escape \

sed -n -r "s/^ignore\s+(.*)$/\1/p" ./fl.log
20.3.2013 08:43 cronin | skóre: 49
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
grep "^ignore " | cut -f 2- -d " "
21.3.2013 00:00 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Filtrování slov v souboru
Tak cut mám také rád, bohužel je při své jednoduchosti často nanic, protože člověka tak trochu tlačí do nerealistických předpokladů, jako že mezi ignore a názvem souoru je zrovna mezera, a navíc jen jedna apod.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.