Filtrování slov v souboru (vyřešeno)

grep -v '^ignore .*' sed 's/^*/d/' > soubor
^--příkaz            ^---další příkaz
...ale příkazy se v shellu musí oddělovat nečím víc než mezerou, např. rourou |

grep -v '^ignore .*' sed 's/^*/d/' > soubor
      ^--- chcete vybrat pouze řádky, kde je ignore? Ale -v znamená "vyjma..."
           čili to vybere řádky, kde *není* na začátku ignore.

grep '^ignore .*' soubor | sed 's/^*/d/' > soubor
                  ^      ^        ^  ^--- d (ale v jiném kontextu) maže celý řádek, ne jen slovo, nedejte tam nic a slovo bude nahrazeno mezerou (=vymazáno)
                  |      |        `-- zde má být regulární výraz (regexp), ne wildcard!!!
                  |      `-- to je ta roura
                  `--- grep potřebuje jako parametr soubor, který má zpracovávat

Takže jste asi chtěla napsat něco takového:

grep '^ignore' soubor | sed -e 's/^[^\s]\+\s\+//'

Což lze rovnou v sedu udělat takto:

sed -n -e "s/^ignore\s\+\(.*\)$/\1/p" soubor

19.3.2013 17:08 Makr
Rozbalit Rozbalit vše Re: Filtrování slov v souboru

Omlouvám se, o rouře samozřejmě vím, jen mi vypadla.

Ano, původně jsem zamýšlela, že nejdřív si vyfiltruji ty řádky, kde není ignore a ty pak smažu a dál s tím dál budu pracovat. Prosím Vás, vysvětlil bystě mi, co za tím ignore vše značí? Nemůžu si to dát do souvislosti.

20.3.2013 23:56 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Filtrování slov v souboru

Ano, původně jsem zamýšlela, že nejdřív si vyfiltruji ty řádky, kde není ignore a ty pak smažu a dál s tím dál budu pracovat.

To by šlo příkazem:

sed -e "/^ignore/d" soubor.txt > soubor_bez_ignore.txt

existuje i parametr -i kterým přepíšete původní soubor.txt.

Pokud byste to chtěla pomocí grep tak:

grep -v "^ignore" soubor.txt > soubor_bez_ignore.txt

a dál pak pracovat s novým souborem.

co za tím ignore vše značí?

sed -n -e "s/^ignore\s\+\(.*\)$/\1/p" soubor

Je to především regulární výraz, regular expression, regexp.

\s = bílý znak, zpravidla mezera, tabulátor apod.
\+ = opakující se alespoň jednou
\(.*\) = jakýkoliv řetězec, v závorkách je to proto, abych ten text mohl následně použít zápisem \1
$ = konec řádku

\1 = zde bude vložen text z první (výše uvedené) závorky, a protože tam toho víc není,
celý výraz vlevo bude nahrazen jen "obsahem" té závorky, což by měl být ten
název souboru.

Před znaky + ( ) jsou obrácená lomítka, protože je nutné je v uvedeném kontextu escapovat, jinak by byly považovány prostě za znak plus, závorka apod. a neměly by zvláštní význam. Sed umí i perlovskou notaci regulárních výrazů, kde je escapování méně.

20.3.2013 23:57 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Filtrování slov v souboru

Omlouvám se ten první sed filtruje naopak řádky kde ignore je.

21.3.2013 09:10 Makr
Rozbalit Rozbalit vše Re: Filtrování slov v souboru

Děkuji, moc mi to pomohlo.

21.3.2013 14:10 #
Rozbalit Rozbalit vše Re: Filtrování slov v souboru

Osobne preferuji prepinac -r mist -e clovek pak nemusi vsude cpat escape \

sed -n -r "s/^ignore\s+(.*)$/\1/p" ./fl.log

Dotaz: Filtrování slov v souboru

Odpovědi