Portál AbcLinuxu, 12. května 2025 04:20

Dotaz: bash - cetnost slov v souboru

25.10.2012 13:03 peta
bash - cetnost slov v souboru
Přečteno: 737×
Odpovědět | Admin
Ahoj, mám takovýto skript:

#2.parametr = zadany 2.argument v terminalu text="$2"

if [ ! -f "$2" ];then echo "nenasel soubor" exit # echo "$@" 1>&2; odesle chybovy vystup

else

tr '[:upper:]' '[:lower:]' < $text

#1.parametr = zadany 1.argument var=$1 case $var in -h) echo "vypis napovedy: $help" ;; -v) echo "cislo ulohy je 5" ;; -a) echo "trideni abecedne" sort -fd $text | uniq -c | tr -cs "[:alpha:]" "\n" | sort -n | uniq ;; -r) echo "trideni podle abecedy pozpatku" sort -fd $text | uniq -c | tr -cs "[:alpha:]" "\n" | sort -r | uniq ;; *) echo "zadal si spatny parametr, stiskni -h pro napovedu" ;; esac

fi

exit $exitCode

tím, že pak daný skript spustím ./razenicetnosti.sh -a text.txt mi vypisuje slova v zadanym souboru podle abecedy, a pokud se vyskytujou vicekrat, tak je vypise jen jednou. Potrebovala bych jeste vypsat k temto slovum jejich cetnost, kolikrat se vyskytuji v textu. A nevim, jestli mam pripsat nejaky cyklus pro pocitani slov nebo to jde nejak jednoduseji. Zkousela jsem pouzit prikaz grep nebo wc, ale spocetlo mi to vsechna slova nebo pismena dohromady a ne zvlast. Tak jsem chtela poprosit o radu. dik
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

25.10.2012 13:13 ET
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
pokud se vyskytuje slovo na vice radcich, prikaz "uniq -c" ti vypise jejich cetnost
25.10.2012 13:21 ET
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
paklize jsou serazeny pod sebou, coz se dela prikaze sort...
25.10.2012 17:55 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
ok, uz to pocita cetnost

-a) echo "trideni abecedne" sort -fd $text | uniq -c | tr -cs "[:alpha:]" "\n" | sort -n | uniq -c ;; a vypisuje mi to př. 2 ahoj 1 babi

jako vystup bych to chtela mit obracene ahoj 2 babi 1

a pak jeste by me zajimalo, kdyz bych to chtela tridit podle cetnosti..zkousela jsem pridavat jeste dalsi prikazy sort do radky, ale bylo to furt stejne. Dik
25.10.2012 16:49 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Odpovědět | | Sbalit | Link | Blokovat | Admin
Dotaz: Bash-skriptovani
25.10.2012 18:24 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
dobry, tridit podle cetnosti uz mam. akorat tedy, jak to vypsat, aby nejdriv bylo slovo a pak cetnost a ne cetnost a pak slovo

mam :

1 babi 2 ahoj

chci

babi 1 ahoj 2

dik
25.10.2012 18:31 krazy | skóre: 11
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
| awk '{ print $2 $1 }'
25.10.2012 18:32 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Pokud to mas na jednom radku tak treba..

bash-4.2$ echo "1 babi 2 ahoj" | sed "s#\([0-9]*\) \([a-z]*\)#\2 \1#g"

babi 1 ahoj 2
25.10.2012 18:38 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Hleda v retezci cislo (ulozi si ho do prvni promnene) jednu mezeru (lze upravit i pro tab a dalsi bile znaky i za sebou) a slovo bez velkych pismen (zase lze upravit, staci nastudovat reg. vyrazy) (ulozi si ho do druhe promnene). No a pak vypise druhou promnenou, mezeru a prvni promnenou.
25.10.2012 18:51 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
a co jeste pridat k | awk '{printf $2 $1 "\n"}' aby byla mezera mezi slovem a cislem...%s mi nefunguje
25.10.2012 18:58 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
$2 " " $1
25.10.2012 19:06 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
super, moc dik...:-) jeste mozna posledni dotaz. kdyz mam na vystupu treba 5 slov s 5 cetnostmi, jako 6. radek se mi vypise jeste cislo 1. jak ho odstranim?
25.10.2012 19:35 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Vyhod si ten prazdny radek po tr pomoci grep -v "^$" a zjisti si zda je to posix (zda to pojede tam de to budou zkouset).
25.10.2012 20:07 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
ted mi to funguje, jak ma pro 1 soubor, ktery predavam v terminalu jako parametr 2

#2.parametr = zadany 2.argument v terminalu text="$2"

if [ ! -f "$2" ];then echo "nenasel soubor" >&2; exit

else

a tady davam ty podminky, ktere funguji. Akorat bych potrebovala, aby mi to fungovalo pro libovolny pocet souboru.

zkousela jsem neco podobneho, jako je tady: text="" for name in "$@" do if [ -f "$name" ] then text="$text "$(cat "$name") else echo "Soubor neexistuje." >&2; exitCode=1 fi done ale to mi to pak at zadam jakykoli parametr pro trideni, tak mi to pise, ze nenasel soubor a chzbova hlaska...poradil bys mi tedy jeste s tim for cyklem?
25.10.2012 20:45 NN
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
if [ ! $2 ]; then echo malo param; fi
shift
for file in $@;do
echo $file
done
25.10.2012 20:47 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Mas to cely uz jednou vyreseny tady... stahla si to? Dotaz: Bash-skriptovani. Neno pokud mas prvni parametry prepinace tak si je zrus shiftem.
25.10.2012 21:17 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Hm, takhle mi to vypisuje pri kazdem zadani "malo param" "zadal si spatny parametr, stiskni -h"...takze mi to uplne preskoci ty podminky

#!/bin/bash LANG="en_US.UTF-8" exitCode=0 #2.parametr = zadany 2.argument v terminalu

text="$2"

# if [ ! -f "$2" ];then #echo "nenasel soubor" 1>&2; #exitCode=1 if [ ! $2 ]; then echo malo param; fi shift for file in $@;do echo $file done

tr '[:upper:]' '[:lower:]' < $text

#1.parametr = zadany 1.argument var=$1 case $var in -h) echo "vypis napovedy: $help" ;; -v) echo "cislo ulohy je 5" ;; -a) echo "trideni abecedne vzestupne cetnost" sort -fd $text | uniq -c | tr -cs "[:alpha:]" "\n" | grep -v "^$" | sort -n | uniq -c | sort | awk '{printf $2 " " $1 "\n"}'

;; -aa) echo "trideni jen abecedne" sort -fd $text | uniq -c | tr -cs "[:alpha:]" "\n" | grep -v "^$" | sort -n | uniq -c | awk '{printf $2 " " $1 "\n"}'

;; -r) echo "trideni podle cetnosti sestupne" sort -fd $text | uniq -c | tr -cs "[:alpha:]" "\n" | grep -v "^$" | sort -r | uniq -c | sort -r | awk '{printf $2 " " $1 "\n"}' ;; -rr) echo "trideni podle cetnosti vzestupne" sort -fd $text | uniq -c | tr -cs "[:alpha:]" "\n" | grep -v "^$" | sort -r | uniq -c | sort -n | awk '{printf $2 " " $1 "\n"}'

;; *) echo "zadal si spatny parametr, stiskni -h pro napovedu" ;; esac

exit $exitCode

25.10.2012 21:34 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
cat ?.sh | sed "s#\$#
#g"
25.10.2012 21:35 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
cat test_case.sh | sed "s#\$#<br>#g"
25.10.2012 22:55 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Příloha:
vubec ted nevim ,jak si to myslel s tim test case.. dole ve skkriptu jsem zkousela prochazet jednotlive soubory pomoci while, ale to mi take nefungovalo. Jde mi to opravdu jen pro ten 1 soubor, ktery mam ulozeny jako 2.parametr.
25.10.2012 22:55 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
#soub="$2"

#while [ ! -f $"$soub" ] ; #do #text="$soub"; #soub=soub+1; #done #echo "nenasel soubor" >&2; #exit 1
25.10.2012 23:04 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
možná nešlo by ty soubory načíst nějak jako dát podmínku if [ ! -f "*".txt ] then echo "nenasel soubor" <&2 exit 1

26.10.2012 01:33 peta
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Příloha:
uz to mam...akorat se mi nevypisuje chybova hlaska, kdyz mam spatne zadany soubor >&2
26.10.2012 16:52 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Radek 51: echo "chyba cteni $1" ; >&2 --> echo "chyba cteni $1" >&2

Vis na co se pouziva strednik? Na to same co dalsi radek, oddeli ti prikazy.
26.10.2012 17:05 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Stale mas otresne to zjisteni parametru. Oproti prvnimu zadani kde si mela 4 varianty. Razeni podle abecedy nebo cetnosti a oboje implicitne vzestupne nebo sestupne, tak ted mas jen 2 varianty i kdyz se tvaris ze umis i variantu -rr. A pritom uz to mas davno vyreseny Dotaz: Bash-skriptovani (pisi to sem uz potreti...) Pokud to nechapes tak napis co z toho nechapes. Takhle ti to nevezme ani 2 soubory ( a nemas zadano jak je ma chapat, zda jako jeden nebo kazdy zpracovat zvlast ).
26.10.2012 06:24 _dworkin
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Kdyz to nemas (tady) dobre zalomeny, tak to mas cely jako komentar, jak jsem mohl pomoct kdyz mam hadat kde je delsi radka. Musim do prace, mrknu na to pozdeji.
27.10.2012 08:16 deadmail
Rozbalit Rozbalit vše Re: bash - cetnost slov v souboru
Triedit sa da aj podla zadaneho stlpca ;-)

sort -t" " -k2,2

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.