Portál AbcLinuxu, 13. května 2025 17:40

Dotaz: BASH: Spuštění příkazů v proměnných naráz

Roman Horník avatar 17.7.2016 00:27 Roman Horník | skóre: 8 | Seč
BASH: Spuštění příkazů v proměnných naráz
Přečteno: 490×
Odpovědět | Admin
Nazdar,

mám v cyklu for 2 proměnný, jejichž hodnota je definována matematickou kalkulací v nich, následně předávána příkazu printf, jenž je vypíše na obrazovku.
Problém je v tom, že bych potřeboval, aby se vykonávaly souběžně a po jejich dokončení (pohlídá wait) si je mohl najednou přečíst printf - klidně z další proměnný, kde ovšem obě hodnoty musej bejt oddělený středníkem.

Pro lepší představu to vypadá teď podobně jako tohle:

for N in {1..1000}; do
A=$(bc -l <<< "scale=9; s(3.14159/$N)")
B=$(bc -l <<< "scale=9; c(3.14159/$N)")
printf "$A;$B"
done
Je to teda dost zjednodušený, aby se v tom dalo vyznat.
V současnosti se vypočítá nejdřív $A, hned za ním $B. Vykoná se tak asi 220 výpočtů za vteřinu. Jenže u komplexnějších výpočtů, kde je potřeba navíc třeba stonásobek iterací, proběhne celej cyklus třeba i za víc jak 10 minut. Rád bych to urychlil tím, že by se obě proměnný strčily do subshellu (pomocí &, takže jednak by druhá nemusela čekat na dokončení první, jednak by každou operaci mohlo vykonávat jiný jádro CPU, čili výpočetní výkon by mohl bejt téměř dvojnásobnej, což by mi už stačilo. Nic tomu snad nebrání, $A neoperuje s $B, ani naopak, vlastně tomu brání jen fakt, že momentálně nevím, jak to učunit.
Kdyby někoho něco napadlo (za použití BASHe), byl bych mu moc vděčnej.

I'm only wearing black until they make something darker | Debian-Linux.cz | Debian fórum

Řešení dotazu:


Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Řešení 1× (Roman Horník (tazatel))
17.7.2016 02:49 Petr Gajdůšek | skóre: 13 | blog: Úlomky | Znojmo
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Odpovědět | | Sbalit | Link | Blokovat | Admin
Hodnoty se v subshellech $() už generují, takže je stačí spustit na pozadí a pak wait.
#!/bin/bash
# test1.sh

for N in {1..5000}; do
        A=$(bc -l <<< "scale=9; s(3.14159/$N)" &)
        B=$(bc -l <<< "scale=9; c(3.14159/$N)" &)
        wait
        printf "$A;$B\n"
done
Pokud máš více jak 2 jádra, je asi lepší paralelizovat iterace:
#!/bin/bash
# test2.sh

function wait_for_threads() {
        while [ $(jobs -rp | wc -l) -ge $threads ];
                do sleep $check_interval_secs;
        done
}

threads=$(grep processor /proc/cpuinfo | wc -l)
check_interval_secs=0.01

for N in {1..5000}; do
        wait_for_threads
        (
                A=$(bc -l <<< "scale=9; s(3.14159/$N)")
                B=$(bc -l <<< "scale=9; c(3.14159/$N)")
                printf "$N $A;$B\n"
        ) &
done | sort -n | cut -d' ' -f2-
Režie bude ale obrovská, vzhledem k rychlosti k výpočtu v bc. Takže by to chtělo rozdělit iterace do clusterů, které by byli prováděny paralelně:
#!/bin/bash
# test3.sh

iters=5000

threads=$(grep processor /proc/cpuinfo | wc -l)
cluster_size=$((iters/threads))
last_cluster_size=$((iters-cluster_size*(threads-1)))

temp=$(mktemp -d)

for C in $(seq $threads); do
        
        first_iter=$(( (C-1) * cluster_size + 1 ))
        if [ $C -lt $threads ]; then
                last_iter=$(( first_iter + cluster_size -1 ))
        else
                last_iter=$(( first_iter + last_cluster_size -1 ))
        fi

        (
                for N in $(seq $first_iter $last_iter); do
                        A=$(bc -l <<< "scale=9; s(3.14159/$N)")
                        B=$(bc -l <<< "scale=9; c(3.14159/$N)")
                        printf "$A;$B\n"
                done
        ) > $temp/$C.list &
done

wait

for C in $(seq $threads); do
        cat $temp/$C.list
        rm $temp/$C.list
done

rmdir $temp
Benchmark na i5 (4 core):
$ time ./test0.sh > test0.output # original bez paralelizace

real	0m15.776s
user	0m0.928s
sys	0m1.628s

$ time ./test1.sh > test1.output

real	0m12.012s
user	0m0.608s
sys	0m1.588s

$ time ./test2.sh > test2.output

real	0m11.803s
user	0m1.300s
sys	0m1.288s

$ time ./test3.sh > test3.output

real	0m3.278s
user	0m0.388s
sys	0m0.808s

$ for i in 1 2 3; do cmp test0.output test$i.output; echo $?; done
0
0
0
Řešení 1× (Roman Horník (tazatel))
Roman Horník avatar 17.7.2016 07:06 Roman Horník | skóre: 8 | Seč
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Hmmm, to zní zajímavě. Takhle - udělal jsem takovou kravinku, hračičku, co v okně terminálu pomocí dvou souřadnic kreslí různý matematický obrazce, třeba Lissajousovy. Nebo, za pomocí komplexnějších vzorců, i obrazce podstatně složitější. Podařilo se mi nakreslit kytku se zahnutým stonkem. Kurzor ovládám pomocí printf a escape sekvence \e[Y];[X]H. Samozřejmě je na to nutný použít kladný celý číslo v intervalu 1-[počet řádků nebo sloupců], takže vzorec je těmhle limitům uzpůsobenej a výstup z bc se zaokrouhluje pomocí printf %.0f [číslo]. A v plánu mám osu Z, aby měly obrazce i hloubku (jas; 256-barevnej terminál umí, tuším, 25 odstínů šedý).

K problému: Vykresloval jsem obyčejnou kružnici.
Podle prvního návrhu se vykreslení o 15% zpomalilo a celý to tradičně jelo jen v jednom vláknu.
Druhej příklad: Vykreslování probíhalo na pozadí, takže jsem přišel o potěšení z pohledu na zrod kružnice. Ke zrychlení ale došlo, celý to zabralo 84% původního času, ale na to, že to běželo na 4 jádra...
No a k poslednímu pokusu - taky mi bylo zapovězeno kreslení, ale výkon je dost slušnej, 45% původního času!

Jenže nakonec, díky Tvýmu nakopnutí, za nějž jsem Ti vděčnej, jinak bych se doteď zabejval těma proměnnejma, jsem na to nakonec kápnul. A trochu jinak - výkon je 46% původního času, tedy o chlup horší, než v posledním příkladu, ale jednak dochází k bezprostřednímu vykreslování a jednak není potřeba cokoliv kamkoliv ukládat. Myšlenka je stejná:

CPU=$(grep processor /proc/cpuinfo | wc -l)

for S in $(seq 1 $CPU); do
	sleep .00$((S-1))
	for N in $(seq $S $CPU 1000); do
		A=$(bc -l <<< "scale=9; s(3.14159/$N)")
		B=$(bc -l <<< "scale=9; c(3.14159/$N)")
		printf "$A;$B"
	done &
done
wait

V mým čtyřjádrovým případě pojedou 4 cykly v kvadruplexu - začínat budou číslama 1-4, pak pojedou N+4 až do tý tisícovky. No a tím sleepem se pro každou ze čtveřice určí odlišná prodleva spuštění cyklu, aby se netloukly. Tady to dělá 0-3ms.

Každopádně strašně dík za nakopnutí správným směrem, jak už jsem psal, ještě doteď bych se v tom akorát tak plácal. Fakt dík!
I'm only wearing black until they make something darker | Debian-Linux.cz | Debian fórum
Roman Horník avatar 17.7.2016 07:15 Roman Horník | skóre: 8 | Seč
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Jo a dost slušnýho zrychlení (60% původního času) jsem docílil ještě tak, že namísto #!/bin/bash jsem použil staticky linkovanej #!/bin/bash-static
Mohlo by se někomu hodit ;-).
I'm only wearing black until they make something darker | Debian-Linux.cz | Debian fórum
17.7.2016 09:30 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Ještě to zkus porovnat s /bin/dash, který by měl být upraven pro dávkové zpracování.
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
Roman Horník avatar 17.7.2016 09:40 Roman Horník | skóre: 8 | Seč
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Nelze vykonat. Nezná <<<, nezná mnou používaný escape sekvence (pozicování a získání počtu řádků a sloupců nahrazeno pomocí tput). A stejně nic nevykreslí, ukončí se příliš rychle. Možná mu dělá potíže cyklus for, dost možná proměnný. Tohle z toho vyleze:

$ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ > > > $ $ $ $ \e[2J$ $ > > > > > > > [3] - Done for A in $(...); do ; ; printf "\\e[${Y};${X}H\\e[48;5;${barva}m \\b\\e[0m"; done [2] - Done for A in $(...); do ; ; printf "\\e[${Y};${X}H\\e[48;5;${barva}m \\b\\e[0m"; done [1] - Done for A in $(...); do ; ; printf "\\e[${Y};${X}H\\e[48;5;${barva}m \\b\\e[0m"; done $ [4] + Done for A in $(...); do ; ; printf "\\e[${Y};${X}H\\e[48;5;${barva}m \\b\\e[0m"; done
I'm only wearing black until they make something darker | Debian-Linux.cz | Debian fórum
17.7.2016 09:48 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Asi to bude tím, že je /bin/dash hodně zjednodušený, aby běhal co nejrychleji a dělal jen to nezbytné, co shell musí umět. Pro daný případ se tedy nehodí.
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
Roman Horník avatar 17.7.2016 09:51 Roman Horník | skóre: 8 | Seč
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
A asi bych už stejně moc nezískal, kdybych to překopal tak, aby to dash vstřebal. Už díky tomu paralelnímu zpracování a změnou interpretru za sice stejnej, ale staticky linkovanej, se proces na čtyřjádru urychlil 3.4x. Když si vezmu, že i vykreslování v terminálu, konkrétně v XTermu, jenž je rychlejší jak mate-terminal/gnome-terminal, výsledek je nádhernej.
Ale i tak díky za snahu.
I'm only wearing black until they make something darker | Debian-Linux.cz | Debian fórum
17.7.2016 09:59 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Odpovědět | | Sbalit | Link | Blokovat | Admin
Co takhle celou aplikaci napsat v bc, Pythonu, Perlu, AWK, Haskellu nebo čemkoli jiném, co je výkonnější než Bash? Přeskakovat při každém průchodu cyklem do bc a zpátky není vůbec efektivní. Navíc se Bash na zpracování čísel vůbec nehodí.
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
17.7.2016 11:29 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zde je příklad, který dělá totéž a je řádově rychlejší:
#!/bin/bash

bc -l <<EOT
scale = 9
for (n = 1; n <= 1000; n++) {
    print s(3.14159/n), ";", c(3.14159/n), "\n";
}
quit
EOT
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
Roman Horník avatar 17.7.2016 14:54 Roman Horník | skóre: 8 | Seč
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
Vypadá to zajímavě, jenže:
  1. Jak už jsem psal, na pozicování používám, respektive musím používat, celý čísla. A bc zrovna goniometrický funkce zaokrouhluje příšerně. Zkus si schválně:
    for N in {0..20}; do bc -l <<< "scale=$N; 4*a(1)"; done
    ... což je Ludolfovo číslo na 0-20 desetinnejch míst; scale=0 nelze použít, ani scale=1. A do scale=5 jen s přimhouřenejma vočima. Bohužel. Proto to proháním přes printf %.0f $(bc se vzorcem), neboť to umí správně zaokrouhlovat. Tahal jsem to původně skrze sed, jenž odstraňoval desetinnou tečku a desetinný čísla za ní, trochu rychlejc, ovšem s nepřesnostma

  2. Kolem výstupu používám formátování. Aby se "bod" vykreslil, používám na něj prázdnou mezeru s obarveným pozadím, něco jako printf "\e[${B};${A}H\e[48;5;161m \e[0m". A to do bc pustit nemůžu :-(
I'm only wearing black until they make something darker | Debian-Linux.cz | Debian fórum
17.7.2016 15:02 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
1. Tak proč používáš bc, když ti nevyhovuje? Použij třeba Python.

2. Však ta výstupní čísla z bc si v Bashi strčíš do printf a můžeš si je obalit čím chceš
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
17.7.2016 15:35 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: BASH: Spuštění příkazů v proměnných naráz
#!/bin/bash

bc_call() {
bc -l <<EOT
scale = 9
for (n = 1; n <= 1000; n++) {
    print s(3.14159/n), " ", c(3.14159/n), "\n";
}
EOT
}

bc_call | while read A B; do
    printf "\e[${B};${A}H\e[48;5;161m \e[0m"
done
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.