Přihlášení | Registrace

napište » Zprávičky

FFmpeg nechal smazat repozitář porušující LGPL

dnes 15:55 | Komunita

FFmpeg nechal kvůli porušení autorských práv odstranit z GitHubu jeden z repozitářů patřících čínské technologické firmě Rockchip. Důvodem bylo porušení LGPL ze strany Rockchipu. Rockchip byl FFmpegem na porušování LGPL upozorněn již téměř před dvěma roky.

🇨🇽 | Komentářů: 4

witr (why-is-this-running)

dnes 15:44 | Zajímavý software

K dispozici je nový CLI nástroj witr sloužící k analýze běžících procesů. Název je zkratkou slov why-is-this-running, 'proč tohle běží'. Klade si za cíl v 'jediném, lidsky čitelném, výstupu vysvětlit odkud daný spuštěný proces pochází, jak byl spuštěn a jaký řetězec systémů je zodpovědný za to, že tento proces právě teď běží'. Witr je napsán v jazyce Go.

🇨🇽 | Komentářů: 0

Yazi 25.12.29

dnes 15:33 | Zajímavý software

Yazi je správce souborů běžící v terminálu. Napsán je v programovacím jazyce Rust. Podporuje asynchronní I/O operace. Vydán byl v nové verzi 25.12.29. Instalovat jej lze také ze Snapcraftu.

Ladislav Hagara | Komentářů: 0

39C3 (Chaos Communication Congress)

26.12. 18:44 | Komunita

Od soboty do úterý probíhá v Hamburku konference 39C3 (Chaos Communication Congress) věnovaná také počítačové bezpečnosti nebo hardwaru. Program (jiná verze) slibuje řadu zajímavých přednášek. Streamy a záznamy budou k dispozici na media.ccc.de.

Ladislav Hagara | Komentářů: 0

Phoenix (Xserver)

26.12. 13:22 | Zajímavý software

Byl představen nový Xserver Phoenix, kompletně od nuly vyvíjený v programovacím jazyce Zig. Projekt Phoenix si klade za cíl být moderní alternativou k X.Org serveru.

🇨🇽 | Komentářů: 7

XLibre Xserver 25.1.0

26.12. 13:11 | Nová verze

XLibre Xserver byl 21. prosince vydán ve verzi 25.1.0, 'winter solstice release'. Od založení tohoto forku X.Org serveru se jedná o vůbec první novou minor verzi (inkrementovalo se to druhé číslo v číselném kódu verze).

🇨🇽 | Komentářů: 0

Wayback 0.3

26.12. 03:33 | Nová verze

Wayback byl vydán ve verzi 0.3. Wayback je "tak akorát Waylandu, aby fungoval Xwayland". Jedná se o kompatibilní vrstvu umožňující běh plnohodnotných X11 desktopových prostředí s využitím komponent z Waylandu. Cílem je nakonec nahradit klasický server X.Org, a tím snížit zátěž údržby aplikací X11.

Ladislav Hagara | Komentářů: 0

Ruby 4.0.0

25.12. 14:44 | Nová verze

Byla vydána verze 4.0.0 programovacího jazyka Ruby (Wikipedie). S Ruby Box a ZJIT. Ruby lze vyzkoušet na webové stránce TryRuby. U příležitosti 30. narozenin, první veřejná verze Ruby 0.95 byla oznámena 21. prosince 1995, proběhl redesign webových stránek.

Ladislav Hagara | Komentářů: 0

Krásné Vánoce

24.12. 02:11 | Komunita

Všem čtenářkám a čtenářům AbcLinuxu krásné Vánoce.

Ladislav Hagara | Komentářů: 30

Parrot OS 7.0

24.12. 02:00 | Nová verze

Byla vydána nová verze 7.0 linuxové distribuce Parrot OS (Wikipedie). S kódovým názvem Echo. Jedná se o linuxovou distribuci založenou na Debianu a zaměřenou na penetrační testování, digitální forenzní analýzu, reverzní inženýrství, hacking, anonymitu nebo kryptografii. Přehled novinek v příspěvku na blogu.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Kdo vám letos nadělí dárek?

Ježíšek (35%)

Santa Claus (1%)

Děda Mráz (19%)

La Befana (1%)

Odin (1%)

Laskakit (1%)

Někdo z rodiny (12%)

Já sám (13%)

Nikdo (16%)

Celkem 165 hlasů

Komentářů: 18, poslední 24.12. 15:29

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Jak zakcelerovat tento skript

Štítky: AWK, Bash, HTML, programování, Python, sed, shelly, web, Windows

Dotaz: Jak zakcelerovat tento skript

2.2.2007 22:49 vasek125 | skóre: 30 | Mladá Boleslav
Jak zakcelerovat tento skript

Přečteno: 148×

Odpovědět | Admin

Tento skript se provádí 3 minuty. Jde o upravený log squidu access.log, kterej ještě není ani z poloviny naplněnej, což znaměná, že by doba provádění byla už neúnosná. Kámen úrazu je v cyklu:


SOURCE="/var/www/www-block/events.txt"
ciladresy=`cat /var/www-ssl/admin/access.log`

for x in `grep -v ^# $SOURCE | awk '{print $1"|"$2"|"$3"|"$4"|"$5"|"$6"|"$7"|"$8"|"$9"|"$10"|"$11"|"$12"|"$13"|"$14"|"$15"|"$16"|"$17"|"$18"|"$19}'`; do

x=`echo $x | sed 's/|/ /g'`
x1=`echo $x | awk '{ print $1 }'`
x2=`echo $x | awk '{ print $2 }'`
x3=`echo $x | awk '{ print $3 }'`
x4=`echo $x | awk '{ print $4 }'`
x5=`echo $x | awk '{ print $5 }'`
x6=`echo $x | awk '{ print $6 }'`
x7=`echo $x | awk '{ print $7 }'`
x8=`echo $x | awk '{ print $8 }'`
x9=`echo $x | awk '{ print $9 }'`
x10=`echo $x | awk '{ print $10 }'`
x11=`echo $x | awk '{ print $11 }'`
x12=`echo $x | awk '{ print $12 }'`
x13=`echo $x | awk '{ print $13 }'`
x14=`echo $x | awk '{ print $14 }'`
x15=`echo $x | awk '{ print $15 }'`
x16=`echo $x | awk '{ print $16 }'`
x17=`echo $x | awk '{ print $17 }'`
x18=`echo $x | awk '{ print $18 }'`
x19=`echo $x | awk '{ print $19 }'`


ciladresykk=`echo "$ciladresy" | grep "$x1 $x2 $x3" | awk '{ print $4 }'` 


echo "$x1 $x2 $x3 $x4 $x5 $x6 $x7 $x8 $x9 $x10 $x11 $x12 $x13 $x14 $x15 $x16 $x17 $x18 $x19 $ciladresykk" >> /var/www-ssl/admin/squid/squidblok.html

done

vzor /var/www-ssl/admin/access.log

02/02/2007 11:55:37 192.168.1.180 http://www.sonnerie.net/js/xiti.js
02/02/2007 11:55:38 192.168.1.180 http://logi6.xiti.com/hit.xiti?

vzor /var/www/www-block/events.txt

02/02/2007 11:42:16           192.168.1.180           Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)
02/02/2007 11:55:38           192.168.1.180           Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)

Celé řešení slouží k vypsání zablokovaných spojení a pomocí druhého logu se k těmto spojením hledají cílové adresy. Určitě by to šlo nějak urychlit. Nějaký nápad?

Nástroje: Začni sledovat (2) ?

Odpovědi

2.2.2007 23:17 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Napiš to celé v awk nebo perlu. Hezky jako jeden script. Případně to rozděl na pár částí, ale hlavně nepouštěj na každou ptákovinu několik nových procesů. Taky zbytečně neukládej data do proměnných, když je můžeš přímo číst ze souborů.

Udělat něco jako:

grep -v '^#' $SOURCE \
| while read ln
do
   arr=($ln)
   echo -n $ln
   grep "${arr[0]} ${arr[1]} ${arr[2]}" "$ciladresy" | awk '{ print $4 }'
done >> /var/www-ssl/admin/squid/squidblok.html

ps: nezkoušel jsem to.

Hello world ! Segmentation fault (core dumped)

2.2.2007 23:18 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Hm, koukám, že si trošku protiřečím :-D

Hello world ! Segmentation fault (core dumped)

3.2.2007 00:49 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Supr, dík, skript proběhne už za 20 sekund, místo 2 minut.

3.2.2007 00:58 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Jestli správně chápu zadání, tak klíčem jsou vždy první tři položky oddělené mezerami a podle této trojice nalezené v jednom logu se hledá ekvivalent v druhém logu? Pokud ano, tak to jde napsat třeba takto:

#!/usr/bin/env python
def splitter(filename):
    for line in file(filename):
        line = line.strip()
        if not line: continue
        splitted = line.split(None, 3)
        yield tuple(splitted[:3]), splitted[3]

access = {}
access_splitter = splitter('access.log')
for k, v in access_splitter:
    access[k] = v

events_splitter = splitter('events.txt')
for k, v in events_splitter:
    try:
        url = access[k]
    except KeyError:
        url = ''
    print ' '.join(k), v, url

Dává to stejné výsledky jako ten skript v shellu,

02/02/2007 11:42:16 192.168.1.180 Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727) 
02/02/2007 11:55:38 192.168.1.180 Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727) http://logi6.xiti.com/hit.xiti?

tak je to doufám správně. Testoval jsem zpracování dvou logů, z nichž každý měl 100000 položek. Za tři sekundy to bylo hotovo.

3.2.2007 01:27 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Vyzkouším. Pokud se to zpracuje tak rychle, tak je to bezva.

3.2.2007 10:52 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Je to velmi rychlé. Ale má to jeden háček. K tomu prvnímu by se mělo dát přiřadit víc položek z toho logu access.log. Ne jen jedna, jak je to v tomhle skriptu.

3.2.2007 11:22 Jan Martinek | skóre: 43 | blog: johny | Brno
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

No, já tomu fakt totiž fakt nerozumím a ani moc nechápu, co ten log obsahuje :-)

Ale to je teď jedno. Zkrátka když budu mít events.txt s tímto obsahem

02/02/2007 11:42:16           192.168.1.180   prohlizec1
02/02/2007 11:55:38           192.168.1.180   prohlizec2

a access.log s tímto

02/02/2007 11:55:37 192.168.1.180 url1
02/02/2007 11:55:38 192.168.1.180 url2
02/02/2007 11:55:38 192.168.1.180 url3

Tak má být výsledek tohle?

02/02/2007 11:42:16 192.168.1.180 prohlizec1 
02/02/2007 11:55:38 192.168.1.180 prohlizec2 url2 url3

Pokud ano, tak to lze vyřešit třeba takto:

#!/usr/bin/env python
def splitter(filename):
    for line in file(filename):
        line = line.strip()
        if not line: continue
        splitted = line.split(None, 3)
        yield tuple(splitted[:3]), splitted[3]

access = {}
access_splitter = splitter('access.log')
for k, v in access_splitter:
    try:
        access[k].append(v)
    except KeyError:
        access[k] = [v]

events_splitter = splitter('events.txt')
for k, v in events_splitter:
    try:
        urls = access[k]
    except KeyError:
        urls = []
    print ' '.join(k), v, ' '.join(urls)

Mohl bys udělat rychlostní test? Teda pokud je to vůbec správně ...

3.2.2007 01:02 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Jen bych podotkl, že používat grep|awk je tzv. chujovina.

awk "/$x1 $x2 $x3/ { print $4 }"

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

3.2.2007 01:25 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Při použití grepu je to o dost rychlejší než všechno mít v awk.

3.2.2007 01:31 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Fakt? Tak je to rozbitý. Ještě něco, místo

ciladresy=`cat /var/www-ssl/admin/access.log`

bych dal

ciladresy=$(</var/www-ssl/admin/access.log)

a místo

for x in `grep -v ^# $SOURCE | awk [...]`; do

tohle

awk '!/^#/ [...]' $SOURCE | while read x; do

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

3.2.2007 01:33 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Btw

root@amd64 ~ # time grep -v ALL /etc/hosts.deny | awk '{print$1}'
sshd:

real    0m2.667s
user    0m2.566s
sys     0m0.014s
root@amd64 ~ # time awk '!/ALL/ {print$1}' /etc/hosts.deny
sshd:

real    0m0.006s
user    0m0.004s
sys     0m0.002s

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

3.2.2007 01:41 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Ten původní skript při použití grep s awk běžel 2 minuty, jen s awk něco přes 3 minuty. Možná při použití awk vadí víc položel $x1 ..

3.2.2007 10:53 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

A jak bych měl pro awk nahradit tohle?:

grep "${arr[0]} ${arr[1]} ${arr[2]}" "$ciladresy" | awk '{ print $4 }'

Při použití awk mi to nefunguje vůbec. Nelíbí se mu ${arr[0]} ${arr[1]} ${arr[2]}. Při použití textu to funguje.

3.2.2007 10:56 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

awk "/${arr[0]} ${arr[1]} ${arr[2]}/ { print $4 }" "$ciladresy"

Nešlo ti to patrně proto, žes zapomněl, že bash proměnný v apostrofech neexpanduje.

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

3.2.2007 11:04 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

awk: line 1: syntax error at or near :

Při použití ' se skript provede, ale nefunguje asi kvůli těm chybějícím mezerám.

3.2.2007 11:10 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Hmm, asi vadí mu to, co je v těch proměnných. Docházejí mi nápady :-/

kvůli těm chybějícím mezerám.

Huh?

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

3.2.2007 11:24 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Trochu jsem testoval. Vadí mu

02/02/2007

v ty první proměnný, přičemž 02\/02\/2007 bere v pohodě. Teď jak ho přimět, aby to ignoroval či jak to rychle nahradit.

3.2.2007 11:30 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Aha... tak teda třeba:

hm="${arr[0]} ${arr[1]} ${arr[2]}"
hm="${hm//\//\/}"
awk "/$hm/ {print $1}" něco

“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

3.2.2007 12:05 vasek125 | skóre: 30 | Mladá Boleslav
Rozbalit Rozbalit vše Re: Jak zakcelerovat tento skript

Teď to funguje, ale print vypíše celý řádek místo části.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje