Portál AbcLinuxu, 29. prosince 2025 17:39
(z kolika měření jsou ty výsledky?)
. Parametre pri kompilacii gcc -O2 -Wall -g.
. Pozeram, ze sa pouziva viac globalnych premmenych ako by bolo zdrave.
void PridajRiadokNovy(void) {
int i, j, tmp, tmp2, xx=dlzka;
tmp = dalsi * c_tz;
for(i=0;i<c_tz;i++) {
if(znacka2[pole[tmp+i]]) continue;
for(j=0;j<c_max;j++) {
if(!znacka[tmp2 = pole2[pole[tmp+i]*c_max+j]]) {
znacka[tmp2]++;
dlzka++;
}
}
znacka2[pole[tmp+i]]++;
}
predch=dlzka-xx;
if(!dalsi) for(i=0;i<c_rt;i++) zrychli[i]=predch;
riadok[dalsi]++;
cnt++;
}
void DalsiRiadokNovy(void) {
int i, j, k, tmp, tmp2;
mini = 0;
for(k=0;k<c_rt;k++){
if(!riadok[k]) {
if(zrychli[k]<=mini) continue;
tmp = k * c_tz;
teraz = 0;
memset(znacka3, 0, c_ru);
for(i=0;i<c_tz;i++) {
if(znacka2[pole[tmp+i]]) continue;
for(j=0;j<c_max;j++)
if(!znacka[tmp2 = pole2[pole[tmp+i]*c_max+j]] && !znacka3[tmp2]) {
teraz++;
znacka3[tmp2]++;
}
}
zrychli[k]=teraz;
if(teraz > mini) {
dalsi = k;
mini = teraz;
}
if(predch==teraz) break;
}
}
}
memset() být implementovány přímo překladačem, takže by ani na volání knihovny nemělo dojít. Ale to byste se asi musel podívat do výsledného kódu (např. si to nechat přeložit jen do assembleru).
$ cat memset.c
int main() {
int num = 1;
memset(&num, 0, sizeof(num));
}
$ gcc -S memset.c
$ cat memset.s
.file "memset.c"
.text
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $24, %esp
andl $-16, %esp
movl $0, %eax
subl %eax, %esp
movl $1, -4(%ebp)
movl $4, 8(%esp)
movl $0, 4(%esp)
leal -4(%ebp), %eax
movl %eax, (%esp)
call memset
leave
ret
.size main, .-main
.section .note.GNU-stack,"",@progbits
.ident "GCC: (GNU) 3.3.5 (Debian 1:3.3.5-13)"
Co z toho vidim?
call memseta znamená to, že memset() je spracovaný ako každá iná funkcia. T.j. že sa na stack nahádžu jej parametre a potom sa zavolá nejaký ďalší kód od inokiaľ, ktorý podľa tých parametrov niečo robí. Ak by to bolo nadrôtované v GCC, tak by tam nebolo volanie funkcie ale nejaká asm inštrukcia s prefixom "rep", alebo "loop".
hehe, odpovedám sám na seba... 
Pozeral som ako sa to kompiluje u mňa v GCC 4.1, a vo výsledku nikdy nie je call, a dokonca ani rep alebo loop. Záhada?
memset() nebo memcpy() mají novější verze gcc jako builtin. To naznačuje už fakt, že když zkusíte zkompilovat to, co zde bylo uvedeno, pomocí gcc 4.1, dostanete tuto chybu:
mike@lion:~/tmp> gcc -S memset.c memset.c: In function ‘main’: memset.c:3: warning: incompatible implicit declaration of built-in function ‘memset’
$ gcc --version|grep gcc
gcc (GCC) 4.0.3 (Ubuntu 4.0.3-1ubuntu5)
$ gcc -O2 -S gext.c
$ grep memset gext.s
call memset
call memset
call memset
call memset
call memset
$ grep memset gext.c
memset(znacka3, 0, c_ru);
memset(riadok, 0, c_rt);
memset(znacka, 0, c_ru);
memset(sucet, 0, sizeof(int)*c_rz);
memset(znacka2, 0, c_rz);
$ find . -name '*memset*' ./gcc/config/memset.c ./libiberty/memset.c ./libssp/memset-chk.cco je v skutocnosti trivialny cyklus:
$ cat gcc/config/memset.c
/* Public domain. */
#include <stddef.h>
void *
memset (void *dest, int val, size_t len)
{
unsigned char *ptr = dest;
while (len-- > 0)
*ptr++ = val;
return dest;
}
gcov som zistil kolko krat sa ktory riadok vykona, snad pomoze:
2931: 46:void DalsiRiadokNovy(void) {
-: 47: int i, j, k, tmp, tmp2;
2931: 48: mini = 0;
-: 49:
218359778: 50: for(k=0;k<c_rt;k++){
218359667: 51: if(!riadok[k]) {
216130000: 52: if(zrychli[k]<=mini) continue;
1236087: 53: tmp = k * c_tz;
1236087: 54: teraz = 0;
1236087: 55: memset(znacka3, 0, c_ru);
7416522: 56: for(i=0;i<c_tz;i++) {
6180435: 57: if(znacka2[pole[tmp+i]]) continue;
135608850: 58: for(j=0;j<c_max;j++)
130586300: 59: if(!znacka[tmp2 = pole2[pole[tmp+i]*c_max+j]] && !znacka3[tmp2]) {
55771154: 60: teraz++;
55771154: 61: znacka3[tmp2]++;
-: 62: }
-: 63: }
1236087: 64: zrychli[k]=teraz;
1236087: 65: if(teraz > mini) {
27552: 66: dalsi = k;
27552: 67: mini = teraz;
-: 68: }
1236087: 69: if(predch==teraz) break;
-: 70: }
-: 71: }
111: 72:}
, je to fakt memset(). Mojim nespravnym pouzivanim profilera na dynamicky linkovanu binarku som dostaval skreslene vysledky, staticka ukazuje v com je problem. Casy su trochu dlhsie kvoli zapnutemu profileru.
athlon@750 (116.04 s) % cumulative self self total time seconds seconds calls s/call s/call name 83.83 242.63 242.63 memset 15.50 287.48 44.85 2931 0.02 0.02 DalsiRiadokNovy duron@1600 (268.35 s) % cumulative self self total time seconds seconds calls s/call s/call name 93.79 628.86 628.86 memset 6.07 669.56 40.70 2931 0.01 0.01 DalsiRiadokNovy athlon64@2200 (61.91 s) % cumulative self self total time seconds seconds calls s/call s/call name 92.94 143.58 143.58 memset 6.75 154.01 10.43 2931 0.00 0.00 DalsiRiadokNovyPricina je jasna, teraz uz len ako vyriesit problem.
-g ????
Třeba může mít linux naprosto debilní plánovač...
Ale problém bych hledal někde jinde, rozhodně si nepoběžím nainstalovat freebsd :-P
real 0m32.367s user 0m29.428s sys 0m0.118s
load average: 0.00, 0.02, 0.00 takze vela tam toho nie je, je to gw do netu pre par ludi. Ten program len tak beží, alebo aj niečo vypisuje?
Ak vypisuje, a je spúšťaný v grafike, tak je to jasné - antialiasing, rendering fontu, plus nejaký neoptimalizovaný ovládač grafiky, ktorý nestíha texty tak rýchlo scrollovať.
A na tom Duronovom routri to asi ide cez ssh, takže sa na ňom nič nevykresľuje... Hádam dobre?
.
if(znacka2[pole[tmp+i]]) continue;ale nikde tam neni inicializace
znacka2. To muze byt jeden z duvodu. Kdybys sem hodil celej ten program, tak uz by ti urcite nekdo rek, co tam mas spatne...
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.