Spolek OpenAlt zve příznivce otevřených řešení a přístupu na 209. brněnský sraz, který proběhne tento pátek 16. května od 18:00 ve studentském klubu U Kachničky na Fakultě informačních technologií Vysokého učení technického na adrese Božetěchova 2/1. Jelikož se Brno stalo jedním z hlavních míst, kde se vyvíjí open source knihovna OpenSSL, tentokrát se OpenAlt komunita potká s komunitou OpenSSL. V rámci srazu Anton Arapov z OpenSSL
… více »GNOME Foundation má nového výkonného ředitele. Po deseti měsících skončil dočasný výkonný ředitel Richard Littauer. Vedení nadace převzal Steven Deobald.
Byl publikován přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) za uplynulé dva měsíce. Servo zvládne už i Gmail. Zakázány jsou příspěvky generované pomocí AI.
Raspberry Pi Connect, tj. oficiální služba Raspberry Pi pro vzdálený přístup k jednodeskovým počítačům Raspberry Pi z webového prohlížeče, byla vydána v nové verzi 2.5. Nejedná se už o beta verzi.
Google zveřejnil seznam 1272 projektů (vývojářů) od 185 organizací přijatých do letošního, již jednadvacátého, Google Summer of Code. Plánovaným vylepšením v grafických a multimediálních aplikacích se věnuje článek na Libre Arts.
Byla vydána (𝕏) dubnová aktualizace aneb nová verze 1.100 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.100 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.5.
OpenSearch (Wikipedie) byl vydán ve verzi 3.0. Podrobnosti v poznámkách k vydání. Jedná se o fork projektů Elasticsearch a Kibana.
PyXL je koncept procesora, ktorý dokáže priamo spúštat Python kód bez nutnosti prekladu ci Micropythonu. Podľa testov autora je pri 100 MHz približne 30x rýchlejší pri riadeni GPIO nez Micropython na Pyboard taktovanej na 168 MHz.
Grafana (Wikipedie), tj. open source nástroj pro vizualizaci různých metrik a s ní související dotazování, upozorňování a lepší porozumění, byla vydána ve verzi 12.0. Přehled novinek v aktualizované dokumentaci.
Řešení dotazu:
Vzhledem k tomu, že čísla dostáváte od nejvyšších řádů, tak to o moc lépe nepůjde. V každém případě se odnaučte alokovat velká pole na zásobníku, na rychlost to sice vliv nemá, ale je to zlozvyk, který se vám může vymstít. Dále je zbytečné udržovat si dvě pole na operandy. Místo toho bych si do jednoho pole ukládal jen součty číslic (prozatím bez ohledu na přenos) a pak je na konci zpracoval. Možná by určité urychlení přineslo i to, když si do prvku pole místo jednoho řádu uložíte rovnou víc (při 32-bitovém int
zvládnete osm řádů včetně případného přenosu, s 64-bitovým long
i dvojnásobek).
Stejně mám ale temné podezření, že nejvíc času ten program stráví konverzí vstupu a výstupu.
Mimochodem, jak jste z "Time limit: 3.000 seconds" přišel na to, že má program skončit do 0.3 sekundy?
Samotné časy moc velkou vypovídací hodnotu nemají. Čas běhu pro konkrétní data bude hodně záviset na verzi a parametrech překladače a systému, na kterém se to měří.
Ještě jeden tip: pokud se můžete spolehnout, že vstup vypadá přesně tak, jak má, můžete místo scanf()
načítat jednotlivé znaky pomocí getchar()
a na číselnou hodnotu převádět odečtením '0'
. Podobně půjde zrychlit i výpis na konci.
Cas se meri prave na tom serveru, vse se praklada stejnym prekladacem a vsichni maji stejna vstupni data.Samotné časy moc velkou vypovídací hodnotu nemají. Čas běhu pro konkrétní data bude hodně záviset na verzi a parametrech překladače a systému, na kterém se to měří.
Diky to je ono, pouzil jsemJeště jeden tip: pokud se můžete spolehnout, že vstup vypadá přesně tak, jak má, můžete místo
scanf()
načítat jednotlivé znaky pomocígetchar()
a na číselnou hodnotu převádět odečtením'0'
. Podobně půjde zrychlit i výpis na konci.
getchar()
a putchar()
a cas se zkratil z 1 sekundy na 0.2 sekundy. Ani jsem netusil, ze scanf()
a printf()
spotrebuji tolik casu:)
scanf()
musí kvůli své obecnosti udělat, tak to moc překvapivé není.
result= result+(integera+integer b)*(10**j)
jedním for-em ty čísla načítáš do pole a druhým sčítáš prvky toho pole proč to nedat do jednoho for-u ...To prave nevim jak udelat, kdyz to musim zacit vyhodnocovat od nejnizsiho radu, a ty cisla dostavam od nejvyssiho.
... polím se nejlépe úplně vyhnout použít něco jako result= result+(integera+integer b)*(10**j)
V zadani je ze ta cisla muzou byt dlouha az 1 000 000 radu.
Tady právě moc ne, protože přímá aplikace klasického postupu by ve výsledku vedla na kvadratickou časovou složitost. Pokud chcete lineární, nezbyde vám než všechno uložit. Přičemž, jak už bylo zmíněno, stačí ukládat rovnou součty číslic a projet pak jednou celé pole. Tj. asi nějak takhle (bez kontroly chyb a předčasného EOF):
uint8_t* s = (uint8_t*) malloc((N+1) * sizeof(uint8_t)); for (i=1; i<=N; i++) { int c; uint8_t digit = 0; while ((c = getchar()) != '\n') if (c >= '0' && c <= '9') digit += (c - '0'); s[i] = digit; } unsigned cy = 0; for (i=N; i>0; i--) { s[i] += cy; if (s[i] > 9) { s[i] -= 10; cy = 1; } else { cy = 0; } } s[0] = cy;
#include <assert.h> #include <cstring> #include <climits> #include <iomanip> #include <iostream> int main() { assert(sizeof(unsigned long) > sizeof(unsigned int)); int digits; std::cin >> digits; digits += 1; int allocate = (digits / (sizeof(unsigned int) * 2)) + 1; unsigned int* addend1 = new unsigned int[allocate]; unsigned int* addend2 = new unsigned int[allocate]; unsigned int* sum = new unsigned int[allocate]; memset(addend1, 0, allocate); memset(addend2, 0, allocate); memset(sum, 0, allocate); unsigned int num1 = 0; unsigned int num2 = 0; unsigned int currByte = (digits - 2) / 2; for (int i = digits-2; i >= 0; i--) { unsigned int in1, in2; std::cin >> std::hex >> in1 >> in2; if (i % 2) { num1 |= in1 << 4; num2 |= in2 << 4; continue; } num1 |= in1; num2 |= in2; memcpy((void*)addend1 + currByte, &num1, 1); memcpy((void*)addend2 + currByte, &num2, 1); num1 = 0; num2 = 0; currByte--; for (int x = allocate - 1; x >= 0; x--) std::cout << "- " << std::hex << addend1[x] << " "; std::cout << std::endl; } std::cout << std::endl; for (int i = allocate - 1; i > = 0; i--) std::cout << std::hex << addend1[i] << " "; std::cout << std::endl << std::endl; unsigned int carry = 0; for (int i = 0; i < allocate; i++) { unsigned long result = static_cast<unsigned long>(addend1[i]) + static_cast<unsigned long>(addend2[i]) + carry; carry = result >> sizeof(unsigned int) * 8; sum[i] = result; } for (int i = allocate - 1; i >= 0; i--) std::cout << std::hex << sum[i]; std::cout << std::endl; return 0; }(och ten parser to zprasil, snad je to i nadále funkční:) )
scanf()
a printf()
. Konverzí mezi desítkovou a šestnáctkovou soustavou už byste to zabil úplně, nenapadá mne totiž způsob, jak konverzi šestnáctkového dlouhého čísla na desítkové udělat s lineární časovou složitostí (vzhledem k délce).
Používejte jen 2 staticky alokovaná pole,
To je jak házet hrách na stěnu… Tak ještě jednou: dvě pole jsou úplně zbytečná, stačí jedno.
staticky alokovaná pole, alokujte je podle prvního bloku a pouze pokud bude další blok větší tak je realokujte
Jak se realokuje staticky alokované pole?
Pokuste se to dostat je jediné smyčky.
Jak?
int main()
{ int blocks;
scanf("%d\n", &blocks);
int length, oldlength = 10;
int result;
int carry = 0;
int *i1, *i2;
i1 = malloc (10* sizeof (int));
i2 = malloc (10* sizeof (int));
for (int i = 0; i < blocks; i++)
{ scanf("%d\n", &length);
if (length > oldlength)
{ i1 = realloc(i1, length * sizeof (int));
i2 = realloc (i2, length * sizeof (int));
oldlength = length; }
for (int j = 0; j < length; j++)
scanf("%d %d\n", i1 + j, i2 + j);
for (int j = (length - 1); j >= 0; j--)
{ result = *(i1 + j) + *(i2 + j) + carry;
if (result > 9)
{ carry = 1; *(i1+j) = result - 10; } else
{ carry = 0; *(i1 + j) = result; }
}
if (i != 0) printf("\n");
for (int j = 0; j < length; j++)
printf("%d", *(i1 + j); printf("\n"); }
free (i1); free (i2); return 0; }
Samo že náhrada scanf a printf za getchar a putchar jak bylo psáno výše má také velký vliv, ale to už doplníte sám.
Ještě jsem ostranil to dělení a modulo, což jsou také poměrně pomalé operace.
Na druhou stranu, podle původního zadání není délka čísel větší než 1.000.000, takže pole by asi šlo udělat rovnou tak velký a
dál s nima nehýbat, spolklo by to 4 Mbyte paměti což se asi dá skousnout.
Ta optimalizace do jednoho cyklu asi opravdu nepůjde.
Takže když si to shrneme, tak pole, které realokujete, není staticky alokované, a na jednu smyčku to také nemáte. Takže mé výhrady byly zcela oprávněné. Včetně té první, kterou jste ignoroval a dál úplně zbytečně alokujete dvě pole místo jednoho.
Navíc použití realloc()
je zbytečné a neefektivní. Vy přece nepotřebujete zachovat hodnoty z minulého bloku, takže je efektivnější zavolat free()
a malloc()
a zbytečně nekopírovat původní obsah.
Ještě jsem ostranil to dělení a modulo, což jsou také poměrně pomalé operace.
Není to až tak strašné. Na současných procesorech nadělá třeba podmíněný skok s nesprávně odhadnutým výsledkem víc škody než celé násobení a dělení.
Na druhou stranu, podle původního zadání není délka čísel větší než 1.000.000, takže pole by asi šlo udělat rovnou tak velký a dál s nima nehýbat, spolklo by to 4 Mbyte paměti což se asi dá skousnout.
Vzhledem k tomu, že stejně pracujeme s hodnotami v rozsahu 0-19, je vašich 8 MB (používáte dvě pole) osmkrát více, než je potřeba.
Tiskni
Sdílej: