O víkendu 11. a 12. května lze navštívit Maker Faire Prague, festival plný workshopů, interaktivních činností a především nadšených a zvídavých lidí.
Byl vydán Fedora Asahi Remix 40, tj. linuxová distribuce pro Apple Silicon vycházející z Fedora Linuxu 40.
Představena byla služba Raspberry Pi Connect usnadňující vzdálený grafický přístup k vašim Raspberry Pi z webového prohlížeče. Odkudkoli. Zdarma. Zatím v beta verzi. Detaily v dokumentaci.
Byla vydána verze R14.1.2 desktopového prostředí Trinity Desktop Environment (TDE, fork KDE 3.5). Přehled novinek v poznámkách k vydání, podrobnosti v seznamu změn.
Dnešním dnem lze již také v Česku nakupovat na Google Store (telefony a sluchátka Google Pixel).
Apple představil (keynote) iPad Pro s čipem Apple M4, předělaný iPad Air ve dvou velikostech a nový Apple Pencil Pro.
Richard Biener oznámil vydání verze 14.1 (14.1.0) kolekce kompilátorů pro různé programovací jazyky GCC (GNU Compiler Collection). Jedná se o první stabilní verzi řady 14. Přehled změn, nových vlastností a oprav a aktualizovaná dokumentace na stránkách projektu. Některé zdrojové kódy, které bylo možné přeložit s předchozími verzemi GCC, bude nutné upravit.
Free Software Foundation zveřejnila ocenění Free Software Awards za rok 2023. Vybráni byli Bruno Haible za dlouhodobé příspěvky a správu knihovny Gnulib, nováček Nick Logozzo za front-end Parabolic pro yt-dlp a tým Mission logiciels libres francouzského státu za nasazování svobodného softwaru do praxe.
Před 10 lety Microsoft dokončil akvizici divize mobilních telefonů společnosti Nokia a pod značkou Microsoft Mobile ji zanedlouho pohřbil.
Fedora 40 release party v Praze proběhne v pátek 17. května od 18:30 v prostorách společnosti Etnetera Core na adrese Jankovcova 1037/49, Praha 7. Součástí bude program kratších přednášek o novinkách ve Fedoře.
Řešení dotazu:
Vzhledem k tomu, že čísla dostáváte od nejvyšších řádů, tak to o moc lépe nepůjde. V každém případě se odnaučte alokovat velká pole na zásobníku, na rychlost to sice vliv nemá, ale je to zlozvyk, který se vám může vymstít. Dále je zbytečné udržovat si dvě pole na operandy. Místo toho bych si do jednoho pole ukládal jen součty číslic (prozatím bez ohledu na přenos) a pak je na konci zpracoval. Možná by určité urychlení přineslo i to, když si do prvku pole místo jednoho řádu uložíte rovnou víc (při 32-bitovém int
zvládnete osm řádů včetně případného přenosu, s 64-bitovým long
i dvojnásobek).
Stejně mám ale temné podezření, že nejvíc času ten program stráví konverzí vstupu a výstupu.
Mimochodem, jak jste z "Time limit: 3.000 seconds" přišel na to, že má program skončit do 0.3 sekundy?
Samotné časy moc velkou vypovídací hodnotu nemají. Čas běhu pro konkrétní data bude hodně záviset na verzi a parametrech překladače a systému, na kterém se to měří.
Ještě jeden tip: pokud se můžete spolehnout, že vstup vypadá přesně tak, jak má, můžete místo scanf()
načítat jednotlivé znaky pomocí getchar()
a na číselnou hodnotu převádět odečtením '0'
. Podobně půjde zrychlit i výpis na konci.
Cas se meri prave na tom serveru, vse se praklada stejnym prekladacem a vsichni maji stejna vstupni data.Samotné časy moc velkou vypovídací hodnotu nemají. Čas běhu pro konkrétní data bude hodně záviset na verzi a parametrech překladače a systému, na kterém se to měří.
Diky to je ono, pouzil jsemJeště jeden tip: pokud se můžete spolehnout, že vstup vypadá přesně tak, jak má, můžete místo
scanf()
načítat jednotlivé znaky pomocígetchar()
a na číselnou hodnotu převádět odečtením'0'
. Podobně půjde zrychlit i výpis na konci.
getchar()
a putchar()
a cas se zkratil z 1 sekundy na 0.2 sekundy. Ani jsem netusil, ze scanf()
a printf()
spotrebuji tolik casu:)
scanf()
musí kvůli své obecnosti udělat, tak to moc překvapivé není.
result= result+(integera+integer b)*(10**j)
jedním for-em ty čísla načítáš do pole a druhým sčítáš prvky toho pole proč to nedat do jednoho for-u ...To prave nevim jak udelat, kdyz to musim zacit vyhodnocovat od nejnizsiho radu, a ty cisla dostavam od nejvyssiho.
... polím se nejlépe úplně vyhnout použít něco jako result= result+(integera+integer b)*(10**j)
V zadani je ze ta cisla muzou byt dlouha az 1 000 000 radu.
Tady právě moc ne, protože přímá aplikace klasického postupu by ve výsledku vedla na kvadratickou časovou složitost. Pokud chcete lineární, nezbyde vám než všechno uložit. Přičemž, jak už bylo zmíněno, stačí ukládat rovnou součty číslic a projet pak jednou celé pole. Tj. asi nějak takhle (bez kontroly chyb a předčasného EOF):
uint8_t* s = (uint8_t*) malloc((N+1) * sizeof(uint8_t)); for (i=1; i<=N; i++) { int c; uint8_t digit = 0; while ((c = getchar()) != '\n') if (c >= '0' && c <= '9') digit += (c - '0'); s[i] = digit; } unsigned cy = 0; for (i=N; i>0; i--) { s[i] += cy; if (s[i] > 9) { s[i] -= 10; cy = 1; } else { cy = 0; } } s[0] = cy;
#include <assert.h> #include <cstring> #include <climits> #include <iomanip> #include <iostream> int main() { assert(sizeof(unsigned long) > sizeof(unsigned int)); int digits; std::cin >> digits; digits += 1; int allocate = (digits / (sizeof(unsigned int) * 2)) + 1; unsigned int* addend1 = new unsigned int[allocate]; unsigned int* addend2 = new unsigned int[allocate]; unsigned int* sum = new unsigned int[allocate]; memset(addend1, 0, allocate); memset(addend2, 0, allocate); memset(sum, 0, allocate); unsigned int num1 = 0; unsigned int num2 = 0; unsigned int currByte = (digits - 2) / 2; for (int i = digits-2; i >= 0; i--) { unsigned int in1, in2; std::cin >> std::hex >> in1 >> in2; if (i % 2) { num1 |= in1 << 4; num2 |= in2 << 4; continue; } num1 |= in1; num2 |= in2; memcpy((void*)addend1 + currByte, &num1, 1); memcpy((void*)addend2 + currByte, &num2, 1); num1 = 0; num2 = 0; currByte--; for (int x = allocate - 1; x >= 0; x--) std::cout << "- " << std::hex << addend1[x] << " "; std::cout << std::endl; } std::cout << std::endl; for (int i = allocate - 1; i > = 0; i--) std::cout << std::hex << addend1[i] << " "; std::cout << std::endl << std::endl; unsigned int carry = 0; for (int i = 0; i < allocate; i++) { unsigned long result = static_cast<unsigned long>(addend1[i]) + static_cast<unsigned long>(addend2[i]) + carry; carry = result >> sizeof(unsigned int) * 8; sum[i] = result; } for (int i = allocate - 1; i >= 0; i--) std::cout << std::hex << sum[i]; std::cout << std::endl; return 0; }(och ten parser to zprasil, snad je to i nadále funkční:) )
scanf()
a printf()
. Konverzí mezi desítkovou a šestnáctkovou soustavou už byste to zabil úplně, nenapadá mne totiž způsob, jak konverzi šestnáctkového dlouhého čísla na desítkové udělat s lineární časovou složitostí (vzhledem k délce).
Používejte jen 2 staticky alokovaná pole,
To je jak házet hrách na stěnu… Tak ještě jednou: dvě pole jsou úplně zbytečná, stačí jedno.
staticky alokovaná pole, alokujte je podle prvního bloku a pouze pokud bude další blok větší tak je realokujte
Jak se realokuje staticky alokované pole?
Pokuste se to dostat je jediné smyčky.
Jak?
int main()
{ int blocks;
scanf("%d\n", &blocks);
int length, oldlength = 10;
int result;
int carry = 0;
int *i1, *i2;
i1 = malloc (10* sizeof (int));
i2 = malloc (10* sizeof (int));
for (int i = 0; i < blocks; i++)
{ scanf("%d\n", &length);
if (length > oldlength)
{ i1 = realloc(i1, length * sizeof (int));
i2 = realloc (i2, length * sizeof (int));
oldlength = length; }
for (int j = 0; j < length; j++)
scanf("%d %d\n", i1 + j, i2 + j);
for (int j = (length - 1); j >= 0; j--)
{ result = *(i1 + j) + *(i2 + j) + carry;
if (result > 9)
{ carry = 1; *(i1+j) = result - 10; } else
{ carry = 0; *(i1 + j) = result; }
}
if (i != 0) printf("\n");
for (int j = 0; j < length; j++)
printf("%d", *(i1 + j); printf("\n"); }
free (i1); free (i2); return 0; }
Samo že náhrada scanf a printf za getchar a putchar jak bylo psáno výše má také velký vliv, ale to už doplníte sám.
Ještě jsem ostranil to dělení a modulo, což jsou také poměrně pomalé operace.
Na druhou stranu, podle původního zadání není délka čísel větší než 1.000.000, takže pole by asi šlo udělat rovnou tak velký a
dál s nima nehýbat, spolklo by to 4 Mbyte paměti což se asi dá skousnout.
Ta optimalizace do jednoho cyklu asi opravdu nepůjde.
Takže když si to shrneme, tak pole, které realokujete, není staticky alokované, a na jednu smyčku to také nemáte. Takže mé výhrady byly zcela oprávněné. Včetně té první, kterou jste ignoroval a dál úplně zbytečně alokujete dvě pole místo jednoho.
Navíc použití realloc()
je zbytečné a neefektivní. Vy přece nepotřebujete zachovat hodnoty z minulého bloku, takže je efektivnější zavolat free()
a malloc()
a zbytečně nekopírovat původní obsah.
Ještě jsem ostranil to dělení a modulo, což jsou také poměrně pomalé operace.
Není to až tak strašné. Na současných procesorech nadělá třeba podmíněný skok s nesprávně odhadnutým výsledkem víc škody než celé násobení a dělení.
Na druhou stranu, podle původního zadání není délka čísel větší než 1.000.000, takže pole by asi šlo udělat rovnou tak velký a dál s nima nehýbat, spolklo by to 4 Mbyte paměti což se asi dá skousnout.
Vzhledem k tomu, že stejně pracujeme s hodnotami v rozsahu 0-19, je vašich 8 MB (používáte dvě pole) osmkrát více, než je potřeba.
Tiskni Sdílej: