Byly publikovány informace o novém bezpečnostním problému pojmenovaném GPU.zip (paper, GitHub). S vlastním logem. Jedná se o možný útok postranním kanálem na grafickou kartu (GPU). Proces může "krást pixely" jinému procesu.
Projekt GNU dnes slaví 40. výročí. Přesně před čtyřiceti lety, 27. září 1983, Richard Stallman oznámil, že se chystá napsat s Unixem kompatibilní operační systém GNU (Gnu's Not Unix). Hlavní oslava a setkání hackerů probíhá ve Švýcarsku ve městě Biel/Bienne. Na programu je také přednáška Richarda Stallmana.
Byl vydán Mozilla Firefox 118.0. Přehled novinek v poznámkách k vydání, poznámkách k vydání pro firmy a na stránce věnované vývojářům. Vypíchnout je nutno automatický lokální strojový překlad webových stránek. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 118 je již k dispozici také na Flathubu a Snapcraftu.
Byla vydána nová major verze 15.0.0 softwaru OCRmyPDF pro přidávání textové vrstvy k naskenovaným PDF dokumentům (PDF/A). Přehled novinek v poznámkách k vydání. OCRmyPDF využívá pro optické rozpoznávání znaků (OCR) engine Tesseract.
Karel Matějka zveřejnil druhé demo své chystané hry Bzzzt. Kromě verze pro Windows a macOS je dostupná i verze pro Linux. Plná verze hry má vyjít zanedlouho.
Noví Bulánci byli oficiálně vydáni. V roce 2021 bylo na Startovači na podporu vývoje této hry vybráno 7,3 miliónů Kč. Hra je zatím určena jenom pro Windows, díky Protonu ale běží také na Linuxu.
ChatGPT může vidět, slyšet a mluvit.
Upscaler je open source nástroj pro zvýšení rozlišení a vylepšení obrázků pomocí AI. Vývoj probíhá na GitLabu. Instalovat lze také z Flathubu. Stejně jako Upscayl je Upscaler postaven nad Real-ESRGAN.
GNUnet (Wikipedie) byl vydán v nové major verzi 0.20.0. Jedná se o framework pro decentralizované peer-to-peer síťování, na kterém je postavena řada aplikací.
V Dublinu o víkendu proběhla dvanáctá iterace multimediální konference Video Dev Days, kterou pravidelně pořádá nezisková organizace VideoLAN. Záznamy přednášek z prvního a druhého dne jsou dostupné na YouTube.
Řešení dotazu:
Vzhledem k tomu, že čísla dostáváte od nejvyšších řádů, tak to o moc lépe nepůjde. V každém případě se odnaučte alokovat velká pole na zásobníku, na rychlost to sice vliv nemá, ale je to zlozvyk, který se vám může vymstít. Dále je zbytečné udržovat si dvě pole na operandy. Místo toho bych si do jednoho pole ukládal jen součty číslic (prozatím bez ohledu na přenos) a pak je na konci zpracoval. Možná by určité urychlení přineslo i to, když si do prvku pole místo jednoho řádu uložíte rovnou víc (při 32-bitovém int
zvládnete osm řádů včetně případného přenosu, s 64-bitovým long
i dvojnásobek).
Stejně mám ale temné podezření, že nejvíc času ten program stráví konverzí vstupu a výstupu.
Mimochodem, jak jste z "Time limit: 3.000 seconds" přišel na to, že má program skončit do 0.3 sekundy?
Samotné časy moc velkou vypovídací hodnotu nemají. Čas běhu pro konkrétní data bude hodně záviset na verzi a parametrech překladače a systému, na kterém se to měří.
Ještě jeden tip: pokud se můžete spolehnout, že vstup vypadá přesně tak, jak má, můžete místo scanf()
načítat jednotlivé znaky pomocí getchar()
a na číselnou hodnotu převádět odečtením '0'
. Podobně půjde zrychlit i výpis na konci.
Cas se meri prave na tom serveru, vse se praklada stejnym prekladacem a vsichni maji stejna vstupni data.Samotné časy moc velkou vypovídací hodnotu nemají. Čas běhu pro konkrétní data bude hodně záviset na verzi a parametrech překladače a systému, na kterém se to měří.
Diky to je ono, pouzil jsemJeště jeden tip: pokud se můžete spolehnout, že vstup vypadá přesně tak, jak má, můžete místo
scanf()
načítat jednotlivé znaky pomocígetchar()
a na číselnou hodnotu převádět odečtením'0'
. Podobně půjde zrychlit i výpis na konci.
getchar()
a putchar()
a cas se zkratil z 1 sekundy na 0.2 sekundy. Ani jsem netusil, ze scanf()
a printf()
spotrebuji tolik casu:)
scanf()
musí kvůli své obecnosti udělat, tak to moc překvapivé není.
result= result+(integera+integer b)*(10**j)
jedním for-em ty čísla načítáš do pole a druhým sčítáš prvky toho pole proč to nedat do jednoho for-u ...To prave nevim jak udelat, kdyz to musim zacit vyhodnocovat od nejnizsiho radu, a ty cisla dostavam od nejvyssiho.
... polím se nejlépe úplně vyhnout použít něco jako result= result+(integera+integer b)*(10**j)
V zadani je ze ta cisla muzou byt dlouha az 1 000 000 radu.
Tady právě moc ne, protože přímá aplikace klasického postupu by ve výsledku vedla na kvadratickou časovou složitost. Pokud chcete lineární, nezbyde vám než všechno uložit. Přičemž, jak už bylo zmíněno, stačí ukládat rovnou součty číslic a projet pak jednou celé pole. Tj. asi nějak takhle (bez kontroly chyb a předčasného EOF):
uint8_t* s = (uint8_t*) malloc((N+1) * sizeof(uint8_t)); for (i=1; i<=N; i++) { int c; uint8_t digit = 0; while ((c = getchar()) != '\n') if (c >= '0' && c <= '9') digit += (c - '0'); s[i] = digit; } unsigned cy = 0; for (i=N; i>0; i--) { s[i] += cy; if (s[i] > 9) { s[i] -= 10; cy = 1; } else { cy = 0; } } s[0] = cy;
#include <assert.h> #include <cstring> #include <climits> #include <iomanip> #include <iostream> int main() { assert(sizeof(unsigned long) > sizeof(unsigned int)); int digits; std::cin >> digits; digits += 1; int allocate = (digits / (sizeof(unsigned int) * 2)) + 1; unsigned int* addend1 = new unsigned int[allocate]; unsigned int* addend2 = new unsigned int[allocate]; unsigned int* sum = new unsigned int[allocate]; memset(addend1, 0, allocate); memset(addend2, 0, allocate); memset(sum, 0, allocate); unsigned int num1 = 0; unsigned int num2 = 0; unsigned int currByte = (digits - 2) / 2; for (int i = digits-2; i >= 0; i--) { unsigned int in1, in2; std::cin >> std::hex >> in1 >> in2; if (i % 2) { num1 |= in1 << 4; num2 |= in2 << 4; continue; } num1 |= in1; num2 |= in2; memcpy((void*)addend1 + currByte, &num1, 1); memcpy((void*)addend2 + currByte, &num2, 1); num1 = 0; num2 = 0; currByte--; for (int x = allocate - 1; x >= 0; x--) std::cout << "- " << std::hex << addend1[x] << " "; std::cout << std::endl; } std::cout << std::endl; for (int i = allocate - 1; i > = 0; i--) std::cout << std::hex << addend1[i] << " "; std::cout << std::endl << std::endl; unsigned int carry = 0; for (int i = 0; i < allocate; i++) { unsigned long result = static_cast<unsigned long>(addend1[i]) + static_cast<unsigned long>(addend2[i]) + carry; carry = result >> sizeof(unsigned int) * 8; sum[i] = result; } for (int i = allocate - 1; i >= 0; i--) std::cout << std::hex << sum[i]; std::cout << std::endl; return 0; }(och ten parser to zprasil, snad je to i nadále funkční:) )
scanf()
a printf()
. Konverzí mezi desítkovou a šestnáctkovou soustavou už byste to zabil úplně, nenapadá mne totiž způsob, jak konverzi šestnáctkového dlouhého čísla na desítkové udělat s lineární časovou složitostí (vzhledem k délce).
Používejte jen 2 staticky alokovaná pole,
To je jak házet hrách na stěnu… Tak ještě jednou: dvě pole jsou úplně zbytečná, stačí jedno.
staticky alokovaná pole, alokujte je podle prvního bloku a pouze pokud bude další blok větší tak je realokujte
Jak se realokuje staticky alokované pole?
Pokuste se to dostat je jediné smyčky.
Jak?
int main()
{ int blocks;
scanf("%d\n", &blocks);
int length, oldlength = 10;
int result;
int carry = 0;
int *i1, *i2;
i1 = malloc (10* sizeof (int));
i2 = malloc (10* sizeof (int));
for (int i = 0; i < blocks; i++)
{ scanf("%d\n", &length);
if (length > oldlength)
{ i1 = realloc(i1, length * sizeof (int));
i2 = realloc (i2, length * sizeof (int));
oldlength = length; }
for (int j = 0; j < length; j++)
scanf("%d %d\n", i1 + j, i2 + j);
for (int j = (length - 1); j >= 0; j--)
{ result = *(i1 + j) + *(i2 + j) + carry;
if (result > 9)
{ carry = 1; *(i1+j) = result - 10; } else
{ carry = 0; *(i1 + j) = result; }
}
if (i != 0) printf("\n");
for (int j = 0; j < length; j++)
printf("%d", *(i1 + j); printf("\n"); }
free (i1); free (i2); return 0; }
Samo že náhrada scanf a printf za getchar a putchar jak bylo psáno výše má také velký vliv, ale to už doplníte sám.
Ještě jsem ostranil to dělení a modulo, což jsou také poměrně pomalé operace.
Na druhou stranu, podle původního zadání není délka čísel větší než 1.000.000, takže pole by asi šlo udělat rovnou tak velký a
dál s nima nehýbat, spolklo by to 4 Mbyte paměti což se asi dá skousnout.
Ta optimalizace do jednoho cyklu asi opravdu nepůjde.
Takže když si to shrneme, tak pole, které realokujete, není staticky alokované, a na jednu smyčku to také nemáte. Takže mé výhrady byly zcela oprávněné. Včetně té první, kterou jste ignoroval a dál úplně zbytečně alokujete dvě pole místo jednoho.
Navíc použití realloc()
je zbytečné a neefektivní. Vy přece nepotřebujete zachovat hodnoty z minulého bloku, takže je efektivnější zavolat free()
a malloc()
a zbytečně nekopírovat původní obsah.
Ještě jsem ostranil to dělení a modulo, což jsou také poměrně pomalé operace.
Není to až tak strašné. Na současných procesorech nadělá třeba podmíněný skok s nesprávně odhadnutým výsledkem víc škody než celé násobení a dělení.
Na druhou stranu, podle původního zadání není délka čísel větší než 1.000.000, takže pole by asi šlo udělat rovnou tak velký a dál s nima nehýbat, spolklo by to 4 Mbyte paměti což se asi dá skousnout.
Vzhledem k tomu, že stejně pracujeme s hodnotami v rozsahu 0-19, je vašich 8 MB (používáte dvě pole) osmkrát více, než je potřeba.
Tiskni
Sdílej: