Přihlášení | Registrace

napište » Zprávičky

Bad UX World Cup 2025

dnes 18:55 | Humor

Jak na webu co nejšíleněji zadávat datum? Jak to uživatelům co nejvíce znepříjemnit? V Bad UX World Cup 2025 (YouTube) se vybíraly ty nejšílenější UX návrhy. Vítězným návrhem se stal Perfect Date.

Ladislav Hagara | Komentářů: 0

Collabora Office pro desktop

dnes 12:44 | Zajímavý software

Společnost Collabora vydala (YouTube) na LibreOffice založený desktopový kancelářský balík Collabora Office. Pro Windows, macOS a Linux. Se stejným uživatelským rozhraním jako Collabora Online. Svůj desktopový kancelářský balík s rozhraním LibreOffice pojmenovala Collabora Office Classic.

Ladislav Hagara | Komentářů: 1

AV Linux (AVL) a MX Moksha (MXM) 25

dnes 12:00 | Nová verze

Glen MacArthur vydal AV Linux (AVL) a MX Moksha (MXM) 25. S linuxovým jádrem Liquorix. AV Linux (Wikipedie) je linuxová distribuce optimalizována pro tvůrce audio a video obsahu. Nejnovější AV Linux vychází z MX Linuxu 25 a Debianu 13 Trixie. AV Linux přichází s desktopovým prostředím Enlightenment 0.27.1 a MX Moksha s prostředím Moksha 0.4.1 (fork Enlightenmentu).

Ladislav Hagara | Komentářů: 0

1. snapshot Ubuntu 26.04 LTS (Resolute Raccoon)

včera 17:55 | Nová verze

Ubuntu pro testování nových verzí vydává měsíční snapshoty. Dnes vyšel 1. snapshot Ubuntu 26.04 LTS (Resolute Raccoon).

Ladislav Hagara | Komentářů: 0

Riziko prolamování šifrované komunikace: Státy EU se shodly na návrhu proti dětské pornografii

včera 14:33 | IT novinky

Zástupci členských států EU se včera shodli na návrhu, který má bojovat proti šíření materiálů na internetu zobrazujících sexuální zneužívání dětí. Nařízení známé pod zkratkou CSAM a přezdívané chat control mělo množství kritiků a dlouho nebyla pro jeho schválení dostatečná podpora. Pro schválení byla potřeba kvalifikovaná většina a dánské předsednictví v Radě EU se snažilo dosáhnout kompromisu. Návrh nakonec po dlouhých týdnech

… více »

Ladislav Hagara | Komentářů: 10

Herní engine s&box je open source

včera 12:22 | Zajímavý software

Britské herní studio Facepunch stojící za počítačovými hrami Garry's Mod a Rust uvolnilo svůj herní engine s&box (Wikipedie) jako open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT. Herní engine s&box je postavený nad proprietárním herním enginem Source 2 od společnosti Valve.

Ladislav Hagara | Komentářů: 1

Vývoj Zigu přesunut z GitHubu na Codeberg

včera 04:55 | Komunita

Vývoj programovacího jazyka Zig byl přesunut z GitHubu na Codeberg. Sponzoring na Every.

Ladislav Hagara | Komentářů: 4

KDE Plasma 6.8 už pouze nad Waylandem

včera 04:44 | Komunita

Stejně jako GNOME i KDE Plasma končí s X11. KDE Plasma 6.8 poběží už pouze nad Waylandem. Aplikace pro X11 budou využívat XWayland.

Ladislav Hagara | Komentářů: 3

Europoslanci vyzvali k zákazu sociálních sítí pro osoby mladší 16 let

26.11. 14:55 | IT novinky

Poslanci Evropského parlamentu dnes vyzvali k výraznému zvýšení ochrany nezletilých na internetu, včetně zákazu vstupu na sociální sítě pro osoby mladší 16 let. Legislativně nezávazná zpráva, kterou dnes odsouhlasil Evropský parlament poměrem 493 hlasů pro ku 92 proti, kromě zavedení věkové hranice 16 let pro využívání sociálních sítí, platforem pro sdílení videí či společníků s umělou inteligencí (AI) vyzývá také k zákazu … více »

Ladislav Hagara | Komentářů: 50

Doom v KiCadu nebo na osciloskopu? Žádný problém

26.11. 14:11 | Humor

Doom v KiCadu nebo na osciloskopu? Žádný problém: KiDoom: Running DOOM on PCB Traces a ScopeDoom: DOOM on an Oscilloscope via Sound Card.

Ladislav Hagara | Komentářů: 3

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (34%)

Gitlab (47%)

Atlassian (20%)

Bitbucket (18%)

Gitea (23%)

Mercurial (16%)

jen git (24%)

jen svn (16%)

Jiné (uvedu v diskusi) (18%)

Celkem 415 hlasů

Komentářů: 17, poslední 19.11. 21:57

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Databázová poradna / SQLite zpomaluje během INSERT OR IGNORE

Štítky: AbcLinuxu, ahoj, audio, databáze, Debian, distribuce, Gentoo, GNOME, grafika, hardware, IDE, instalace, Internet, KDE, kernel, Linux, multimédia, ovladače, problém, programování, prohlížeče, server, sítě, software, SUSE, textové editory, Ubuntu, USB, Vim

Dotaz: SQLite zpomaluje během INSERT OR IGNORE

21.5.2020 07:03 Aleš Nehyba | skóre: 1
SQLite zpomaluje během INSERT OR IGNORE

Přečteno: 1168×

Odpovědět | Admin

ahoj,

Při vkládání velkého množství záznamů do SQLite pomocí příkazu INSERT OR IGNORE pozoruji výrazné zpomalení. Data vkládám přes python z csv souborů. Mám desítky souborů o velikosti cca 300 MB a každý obsahuje statisíce až milion záznamů - textové popisky definující význam a k nim přiřazená číselné hodnoty. Python vytváří několik číselníků, do kterých se ukládají ty popisky, aby se šetřilo místo, protože ty jsou hodně duplicitní.

Zpracování prvních takových souborů trvá pár desítek vteřin/několik minut na každý soubor. Postupně se čas zpracování souboru prodlužuje a dosahuje i desítek minut/pár hodin. Nějak významně nepomohlo ani vypnutí indexování během vkládání. Transakce používám.

K datům bude přistupovat pouze jeden program běžící lokálně. Proto jsem volil sqlite. To zpomalování při vkládání mě ale nutí zeptat se, jestli by na tom jiné databáze nebyly lépe?

Řešení dotazu:

Nástroje: Začni sledovat (0) ?

Odpovědi

21.5.2020 12:10 debian+
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Urcite lepsie.

Mas na vyber SQL alebo NoSQL databazy. SQLite pri ukladany zmeny potrebuje ulozit databazu ako SQL dotaz (RAW -> SQL), co pri tom mnozstve chce cas a blokuje pracu s DB.

21.5.2020 12:46 EtDirloth | skóre: 11
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Ako vzdy, aj tu plati, ze DB engine treba vyberat podla potrieb aplikacie. Takze tazko povedat, ako by na tom boli ine databazy.

Nevieme, ako vyzeraju data. Mohol by tu pomoct bulk load CSV do docasnej tabulky v sqlite a nasledny podmieneny INSERT INTO trvale SELECT FROM docasne WHERE NOT IN/NOT EXISTS (trvale). Toto sa potom da urobit aj z CLI, resp. v bashi cez sqlite3 klienta.

Nepozname tvoju aplikaciu - a v akej forme robis dotazy. Python je dost pomaly a ten bottleneck mozes mat v nejakom tvojom foreach. Skus si spravit profiling, nech vidis, kde ten program travi cas.

Nevieme, ci potrebujes mat data perzistentne. Subor so Sqlite databazou je mozne nacitat aj do RAM a pouzit ju ako in-memory DB. Spatne ulozenie do suboru vsak bolo par rokov dozadu trochu zlozitejsie, ale islo aj to. Ak potrebujes len key-value, potom by mozno taky Redis bol pre teba vhodnejsi.

21.5.2020 18:09 Aleš Nehyba | skóre: 1
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Díky za tip. Zkusím tu dočasnou tabulku.

Data převádím do databáze pro trvalé uložení. Vyhledávání v původních csv souborech celkem trvá. Dotaz do SQL je mnohonásobně rychlejší. Těch dotazů může být v dávce několik tisíc, výsledkem každého je několik desítek řádků pro další zpracování. Zpočátku to vypadalo, že databáze je řešení. Ale s prodlužujícím se časem zpracování insertů už to tak růžové není. Už je skoro jedno, jestli čekat hodiny na přípravu dat pro sql dotazy, nebo hodiny na zpracování dotazů do csv.

Velikost databáze je dnes cca 12 GB. Za rok naroste cca o 1 GB, to je asi 6 mio záznamů.

28.5.2020 11:33 Aleš Nehyba | skóre: 1
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Tak ta úprava INSERT pomohla. Díky.

21.5.2020 12:50 Kit | skóre: 46 | Brno
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Bez znalostí požadavků na systém (typy dotazů) se dá těžko odpovědět. Plnění SQLite skutečně trvá déle a možná bude stát za to vydržet i několikadenní plnění, protože čtení bývá rychlé.

Ovšem pokud to má být KVS, tak se dá najít pár vhodnějších databází. Je možné i využití NoSQL.

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

21.5.2020 14:05 Kit | skóre: 46 | Brno
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Na tohle by se dala využít DB4, která je pro podobné účely fakt rychlá. Zkoušel jsem i Tokyo Cabinet, který také podával zajímavé výkony.

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

21.5.2020 20:32 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Bulk insert se tu řeší v diskuzích pravidelně (pro různé databáze). Každá databáze se chová jinak a řada databází umí nacpat csv do tabulky přímým importem - je to mnohonásobně rychlejší než normální insert (i multi-insert, kdy se vkládá více záznamů jediným dotazem). Některé databáze umí mít jako storage i csv, takže by pak stálo za to zkusit načíst csv takto a pak selectem překopírovat do cílové tabulky. Zkusit jak je na tom databáze s výkonem v režimu in-memory. Při importu koukat na obsazení RAM, vytížení CPU a vytížení IO. Pokud jde o data ze sensorů existují specializované time-series databáze, které řeší některá specifika efektivněji.

Nakonec stojí za zvážení změna workflow, zda by nešlo vkládat záznamy do databáze bez csv mezikroku.

Pokud to chcete řešit podrobněji, chce to vidět ten python script a vzorek dat.

-- OldFrog

21.5.2020 20:42 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

PS: Ruční tvorbě číselníků by se šlo asi vyhnout, například by šlo popisky uložit do jiné 1:1 tabulky a na tu tabulku nastavit vhodný typ úložiště (s kompresí) nebo prostě jen nastavit jiný vhodnější typ sloupce (trigramy). To by odvedlo stejnou práci - a oproti skriptu by to bylo určitě efektivnější. Jsem celkově přesvědčen, že vhodné řešení může přinést řádové urychlení.

-- OldFrog

23.5.2020 21:47 Tom K | skóre: 22
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

sqlite3 má jako vlastnost, že při určitém počtu záznamů začne výrazně zpomalovat insert. Ten počet je někde okolo milionu řádků. Souvisí to s implicitním indexem a UNIQUE sloupci, které se chovají jako indexy. Na jednom projektu, kde jsem potřeboval řádově desítky milionů řádků jsem to řešil rozdělením do samostatných databází, které jsem následně spojil (bylo jich 512).
Při spojování je důležité klíčové slovo WITHOUT ROWID.
Zajímavý odkaz je tady: https://stackoverflow.com/questions/15778716/sqlite-insert-speed-slows-as-number-of-records-increases-due-to-an-index/15809806

echo -n "u48" | sha1sum | head -c3; echo

24.5.2020 21:18 Aleš Nehyba | skóre: 1
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Díky. Ve dvou největších tabulkách mám 25 mio a 60 mio řádků. Zkusím ta data rozdělit podle let.

24.5.2020 23:11 Kit | skóre: 46 | Brno
Rozbalit Rozbalit vše Re: SQLite zpomaluje během INSERT OR IGNORE

Však už to máš rozděleno. Z každého vstupního souboru uděláš jednu databázi a následně je spojíš do jedné.

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje