abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

včera 23:11 | Nová verze

Byla vydána verze 2.4.0 analyzátoru síťového provozu Wireshark. Jedná se o první stabilní verzi nové řady 2.4. Podrobný přehled novinek v poznámkách k vydání. V červnu proběhla konference SharkFest’17 US věnovaná Wiresharku. Záznamy přednášek jsou k dispozici na YouTube.

Ladislav Hagara | Komentářů: 0
včera 13:11 | Pozvánky

Spolek OpenAlt zve příznivce otevřeného přístupu na 142. brněnský sraz, který proběhne v pátek 21. července od 18:00 hodin ve Sport Centru Srbská (Srbská 4). Od 19:00 je pro zájemce zamluveno hřiště na plážový volejbal.

Ladislav Hagara | Komentářů: 0
včera 12:34 | Bezpečnostní upozornění

V GNOME Soubory, původně Nautilus, konkrétně v generování náhledů exe, msi, dll a lnk souborů byla nalezena a opravena bezpečnostní chyba CVE-2017-11421 s názvem Bad Taste. Při otevření složky obsahující tyto soubory může být spuštěn VBScript obsažen v názvech těchto souborů.

Ladislav Hagara | Komentářů: 2
včera 11:00 | Bezpečnostní upozornění

Společnost Oracle vydala čtvrtletní bezpečnostní aktualizaci svých softwarových produktů (CPU, Critical Patch Update). Opraveno bylo celkově 308 bezpečnostních chyb. V Oracle Java SE je například opraveno 32 bezpečnostních chyb. Vzdáleně zneužitelných bez autentizace je 28 z nich. V Oracle MySQL je opraveno 30 bezpečnostních chyb. Vzdáleně zneužitelných bez autentizace je 9 z nich.

Ladislav Hagara | Komentářů: 0
včera 01:00 | Komunita

Mark Krenz, známý svým twitterovým účtem @climagic (Command Line Magic), kde ukazuje, co vše a jak lze dělat v příkazovém řádku, přednášel včera v Praze. Záznam přednášky je k dispozici na YouTube.

Ladislav Hagara | Komentářů: 0
19.7. 10:00 | Nová verze

Microsoft vydal Skype pro Linux ve verzi 5.4 Beta. Nejnovější Skype pro Linux je postaven na frameworku Electron 1.7.4 a přináší skupinové videohovory.

Ladislav Hagara | Komentářů: 11
19.7. 06:00 | Nová verze

Werner Koch, zakladatel a hlavní vývojář GnuPG, oznámil vydání verze 1.8.0 svobodné kryptografické knihovny Libgcrypt. Jedná se o první stabilní verzi nové řady 1.8. Ta je API i ABI kompatibilní s řadou 1.7. Z novinek vývojáři zdůrazňují podporu kryptografických hašovacích funkcí Blake2 (Wikpedie), šifrovací mód XTS nebo zvýšení výkonu na architektuře ARM.

Ladislav Hagara | Komentářů: 0
18.7. 15:55 | Zajímavý projekt

Stefan Vorkoetter představil na svých stránkách DIY tablet s Raspberry Pi 3 Model B. Z Raspberry Pi odstranil USB porty, ethernetový port i GPIO konektor. Použil oficiální sedmipalcový dotykový displej s rozlišením 800x480 pixelů. Hmotnost tabletu je 484  g.

Ladislav Hagara | Komentářů: 6
18.7. 06:00 | Zajímavý projekt

Podpořit vývoj otevřených technologií pro rozpoznávaní řeči lze na stránkách Common Voice. Jedná se o projekt Mozilly, jehož prvním cílem je nahrání a následné zveřejnění pod open source licencí 10 000 hodin záznamů řeči. Pomoci může kdokoli. Stačí na stránkách projektu do mikrofonu přečíst napsaný text nebo si nechat přehrávat již nahrané záznamy a určovat, zda napsaným textům odpovídají. Podrobnosti v často kladených otázkách (FAQ).

Ladislav Hagara | Komentářů: 4
18.7. 05:00 | IT novinky

Do pátku probíhá v Praze IETF 99, tj. 99. setkání organizace Internet Engineering Task Force (IETF) odpovědné za tvorbu internetových standardů RFC (Request for Comments). Vybrané přednášky a jednání lze sledovat online. Záznamy jsou k dispozici na YouTube. Těsně před setkáním bylo vydáno RFC 8200 nahrazující RFC 2460 a po více než 18 letech standardizující IPv6 (STD 86).

Ladislav Hagara | Komentářů: 0
Chystáte se pořídit CPU AMD Ryzen?
 (7%)
 (31%)
 (1%)
 (10%)
 (43%)
 (8%)
Celkem 1025 hlasů
 Komentářů: 65, poslední 1.6. 19:16
    Rozcestník

    Dotaz: použití sqlite pro hromady čísel: rychlost?

    28.6.2008 12:44 vencas | skóre: 32
    použití sqlite pro hromady čísel: rychlost?
    Přečteno: 1022×
    Zdravím,

    pracuju na fyzikálním simulačním programu, kde se během výpočtů pravidelně (pro účely pozdější visualisace) ukládá část stavu simulace. Mám např. 10000 částic a u každé z nich potřebuju jednou za 30s výpočtu uložit 3 souřadnice (typ double) polohy, 4 složky prostorové orientace, 3 další pro označení RGB. Když výpočet běží třeba 24 hodin, dává to řádově stamiliony čísel.

    V současné chvíli se vytváří hromada souborů snapshot-0001340.bz2 atd, které v sobě mají ta čísla v ASCII (ve sloupcích, každý řádek jedna částice). ((předesílám, surová binární data nechci, to se nedá pohodlně prohlížet)) No a při čtení se soubory vyhledají v daném adresáři, setřídí (podle čísla iterace) a postupně načítají.

    No a napadlo mě, co kdyby se to ukládalo do sqlite. Výhodou by byl jeden soubor (sqlite prý podporuje až 2TB, mně to bzip2ované zabíralo asi 1GB), případně by se dal formát různě modifikovat, ukládat nějaká metadata u každé iterace (třeba kolik bylo hodin) atd.

    Dokáže někdo ze zkučených odhadnout, jak by to bylo s rychlostí zápisu a jak s rychlostí čtení? Při čtení budu muset vždy vyhledat číslo podle iterace, čísla částice a údaje, který si chci přečíst - čtení je ale striktně sekvenční, nebude ta hromada SELECTů moc pomalá?

    Jakou strukturu by měla mít tabulka? Třeba sloupce: iterace, id_částice, 10 sloupců pro čísla. Nebo pro každou iteraci zvláštní tabulku a pak jednu supertabulku, kde budou jméne těch tabulek pro jednotlivé iterace?

    Mám s databázemi minimální zkušenosti, omlouvám se za možná hloupé otázky. Google mi přímo k tématu nic neporadil, nebo jsem nevěděl, jak se správně zeptat.

    Díky moc, Vašek

    Odpovědi

    28.6.2008 13:59 Miška | skóre: 30 | Praha
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Ad sekvencni cteni - muzes udelat jeden velkej select a pak sekvencne cist radky vysledku ;-)
    28.6.2008 14:03 cynik
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Rezije ukladani do cehokoli (textovy soubor nebo databaze) je velka. Doporucuju data typu program <-> program ukladat primo ve vnitrni reprezentaci bez jakekoli konverze. Pokud jsou data ulozena v nejake tabulce podobne strukture, pak k nim bude pristup velmi rychly. Jinymi slovy se tomu rika binarni ukladani dat.
    28.6.2008 14:17 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Ano, že je tam režie je jasné. Binárně to ale ukládat nejde, protože ta čísla jsou rozprsklá v instancích různých tříd a kdyby se změnily datové struktury, tak už se to nenačte. A nebylo by to přenositelné mezi architekturami.

    Ukládání v ASCII do texťáků a čtení z nich je výkonem ucházející. Měl jsem se zeptat přesněji: jestli to v sqlite nebude řádově pomalejší. Výhoda jednoho souboru a metadat to i při malém zpomalení myslím vyváží.
    28.6.2008 23:35 Semo | skóre: 44 | blog: Semo
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Ani sqlite neoklame fyziku. Ak sekvencny zapis do suboru je vykonovo iba relativne tesne nad pozadovanym vykonom, tak ziadnou databazou rychlejsi zapis nespravis. Skor pomalsi, ak to bude zapisovat na preskacku (data + indexy napr.). Jedine cim by si mohlo ziskat je, ze data budu vlastne zapisovane binarne za cenu toho, ze na ludske citanie dat potrebujes sqlite ako interpreter. Co mozes dosiahnut aj binarnym ukladanim dat do suboru (vyhnut sa fprintf a fscanf, pretoze to su obrovske a relativne molochy (binarne neznamena automaticky, ze skopirujes 100MB pamate zaradom do suboru)) a ukladat int ako 4 byty. A na ludske citanie si spravit vlastny interpreter.
    If you hold a Unix shell up to your ear, you can you hear the C.
    29.6.2008 14:32 kafa | skóre: 10
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Binárním zápisem není myšlena žádná perzistence dat ale záznam bez konverce (fwrite a fread u C). Pokud jste schopen zapisovat s konverzí, musí to jít i bez ní - žádná změna datových struktur není potřeba. Popravdě řečeno provádět dvojí zbytečnou konverzi je hrůzné a zpomalení citelné. A pokud data na disku potřebujete prohlížet (i když moc nechápu proč), není problém napsat krátký konverzní program pouze pro tento účel. Pokud nepotřebujete vybírat jednotlivé body a musíte zpracovat např. včechny body dané instance (asi ano - pokud vyhovuje sekvenční čtení), pak o využití databáze vůbec neuvažujte. Přinese vám pouze komplikace, řádové zpomalení a ztrátu času při experimentování!
    28.6.2008 18:58 diverman | skóre: 32 | blog: život s tučňáčkem
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    pokud netrvas na stalosti ulozenych dat, muzes zkusit 'memcached', ten je rychly dostatecne...
    deb http://ftp.cz.debian.org/debian jessie main contrib non-free
    28.6.2008 21:59 franta
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    memcached je pouze objektova cache z nic bez znalosti presneho identifikatoru objektu nedostanu vubec nic. Tudiz je to na reseni tohodle problemu i zdanlive naprosto nepouzitelne reseni. Dale pokud te cachi dojde pridelena pamet tak proste dalsi vysledky vypoctu proste zahodim ? K cemu potom provadet takovy vypocet ?
    29.6.2008 22:15 Aleš Kapica | skóre: 46 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Nedávno jsem si dělal takovou utilitku. Data jsem vrazil do sqlite3. Takže jen pár postřehů:

    Soubor importovaný do databáze měl 3015232. Vkládání přes jednotlivé SQL inserty bylo nekonečné, mnohem lepší výsledek jsem dosáhl s použitím oddělovačů.

    Na rychlost výběru má značný vliv skutečnost zda je či není vytvořený index.
    29.6.2008 22:16 Aleš Kapica | skóre: 46 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    U čísla jsem zapoměl uvést čeho - pochopitelně řádků.
    29.6.2008 22:23 Aleš Kapica | skóre: 46 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Ještě k rychlosti výběru. Bez indexu v řádech sekund. S indexem v desetinách sekundy.
    29.6.2008 22:27 e | skóre: 10
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    A ty inserty jsi mel zabalene do jedne transakce nebo se po kazdem insertu provadel autocommit? Jeste mne napadlo pouzit rrdtool... Ale asi by se musel pouzit zvlastni soubor pro kazdou castici.
    JA RAD PORADM KDYZ VIM vic (hebmilo.cz)
    29.6.2008 22:38 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Můžete prosím trochu víc pro člověka neznalého sqlite? jen třeba napsat pár klíčových slov podle kterých dohledám, jak udělat oddělovače atd.

    Vytvoření indexu: to se dá udělat při otevření databáze, ne? Zjistit, jestli tam index je, pokud ne, udělat ho.

    Díky.
    29.6.2008 23:27 Aleš Kapica | skóre: 46 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Na ukázku kousek kódu..
    sed -e '1,2 d' -e 's/"//g' -e 's/,/|/g' "$PATHDATA/GeoLiteCity-Location.csv" > $TMP
    sqlite3 $IPDatabase ".import $TMP Location"
    sqlite3 $IPDatabase 'CREATE INDEX "main" on Location (locId ASC);'
    
    Ta utilitka slouží pro vyhledání souřadnic pro IP, tohle je jen kousek z kódu. Podstatné je, že csv soubor je upraven ořezáním prvních dvou řádků a nahrazením oddělovače na typ jaký používá sqlite3 nativně (svislítko). Takto upravený soubor s daty je naimportován do příslušné tabulky. Poslední řádek pak po importu vytvoří index.

    A vůbec, v dokumentaci se můžete dočíst spoustu zajímavých věcí a tipů.
    30.6.2008 08:29 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Děkuju. Když to udělám se svislítkem, tak se čísla v paměti převede na string (čísla oddělená svislítkem), který si v příkazu sqlite rozparsuje, jednotlivá čísla převede zpět na číslo a uloží jako binární záznamy? V API jsem nenašel funkci (*insert*), která by nepotřebovala ten převod na text. Ale možná že to je zanedbatelné zpomalení.
    30.6.2008 08:58 Aleš Kapica | skóre: 46 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    FAQ bod 3, podle všeho je to naprosto normální.
    30.6.2008 11:45 Semo | skóre: 44 | blog: Semo
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Nechapem preco si tak posadnuty prevadzanim na text a potom naspat. Ale tvoja vec. Len ako na ilustraciu "zanedbatelneho spomalenia" dva programceky. Kazdy kopiruje iba z pamate do pamate, jeden to konvertuje na text a naspat, druhy priamo - binarne.
    #include <stdio.h>
    
    int main(int argc, char** argv)
    {
        int i, n;
        char s[20];
        for (i=0; i<30000000; i++) {
            sprintf(s, "%d", i);
            sscanf(s, "%d", &n);
        }
        return 0;
    }
    
    time ./print
    real    0m25.825s
    user    0m25.680s
    sys     0m0.010s
    
    a druhy:
    #include <string.h>
    
    int main(int argc, char** argv)
    {
        int i, n, b;
        for (i=0; i<30000000; i++) {
            memcpy(&b, &i, sizeof(i));
            memcpy(&n, &b, sizeof(i));
        }
        return 0;
    }
    
    time ./write
    real    0m0.305s
    user    0m0.300s
    sys     0m0.000s
    
    (user time druheho programu rastie linearne s hornou hranicou cyklu, takze cas na vytvorenie procesu a podobne mozeme zanedbat.)

    Isteze, vypisovanie cisel do suboru nie je iba samotna koverzia, ale aj cinnosti, ktore treba spravit pri oboch sposoboch vypisu a nacitania, takze celkovy pomer nebude tak vysoky. Ale o "nenarocnosti" to hovori dost.

    Zaver: vzhladom na jednorazove sekvencne zapisovanie/nacitavanie dat do/zo suborov, nic lepsie ako binarny zapis do suboru nenajdes.
    If you hold a Unix shell up to your ear, you can you hear the C.
    30.6.2008 13:22 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Proč jsem "posedlý", když tomu tak chcete říkat: do sqlite to budu ukládat tak, ža zavolám sqlite3_prepare(...); sqlite3_step(...) nebo případně sqlite3_exec(...). Ve všech případech tomu příkazu předávám SQL příkaz jako char*. Tím pádem ta data musím nejdřív překonvertovat na text. Sqlite si data rozparsuje a pokusí se ta čísla (v textu) uložit jako čísla v databázi (děkuju za odkaz na FAQ 3.) Chápu to správně?

    Opravdu jsem začátečník s databázemi, tak mě nezabíjejte. Představoval jsem si, že bude existovat funkce jako sqlite3_insert_float(sqlite* databaze,table* tabulka,float hodnota), aby to nemuselo jít přes příkaz SQL.

    (Za to měření rychlosti děkuju, počet částic je ale v reálu o 3 řády menší, takže třeba by to opravdu tak hrozné nebylo. Nevím, časem zkusím.)
    30.6.2008 13:47 JS
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    SQLite je na tohle imho pomale, zkuste Datadraw. Nemam s tim zkusenosti, ale vypada to zajimave. Jinak pokud chcete data sekvencne ulozit, pak setridit a znovu zpracovat, proc nepouzit obycejny soubor a sort?
    30.6.2008 20:25 Jirka P
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Na tohle by měly být ty CDF/HDF formáty, zkus je. (Nemá s tím někdo zkušenosti?)
    1.7.2008 08:01 J. Macků
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Nevím na jakém hw to chcete provozovat. Zde jsou jakési orientační benchmarky (http://www.sqlite.org/speed.html) se starší verzí. Řada 3 má více funkcí a je rychlejší. Pokud ty inserty uzavřete do transakce, tak se s 10000 vzorky musíte vejít hluboko pod 1s. Kdysi jsme dělali projekt na ukládání dat s sqlite a protože toho bylo hodně, dělali jsme denní tabulky a měsíční databáze. SQLite to zvládala velmi dobře. Pro nastíněný účel bych doporučil jednu tabulku (co záznam to řádek) pokud nevychází počet sloupců příliš velký (<50). Indexoval bych až hotové tabulky (třeby ty denní) pro účely vyhledávání (zpracování). Pokud použijete prepare, bind, step, finalize (http://www.sqlite.org/c3ref/stmt.html), žádné konverze se neuplatní.

    Jediné co SQLite z podstaty nemá ráda jsou konkurenční přístupy a mnoho jednotlivých přístupů. I to se dá zlepšit třeba uložením databáze na ramdisk s periodickou replikací na HDD.

    S pozdravem J.M.
    7.7.2008 21:46 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Nádherná odpověď, vřelé díky.
    7.7.2008 23:00 vencas | skóre: 32
    Rozbalit Rozbalit vše Re: použití sqlite pro hromady čísel: rychlost?
    Příloha:
    Přikládám pro zájemce výsledek pokusů. Použil jsem moc hezký c++ wrapper sqlite3x. Při 1e5 řádků po 10 sloupcích dostávám něco přes 1s na uložení všeho plus opětovné přečtení. Select je kupodivu podstatně rychlejší, možná je to kvůli cachování. Rychlost je tedy dostatečná.

    Ještě nevím, jestli pro jednotlivé kroky, kdy se budou všechna data ukládat bude lepší vytvořit tabulky, která bude obsahovat jména všech tabulek (s dalšími údaji), ve kterých terpve budou data uložena, nebo to vše narvat do jedné obrovské tabulky, přičemž id snapshotu bude další sloupec - to bude asi pomalejší pro select? Náhodný přístup ani není víceméně třeba, tak to asi udělám jako supertabulka se jmény tabulek s daty.

    Díky všem za odpovědi.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.