abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 18:11 | IT novinky

    Dnes a zítra probíhá vývojářská konference Google I/O 2025. Sledovat lze na YouTube a na síti 𝕏 (#GoogleIO).

    Ladislav Hagara | Komentářů: 0
    dnes 15:22 | Komunita

    V Bostonu probíhá konference Red Hat Summit 2025. Vybrané přednášky lze sledovat na YouTube. Dění lze sledovat na síti 𝕏 (#RHSummit).

    Ladislav Hagara | Komentářů: 0
    dnes 15:00 | Nová verze

    Společnost Red Hat oficiálně oznámila vydání Red Hat Enterprise Linuxu 10. Vedle nových vlastností přináší také aktualizaci ovladačů a předběžné ukázky budoucích technologií. Podrobnosti v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 1
    dnes 12:22 | Pozvánky

    Tuto sobotu 24. května se koná historicky první komunitní den projektu Home Assistant. Zváni jsou všichni příznivci, nadšenci a uživatelé tohoto projektu. Pro účast je potřebná registrace. Odkazy na akce v Praze a v Bratislavě.

    jose17 | Komentářů: 0
    dnes 04:44 | IT novinky

    Troy Hunt představil Have I Been Pwned 2.0, tj. nový vylepšený web služby, kde si uživatelé mohou zkontrolovat, zda se jejich hesla a osobní údaje neobjevili v únicích dat a případně se nechat na další úniky upozorňovat.

    Ladislav Hagara | Komentářů: 13
    včera 23:22 | Zajímavý software

    Microsoft představil open source textový editor Edit bežící v terminálu. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 7
    včera 22:22 | Zajímavý software

    V Seattlu a také online probíhá konference Microsoft Build 2025. Microsoft představuje své novinky. Windows Subsystem for Linux je nově open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 0
    včera 13:11 | Zajímavý článek

    Z příspěvku Turris Sentinel – co přinesl rok 2024 na blogu CZ.NIC: "Za poslední rok (únor 2024 – únor 2025) jsme zachytili 8,3 miliardy incidentů a to z 232 zemí a z jejich závislých území. Tyto útoky přišly od 6,2 milionu útočníků (respektive unikátních adres). SMTP minipot je stále nejlákavější pastí, zhruba 79 % útoků bylo směřováno na tento minipot, 16 % útoků směřovalo na minipot Telnet, 3 % útoků směřovaly na minipot HTTP a 2 % na minipot FTP. Dále jsme zaznamenali 3,2 milionu unikátních hesel a 318 tisíc unikátních loginů, které útočníci zkoušeli."

    Ladislav Hagara | Komentářů: 1
    včera 12:44 | Nová verze

    Byla vydána (Mastodon, 𝕏) nová verze 3.0.4 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP je již k dispozici také na Flathubu.

    Ladislav Hagara | Komentářů: 0
    včera 12:33 | Nová verze

    Byla vydána nová stabilní verze 7.4 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 136. Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (60%)
     (23%)
     (9%)
     (2%)
     (0%)
     (0%)
     (6%)
    Celkem 47 hlasů
     Komentářů: 5, poslední dnes 20:57
    Rozcestník

    Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB

    26.6.2021 21:54 | programovanie | poslední úprava: 26.6.2021 22:21

    Online zde (slovenština).

    Inspirovanou diskusním dotazem „3700 tabuliek“.        

    Hodnocení: 44 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    27.6.2021 11:50 Matlák
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    Pěkné srovnání a odkazované čtení o hash tabulkách v PHP (ačkoliv se domnívám že PHP se na velké projekty nehodí a ani na velká data ne - třiceti terabajty dat zmíněných v dotazu "3700 tabuliek" bych PHP rozhodně nekrmil :-)), jen to LENGHT tam pěkně tahá za oči, to bych být tebou opravil.
    27.6.2021 11:51 Matlák
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    s/zmíněných/zmíněnými/
    27.6.2021 15:38 z_sk | skóre: 34 | blog: analyzy
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    Ahoj.

    Ono treba poznat limity nastrojov, a bud volit iny alebo zmenit architektiru. Je rozdiel robit softver pre delenie cisiel v textovej forme s dlzkou do 10B na cislo a druhe, ze cislo moze byt nekonecne dlhe (iba limit hardveru). Ja som potom indexoval inac (robene pre nekonecno), lebo PHP a kolko mam RAM sa mi nechcelo riesti.

    No moje porovnavanie dava, co ponuk one box riesenie PHP bez optimalizacii (zo uz zrejme by muselo byt prepisany kod do C, C++ alebo Rust).

    K jeho diskusii. Nepise kolko ma dotazov. Co mne vyslo, tak 11GB databaza pri jeho jednej popisanej struktury ma tabulka 22M zaznamov. Nevyhnutny cas pre import je nacitanie zo suboru a zapisat DB interne. Cize zapisat 2x11GB=2x3,6s (disk 50MB/s). K tomu ak easy riesenie este zotriedenie dat v poli s pametanim kluca, tak nam vychadza pri 22M polozkach zabere 2 229 MB a 36.506s. Ak ma DB velku 11 GB, tak pri 32 GB RAM sa mu to v pohode zmesti do RAM. Takze na nevytazenom systeme to trva aktualizacia dajme 1 minutu. 3600 tabuliek = 2.29 dna v najhorsom pripade. Takze zalezi kolko tabuliek sa akt. Ak je potrebne aktualizovat vela, tak zotriedit v BTree strome a podobne.
    debian.plus@protonmail.com
    27.6.2021 16:21 z_sk | skóre: 34 | blog: analyzy
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    Ach moje pocitanie, oprava:

    zapis (50 MB/s)zotredeniaexport/import (1 DB)export (3300 DB, najhorsi scenar)
    2 x 220 s36,506 s476,5 s18,19 dni
    2 x 220 s0 s440 s16,80 dni

    zapis (200 MB/s)zotredeniaexport/import (1 DB)export (3300 DB, najhorsi scenar)
    2 x 55 s36,506 s38,326 s5,59 dni
    2 x 55 s0 s440 s4,20 dni

    DB ma 11 GB.

    To moze byt rad, ze mu to trva 1 den ked porovna najhorsie scenare. :)
    debian.plus@protonmail.com
    28.6.2021 03:08 z_sk | skóre: 34 | blog: analyzy
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    Správne: Ach moje počítanie, oprava:
    zapis (50 MB/s)zotredeniaexport/import (1 DB)export (3300 DB, najhorsi scenar)
    2 x 220 s36,506 s476,5 s18,19 dni
    2 x 220 s0 s440 s16,80 dni

    zapis (200 MB/s)zotredeniaexport/import (1 DB)export (3300 DB, najhorsi scenar)
    2 x 55 s36,506 s38,326 s5,59 dni
    2 x 55 s0 s110 s4,20 dni

    DB ma 11 GB.

    Hm, prečo interné neukladá si vo vlastnej implementovanej DB ako CVS, ved aj sqlite je vlastne txt subor, iba inak zabalene dáta. Tuším aj nejaká DB (tuším MariaDB) povoľuje ukladať ako CVS.

    Hm, keby sa ešte ukladať dáta zazipované, tak bolo by to menej miesta zaberalo, resp. bolo nutné ukladať.

    Pre 22M záznamov:

    284M	cvs.txt
    111M	cvs.txt.gz

    debian.plus@protonmail.com
    28.6.2021 09:28 samalama
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    prosim vas, ako sa da niekto zakazat na internete...?
    28.6.2021 11:17 t@fu
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    No jednoducho - izolaciou. Nech sa realizuje na jednom fore, napr. na abclinuxu a na zbytok internetu nech nelozi :-)
    Člověk z Horní Dolní avatar 28.6.2021 13:54 Člověk z Horní Dolní | blog: blbeczhornidolni
    Rozbalit Rozbalit vše Re: Benchmark hašovacích tabuliek v PHP cez jednod. key-value DB
    PHP? LOL

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.