abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:33 | Komunita

    Richard Stallman dnes v Liberci přednáší o svobodném softwaru a svobodě v digitální společnosti. Od 16:30 v aule budovy G na Technické univerzitě v Liberci. V anglickém jazyce s automaticky generovanými českými titulky. Vstup je zdarma i pro širokou veřejnost.

    Ladislav Hagara | Komentářů: 8
    dnes 03:55 | Komunita

    sudo-rs, tj. sudo a su přepsáné do programovacího jazyka Rust, nahradí v Ubuntu 25.10 klasické sudo. V plánu je také přechod od klasických coreutils k uutils coreutils napsaných v Rustu.

    Ladislav Hagara | Komentářů: 0
    včera 22:11 | Nasazení Linuxu

    Fedora se stala oficiální distribucí WSL (Windows Subsystem for Linux).

    Ladislav Hagara | Komentářů: 1
    včera 13:22 | IT novinky

    Společnost IBM představila server IBM LinuxONE Emperor 5 poháněný procesorem IBM Telum II.

    Ladislav Hagara | Komentářů: 1
    včera 04:55 | Nová verze

    Byla vydána verze 4.0 multiplatformního integrovaného vývojového prostředí (IDE) pro rychlý vývoj aplikaci (RAD) ve Free Pascalu Lazarus (Wikipedie). Přehled novinek v poznámkách k vydání. Využíván je Free Pascal Compiler (FPC) 3.2.2.

    Ladislav Hagara | Komentářů: 1
    včera 00:33 | Komunita

    Podpora Windows 10 končí 14. října 2025. Připravovaná kampaň Konec desítek (End of 10) může uživatelům pomoci s přechodem na Linux.

    Ladislav Hagara | Komentářů: 29
    5.5. 23:22 | Pozvánky

    Již tuto středu proběhne 50. Virtuální Bastlírna, tedy dle římského číslování L. Bude L značit velikost, tedy více diskutujících než obvykle, či délku, neboť díky svátku lze diskutovat dlouho do noci? Bude i příští Virtuální Bastlírna virtuální nebo reálná? Nejen to se dozvíte, když dorazíte na diskuzní večer o elektronice, softwaru, ale technice obecně, který si můžete představit jako virtuální posezení u piva spojené s učenou

    … více »
    bkralik | Komentářů: 0
    5.5. 22:33 | IT novinky

    Dle plánu dnes končí služba Skype. Uživatelé mohou pokračovat v Microsoft Teams.

    Ladislav Hagara | Komentářů: 1
    5.5. 21:44 | IT novinky

    Český statistický úřad rozšiřuje Statistický geoportál o Datový portál GIS s otevřenými geografickými daty. Ten umožňuje stahování datových sad podle potřeb uživatelů i jejich prohlížení v mapě a přináší nové možnosti v oblasti analýzy a využití statistických dat.

    Ladislav Hagara | Komentářů: 2
    5.5. 12:33 | Zajímavý projekt

    Kevin Lin zkouší využívat chytré brýle Mentra při hraní na piano. Vytváří aplikaci AugmentedChords, pomocí které si do brýlí posílá notový zápis (YouTube). Uvnitř brýlí běží AugmentOS (GitHub), tj. open source operační systém pro chytré brýle.

    Ladislav Hagara | Komentářů: 1
    Jaký filesystém primárně používáte?
     (57%)
     (1%)
     (8%)
     (22%)
     (4%)
     (2%)
     (3%)
     (1%)
     (1%)
     (3%)
    Celkem 543 hlasů
     Komentářů: 23, poslední dnes 07:51
    Rozcestník

    Dotaz: PostgreSQL indexy

    18.1.2012 14:04 Program
    PostgreSQL indexy
    Přečteno: 485×
    Zdravím, před nějakou dobou jsem narazil u MySQL na problémy s mazáním řádků ve velkých tabulkách (14-40 mil. řádků). Rychlost byla žalostná. Zkoušel jsem db přeimportovat na PostgreSQL (9.1), ale výsledek byl ještě horší. postmaster pořád počítal index (integer), skoro nehrabal na disk a operace trvaly řádově hodiny až dny.

    Zkusil jsem vytvořit nad tabulkou HASH indexy a hle, doba zpracování se smrskla na pár minut. Bohužel hash indexy jsou nedoporučované a plně nepodporované. Všude jsem se dočetl, že nemají výkonnostní benefit prakticky žádný.

    Chtěl jsem se tedy zeptat, jak to s indexy u psql je, přehlídl jsem nějakou možnou optimalizaci BTREE indexů, která by je posunula na úroveň HASH indexů?

    Mockrát díky.

    Odpovědi

    okbob avatar 18.1.2012 19:03 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: PostgreSQL indexy
    Jak mazete?

    Mazete jednim prikazem nebo iteracne

    Jedete v transakci?

    Chytal se vam index?

    co vam vypise EXPLAIN DELETE ... ?

    Update BTREE je relativne pomala operace (zvlast pokud jedete v nahodnem poradi) - pokud Vam pomuze HASH, tak to nereste - proste pred intenzivnim mazanim si vytvorte hash index, dropnete pripadne btree indexy, promazejte, dropnete hash index a vytvorte Btree. HASH index se prilis nepouziva, protoze je pouzitelny pouze pro filtrovani na rovnost. Pro vsechny ostatni operace se neda pouzit. Ve starsich verzich byl navic vykonostne horsi ve vsech ohledech nez BTREE. V 9 prosel refaktoringem. A to je tak asi vsechno o tom vim.

    Pro BTREE zkuste seradit ID, ktera mazete - tak abyste mazal vzestupne. Treba si je ulozit nekam do docasne tabulky

    id urcena ke smazani jsem ulozil do tabulky delid
    --overeni, ze se sortuje
    postgres=# explain DELETE FROM g USING delid WHERE g.i = delid.i;
                                           QUERY PLAN                                       
    ----------------------------------------------------------------------------------------
     Delete on g  (cost=11459.39..47502.35 rows=100000 width=12)
       ->  Merge Join  (cost=11459.39..47502.35 rows=100000 width=12)
             Merge Cond: (g.i = delid.i)
             ->  Index Scan using g_pkey on g  (cost=0.00..303936.00 rows=9999977 width=10)
             ->  Materialize  (cost=11459.32..11959.32 rows=100000 width=10)
                   ->  Sort  (cost=11459.32..11709.32 rows=100000 width=10)
                         Sort Key: delid.i
                         ->  Seq Scan on delid  (cost=0.00..1443.00 rows=100000 width=10)
    
    odstraneni 77 tis radku trvalo cca 57 ms
    18.1.2012 21:43 Program
    Rozbalit Rozbalit vše Re: PostgreSQL indexy
    Dobrý den a díky za odpověď.

    Maže se přes FK ON DELETE CASCADE, takže víceméně náhodně, ale pomalé jsou všechny operace nad danou tabulkou, kde se využívají klíče (zejména JOIN z odkazované tabulky). V update BTREE problém není, protože po přidání HASH indexu ty steré jsem nemazal (i když by to dost možná ještě více zrychlilo). Nepoužitým indexem to také není, protože to by skenovalo tabulku, což se nedělo.

    Co se explainu týče, teď ho po ruce nemám, ale nic zajímavého tam nebylo, jen z explain analyze byly vidět šílené časy.

    Mě jde o to, že i v PSQL 9. je HASH index nedoporučovaný a nelogovoaný, z dokumentace mi připadalo, že je to jakýsi pokus se kterým se nepočítá. Nic méně výkonnostní benefit byl obrovský a při použití jen BTREE indexů dotaz visel na procesoru a strašně dlouho. Nemyslím, že je na BTREE něco tak hrozně výpočetně náročného, takže by mě zajímalo, jestli to není třeba typická vlastnost nevhodného nastavení (až na shared buffers bylo asi všechno default).

    Díky
    okbob avatar 18.1.2012 22:13 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: PostgreSQL indexy
    Z testů by HASH index neměl být extrémně lepší než BTREE - spíše naopak - nicméně vždy záleží i na samotných datech. Možná mají Vaše data takové rozdělení a takový typ, že je na nich BTREE neefektivní a naopak HASH funguje výborně. Dovedu si představit, že pokud byste měl klíče textové v určitém tvaru, tak by BTREE nemusel dopadnout dobře. Musel bych mít v ruce Vaše data, abych se mohl podívat jak vypadá index zevnitř - případně se i vy sám můžete podívat na stav indexu - v contribu je modul pgstattuple, kde je funkce pgstatindex, která vrací fragmentaci indexu, hloubku indexu a další údaje.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.