abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 02:22 | Nová verze

    Byla vydána nová stabilní verze 3.23.0, tj. první z nové řady 3.23, minimalistické linuxové distribuce zaměřené na bezpečnost Alpine Linux (Wikipedie) postavené na standardní knihovně jazyka C musl libc a BusyBoxu. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 18:11 | Nová verze

    Byla vydána verze 6.0 webového aplikačního frameworku napsaného v Pythonu Django (Wikipedie). Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 05:55 | Nová verze

    Po více než 7 měsících vývoje od vydání verze 6.8 byla vydána nová verze 6.9 svobodného open source redakčního systému WordPress. Kódové jméno Gene bylo vybráno na počest amerického jazzového klavíristy Gene Harrise (Ray Brown Trio - Summertime).

    Ladislav Hagara | Komentářů: 11
    včera 05:11 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za listopad (YouTube).

    Ladislav Hagara | Komentářů: 0
    včera 01:55 | Nová verze

    Google Chrome 143 byl prohlášen za stabilní. Nejnovější stabilní verze 143.0.7499.40 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 13 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    2.12. 19:33 | Nová verze

    Společnost Valve aktualizovala přehled o hardwarovém a softwarovém vybavení uživatelů služby Steam. Podíl uživatelů Linuxu dosáhl 3,2 %. Nejčastěji používané linuxové distribuce jsou Arch Linux, Linux Mint a Ubuntu. Při výběru jenom Linuxu vede SteamOS Holo s 26,42 %. Procesor AMD používá 66,72 % hráčů na Linuxu.

    Ladislav Hagara | Komentářů: 0
    2.12. 15:22 | IT novinky

    Canonical oznámil (YouTube), že nově nabízí svou podporu Ubuntu Pro také pro instance Ubuntu na WSL (Windows Subsystem for Linux).

    Ladislav Hagara | Komentářů: 0
    2.12. 13:11 | IT novinky

    Samsung představil svůj nejnovější chytrý telefon Galaxy Z TriFold (YouTube). Skládačka se nerozkládá jednou, ale hned dvakrát, a nabízí displej s úhlopříčkou 10 palců. V České republice nebude tento model dostupný.

    Ladislav Hagara | Komentářů: 9
    2.12. 12:33 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 25.11.1. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 1
    2.12. 04:00 | Nová verze

    Byla vydána nová verze 15.0 svobodného unixového operačního systému FreeBSD. Podrobný přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 7
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (47%)
     (19%)
     (18%)
     (23%)
     (15%)
     (25%)
     (16%)
     (18%)
    Celkem 426 hlasů
     Komentářů: 18, poslední 2.12. 18:34
    Rozcestník

    Dotaz: PostgreSQL indexy

    18.1.2012 14:04 Program
    PostgreSQL indexy
    Přečteno: 505×
    Zdravím, před nějakou dobou jsem narazil u MySQL na problémy s mazáním řádků ve velkých tabulkách (14-40 mil. řádků). Rychlost byla žalostná. Zkoušel jsem db přeimportovat na PostgreSQL (9.1), ale výsledek byl ještě horší. postmaster pořád počítal index (integer), skoro nehrabal na disk a operace trvaly řádově hodiny až dny.

    Zkusil jsem vytvořit nad tabulkou HASH indexy a hle, doba zpracování se smrskla na pár minut. Bohužel hash indexy jsou nedoporučované a plně nepodporované. Všude jsem se dočetl, že nemají výkonnostní benefit prakticky žádný.

    Chtěl jsem se tedy zeptat, jak to s indexy u psql je, přehlídl jsem nějakou možnou optimalizaci BTREE indexů, která by je posunula na úroveň HASH indexů?

    Mockrát díky.

    Odpovědi

    okbob avatar 18.1.2012 19:03 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: PostgreSQL indexy
    Jak mazete?

    Mazete jednim prikazem nebo iteracne

    Jedete v transakci?

    Chytal se vam index?

    co vam vypise EXPLAIN DELETE ... ?

    Update BTREE je relativne pomala operace (zvlast pokud jedete v nahodnem poradi) - pokud Vam pomuze HASH, tak to nereste - proste pred intenzivnim mazanim si vytvorte hash index, dropnete pripadne btree indexy, promazejte, dropnete hash index a vytvorte Btree. HASH index se prilis nepouziva, protoze je pouzitelny pouze pro filtrovani na rovnost. Pro vsechny ostatni operace se neda pouzit. Ve starsich verzich byl navic vykonostne horsi ve vsech ohledech nez BTREE. V 9 prosel refaktoringem. A to je tak asi vsechno o tom vim.

    Pro BTREE zkuste seradit ID, ktera mazete - tak abyste mazal vzestupne. Treba si je ulozit nekam do docasne tabulky

    id urcena ke smazani jsem ulozil do tabulky delid
    --overeni, ze se sortuje
    postgres=# explain DELETE FROM g USING delid WHERE g.i = delid.i;
                                           QUERY PLAN                                       
    ----------------------------------------------------------------------------------------
     Delete on g  (cost=11459.39..47502.35 rows=100000 width=12)
       ->  Merge Join  (cost=11459.39..47502.35 rows=100000 width=12)
             Merge Cond: (g.i = delid.i)
             ->  Index Scan using g_pkey on g  (cost=0.00..303936.00 rows=9999977 width=10)
             ->  Materialize  (cost=11459.32..11959.32 rows=100000 width=10)
                   ->  Sort  (cost=11459.32..11709.32 rows=100000 width=10)
                         Sort Key: delid.i
                         ->  Seq Scan on delid  (cost=0.00..1443.00 rows=100000 width=10)
    
    odstraneni 77 tis radku trvalo cca 57 ms
    18.1.2012 21:43 Program
    Rozbalit Rozbalit vše Re: PostgreSQL indexy
    Dobrý den a díky za odpověď.

    Maže se přes FK ON DELETE CASCADE, takže víceméně náhodně, ale pomalé jsou všechny operace nad danou tabulkou, kde se využívají klíče (zejména JOIN z odkazované tabulky). V update BTREE problém není, protože po přidání HASH indexu ty steré jsem nemazal (i když by to dost možná ještě více zrychlilo). Nepoužitým indexem to také není, protože to by skenovalo tabulku, což se nedělo.

    Co se explainu týče, teď ho po ruce nemám, ale nic zajímavého tam nebylo, jen z explain analyze byly vidět šílené časy.

    Mě jde o to, že i v PSQL 9. je HASH index nedoporučovaný a nelogovoaný, z dokumentace mi připadalo, že je to jakýsi pokus se kterým se nepočítá. Nic méně výkonnostní benefit byl obrovský a při použití jen BTREE indexů dotaz visel na procesoru a strašně dlouho. Nemyslím, že je na BTREE něco tak hrozně výpočetně náročného, takže by mě zajímalo, jestli to není třeba typická vlastnost nevhodného nastavení (až na shared buffers bylo asi všechno default).

    Díky
    okbob avatar 18.1.2012 22:13 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: PostgreSQL indexy
    Z testů by HASH index neměl být extrémně lepší než BTREE - spíše naopak - nicméně vždy záleží i na samotných datech. Možná mají Vaše data takové rozdělení a takový typ, že je na nich BTREE neefektivní a naopak HASH funguje výborně. Dovedu si představit, že pokud byste měl klíče textové v určitém tvaru, tak by BTREE nemusel dopadnout dobře. Musel bych mít v ruce Vaše data, abych se mohl podívat jak vypadá index zevnitř - případně se i vy sám můžete podívat na stav indexu - v contribu je modul pgstattuple, kde je funkce pgstatindex, která vrací fragmentaci indexu, hloubku indexu a další údaje.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.