abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

včera 23:55 | IT novinky

Google na YouTube oficiálně představil Android 8.0 Oreo. Přehled novinek v příspěvku na blogu věnovaném vývojářům.

Ladislav Hagara | Komentářů: 1
včera 16:44 | Zajímavý článek

Po téměř 3 měsících od vydání třetího čísla publikoval Michal Špaček na svých stránkách čtvrté číslo newsletteru věnovanému bezpečnosti, bezpečnému vývoji převážně webových aplikací a bezpečnosti uživatelů. Jedná se současně o číslo poslední: "Nepíše se mi to lehce, a trvalo to, než jsem to ze sebe dostal, ale tohle je poslední newsletter v této podobě. Ani jsem ho nestihl pojmenovat a už jsem ho zabil. Nezbývá mi tolik času, abych každou událost, novinku a změnu v prohlížeči detailně popisoval tak, jak bych v newsletteru chtěl, mrzí mě to".

Ladislav Hagara | Komentářů: 0
včera 07:00 | Nová verze

Byla vydána diaspora* ve verzi 0.7.0.0. Jedná se o svobodný software, který slouží jako osobní webový server pro poskytování služeb sociální sítě (Wikipedie). Přehled novinek v příspěvku na blogu a na GitHubu. Sociální síť diaspora* byla před pěti lety předána komunitě.

Ladislav Hagara | Komentářů: 0
včera 06:00 | IT novinky

Společnost Hardkernel stojící za jednodeskovými počítači ODROID představila na YouTube minipočítač určený pro domácí cloud ODROID-HC1 vycházející z ODROID-XU4. Minipočítač s kovovou krabičkou, do které stačí vložit 2 a půl palcový disk, lze koupit za 49 dolarů. ODROID-HC1 je stohovatelný.

Ladislav Hagara | Komentářů: 26
20.8. 16:22 | Nová verze

Byl vydán DB Browser for SQLite (sqlitebrowser) ve verzi 3.10.0. Nejnovější stabilní verze této grafické nadstavby nad relačním databázovým systémem SQLite (Wikipedie) přináší například integraci s DBHub.io, tj. platformou pro sdílení SQLite databází. Podrobnosti na GitHubu.

Ladislav Hagara | Komentářů: 2
20.8. 08:00 | IT novinky

Andy Rubin, spoluzakladatel společnosti Android, jež byla v roce 2005 koupena Googlem, nyní CEO společnosti Essential Products, oznámil předprodej chytrého telefonu Essential. Telefon se začne rozesílat 1. září. Cena telefonu je 699 dolarů. Cena telefonu současně s 360° kamerou s rozlišením 4K byla stanovena na 749 dolarů. Kameru, v budoucnu i další příslušenství, lze k telefonu připojit pomocí konektoru s magnety.

Ladislav Hagara | Komentářů: 0
19.8. 13:44 | Zajímavý software

Evropská komise vydala novou verzi 1.4.0.1 svého open source v Javě naprogramovaného softwaru pro online průzkumy EUSurvey. Online dotazníky lze vytvářet na stránkách Evropské komise nebo si lze software stáhnout (zip a war) a nainstalovat lokálně. Zdrojové kódy jsou k dispozici pod licencí EUPL (European Union Public Licence).

Ladislav Hagara | Komentářů: 0
18.8. 23:55 | Komunita

Ubuntu 17.10 (Artful Aardvark) bude ve výchozím stavu zobrazovat Dok (Launcher). Jedná se o rozšíření GNOME Shellu Ubuntu Dock. To bylo forknuto z rozšíření Dash to Dock. Ukázka na YouTube [reddit].

Ladislav Hagara | Komentářů: 8
17.8. 15:33 | Nová verze

Byla vydána verze 17.08.0 KDE Aplikací (KDE Applications). Přehled novinek v kompletním seznamu změn a na stránce s dalšími informacemi. Aplikace kmag, kmousetool, kgoldrunner, kigo, konquest, kreversi, ksnakeduel, kspaceduel, ksudoku, kubrick, lskat a umbrello byly portovány na KDE Frameworks 5.

Ladislav Hagara | Komentářů: 0
17.8. 15:11 | Nová verze

Simon Long představil na blogu Raspberry Pi novou verzi 2017-08-16 linuxové distribuce Raspbian určené především pro jednodeskové miniaturní počítače Raspberry Pi. Společně s Raspbianem byl aktualizován také instalační nástroj NOOBS (New Out Of the Box Software). Nejnovější Raspbian je založen na Debianu 9 Stretch. Přehled novinek v poznámkách k vydání. Řešena je také bezpečnostní chyba Broadpwn (CVE-2017-9417).

Ladislav Hagara | Komentářů: 2
Těžíte nějakou kryptoměnu?
 (4%)
 (2%)
 (18%)
 (76%)
Celkem 371 hlasů
 Komentářů: 21, poslední 13.8. 09:57
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: pgsql - rozdělit update kličkou na menší dávky

    16.11.2010 09:14 jeleniste | skóre: 13 | blog: Prokustovo lože
    pgsql - rozdělit update kličkou na menší dávky
    Přečteno: 283×
    Velký a paměťově náročný update mi končí s memory fail, když ho provádím po částech, tak to jde. Dotaz vypadá asi tak
    update tb1 
    set cosi = neco_jinyho
    from
    (
      select
      tb1.id,  
      agregacni_fce(kousicky) neco jinyho
      from tI join tII
      on tb1.id = tII.id
      group by tb1.id
    
    )dta
    where tb1.id = dta.id
    
    
    (snad sem nic nevynechal)
    no, ja bych to chtel rozdelit na mensi sousta podle nejakyho toho CTID, nebo OID a prohnat to smyckou, mam zhruba predstavu, jak bysem to delal, ale neumim plSQL (sem doma na MSSQL), takze bych to asi delal pomoci davkovyho souboru, kde bych volal dokolecka psql, coz ale je evidentne dost neohrabany. Nemate nekdo v zalozkach link, kde se neco podobnyho resi primo v plSQL (plpython pouzit nemuzu protoze postgre na win..). Diky
    Nejsem blbý, jen se hloupě ptám

    Odpovědi

    16.11.2010 09:21 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    tuto sem si vyguglil
    bude mi to fungovat aji na postgre???
    for i in 1..(select count(*)/500 from tbl) loop
        update tbl1
         ........ where ctid between i*500 and (i+1) * 500;
    end loop;
    bude tohle delat to co potrebuju
    Nejsem blbý, jen se hloupě ptám
    16.11.2010 09:24 Filip Jirsák | skóre: 66 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    Zkuste PostgreSQL wiki, jsou tam české i anglické triky a řešení, třeba tam něco pro inspiraci najdete – třeba Fast first n rows removing by mohlo pomoci.
    16.11.2010 13:38 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    chm, tam píšou, že pro update/delete nejde použít limit.., přižemž tady http://www.postgres.cz/index.php/PostgreSQL_SQL_Tricks#Removing_of_duplicate_rows je limit pro mazání duplicit použitej, no, stejná finta by šla použít i na to dávkování, brát jich LIMIT 500 a mít where col is null.
    Nejsem blbý, jen se hloupě ptám
    16.11.2010 13:40 jeleniste | skóre: 13 | blog: Prokustovo lože
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    ajaj, teď plácám koniny, sem si to blbě přečet.
    Nejsem blbý, jen se hloupě ptám
    default avatar 16.11.2010 20:14 default | skóre: 22 | Madrid
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    Eště aby ti to fungovalo, když tam máš kartézák jak kráva:
    update tb1 
    set cosi = neco_jinyho
    from
    (
      select
      tb1.id,  
      agregacni_fce(kousicky) neco jinyho
      from tI join tII
      on tb1.id = tII.id
      group by tb1.id
    
    )dta
    where tb1.id = dta.id
    
    
    Zkus tohle:
    UPDATE tb1
    SET
        tb1.cosi = (SELECT
                    AGG(...) AS neco_jinyho
                FROM
                    tii INNER JOIN ti ON (tii.id = ti.ref_id) -- uprav si Join Condition
                WHERE
                    tii.id = tb1.id
                GROUP BY
                    tii.id)
    WHERE
        EXISTS (SELECT
                    1
                FROM
                    tii INNER JOIN ti ON (tii.id = ti.ref_id) -- viz výše
                WHERE
                    tii.id = tb1.id)
    /
    
    Tohle prostě musí fungovat. Takovýhle dotazy pouštím obden nad miliony záznamy.

    Ta GROUP BY klauzule tam vpodstatě být nemusí, protože v SELECT klauzuli je jen ta agregačka.

    Dotaz zupdatuje sloupek COSI výpočtem nějaký agregačky pro všechny záznamy tabulky TB1, pro které existují odpovídající záznamy ve spojení tabulek TI a TII.

    Rozdělení na více dotazů moc nedoporučuji. Dělá to jen problémy.

    Podle toho, co jsem z tvého příkladu pochopil, omezuješ množinu TII množinou TI. Jinými slovy, v tabulce TII máš víc záznamů, které nechceš zahrnout do agregačky. V tom případě doporučuji udělat dočasnou tabulku:
    CREATE TABLE tmp_data AS
    SELECT
        tii.id AS tii_id,
        "další",
        "sloupce",
        "pro",
        "agregačku"
    FROM
        tii INNER JOIN ti ON (tii.id = ti.ref_id) -- uprav si Join Condition
    /
    
    CREATE INDEX idx_tmpdata ON tmp_data (tii_id)
    /
    
    a vypočítat tuto agregačku z této tabule. V případě, že tabulka TII obsahuje více nerelevantních záznamů než tabulka TB1, můžeš tyto záznamy též odstranit například dalším INNER JOINem. Ten index může být klidně složený. Databázi pak bude stačit probrousit index a s přístupem do vlastní tabule nebude ztrácet čas.

    Když i tohle bude málo, pak si z týhle tabule předpočítej i tu agregačku a to už musí fungovat i kdybys nechtěl. :-)

    Když sem nahraješ nějaký rozumný demo na hraní, možná ti i někdo pomůže. Takhle nevíme, jestli je ten tvůj dotaz špatně v reálu, nebo si jen nezvládnul obfuskaci. :-D
    19.11.2010 11:44 jeleniste
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    Díky, no ten dotaz přesně, kterej jsem pouštěl je trochu jinej, nemam to tady, lovil jsem z paměti. V podstatě jde o to, mám dvě tabulky, tabulku body a spojení, (ježkovy voči, teď mi to došlo, jsem teda blbej - je tam ještě třetí tabulka hrany, já blbec updatoval spojení, jsem teda pitomej) a já mam u bodů geometrii, u spojení ne, tady sem vynechal tabulku a skonil jsem to -ouvej
    takže mam tři tabulky, body (včetně geometrie), spojení a hrany, přičemž spojení spojuje 1:1 body a n:1 hrany, chci u hran updatovat geometrii, přičemž ve spojení je popsaný pořadí bodů
    
    update hrany
    set geometrie = geom from
    (select id_hrany, aggrfce(geom_body)
    from spojeni, body
    where 
    spojeni.id_hrany = body.id_hrany
    order by id_hrany, id_bodu
    group by id_hrany
    )hrgm
    on id_hrany = id_hrany
    
    default avatar 19.11.2010 20:37 default | skóre: 22 | Madrid
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    OKi, this changes everything again. :-D

    Až budeš u toho, tak sem pastni DDL statementy relevantních tabulek a indexů a exekuční plán toho dotazu, co tak falíruje. Nejlépe ještě odhady množství dat v té které tabuli. A když ještě přihodíš sample data demostrující povahu produkčních dat, bude to skvělý.

    A hlavně sem pastni ten dotaz neobfusknutej. Agregačních funkcí je spousta a spousta z nich jde nahradit jinými popřípadě nahradit úplně jiným způsobem. Taky si polož otázku, proč potřebuješ updatovat skoro všechno naráz. Třeba jen drobná změna v aplikaci tě zbaví této potřeby… Nebo to je noční dávka zpracovávající nějaké inkrementy? V tom případě by mohl pomoci refaktor schématu. Ale to už jsem se nechal unést mou denní realitou. :-D

    Jakou verzi DB používáš?
    21.11.2010 22:12 jeleniste
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    Ne, je to věc, kterou potřebuju provýst právě jednou a to při importu dat. Myslim si, že to chcípá anžto jedna lomená čára má fakt enormní počet bodů a na tom mě to zdechne. Chroustá to cca 30 min a pak finito. ODhad dat dodam, teď mi to chroustá, ale vzorek bohužel dát nemůžu, nejsou to moje dta. Ale jsou tak středně velký jedná se o update asi 600 tisích záznamů - takže zase tak velký to neni.
    Hází to něco jako memory fail, 27 (přesný znění teď nemám, pustil jsem ten explain a neuložil jsem si to před tim. Kdyžtak dodám posléze.
    update hranice_parcel
    set geometry = geom.geometry
    from
      (
       select
       hp_id,
       ST_MakeLine(geometry) geometry
       from
        (
          select 
           hp_id, sour.geometry
          from
           spojeni_b_poloh spojeni,
           souradnice_obrazu sour
          where
            sour.id = spojeni.bp_id
          order by poradove_cislo_bodu
          offset 0
        ) body
        where hp_id is not null
        group by  hp_id
        having count(*)>1 --pridano 
        offset 0
      ) geom
    where hp_id = hranice_parcel.id;
    
    "Update  (cost=730850.00..732569.06 rows=200 width=173)"
    "  ->  Nested Loop  (cost=730850.00..732569.06 rows=200 width=173)"
    "        ->  Subquery Scan on geom  (cost=730850.00..730855.50 rows=200 width=87)"
    "              ->  Limit  (cost=730850.00..730853.50 rows=200 width=55)"
    "                    ->  HashAggregate  (cost=730850.00..730853.50 rows=200 width=55)"
    "                          Filter: (count(*) > 1)"
    "                          ->  Subquery Scan on body  (cost=685441.55..713875.14 rows=2263314 width=55)"
    "                                Filter: (body.hp_id IS NOT NULL)"
    "                                ->  Limit  (cost=685441.55..691128.27 rows=2274687 width=49)"
    "                                      ->  Sort  (cost=685441.55..691128.27 rows=2274687 width=49)"
    "                                            Sort Key: spojeni.poradove_cislo_bodu"
    "                                            ->  Hash Join  (cost=56887.43..212019.03 rows=2274687 width=49)"
    "                                                  Hash Cond: (spojeni.bp_id = sour.id)"
    "                                                  ->  Seq Scan on spojeni_b_poloh spojeni  (cost=0.00..72125.87 rows=2274687 width=28)"
    "                                                  ->  Hash  (cost=41356.30..41356.30 rows=729530 width=43)"
    "                                                        ->  Seq Scan on souradnice_obrazu sour  (cost=0.00..41356.30 rows=729530 width=43)"
    "        ->  Index Scan using ih_hp_id on hranice_parcel  (cost=0.00..8.56 rows=1 width=109)"
    "              Index Cond: (hranice_parcel.id = geom.hp_id)"
    
    21.11.2010 22:31 jeleniste
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    ERROR:  out of memory
    DETAIL:  Failed on request of size 27.
    
    
    ********** Chyba **********
    
    ERROR: out of memory
    Stav SQL: 53200
    Podrobnosti:Failed on request of size 27.
    21.11.2010 22:39 jeleniste
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    729530 bodu
    2274687 spojeni (ale ne všechna jsou hranice parcel - tady bych mohl nějak ušetřit - ale když jsem dal where hp%id is not null, tak to nepomohlo)
    669749 hranic parcel
    přičemž všechny ty spojovací položky jsou indexovaný using hash
    18.11.2010 15:53 jos
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    střelba od boku: nezdaj se mi tam ty závorky, možná se databáze snaží materializovat moc dat najednou, nešlo by jen:
    update tI 
    set cosi = neco_jinyho
    from
    tI
    join (
      select
        id, agregacni_fce(kousicky) neco_jinyho
      from tI
      join tII on tI.id = tII.id
      group by tI.id
    )dta on tI.id = dta.id
    
    což by ve výsledku nemuselo bejt tak paměťově náročný
    19.11.2010 11:45 jeleniste
    Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
    Jsem to asi zkomolil, díky

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.