abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
dnes 06:00 | Komunita

Na YouTube byl publikován Blender Institute Reel 2016, ani ne dvouminutový sestřih z filmů, které vznikly za posledních 10 let díky Blender Institutu. V institutu aktuálně pracují na novém filmu Agent 327. Dění kolem filmu lze sledovat na Blender Cloudu. Videoukázka Agenta 327 z června letošního roku na YouTube.

Ladislav Hagara | Komentářů: 0
dnes 01:02 | Zajímavý článek

Minulý týden byly vydány verze 1.2.3 a 1.1.7 webového poštovního klienta Roundcube. V oznámení o vydání bylo zmíněno řešení bezpečnostního problému nalezeného společností RIPS a souvisejícího s voláním funkce mail() v PHP. Tento týden byly zveřejněny podrobnosti. Útočník mohl pomocí speciálně připraveného emailu spustit na serveru libovolný příkaz. Stejně, jak je popsáno v článku Exploit PHP’s mail() to get remote code execution z roku 2014.

Ladislav Hagara | Komentářů: 0
včera 16:00 | Nová verze

Byla vydána verze 0.98 svobodného nelineárního video editoru Pitivi. Z novinek lze zmínit například přizpůsobitelné klávesové zkratky. Videoukázka práce s nejnovější verzí Pitivi na YouTube.

Ladislav Hagara | Komentářů: 1
včera 15:00 | Zajímavý software

Stop motion je technika animace, při níž je reálný objekt mezi jednotlivými snímky ručně upravován a posouván o malé úseky, tak aby po spojení vyvolala animace dojem spojitosti. Jaký software lze pro stop motion použít na Linuxu? Článek na OMG! Ubuntu! představuje Heron Animation. Ten bohužel podporuje pouze webové kamery. Podpora digitálních zrcadlovek je začleněna například v programu qStopMotion.

Ladislav Hagara | Komentářů: 3
7.12. 21:21 | Nová verze Ladislav Hagara | Komentářů: 0
7.12. 11:44 | Zajímavý projekt

Na Indiegogo byla spuštěna kampaň na podporu herní mini konzole a multimediálního centra RetroEngine Sigma od Doyodo. Předobjednat ji lze již od 49 dolarů. Požadovaná částka 20 000 dolarů byla překonána již 6 krát. Majitelé mini konzole si budou moci zahrát hry pro Atari VCS 2600, Sega Genesis nebo NES. Předinstalováno bude multimediální centrum Kodi.

Ladislav Hagara | Komentářů: 2
7.12. 00:10 | Nová verze

Byla vydána verze 4.7 redakčního systému WordPress. Kódové označením Vaughan bylo vybráno na počest americké jazzové zpěvačky Sarah "Sassy" Vaughan. Z novinek lze zmínit například novou výchozí šablonu Twenty Seventeen, náhledy pdf souborů nebo WordPress REST API.

Ladislav Hagara | Komentářů: 8
6.12. 12:00 | Zajímavý projekt

Projekt Termbox umožňuje vyzkoušet si linuxové distribuce Ubuntu, Debian, Fedora, CentOS a Arch Linux ve webovém prohlížeči. Řešení je postaveno na projektu HyperContainer. Podrobnosti v často kladených dotazech (FAQ). Zdrojové kódy jsou k dispozici na GitHubu [reddit].

Ladislav Hagara | Komentářů: 27
6.12. 11:00 | Bezpečnostní upozornění

Byly zveřejněny informace o bezpečnostní chybě CVE-2016-8655 v Linuxu zneužitelné k lokální eskalaci práv. Chyba se dostala do linuxového jádra v srpnu 2011. V upstreamu byla opravena minulý týden [Hacker News].

Ladislav Hagara | Komentářů: 2
5.12. 22:00 | Komunita

Přibližně před měsícem bylo oznámeno, že linuxová distribuce SUSE Linux Enterprise Server (SLES) běží nově také Raspberry Pi 3 (dokumentace). Obraz verze 12 SP2 pro Raspberry Pi 3 je ke stažení zdarma. Pro registrované jsou po dobu jednoho roku zdarma také aktualizace. Dnes bylo oznámeno, že pro Raspberry Pi 3 je k dispozici také nové openSUSE Leap 42.2 (zprávička). K dispozici je hned několik obrazů.

Ladislav Hagara | Komentářů: 6
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (8%)
 (5%)
 (3%)
Celkem 799 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama
Štítky: není přiřazen žádný štítek

Dotaz: pgsql - rozdělit update kličkou na menší dávky

16.11.2010 09:14 jeleniste | skóre: 13 | blog: Prokustovo lože
pgsql - rozdělit update kličkou na menší dávky
Přečteno: 279×
Velký a paměťově náročný update mi končí s memory fail, když ho provádím po částech, tak to jde. Dotaz vypadá asi tak
update tb1 
set cosi = neco_jinyho
from
(
  select
  tb1.id,  
  agregacni_fce(kousicky) neco jinyho
  from tI join tII
  on tb1.id = tII.id
  group by tb1.id

)dta
where tb1.id = dta.id

(snad sem nic nevynechal)
no, ja bych to chtel rozdelit na mensi sousta podle nejakyho toho CTID, nebo OID a prohnat to smyckou, mam zhruba predstavu, jak bysem to delal, ale neumim plSQL (sem doma na MSSQL), takze bych to asi delal pomoci davkovyho souboru, kde bych volal dokolecka psql, coz ale je evidentne dost neohrabany. Nemate nekdo v zalozkach link, kde se neco podobnyho resi primo v plSQL (plpython pouzit nemuzu protoze postgre na win..). Diky
Nejsem blbý, jen se hloupě ptám

Odpovědi

16.11.2010 09:21 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
tuto sem si vyguglil
bude mi to fungovat aji na postgre???
for i in 1..(select count(*)/500 from tbl) loop
    update tbl1
     ........ where ctid between i*500 and (i+1) * 500;
end loop;
bude tohle delat to co potrebuju
Nejsem blbý, jen se hloupě ptám
16.11.2010 09:24 Filip Jirsák | skóre: 66 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
Zkuste PostgreSQL wiki, jsou tam české i anglické triky a řešení, třeba tam něco pro inspiraci najdete – třeba Fast first n rows removing by mohlo pomoci.
16.11.2010 13:38 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
chm, tam píšou, že pro update/delete nejde použít limit.., přižemž tady http://www.postgres.cz/index.php/PostgreSQL_SQL_Tricks#Removing_of_duplicate_rows je limit pro mazání duplicit použitej, no, stejná finta by šla použít i na to dávkování, brát jich LIMIT 500 a mít where col is null.
Nejsem blbý, jen se hloupě ptám
16.11.2010 13:40 jeleniste | skóre: 13 | blog: Prokustovo lože
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
ajaj, teď plácám koniny, sem si to blbě přečet.
Nejsem blbý, jen se hloupě ptám
default avatar 16.11.2010 20:14 default | skóre: 22 | Madrid
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
Eště aby ti to fungovalo, když tam máš kartézák jak kráva:
update tb1 
set cosi = neco_jinyho
from
(
  select
  tb1.id,  
  agregacni_fce(kousicky) neco jinyho
  from tI join tII
  on tb1.id = tII.id
  group by tb1.id

)dta
where tb1.id = dta.id

Zkus tohle:
UPDATE tb1
SET
    tb1.cosi = (SELECT
                AGG(...) AS neco_jinyho
            FROM
                tii INNER JOIN ti ON (tii.id = ti.ref_id) -- uprav si Join Condition
            WHERE
                tii.id = tb1.id
            GROUP BY
                tii.id)
WHERE
    EXISTS (SELECT
                1
            FROM
                tii INNER JOIN ti ON (tii.id = ti.ref_id) -- viz výše
            WHERE
                tii.id = tb1.id)
/
Tohle prostě musí fungovat. Takovýhle dotazy pouštím obden nad miliony záznamy.

Ta GROUP BY klauzule tam vpodstatě být nemusí, protože v SELECT klauzuli je jen ta agregačka.

Dotaz zupdatuje sloupek COSI výpočtem nějaký agregačky pro všechny záznamy tabulky TB1, pro které existují odpovídající záznamy ve spojení tabulek TI a TII.

Rozdělení na více dotazů moc nedoporučuji. Dělá to jen problémy.

Podle toho, co jsem z tvého příkladu pochopil, omezuješ množinu TII množinou TI. Jinými slovy, v tabulce TII máš víc záznamů, které nechceš zahrnout do agregačky. V tom případě doporučuji udělat dočasnou tabulku:
CREATE TABLE tmp_data AS
SELECT
    tii.id AS tii_id,
    "další",
    "sloupce",
    "pro",
    "agregačku"
FROM
    tii INNER JOIN ti ON (tii.id = ti.ref_id) -- uprav si Join Condition
/

CREATE INDEX idx_tmpdata ON tmp_data (tii_id)
/
a vypočítat tuto agregačku z této tabule. V případě, že tabulka TII obsahuje více nerelevantních záznamů než tabulka TB1, můžeš tyto záznamy též odstranit například dalším INNER JOINem. Ten index může být klidně složený. Databázi pak bude stačit probrousit index a s přístupem do vlastní tabule nebude ztrácet čas.

Když i tohle bude málo, pak si z týhle tabule předpočítej i tu agregačku a to už musí fungovat i kdybys nechtěl. :-)

Když sem nahraješ nějaký rozumný demo na hraní, možná ti i někdo pomůže. Takhle nevíme, jestli je ten tvůj dotaz špatně v reálu, nebo si jen nezvládnul obfuskaci. :-D
19.11.2010 11:44 jeleniste
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
Díky, no ten dotaz přesně, kterej jsem pouštěl je trochu jinej, nemam to tady, lovil jsem z paměti. V podstatě jde o to, mám dvě tabulky, tabulku body a spojení, (ježkovy voči, teď mi to došlo, jsem teda blbej - je tam ještě třetí tabulka hrany, já blbec updatoval spojení, jsem teda pitomej) a já mam u bodů geometrii, u spojení ne, tady sem vynechal tabulku a skonil jsem to -ouvej
takže mam tři tabulky, body (včetně geometrie), spojení a hrany, přičemž spojení spojuje 1:1 body a n:1 hrany, chci u hran updatovat geometrii, přičemž ve spojení je popsaný pořadí bodů

update hrany
set geometrie = geom from
(select id_hrany, aggrfce(geom_body)
from spojeni, body
where 
spojeni.id_hrany = body.id_hrany
order by id_hrany, id_bodu
group by id_hrany
)hrgm
on id_hrany = id_hrany
default avatar 19.11.2010 20:37 default | skóre: 22 | Madrid
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
OKi, this changes everything again. :-D

Až budeš u toho, tak sem pastni DDL statementy relevantních tabulek a indexů a exekuční plán toho dotazu, co tak falíruje. Nejlépe ještě odhady množství dat v té které tabuli. A když ještě přihodíš sample data demostrující povahu produkčních dat, bude to skvělý.

A hlavně sem pastni ten dotaz neobfusknutej. Agregačních funkcí je spousta a spousta z nich jde nahradit jinými popřípadě nahradit úplně jiným způsobem. Taky si polož otázku, proč potřebuješ updatovat skoro všechno naráz. Třeba jen drobná změna v aplikaci tě zbaví této potřeby… Nebo to je noční dávka zpracovávající nějaké inkrementy? V tom případě by mohl pomoci refaktor schématu. Ale to už jsem se nechal unést mou denní realitou. :-D

Jakou verzi DB používáš?
21.11.2010 22:12 jeleniste
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
Ne, je to věc, kterou potřebuju provýst právě jednou a to při importu dat. Myslim si, že to chcípá anžto jedna lomená čára má fakt enormní počet bodů a na tom mě to zdechne. Chroustá to cca 30 min a pak finito. ODhad dat dodam, teď mi to chroustá, ale vzorek bohužel dát nemůžu, nejsou to moje dta. Ale jsou tak středně velký jedná se o update asi 600 tisích záznamů - takže zase tak velký to neni.
Hází to něco jako memory fail, 27 (přesný znění teď nemám, pustil jsem ten explain a neuložil jsem si to před tim. Kdyžtak dodám posléze.
update hranice_parcel
set geometry = geom.geometry
from
  (
   select
   hp_id,
   ST_MakeLine(geometry) geometry
   from
    (
      select 
       hp_id, sour.geometry
      from
       spojeni_b_poloh spojeni,
       souradnice_obrazu sour
      where
        sour.id = spojeni.bp_id
      order by poradove_cislo_bodu
      offset 0
    ) body
    where hp_id is not null
    group by  hp_id
    having count(*)>1 --pridano 
    offset 0
  ) geom
where hp_id = hranice_parcel.id;
"Update  (cost=730850.00..732569.06 rows=200 width=173)"
"  ->  Nested Loop  (cost=730850.00..732569.06 rows=200 width=173)"
"        ->  Subquery Scan on geom  (cost=730850.00..730855.50 rows=200 width=87)"
"              ->  Limit  (cost=730850.00..730853.50 rows=200 width=55)"
"                    ->  HashAggregate  (cost=730850.00..730853.50 rows=200 width=55)"
"                          Filter: (count(*) > 1)"
"                          ->  Subquery Scan on body  (cost=685441.55..713875.14 rows=2263314 width=55)"
"                                Filter: (body.hp_id IS NOT NULL)"
"                                ->  Limit  (cost=685441.55..691128.27 rows=2274687 width=49)"
"                                      ->  Sort  (cost=685441.55..691128.27 rows=2274687 width=49)"
"                                            Sort Key: spojeni.poradove_cislo_bodu"
"                                            ->  Hash Join  (cost=56887.43..212019.03 rows=2274687 width=49)"
"                                                  Hash Cond: (spojeni.bp_id = sour.id)"
"                                                  ->  Seq Scan on spojeni_b_poloh spojeni  (cost=0.00..72125.87 rows=2274687 width=28)"
"                                                  ->  Hash  (cost=41356.30..41356.30 rows=729530 width=43)"
"                                                        ->  Seq Scan on souradnice_obrazu sour  (cost=0.00..41356.30 rows=729530 width=43)"
"        ->  Index Scan using ih_hp_id on hranice_parcel  (cost=0.00..8.56 rows=1 width=109)"
"              Index Cond: (hranice_parcel.id = geom.hp_id)"
21.11.2010 22:31 jeleniste
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
ERROR:  out of memory
DETAIL:  Failed on request of size 27.


********** Chyba **********

ERROR: out of memory
Stav SQL: 53200
Podrobnosti:Failed on request of size 27.
21.11.2010 22:39 jeleniste
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
729530 bodu
2274687 spojeni (ale ne všechna jsou hranice parcel - tady bych mohl nějak ušetřit - ale když jsem dal where hp%id is not null, tak to nepomohlo)
669749 hranic parcel
přičemž všechny ty spojovací položky jsou indexovaný using hash
18.11.2010 15:53 jos
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
střelba od boku: nezdaj se mi tam ty závorky, možná se databáze snaží materializovat moc dat najednou, nešlo by jen:
update tI 
set cosi = neco_jinyho
from
tI
join (
  select
    id, agregacni_fce(kousicky) neco_jinyho
  from tI
  join tII on tI.id = tII.id
  group by tI.id
)dta on tI.id = dta.id
což by ve výsledku nemuselo bejt tak paměťově náročný
19.11.2010 11:45 jeleniste
Rozbalit Rozbalit vše Re: pgsql - rozdělit update kličkou na menší dávky
Jsem to asi zkomolil, díky

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.