Portál AbcLinuxu, 14. května 2025 05:52

Dotaz: generování db v postgresu

23.9.2012 11:20 jik
generování db v postgresu
Přečteno: 377×
Odpovědět | Admin
Zdravím, z nějakých dat generuji soubor, který obsahuje inserty do 2 závislých tabulek v podobě:

INSERT INTO tab1 (col1, col2) VALUES (2009, 'data1');

INSERT INTO tab2 (tab1_id, col3, col4) SELECT currval(pg_get_serial_sequence('tab1', 'id')), 600016, 'data2';

Potom to předhazuji postgresu příkazem:

psql databáze < soubor_insertů

Celé je to takto nehorázně pomalé. Zatím to nechci tlačit přes Perl - nevím, jestli bude webový server poskytovat Perl:DBI a DBD_Pg. Vcelku ideálně bych si představoval vzít proměnnou a do ní vložit hodnotu toho sekvenceru a potom do insertu dát tu proměnnou, nějak takto:

INSERT INTO tab1 (col1, col2) VALUES (2009, 'data1');

$var = currval(pg_get_serial_sequence('tab1', 'id'));

INSERT INTO tab2 (tab1_id, col3, col4) VALUES ($var, 600016, 'data2'), ...

Zatím jsem však nepřišel na to, jak takovouto proměnnou v postgresu vytvořit.
Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

23.9.2012 11:28 Kit
Rozbalit Rozbalit vše Re: generování db v postgresu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Uzavři ten soubor insertů do jedné transakce.
23.9.2012 13:11 jik
Rozbalit Rozbalit vše Re: generování db v postgresu
No, nějak nevím, jak na to. Zkusil jsem obalit ty inserty do podřízené tabulky:

INSERT INTO tab1 ...

BEGIN transaction

INSERT INTO tab2

...

END transaction

a doba vykonávání se nezměnila (na 11" prckovi necelých 13000 insertů za necelé 3 minuty.
23.9.2012 13:23 Kit
Rozbalit Rozbalit vše Re: generování db v postgresu
A proč ne všechny inserty? Jeden BEGIN; na začátek souboru a jeden COMMIT; na konec.
23.9.2012 13:41 Kit
Rozbalit Rozbalit vše Re: generování db v postgresu
Vložení 10000 záznamů na mém Celeronu: Bez transakce 118 sekund, vše v jedné transakci 6 sekund.
23.9.2012 14:03 jik
Rozbalit Rozbalit vše Re: generování db v postgresu
Joj! chybička se vloudila (chyběl středníček ...). Ze 2:45 na 0:18. Děkuji.
mess avatar 23.9.2012 13:59 mess | skóre: 43 | blog: bordel | Háj ve Slezsku - Smolkov
Rozbalit Rozbalit vše Re: generování db v postgresu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Jak už někdo říkal - uzavřít všechno do jedné transakce. A jako druhou věc bych zkusil místo INSERT postgresovský COPY FROM STDIN, když ten soubor takhle přesměrováváš na standardní vstup.
Cez párne mesiace zošíváš vaginy, cez neparne montuješ hajzle.
23.9.2012 18:02 jik
Rozbalit Rozbalit vše Re: generování db v postgresu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Stejně mám ještě otázku: Předpokládám, že tam bude nějaké kešování, ale nepředstavuje to opakované currval nadbytečnou zátěž, nebylo by šikovnější se na něj zeptat jen jednou, uložit a potom použít tuto uloženou proměnnou? Lze to v PostgreSQL nějak spáchat?
24.9.2012 13:22 Kit
Rozbalit Rozbalit vše Re: generování db v postgresu
Nejlépe to vložit přímo do druhého příkazu INSERT místo proměnné $var. PostgreSQL si to už dokáže optimalizovat sám.

Ještě lépe by bylo celý záznam odeslat jako jeden INSERT a uvnitř zpracovat vloženou procedurou. Otázkou je, zda se v dané aplikaci to úsilí vyplatí. Docílí se tím vyšší konzistence dat.
Heron avatar 26.9.2012 10:41 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: generování db v postgresu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pokud se jedná o jednorázové nahrání spousty dat, nejlepší řešení je COPY. To je daleko nejrychlejší cesta, jak data do PostgreSQL dostat. Co se týče sekvence, šlo by ji po bulk upload nastavit na požadovanou hodnotu.
Heron

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.