Předumpování databáze, aneb bude to brnkačka

Rád se podělím o jednu epizodu z práce adminstrátorské, protože obsahuje pár technických zvrat(k)ů a možná i obecné životní poučení :)

Začátek

Kolega se snažil zkopírovat jednu instanci databáze do druhé. Jenže se mu to pořád nedařilo. Řešili to na poradách už asi tři týdny a pořád žádný výsledek. Už od začátku jsem v hlavě tušil, že bych hravě zvládnul, ale sám toho mám hodně a vůbec, tenhle projekt není moje starost. Jenže to porady pořád natahovalo a už to začínal být opruz i pro mě. Tak jsem se do toho vložil a dobrovolně se nabídl, že vyřeším.

O co jde

Jedná se o jednu Percona 5.6, čistě InnoDB databázi, ve které začalo konstantně leakovat místo na disku:
Graf

Projekt trochu znám a tušil jsem, že tam bude hodně databází a tabulek. Řešení za mě je komplet předumpování do nové čisté instance. Kolega zkoušel všelijak binárně a pomocí replikace bez výpadku, ale nikam se nedostal. A vůbec, dump je grunt, jak říkal můj dědeček administrátor. Navíc jsem se cítil silný v kramflecích, už jsem toto v menším měřítku párkrát dělal.

Prvotní zmapování

SELECT concat(table_schema, '.', table_name) tbl, engine, concat(round(table_rows/1000000,2),'M') rows, concat(round(data_length/(1024*1024*1024),2),'G') DATA, concat(round(index_length/(1024*1024*1024),2),'G') idx, concat(round((data_length+index_length)/ (1024*1024*1024),2),'G') total_size, round(index_length/data_length,2) idxfrac FROM information_schema.TABLES WHERE table_schema not in ('mysql', 'performance_schema', 'information_schema') ORDER BY data_length+index_length DESC;

Plán akce

while read -r db tabulka; do (( i++ )) echo "(${i} / ${tabulky_pocet}) ${db}.${tabulka}" while (( $(jobs -p | wc -l) >= $POCET_PARALELNICH )); do sleep 0.1 done predumpuj "$db" "$tabulka" & done <<< "$tabulky" wait echo "Done"

První test

Bash bug?

Jiná paralelizace

První ostrý pokus

Čím to je?

Druhý ostrý pokus

Konec a poučení?

Bonus na závěr

Komentáře

Poznas prikaz parallel?

debian.plus@protonmail.com

19.6.2020 09:36 henk | skóre: 2 | blog: henkovi_prdy
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

Vím, že existuje. Ale xargs znám už déle, tak dostal přednost. Navíc mi parallel nepřišel moc intuitivní, když jsem na něj koukal naposled.

19.6.2020 10:21 z_sk | skóre: 34 | blog: analyzy
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

Ja preferujem na pararell nieco: v tom duchu (zas bez toho formatovanie vety v tom a s :::: som pouzival)

debian.plus@protonmail.com

projekt, ktery ma 5000 databazi a celkem 550 000 tabulek? Tim se ridi zemekoule, vesmir nebo Agrofert? Uz u SAP jsem si rikal, ze kdyz to ma v zakladni sestave 60 000 tabulek, tak ze se panove analytici u SAP zblaznili, ale jak je videt ono se to da gradovat.

Ostatne soudim, ze fandove relacnich databazi a cele te teorie okolo by se meli nechat vysetrit :-)

19.6.2020 12:26 Faceless man
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

Tabuliek v DB nieje nikdy dosť ! :-P

19.6.2020 12:29 ehmmm
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

A pritom to ma jen 100 GB. (?)

19.6.2020 12:41 Faceless man
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

Na SQL db málo !

19.6.2020 14:13 henk | skóre: 2 | blog: henkovi_prdy
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

:) Řekl bych co to je, ale nejsem si vůbec jistý jestli můžu. Je to prasečina a kdyby se na to někdo podíval, tak by možná zjistil, že půlka jde promazat. Ale to teď nikomu nestojí za námahu.

Jinak k těm prasečinám: viděl jsem i systém, který pro ukládání dat používal názvy sloupců. Následně narazil na interní limit MySQL, tak jsme mu kvůli tomu museli upgradovat na verzi, která má limit výše :)

19.6.2020 14:14 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

Neemuluje se těmi tabulkami dělení dat do partitions?

Hello world ! Segmentation fault (core dumped)

19.6.2020 15:40 podlesh
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

Myslím že je naprosto jasné že ty tabulky nivytvořil žádný analytik, ty jsou prostě generovány za běhu. Možná jsou to dočasné tabulky a chybí mazání?

19.7.2020 20:43 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Předumpování databáze, aneb bude to brnkačka

Viděl jsem projekt, který vytvářel DB per uživatele. Těch tabulek tam nebylo 110 per DB, ale trochu míň. Tuším snad SOGo nebo něco z balíku iRedMail. Je to prasárna, která nemá žádnou výhodu (možná až na jednoduchý drop v případě smazání uživatele). Navíc v žádném normálním DB produktu by to nešlo dělat, obvykle se připojuje ke konkrétní DB a nikoliv k serveru. Ale MySQL to má hold takto.

Ale proč to dělají takto fakt netuším. Když tam těch userů bude fakt hodně, tak v případě MySQL to znamená stejný počet adresářů. Tuším že u ext3 byl limit 32tis podadresářů v jednom adresáři. Tj jen 32tis uživatelů. Kdyby to bylo v normálně strukturované DB, tak by nebyl žádný problém několik milionů.

Heron