Pomalý SELECT

Skús EXPLAIN SELECT ... - to by Ti malo napovedať, či sa naozaj používajú indexy tam kde sa majú, alebo či ich treba vytvoriť / zmeniť / analyzovať (príkaz ANALYZE). Takto od pása by som ale tipoval, že pri prvom selecte sa to načítava z disku, preto to trvá dlhšie. Pri ďalších selectoch to potom už je v cache a ide to rádovo rýchlejšie. Ak sa to chvíľu nepoužíva, tak cache sa naplní inými vecami a zase sa to spomalí. Pomôže pridať do stroja viac RAM, ale ak sa jedná o naozaj veľkú databázu, tak potom už len optimalizovať aplikáciu.

17.12.2009 20:27 dusan456 | skóre: 12 | Poprad
Rozbalit Rozbalit vše Re: Pomalý SELECT

Ďakujem za info, dal som EXPAILN SELECT a dostal som tento výpis:

id 	select_type 	table 	type 	possible_keys 	key 	key_len 	ref 	rows 	Extra
1 	SIMPLE 	         A 	ref 	top_id, id 	top_id 	4 	       const 	636 	Using temporary; Using filesort
1 	SIMPLE 	         C 	ref 	id 	        id 	4 	    test.A._id 	  1 	 
1 	SIMPLE 	         B 	ref 	id,language 	id 	4 	    test.A._id 	 35 	Using where

Takže v A tabulke mám použiť spoločný index pre top_id a id?

Ja používam index pre top_id a id na každé samostatne.

17.12.2009 21:41 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
Rozbalit Rozbalit vše Re: Pomalý SELECT

Skús taký index vytvoriť a cez EXPLAIN pozrieť, či ho potom použije. Ak ho nepoužije, tak ho opäť zhodíš - nemáš čo stratiť...

18.12.2009 00:06 vlasta | skóre: 10 | Brno
Rozbalit Rozbalit vše Re: Pomalý SELECT

ohledne te rychlosti, jeste muze byt problem v tom razeni, paklize ten dotaz vraci tisice radku, tak nejvic zdrzuje tohle. Zkus, jak to rychle dobehne bez toho razeni... Dalsi vec, co jsem nepochopil, je ten group by... K cemu to tam vlastne je a nezarve pritom interpret, ze se nejedna o group by vyraz?

Jen poznámečka:
Pokud by se jednalo o MySQL, tak jsem měl zkušenost, že dotazy zapisované tímto způsobem (spojování tabulek přes WHERE) na velkých datech (statisíce až miliony řádku v několika tabulkách) bylo docela o dost pomalejší než použití klausule JOIN a potvrdilo se to i na M$SQL(už ale nevím verzi) i když tam byl rozdíl výrazně nižší.
Vysvětlil jsem si to tak, že při zápisu přes WHERE se vytvoří data na vše a pak se omezují a při JOINování dochází k postupné redukci dat, tudíž to nemá takové paměťové nároky.
A na Oracle (jen z konzultace, nezkoušel jsem to) je to prej jedno.

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

17.12.2009 23:01 dusan456 | skóre: 12 | Poprad
Rozbalit Rozbalit vše Re: Pomalý SELECT

..a nepomohol by ste mi prosim prerobiť to na JOIN dotaz? Ja som to stále nepochopil tie JOIN dotazy, ako to vlastne funguje.

17.12.2009 23:33 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Pomalý SELECT

Zkusil jsem to - nějak se mně to nezdá a skoro spím :(
Pokud bych se na to měl podívat vážně, tak mně sem hoďte strukturu těch tabulek, potřeboval bych vědět kde jsou PRIMARNI a UNIQUE klíče a zítra během dopoledne se na to juknu (poctivě)

SELECT A.name, A.id, B.popis, C.url, A.adresa, A.trieda
  FROM tab3 AS C
    LEFT JOIN tab1 AS A ON A.id=C.id AND A.top_id = '8930440'
    LEFT JOIN tab2 AS B ON B.id=C.id AND B.popistyp_id=11
      WHERE (B.language='sk' OR B.language='en')
      GROUP BY A.id
        ORDER BY B.language='sk' DESC

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

17.12.2009 23:39 vlasta | skóre: 10 | Brno
Rozbalit Rozbalit vše Re: Pomalý SELECT

myslim, ze pouziti left joinu muze rapidne zmenit mnozinu vracenych radku... Nehlede na to, ze outer joiny jsou obecne pomalejsi...

18.12.2009 00:00 dusan456 | skóre: 12 | Poprad
Rozbalit Rozbalit vše Re: Pomalý SELECT

Pripájam štruktúru tabuliek a vopred ďakujem za Vašu ochotu.

Ešte som tu aj čítal, že InnoDB je rýchlejšia, ako MYISAM, možno aj to by pomohlo??

CREATE TABLE `tab3` (
  `id` int(16) NOT NULL default '0',
  `url` varchar(255) default NULL,
  KEY `id` (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

CREATE TABLE `tab2` (
  `popis` text,
  `popistyp_id` int(6) NOT NULL default '0',
  `id` int(16) NOT NULL default '0',
  `language` char(2) default NULL,
  KEY `id` (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

CREATE TABLE `tab1` (
  `adresa` varchar(255) default NULL,
  `top_id` int(16) NOT NULL default '0',
  `trieda` char(2) default NULL,
  `id` int(16) NOT NULL default '0',
  `name` varchar(255) default NULL,
  KEY `top_id` (`top_id`),
  KEY `id` (`id`),
  KEY `name` (`name`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

18.12.2009 11:06 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Pomalý SELECT

Tak s touto strukturou, je asi JOIN vs. WHERE putna, bo je to opravdu každý s každým :), čekal jsem tam nějaké UNIQUE či PRIMARY
Můj předchozí pokus s LEFT JOIN je špatně.

PS: to ORDER BY, má být opravdu na pravdivostní hodnotu ?, dal bych tam jen ORDER BY B.language DESC nebo ORDER BY B.language ASC

Takže asi takto:

SELECT DISTINCT A.name, A.id, B.popis, C.url, A.adresa, A.trieda
  FROM (SELECT * FROM tab1 WHERE top_id = '8930440') AS A
       INNER JOIN tab2 AS B ON A.id = B.id AND B.popistyp_id =11 AND B.language IN ('sk', 'en')
       INNER JOIN tab3 AS C ON A.id = C.id 
  ORDER BY B.language DESC

Čekal bych vyšší výkon ale nevím (no a pak ještě doladit indexi podle EXPLAIN).

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

18.12.2009 11:36 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Pomalý SELECT

Ještě možná by pomohl jeden DISTINCT navíc.

SELECT DISTINCT A.name, A.id, B.popis, C.url, A.adresa, A.trieda
  FROM (SELECT DISTINCT name, id, adresa, trieda FROM tab1 WHERE top_id = '8930440') AS A
       INNER JOIN tab2 AS B ON A.id = B.id AND B.popistyp_id =11 AND B.language IN ('sk', 'en')
       INNER JOIN tab3 AS C ON A.id = C.id 
  ORDER BY B.language DESC

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

18.12.2009 14:28 vlasta | skóre: 10 | Brno
Rozbalit Rozbalit vše Re: Pomalý SELECT

Za predpokladu, ze id je v tab1 primarni klic, tak ten distinct ve vnitrnim selectu je naprosto zcestny, niceho tim nedosahnes, krom zpomaleni dotazu, coz je trosku v rozporu se zadanim.

A za hypotetickeho predpokladu, ze vazba mezi tabulkami 123 je 1:1, tak je k nicemu i ten prvni distinct.

A take nemuzu zapomenout na jeden dalsi fakt, ze MySQL pri pouziti nested selectu jaksi opomiji pouzit pri relaci index...

18.12.2009 14:44 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Pomalý SELECT

"Za predpokladu, ze id je v tab1 primarni ani unique klic" NIC není primární klíč :).
A tím pádem vnitřní distinct omezuje množinu již na počátku.

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

18.12.2009 14:51 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Pomalý SELECT

Sorry, repete:
"Za predpokladu, ze id je v tab1 primarni klic" — NIC není primární klíč :).
A tím pádem vnitřní distinct omezuje množinu již na počátku.

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

17.12.2009 23:37 vlasta | skóre: 10 | Brno
Rozbalit Rozbalit vše Re: Pomalý SELECT

poradil bych ti, at si koupis nejakou sql book for busy developers...

SELECT A.name, A.id, B.popis, C.url, A.adresa, A.trieda 
FROM tab1 A
JOIN tab2 B ON B.id = A.id
JOIN tab3 C ON C.id = A.id
WHERE A.top_id = 8930440 
AND B.popistyp_id=11 
--AND (B.language='sk' OR B.language='en') 
--hezci a jednoduseji modifikovatelna je podle me klauzule in
AND B.language IN ('sk', 'en')
GROUP BY A.id
ORDER BY B.language='sk' DESC

Jestli je klauzule join rychlejsi nez spojeni omezene v klauzuli where se rika, ze by to melo byt vykonove stejne (resp. parser by to mel chapat jako stejny vyraz) a jestli ne, tak se jedna o bug. Nicmene joiny jsou pro spoustu lidi prehlednejsi a v pripade jejich pouziti te syntakticka kontrola nepusti pres opomenute vyjadreni relace...

18.12.2009 11:19 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Pomalý SELECT

S prohlášením, že se jedná o bug bych byl opatrný, to že výsledek je identický ještě neznamená, že vnitřní optimalizace nemůže postupovat jinak.
Ale pravděpodobně u INNER JOIN to tak bude. S provádením LEFT a RIGHT JOINU, už to ale bude jinak (nehledě na to že LEF a RIGHT mohou mít na některých enginech rozdílný výkon).

Pozn. na PostrgeSql, jsem četl, že rychlost přes WHERE a JOIN je za ideálních podmínek identická, což už samo o sobě vzbuzuje oprávněnou pochybnost a nutí to aspoň zkusit (bohužel to teď nemohu najít, abych dal odkaz).

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

18.12.2009 11:36 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
Rozbalit Rozbalit vše Re: Pomalý SELECT

Rychlost spojení zapsaného skreze WHERE a INNER JOINu musí být identická v každém případě (v PostgreSQL). Ideální podmínky jsou, s prominutím, blbost.

18.12.2009 08:11 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
Rozbalit Rozbalit vše Re: Pomalý SELECT

viz http://www.root.cz/clanky/leftright-outer-inner-join-v-sql/

Ďakujem všetkým za info, zistil som, že časový problém robí

ORDER BY language

15 rows in set (11.39 sec), bez ORDER BY je to (0.39 sec)

Potrebujem to však nutne vyriešiť, aby najprv radilo vysledky s language='sk' a až potom výsledky s language='en'.

Rozmyšlam vytvoriť tab4 v podstate identickú s tab1 v počte riadkov so stĺpcami 'id' a 'sk', kde by bolo 'sk' buď 1, alebo 0, podľa toho či obsahuje language='sk' a potom dať ORDER BY tab4.sk, možno to bude radiť rýchlejšie.

19.12.2009 10:57 cronin | skóre: 49
Rozbalit Rozbalit vše Re: Pomalý SELECT

Nestaci urobit index nad language? Potom byt mozno vedela databaza sekvencne citat zaznamy z toho indexu, namiesto citania vsetkych a nasledneho triedenia. To je totiz uzitocny side-effect indexu, ze udaje v jeho listoch su zoradene. Takze ak treba ORDER BY, staci ist sekvencne podla indexu a testovat splnenie WHERE; vsetko sa ale da urobit streamovo. A ked sa k tomu pridaju selektivne indexy z PostgreSQL alebo FBI z Oracle, staci dobry index a netreba overovat ani to WHERE. :-)

Ak sa skutocne jedna iba o pevne dany pocet jazykov, nie je mozne to vyriesit "inziniersky"? T.j. spustit dva selecty za sebou, kazdy pre jeden jazyk, a resultsety si spojit az v aplikacii?

19.12.2009 21:32 kulik
Rozbalit Rozbalit vše Re: Pomalý SELECT

To by snad musel byt bug databaze, setrideni 15 zaznamu by z hlediska casu vubec nemelo byt pozorovatelne. Jak se lisi plany s order by a bez order by? Je mozne, ze se voli plan, ktery by byl efektivni az od treba desetitisicu vybranych zaznamu. Pokud ano, pak je potreba ho zmenit, jak se to udela v MySQL nevim, ale pocitam ze nejake hinty by tam mely byt k dispozici.

6.10.2010 16:47 vlasta | skóre: 10 | Brno
Rozbalit Rozbalit vše Re: Pomalý SELECT

Resenim by bylo rozdelit dotaz na 2 totozne s rozdilnym language a spojit je pomoci UNION

6.10.2010 20:28 jakub hajek
Rozbalit Rozbalit vše Re: Pomalý SELECT

Na to pozor, na to, ze databaze vrati nejdriv zaznamy z prvni casti unionu a pak z druhe, nemuzete spolehat. Dokonce IMHO neni zaruceno ani to, ze zaznamy z jednotlivych casti unionu prijdou pohromade. Neznam tedy mysql, ale napr. v oracle tomu tak je.

6.10.2010 20:45 jos
Rozbalit Rozbalit vše Re: Pomalý SELECT

bez ORDER BY asi žádná databáze negarantuje pořadí vrácených záznamů, takže pozor na všechny SELECTy

Dotaz: Pomalý SELECT

Odpovědi