abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:22 | IT novinky

    Správní rada americké mediální skupiny Warner Bros. Discovery (WBD) podle očekávání odmítla nepřátelskou nabídku na převzetí od firmy Paramount Skydance za 108,4 miliardy dolarů (2,25 bilionu Kč). Paramount podle ní neposkytl dostatečné finanční záruky. Akcionářům proto doporučuje nabídku od Netflixu.

    Ladislav Hagara | Komentářů: 0
    dnes 14:22 | Bezpečnostní upozornění

    Na WhatsAppu se šíří nový podvod, který ovšem vůbec nevypadá jako hackerský útok. Žádná krádež hesla. Žádné narušení zabezpečení. Žádné zjevné varovné signály. Místo toho jsou lidé trikem donuceni, aby útočníkům sami poskytli přístup, a to pouhým provedením toho, co vypadá jako běžný ověřovací krok. Bezpečnostní experti Avastu tento nový typ útoku nazývají ghostpairing, protože útočníci si při něm tiše vytvářejí „zařízení duchů“, které žije uvnitř vašeho účtu.

    Ladislav Hagara | Komentářů: 4
    dnes 12:33 | Nová verze

    Český LibreOffice tým vydává aktualizaci překladu příručky LibreOffice Draw 25.8. Tato kniha se zabývá hlavními funkcemi programu Draw, vektorové grafické komponenty systému LibreOffice. Pomocí Draw lze vytvářet širokou škálu grafických obrázků. Příručka je ke stažení na stránce dokumentace a tým hledá dobrovolníky pro další překlady.

    ZCR | Komentářů: 0
    dnes 04:00 | IT novinky

    Anthony Enzor-DeMeo je novým CEO Mozilla Corporation. Mozillu převzal po dočasné CEO Lauře Chambers. Vybudovat chce nejdůvěryhodnější softwarovou společnost na světě. Firefox by se měl vyvinout v moderní AI prohlížeč.

    Ladislav Hagara | Komentářů: 4
    včera 17:11 | Nová verze

    Byla vydána nová verze 9.20 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Vypíchnout lze například nový balíček RustDesk Server pro vzdálený přístup.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | Nová verze

    Jonathan Thomas oznámil vydání nové verze 3.4.0 video editoru OpenShot (Wikipedie). Představení novinek také na YouTube. Zdrojové kódy OpenShotu jsou k dispozici na GitHubu. Ke stažení je i balíček ve formátu AppImage. Stačí jej stáhnout, nastavit právo na spouštění a spustit.

    Ladislav Hagara | Komentářů: 0
    včera 14:22 | Nová verze

    Byla vydána nová verze 1.6 otevřeného, licenčními poplatky nezatíženého, univerzálního ztrátového formátu komprese zvuku Opus (Wikipedie) a jeho referenční implementace libopus. Podrobnosti na demo stránce.

    Ladislav Hagara | Komentářů: 3
    včera 01:33 | Komunita

    Vojtěch Polášek představil Vojtux, tj. linuxovou distribuci pro zrakově postižené uživatele. Vychází ze spinu Fedory 43 s desktopovým prostředím MATE. Konečným cílem je, aby žádný Vojtux nebyl potřeba a požadovaná vylepšení se dostala do upstreamu.

    Ladislav Hagara | Komentářů: 11
    včera 00:33 | Nová verze

    Byla vydána (Mastodon, 𝕏) druhá RC verze GIMPu 3.2. Přehled novinek v oznámení o vydání. Podrobně v souboru NEWS na GitLabu.

    Ladislav Hagara | Komentářů: 0
    15.12. 15:22 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 160 (pdf).

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (47%)
     (20%)
     (17%)
     (23%)
     (15%)
     (24%)
     (16%)
     (18%)
    Celkem 478 hlasů
     Komentářů: 19, poslední 11.12. 20:04
    Rozcestník

    Dotaz: Pomalý SELECT

    9.5.2009 18:24 Jirka
    Pomalý SELECT
    Přečteno: 678×

    Předem se omlouvám, za delší popis situace. Mám dvě tabulky, jedna je velká (milion záznamů) a druhá je číselník.
    Struktura tabulek:

    CREATE TABLE `tab` (
      `id` INT NOT NULL AUTO_INCREMENT,
      `login` char(1) NOT NULL,
      PRIMARY KEY (`id`),
      KEY `login` ( `login` )
    ) ENGINE=MyISAM;
    
    CREATE TABLE `user` (
      `login` char(1) NOT NULL,
      `name` varchar(30) NOT NULL,
      PRIMARY KEY ( `login` ) 
    ) ENGINE=MyISAM;
    

    Naplním daty číselník:

    INSERT INTO `user` (`login`, `name`) VALUES ('a', 'AAA');
    INSERT INTO `user` (`login`, `name`) VALUES ('b', 'BBB');
    INSERT INTO `user` (`login`, `name`) VALUES ('c', 'CCC');
    INSERT INTO `user` (`login`, `name`) VALUES ('d', 'DDD');
    INSERT INTO `user` (`login`, `name`) VALUES ('e', 'EEE');
    INSERT INTO `user` (`login`, `name`) VALUES ('f', 'FFF');
    INSERT INTO `user` (`login`, `name`) VALUES ('g', 'GGG');
    INSERT INTO `user` (`login`, `name`) VALUES ('h', 'HHH');
    INSERT INTO `user` (`login`, `name`) VALUES ('i', 'III');
    INSERT INTO `user` (`login`, `name`) VALUES ('j', 'JJJ');
    

    A pomocí PHP velkou tabulku náhodnými údaji:

    for ($i = 0; $i < 1000000; $i++)
         mysql_query("INSERT INTO `tab` (`login`) VALUES ('".chr(rand(97,106))."')");
    

    Nyní potřebuji provést následující dotaz:

    SELECT SQL_CALC_FOUND_ROWS `tab`.`id`, `tab`.`login`, `user`.`name` 
    FROM `tab` 
    LEFT JOIN `user` ON `tab`.`login` = `user`.`login` 
    ORDER BY `tab`.`id` DESC 
    LIMIT 1;
    +---------+-------+------+
    | id      | login | name |
    +---------+-------+------+
    | 1000000 | i     | III  | 
    +---------+-------+------+
    1 row in set (2.58 sec)
    

    Co mě vadí, je doba trvání dotazu. Pokud odstraním SQL_CALC_FOUND_ROWS, dotaz se zrychlí:

    SELECT `tab`.`id`, `tab`.`login`, `user`.`name` 
    FROM `tab` 
    LEFT JOIN `user` ON `tab`.`login` = `user`.`login` 
    ORDER BY `tab`.`id` DESC 
    LIMIT 1;
    +---------+-------+------+
    | id      | login | name |
    +---------+-------+------+
    | 1000000 | i     | III  | 
    +---------+-------+------+
    1 row in set (0.01 sec)
    

    Nebo když odstraním LEFT JOIN, dotaz se opět zrychlí:

    SELECT SQL_CALC_FOUND_ROWS `tab`.`id`, `tab`.`login` 
    FROM `tab` 
    ORDER BY `tab`.`id` DESC 
    LIMIT 1;
    +---------+-------+
    | id      | login |
    +---------+-------+
    | 1000000 | i     | 
    +---------+-------+
    1 row in set (0.32 sec)
    

    Kupodivu, když přidám WHERE, tak se dotaz také zrychlí:

    SELECT SQL_CALC_FOUND_ROWS `tab`.`id`, `tab`.`login`, `user`.`name` 
    FROM `tab` 
    LEFT JOIN `user` ON `tab`.`login` = `user`.`login` 
    WHERE `tab`.`login`='a' 
    ORDER BY `tab`.`id` DESC 
    LIMIT 1;
    +--------+-------+------+
    | id     | login | name |
    +--------+-------+------+
    | 999998 | a     | AAA  | 
    +--------+-------+------+
    1 row in set (0.17 sec)
    

    Jenže já bych potřeboval zrychlit ten první dotaz, ale nevím jak na to. Může mi někdo poradit, či vysvětlit proč dostávám tak rozdílné časy?

    Odpovědi

    9.5.2009 18:30 Jirka
    Rozbalit Rozbalit vše Re: Pomalý SELECT

    Ještě dodávám, že to testuji na openSUSE 11.1 a na  MySQL 5 z distribuce.

    9.5.2009 18:51 Vojtěch Horký | skóre: 39 | blog: Vojtův zápisník | Praha
    Rozbalit Rozbalit vše Re: Pomalý SELECT
    Nejde náhodou o to, že s tou klauzulí SQL_CALC_FOUND_ROWS server vykonává ten dotaz jako by tam nebyl ten LIMIT 1, aby zjistil, kolik bude řádků (tudíž bez toho WHERE to bude asi full-scan) a teprve pak to ořeže?

    Nevyšlo by rychleji ptát se na počet řádků pomocí dalšího COUNT(*) dotazu (to by měl stačit průchod přes index)?

    BTW - indexy máte vytvořené?
    I am always ready to learn although I do not always like to be taught. (W. Churchill)
    9.5.2009 19:02 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Pomalý SELECT
    Spojovat tabulky přes řetězce je, řekněme, suboptimální – daleko lépe se bude databázi pracovat, pokud v té tabulce vytvoříte číselný primární klíč a spojovat budete přes něj. Dotaz bez SQL_CALC_FOUND_ROWS je rychlejší, protože v tom druhém dotazu používáte LIMIT – s ním databázi stačí, když najde první výsledek, a ten vám vrátí. Když ale musí spočítat SQL_CALC_FOUND_ROWS, musí stejně dotaz provést celý, jako by tam LIMIT nebyl.
    10.5.2009 09:14 Jirka
    Rozbalit Rozbalit vše Re: Pomalý SELECT

    Díky za náměty a rady. Všechny jsem je postupně vyzkoušel a navíc jsem ještě zkusil změnit engine na InnoDB. Změna enginu zrychlila dotaz více jak dvakrát. Provést dotaz bez SQL_CALC_FOUND_ROWS a následně použít COUNT(*) opět zrychlilo dotaz dvakrát. Pokud jsem tabulky spojil přes TINYINT došlo je k malému zrychlení. Vítězem je tedy kombinace všech návrhů:

    CREATE TABLE `tab` (
      `id` INT NOT NULL AUTO_INCREMENT,
      `login` TINYINT NOT NULL,
      PRIMARY KEY (`id`),
      KEY `login` ( `login` )
    ) ENGINE=InnoDB;
    
    CREATE TABLE `user` (
      `login` TINYINT NOT NULL,
      `name` varchar(30) NOT NULL,
      PRIMARY KEY ( `login` ) 
    ) ENGINE=InnoDB;
    

    Naplnit daty

    SELECT `tab`.`id`, `tab`.`login`, `user`.`name` 
    FROM `tab` 
    LEFT JOIN `user` ON `tab`.`login` = `user`.`login` 
    ORDER BY `tab`.`id` DESC 
    LIMIT 1;
    +---------+-------+------+
    | id      | login | name |
    +---------+-------+------+
    | 1000000 |     5 | EEE  | 
    +---------+-------+------+
    1 row in set (0.00 sec)
    
    SELECT count(*) 
    FROM `tab` 
    LEFT JOIN `user` ON `tab`.`login` = `user`.`login` 
    ORDER BY `tab`.`id` DESC;
    +----------+
    | count(*) |
    +----------+
    |  1000000 | 
    +----------+
    1 row in set (0.49 sec)
    

    Což je pětinásobné zrychlení. Nevýhodou je u enginu InnoDB delší vkládání dat a absence fulltexty. Všem díky.

    AraxoN avatar 10.5.2009 18:25 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
    Rozbalit Rozbalit vše Re: Pomalý SELECT

     

    SELECT count(*) 
    FROM `tab` 
    LEFT JOIN `user` ON `tab`.`login` = `user`.`login` 
    ORDER BY `tab`.`id` DESC;
    +----------+
    | count(*) |
    +----------+
    |  1000000 | 
    +----------+
    1 row in set (0.49 sec)
    

    Což je pětinásobné zrychlení. Nevýhodou je u enginu InnoDB delší vkládání dat a absence fulltexty. Všem díky.

    A ešte sa Ti to urýchli asi miliónkrát, keď odtiaľ vyhodíš ten zbytočný LEFT JOIN a ORDER BY: :-D

    SELECT count(*) 
    FROM `tab`;
    +----------+
    | count(*) |
    +----------+
    |  1000000 | 
    +----------+
    1 row in set (0.00 sec)
    
    11.5.2009 08:51 Jirka
    Rozbalit Rozbalit vše Re: Pomalý SELECT

    Špatný nápad to není, on je dokonce skvělý. Celé je to ve třídě, která se stará o zobrazení jakéhokoli SQL dotazu v prohlížeči, ta třída se stará o stránkování. K tomu potřebuji znát i celkový počet řádků. Takže se ten SQL dotaz musí upravit programem. Zatím je postup následující:

    přidám k SQL dotazu LIMIT a provedu dotaz

    odstraním vše mezi SELECT a FROM a dám tam COUNT(*)

    A teď ještě vyhodit všechny LEFT JOIN a ORDER BY, ale nechat všechny WHERE, GROUP, HAVING. Nepopletl jsem to?

    AraxoN avatar 11.5.2009 14:05 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
    Rozbalit Rozbalit vše Re: Pomalý SELECT

    Ak je ten SELECT vyrobený automaticky, tak to takto fungovať nebude... Teda pri tomto jednom by to fungovalo, ale nie je to univerzálne a ani to univerzálne byť nemôže.

    Niečo podobné na zobrazovanie listingov používame aj my (komponent, ktorý robí najprv SELECT ... LIMIT OFFSET, a potom z toho odvodí ešte SELECT COUNT), a riešime to tak, že ten druhý SELECT na zistenie počtu riadkov sa tam dá nanútiť, ak automaticky vyrobený SELECT nie je optimálny, alebo nefunguje správne.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.