Projekt systemd schválil kontroverzní pull request, který do JSON záznamů uživatelů přidává nové pole 'birthDate', datum narození, tedy údaj vyžadovaný zákony o ověřování věku v Kalifornii, Coloradu a Brazílii. Jiný pull request, který tuto změnu napravoval, byl správcem projektu Lennartem Poetteringem zamítnut s následujícím zdůvodněním:
… více »Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 163 (pdf).
Eric Lengyel dobrovolně uvolnil jako volné dílo svůj patentovaný algoritmus Slug. Algoritmus vykresluje text a vektorovou grafiku na GPU přímo z dat Bézierových křivek, aniž by využíval texturové mapy obsahující jakékoli předem vypočítané nebo uložené obrázky a počítá přesné pokrytí pro ostré a škálovatelné zobrazení písma, referenční ukázka implementace v HLSL shaderech je na GitHubu. Slug je volným dílem od 17. března letošního
… více »Sashiko (GitHub) je open source automatizovaný systém pro revizi kódu linuxového jádra. Monitoruje veřejné mailing listy a hodnotí navrhované změny pomocí umělé inteligence. Výpočetní zdroje a LLM tokeny poskytuje Google.
Cambalache, tj. RAD (rapid application development) nástroj pro GTK 4 a GTK 3, dospěl po pěti letech vývoje do verze 1.0. Instalovat jej lze i z Flathubu.
KiCad (Wikipedie), sada svobodných softwarových nástrojů pro počítačový návrh elektronických zařízení (EDA), byl vydán v nové major verzi 10.0.0 (𝕏). Přehled novinek v příspěvku na blogu.
Letošní Turingovou cenu (2025 ACM A.M. Turing Award, Nobelova cena informatiky) získali Charles H. Bennett a Gilles Brassard za základní přínosy do oboru kvantové informatiky, které převrátily pojetí bezpečné neprolomitelné komunikace a výpočetní techniky. Jejich protokol BB84 z roku 1984 umožnil fyzikálně zaručený bezpečný přenos šifrovacích klíčů, zatímco jejich práce o kvantové teleportaci položila teoretické základy pro budoucí kvantový internet. Jejich práce spojila fyziku s informatikou a ovlivnila celou generaci vědců.
Firefox 149 dostupný od 24. března přinese bezplatnou vestavěnou VPN s 50 GB přenesených dat měsíčně (s CZ a SK se zatím nepočítá) a zobrazení dvou webových stránek vedle sebe v jednom panelu (split view). Firefox Labs 149 umožní přidat poznámky k panelům (tab notes, videoukázka).
Byla vydána nová stabilní verze 7.9 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 146. Přehled novinek i s náhledy v příspěvku na blogu.
Dle plánu byla vydána Opera GX pro Linux. Ke stažení je .deb i .rpm. V plánu je flatpak. Opera GX je webový prohlížeč zaměřený na hráče počítačových her.
Předem se omlouvám, za delší popis situace. Mám dvě tabulky, jedna je velká (milion záznamů) a druhá je číselník.
Struktura tabulek:
CREATE TABLE `tab` ( `id` INT NOT NULL AUTO_INCREMENT, `login` char(1) NOT NULL, PRIMARY KEY (`id`), KEY `login` ( `login` ) ) ENGINE=MyISAM; CREATE TABLE `user` ( `login` char(1) NOT NULL, `name` varchar(30) NOT NULL, PRIMARY KEY ( `login` ) ) ENGINE=MyISAM;
Naplním daty číselník:
INSERT INTO `user` (`login`, `name`) VALUES ('a', 'AAA');
INSERT INTO `user` (`login`, `name`) VALUES ('b', 'BBB');
INSERT INTO `user` (`login`, `name`) VALUES ('c', 'CCC');
INSERT INTO `user` (`login`, `name`) VALUES ('d', 'DDD');
INSERT INTO `user` (`login`, `name`) VALUES ('e', 'EEE');
INSERT INTO `user` (`login`, `name`) VALUES ('f', 'FFF');
INSERT INTO `user` (`login`, `name`) VALUES ('g', 'GGG');
INSERT INTO `user` (`login`, `name`) VALUES ('h', 'HHH');
INSERT INTO `user` (`login`, `name`) VALUES ('i', 'III');
INSERT INTO `user` (`login`, `name`) VALUES ('j', 'JJJ');
A pomocí PHP velkou tabulku náhodnými údaji:
for ($i = 0; $i < 1000000; $i++)
mysql_query("INSERT INTO `tab` (`login`) VALUES ('".chr(rand(97,106))."')");
Nyní potřebuji provést následující dotaz:
SELECT SQL_CALC_FOUND_ROWS `tab`.`id`, `tab`.`login`, `user`.`name` FROM `tab` LEFT JOIN `user` ON `tab`.`login` = `user`.`login` ORDER BY `tab`.`id` DESC LIMIT 1; +---------+-------+------+ | id | login | name | +---------+-------+------+ | 1000000 | i | III | +---------+-------+------+ 1 row in set (2.58 sec)
Co mě vadí, je doba trvání dotazu. Pokud odstraním SQL_CALC_FOUND_ROWS, dotaz se zrychlí:
SELECT `tab`.`id`, `tab`.`login`, `user`.`name` FROM `tab` LEFT JOIN `user` ON `tab`.`login` = `user`.`login` ORDER BY `tab`.`id` DESC LIMIT 1; +---------+-------+------+ | id | login | name | +---------+-------+------+ | 1000000 | i | III | +---------+-------+------+ 1 row in set (0.01 sec)
Nebo když odstraním LEFT JOIN, dotaz se opět zrychlí:
SELECT SQL_CALC_FOUND_ROWS `tab`.`id`, `tab`.`login` FROM `tab` ORDER BY `tab`.`id` DESC LIMIT 1; +---------+-------+ | id | login | +---------+-------+ | 1000000 | i | +---------+-------+ 1 row in set (0.32 sec)
Kupodivu, když přidám WHERE, tak se dotaz také zrychlí:
SELECT SQL_CALC_FOUND_ROWS `tab`.`id`, `tab`.`login`, `user`.`name` FROM `tab` LEFT JOIN `user` ON `tab`.`login` = `user`.`login` WHERE `tab`.`login`='a' ORDER BY `tab`.`id` DESC LIMIT 1; +--------+-------+------+ | id | login | name | +--------+-------+------+ | 999998 | a | AAA | +--------+-------+------+ 1 row in set (0.17 sec)
Jenže já bych potřeboval zrychlit ten první dotaz, ale nevím jak na to. Může mi někdo poradit, či vysvětlit proč dostávám tak rozdílné časy?
Ještě dodávám, že to testuji na openSUSE 11.1 a na MySQL 5 z distribuce.
SQL_CALC_FOUND_ROWS server vykonává ten dotaz jako by tam nebyl ten LIMIT 1, aby zjistil, kolik bude řádků (tudíž bez toho WHERE to bude asi full-scan) a teprve pak to ořeže?
Nevyšlo by rychleji ptát se na počet řádků pomocí dalšího COUNT(*) dotazu (to by měl stačit průchod přes index)?
BTW - indexy máte vytvořené?
SQL_CALC_FOUND_ROWS je rychlejší, protože v tom druhém dotazu používáte LIMIT – s ním databázi stačí, když najde první výsledek, a ten vám vrátí. Když ale musí spočítat SQL_CALC_FOUND_ROWS, musí stejně dotaz provést celý, jako by tam LIMIT nebyl.
Díky za náměty a rady. Všechny jsem je postupně vyzkoušel a navíc jsem ještě zkusil změnit engine na InnoDB. Změna enginu zrychlila dotaz více jak dvakrát. Provést dotaz bez SQL_CALC_FOUND_ROWS a následně použít COUNT(*) opět zrychlilo dotaz dvakrát. Pokud jsem tabulky spojil přes TINYINT došlo je k malému zrychlení. Vítězem je tedy kombinace všech návrhů:
CREATE TABLE `tab` ( `id` INT NOT NULL AUTO_INCREMENT, `login` TINYINT NOT NULL, PRIMARY KEY (`id`), KEY `login` ( `login` ) ) ENGINE=InnoDB; CREATE TABLE `user` ( `login` TINYINT NOT NULL, `name` varchar(30) NOT NULL, PRIMARY KEY ( `login` ) ) ENGINE=InnoDB;
Naplnit daty
SELECT `tab`.`id`, `tab`.`login`, `user`.`name` FROM `tab` LEFT JOIN `user` ON `tab`.`login` = `user`.`login` ORDER BY `tab`.`id` DESC LIMIT 1; +---------+-------+------+ | id | login | name | +---------+-------+------+ | 1000000 | 5 | EEE | +---------+-------+------+ 1 row in set (0.00 sec) SELECT count(*) FROM `tab` LEFT JOIN `user` ON `tab`.`login` = `user`.`login` ORDER BY `tab`.`id` DESC; +----------+ | count(*) | +----------+ | 1000000 | +----------+ 1 row in set (0.49 sec)
Což je pětinásobné zrychlení. Nevýhodou je u enginu InnoDB delší vkládání dat a absence fulltexty. Všem díky.
SELECT count(*) FROM `tab` LEFT JOIN `user` ON `tab`.`login` = `user`.`login` ORDER BY `tab`.`id` DESC; +----------+ | count(*) | +----------+ | 1000000 | +----------+ 1 row in set (0.49 sec)Což je pětinásobné zrychlení. Nevýhodou je u enginu InnoDB delší vkládání dat a absence fulltexty. Všem díky.
A ešte sa Ti to urýchli asi miliónkrát, keď odtiaľ vyhodíš ten zbytočný LEFT JOIN a ORDER BY: 
SELECT count(*) FROM `tab`; +----------+ | count(*) | +----------+ | 1000000 | +----------+ 1 row in set (0.00 sec)
Špatný nápad to není, on je dokonce skvělý. Celé je to ve třídě, která se stará o zobrazení jakéhokoli SQL dotazu v prohlížeči, ta třída se stará o stránkování. K tomu potřebuji znát i celkový počet řádků. Takže se ten SQL dotaz musí upravit programem. Zatím je postup následující:
přidám k SQL dotazu LIMIT a provedu dotaz
odstraním vše mezi SELECT a FROM a dám tam COUNT(*)
A teď ještě vyhodit všechny LEFT JOIN a ORDER BY, ale nechat všechny WHERE, GROUP, HAVING. Nepopletl jsem to?
Ak je ten SELECT vyrobený automaticky, tak to takto fungovať nebude... Teda pri tomto jednom by to fungovalo, ale nie je to univerzálne a ani to univerzálne byť nemôže.
Niečo podobné na zobrazovanie listingov používame aj my (komponent, ktorý robí najprv SELECT ... LIMIT OFFSET, a potom z toho odvodí ešte SELECT COUNT), a riešime to tak, že ten druhý SELECT na zistenie počtu riadkov sa tam dá nanútiť, ak automaticky vyrobený SELECT nie je optimálny, alebo nefunguje správne.
Tiskni
Sdílej: