MKVToolNix, tj. sada nástrojů pro práci s formátem (medialnym kontajnerom) Matroska, byl vydán ve verzi 95.0. Podpora přehrávání formátu Matroska míří do Firefoxu [Bug 1422891, Technický popis]. Přehrávání lze již testovat ve Firefoxu Nightly.
Spolek OpenAlt zve příznivce otevřených řešení a přístupu na 211. sraz, který proběhne v pátek 19. září od 18:00 ve Studentském klubu U Kachničky na Fakultě informačních technologií Vysokého učení technického na adrese Božetěchova 2/1. Na srazu proběhne přednáška Jiřího Eischmanna o nové verzi prostředí GNOME 49. Nemáte-li možnost se zúčastnit osobně, přednáškový blok bude opět streamován živě na server VHSky.cz a následně i zpřístupněn záznam.
Microsoft se vyhnul pokutě od Evropské komise za zneužívání svého dominantního postavení na trhu v souvislosti s aplikací Teams. S komisí se dohodl na závazcích, které slíbil splnit. Unijní exekutivě se nelíbilo, že firma svazuje svůj nástroj pro chatování a videohovory Teams se sadou kancelářských programů Office. Microsoft nyní slíbil jasné oddělení aplikace od kancelářských nástrojů, jako jsou Word, Excel a Outlook. Na Microsoft si
… více »Samba (Wikipedie), svobodná implementace SMB a Active Directory, byla vydána ve verzi 4.23.0. Počínaje verzí Samba 4.23 jsou unixová rozšíření SMB3 ve výchozím nastavení povolena. Přidána byla podpora SMB3 přes QUIC. Nová utilita smb_prometheus_endpoint exportuje metriky ve formátu Prometheus.
Správcovský tým repozitáře F-Droid pro Android sdílí doporučení, jak řešit žádosti o odstranění nelegálního obsahu. Základem je mít nastavené formální procesy, vyhrazenou e-mailovou adresu a být transparentní. Zdůrazňují také důležitost volby jurisdikce (F-Droid je v Nizozemsku).
Byly publikovány informace o další zranitelnosti v procesorech. Nejnovější zranitelnost byla pojmenována VMScape (CVE-2025-40300, GitHub) a v upstream Linuxech je již opravena. Jedná se o variantu Spectre. KVM host může číst data z uživatelského prostoru hypervizoru, např. QEMU.
V červenci loňského roku organizace Apache Software Foundation (ASF) oznámila, že se částečně přestane dopouštět kulturní apropriace a změní své logo. Dnes bylo nové logo představeno. "Indiánské pírko" bylo nahrazeno dubovým listem a text Apache Software Foundation zkratkou ASF. Slovo Apache se bude "zatím" dál používat. Oficiální název organizace zůstává Apache Software Foundation, stejně jako názvy projektů, například Apache HTTP Server.
Byla vydána (𝕏) srpnová aktualizace aneb nová verze 1.104 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.104 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
Spotify spustilo přehrávání v bezztrátové kvalitě. V předplatném Spotify Premium.
Spoluzakladatel a předseda správní rady americké softwarové společnosti Oracle Larry Ellison vystřídal spoluzakladatele automobilky Tesla a dalších firem Elona Muska na postu nejbohatšího člověka světa. Hodnota Ellisonova majetku díky dnešnímu prudkému posílení ceny akcií Oraclu odpoledne vykazovala nárůst o více než 100 miliard dolarů a dosáhla 393 miliard USD (zhruba 8,2 bilionu Kč). Hodnota Muskova majetku činila zhruba 385 miliard dolarů.
Ahoj, mám jen otázku, zda-li je můj SQL dotaz ideální,. Mám následujicí tabulku a data:
CREATE TABLE tbl ( id_link INT NOT NULL, id_label INT NOT NULL ); INSERT INTO tbl (id_link, id_label) VALUES (10,2); INSERT INTO tbl (id_link, id_label) VALUES (10,3); INSERT INTO tbl (id_link, id_label) VALUES (11,1); INSERT INTO tbl (id_link, id_label) VALUES (11,2); INSERT INTO tbl (id_link, id_label) VALUES (11,3); INSERT INTO tbl (id_link, id_label) VALUES (12,1); INSERT INTO tbl (id_link, id_label) VALUES (12,3); SELECT * FROM tbl; +---------+----------+ | id_link | id_label | +---------+----------+ | 10 | 2 | | 10 | 3 | | 11 | 1 | | 11 | 2 | | 11 | 3 | | 12 | 1 | | 12 | 3 | +---------+----------+ 7 rows in set (0.00 sec)
A nyní potřebuji zjistit počet id_link, které mají id_label 1 a současně 3, jde o id_link 11 a 12, celkem tedy 2. Dělám to takto:
SELECT COUNT(*) FROM (SELECT COUNT(*) AS kolikrat FROM tbl WHERE id_label IN (1,3) GROUP BY id_link HAVING kolikrat=2 ) AS tbl2; +----------+ | COUNT(*) | +----------+ | 2 | +----------+
Obdobně, když mě zajímá počet id_link, které mají současně id_label 1,2 a 3 (jde o jeden případ a to id_link 11):
SELECT COUNT(*) FROM (SELECT COUNT(*) AS kolikrat FROM tbl WHERE id_label IN (1,2,3) GROUP BY id_link HAVING kolikrat=3 ) AS tbl2; +----------+ | COUNT(*) | +----------+ | 1 | +----------+ 1 row in set (0.00 sec)
Pravda, funguje to, ale nešlo by to jednodušeji, a hlavně rychleji (při větším množství dat)?. Díky za případné náměty.
Řešení dotazu:
SELECT COUNT(*) FROM tbl t1 JOIN tbl t2 ON t1.id_link=t2.id_link AND t1.id_label=1 AND t2.id_label=3;Ci je to rychlejsie si otestuj sam, ale mohlo by. Predpokladam, ze riadky v tej tabulke su unikatne, inak by sa mnozili zaznamy. Trocha nevyhoda je, ze pre druhu podmienku (1,2,3) uz treba joinovat 3x, ale obecne su databazy skor prisposobene na rychle joiny (kde mozu vyuzivat indexy), nez na divoke subselecty (kde v tom subselecte nevyuziju index).
To funguje, problém je však v tom, že v té podmínce je proměnný počet čísel, třeba i deset.
Ne nutně. Lze použít další (dočasnou, pracovní, ...) tabulku, ze které se budou brát podmínky in a having. V rozumné databázi to o moc pomalejší než semovo řešení nebude. Navíc se u frekventovaného dotazu ušetří za hard parsing.
Váš dotaz je jednoznačně lepší než výše uvedený pomocí spojení tabulek. Netřeba to ani testovat.
Tak jsem Vaše návrhy použil na větších datech a dostal jsem tyto výsledky: při 3 číslech je metoda s JOIN 4x rychlejší, ale při 10 číslech (=10 JOINů) je zase skoro 2x pomalejší než moje původní...
Jde o MySQL, zkoušeno na 5.0, 5.1 i 5.4. Dotazy s JOIN jsou do osmi číslic 3-4krát rychlejší, pak nastane zlom, u devíti číslic je to dvakrát pomalejší a u deseti šestkrát pomalejší než můj původní select. Testováno asi takto:
SELECT COUNT(*) FROM tbl t1 JOIN tbl t2 USING (id_link) JOIN tbl t3 USING (id_link) JOIN tbl t4 USING (id_link) JOIN tbl t5 USING (id_link) JOIN tbl t6 USING (id_link) JOIN tbl t7 USING (id_link) JOIN tbl t8 USING (id_link) JOIN tbl t9 USING (id_link) JOIN tbl t10 USING (id_link) WHERE t1.id_label=15 AND t2.id_label=16 AND t3.id_label=17 AND t4.id_label=3 AND t5.id_label=14 AND t6.id_label=1 AND t7.id_label=61 AND t8.id_label=81 AND t9.id_label=7 AND t10.id_label=55
Hodne zalezi na charakteru tech dat. Group by pravdepodobne provede sort mnoziny vyhovujici podminkam a zalezi na tom, jak velka mnozina do nej bude vstupovat. Pri joinu bude podstatne, v jakem poradi se bude joinovat, pokud nektera z podminek diskriminuje vyrazne vice nez jina - napriklad pokud label 1 a 2 milion zaznamua 3 pouze deset, bude join v poradi 3, 2, 1 mnohonasobne rychlejsi nez join v poradi 1, 2, 3 (pokud tam je vhodny index). Obecne pokud se nedaji udelat zadne rozumne predpoklady o datech bych preferoval reseni s group by, ktere je minimalne prehlednejsi.
Já tam ještě vidím jeden problém. Pokud bude v tabulce dvakrát jedna dvojice id_link a id_label, tak to začne počítat špatně.
To ne, dvojice id_link, id_label je unikátní.
Ja se priznam, ze jsem takhle vecer nepochopil pointu toho HAVING kolikrat=N. K cemu tam vlastne je? Ja bych pocital distinct id_link, tzn. neco jako...
SELECT
COUNT(DISTINCT id_link) AS result
FROM
tbl
WHERE
id_label IN (1,2)
GROUP BY
id_link
SELECT COUNT(1) AS total FROM tbl tbl1 WHERE tbl1.id_label = 1 AND EXISTS (SELECT 1 FROM tbl tbl2 WHERE tbl2.id_link = tbl1.id_link AND tbl2.id_label = 3) /Obecně — a pro velké objemy dat — lze zneužít analytické funkce:
SELECT COUNT(CASE WHEN rn = 1 THEN 1 ELSE NULL END) AS total FROM (SELECT id_link, id_label, COUNT(CASE WHEN id_label IN (1, 2, 3) THEN 1 ELSE NULL END) OVER (PARTITION BY id_link) AS cnt, ROW_NUMBER() OVER (PARTITION BY id_link ORDER BY 1) AS rn FROM tbl) WHERE cnt = 3 /Podmínku na hodnoty
ID_LABEL
vsuneš do výrazu agregační funkce COUNT()
na řádce 7. Počet hodnot pro ID_LABEL
musí být uveden ve WHERE
klauzuli na řádce 12. Tedy:
SELECT COUNT(CASE WHEN rn = 1 THEN 1 ELSE NULL END) AS total FROM (SELECT id_link, id_label, COUNT(CASE WHEN id_label IN (1, 3) THEN 1 ELSE NULL END) OVER (PARTITION BY id_link) AS cnt, ROW_NUMBER() OVER (PARTITION BY id_link ORDER BY 1) AS rn FROM tbl) WHERE cnt = 2 /Výhoda je jasná: stačí full-scan nad tabulkou; žádný joiny. Zbytek odře
WINDOW-SORT
. WITH conditions AS ( SELECT 1 AS val FROM dual UNION ALL SELECT 3 FROM dual) SELECT COUNT(CASE WHEN rn = 1 THEN 1 ELSE NULL END) AS total FROM (SELECT id_link, id_label, COUNT(CASE WHEN id_label IN (SELECT val FROM conditions) THEN 1 ELSE NULL END) OVER (PARTITION BY id_link) AS cnt, ROW_NUMBER() OVER (PARTITION BY id_link ORDER BY 1) AS rn FROM tbl) WHERE cnt = (SELECT COUNT(1) FROM conditions) /Prostě jen uvedeš veškeré hodnoty ve factoring klauzuli.
SELECT COUNT(1) FROM (SELECT COUNT(1) FROM …)
.GROUP BY
či JOIN
y. Na IBM DB2 LUW stačí nahradit klíčové slovo ROW_NUMBER
klíčovým slovem ROWNUMBER
(navíc — klauzule PARTITION BY
a ORDER BY
jsou tam jako bonus nepovinné).GROUP BY
pro člověka, který zná analytické funkce.WHERE
klauzuli, nikoli na počtu vytvořených indexů či jejich existenci. Protože autor potřebuje probrousit celou tabuli — aspoň tak jsem to z dotazu pochopil —, možná by pomohl kompozitní index nad ID_LINK
a ID_LABEL
. Ale vůbec bych se nedivil, kdyby optimizér zvolil TABLE FULL-SCAN
. Proč zbytečně brousit index a pak — vlastně vše — číst pomocí TABLE ACCESS BY INDEX ROWID
? Chtělo by to udělat PoC nad velkým počtem dat. Také záleží na hodnotách NULL
… Je toho prostě víc…
Tiskni
Sdílej: