Přihlášení | Registrace

napište » Zprávičky

Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT

dnes 04:55 | Zajímavý software

Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT. Ve stejném repozitáři se nacházejí i před lety zveřejněné zdrojové k kódy MS-DOSu 1.25 a 2.0.

Ladislav Hagara | Komentářů: 0

Ubuntu 24.04 LTS Noble Numbat

včera 17:33 | Nová verze

Canonical vydal (email, blog, YouTube) Ubuntu 24.04 LTS Noble Numbat. Přehled novinek v poznámkách k vydání a také příspěvcích na blogu: novinky v desktopu a novinky v bezpečnosti. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu MATE, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 10. LTS verzi.

Ladislav Hagara | Komentářů: 8

Videozáznam z Czech Open Source Policy Forum 2024

včera 14:22 | Komunita

Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

Ladislav Hagara | Komentářů: 1

Fossil 2.24

včera 13:22 | Nová verze

Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

Ladislav Hagara | Komentářů: 0

Vivaldi 6.7

včera 12:44 | Nová verze

Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

Ladislav Hagara | Komentářů: 0

Node.js 22

včera 04:55 | Nová verze

OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

Ladislav Hagara | Komentářů: 0

Proxmox Virtual Environment 8.2

včera 04:22 | Nová verze

Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

Ladislav Hagara | Komentářů: 0

R 4.4.0 (Puppy Cup)

včera 04:11 | Nová verze

R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

Ladislav Hagara | Komentářů: 0

IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů

24.4. 22:44 | IT novinky

IBM kupuje společnost HashiCorp (Terraform, Packer, Vault, Boundary, Consul, Nomad, Waypoint, Vagrant, …) za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

Ladislav Hagara | Komentářů: 12

TrueNAS SCALE 24.04 “Dragonfish”

24.4. 15:55 | Nová verze

Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (73%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (16%)

Celkem 771 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Databázová poradna / Optimalizácia selectu s in klauzulou s veľa riadkami

Štítky: pěkné, SQL

Dotaz: Optimalizácia selectu s in klauzulou s veľa riadkami

6.9.2016 13:54 Peter
Optimalizácia selectu s in klauzulou s veľa riadkami

Přečteno: 694×

Odpovědět | Admin

Dobrý deň vám prajem.

Mám tento select, ktorý síce funguje v poriadku, ale keď mám v tabuľke veľa dát, tak sa vykonáva veľmi dlho - momentálne je to cca 1,5 minúty:

select ID from Vydajka
where (
  (IdentifikatorStromu,IdentifikatorRodica) in (select IdentifikatorStromu,max(IdentifikatorRodica) from Vydajka group by IdentifikatorStromu) and
  Ciselnik_StavVyplnovania_ID="5" and
  DatumVydania<=DATE_ADD(CURDATE(),INTERVAL -30 DAY)
)

a snažil som sa ho zoptimalizovať pomocou temp tabuľky, len vážne netuším či to je takto dobre (hlavne sa neviem dopracovať k tomu ako sql vlastne interpretuje zdvojený "in")

create temporary table if not exists transfer as (select IdentifikatorStromu as d1,max(IdentifikatorRodica) as d2 from Vydajka group by IdentifikatorStromu);
select ID from Vydajka, transfer
where (
  identifikatorStromu=transfer.d1 and
  identifikatorRodica=transfer.d2 and
  Ciselnik_StavVyplnovania_ID="5" and
  DatumVydania<=DATE_ADD(CURDATE(),INTERVAL -30 DAY)
)

Za odpoveď, poprípade iné návrhy na optimalizáciu vám vopred veľmi pekne ďakujem.

Nástroje: Začni sledovat (0) ?

Odpovědi

6.9.2016 15:08 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: Optimalizácia selectu s in klauzulou s veľa riadkami

Zkus místo IN použít JOIN.

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

6.9.2016 18:11 Lyco | skóre: 14 | blog: Lyco
Rozbalit Rozbalit vše Re: Optimalizácia selectu s in klauzulou s veľa riadkami

dost možná není problém v dotazu ale v indexech.

Pošli nám EXPLAIN původního dotazu, jakou DB používáš, strukturu všech tabulek z dotazu (včetně indexů) a výsledek dotazů

select count(*) from Vydajka;
select count(*) from (select IdentifikatorStromu from Vydajka group by IdentifikatorStromu) t;
select count(*) from Vydajka where Ciselnik_StavVyplnovania_ID="5";
select count(*) from Vydajka DatumVydania<=DATE_ADD(CURDATE(),INTERVAL -30 DAY);

BTW ta konstrukce

SELECT id FROM t WHERE (x, y) in (SELECT x, MAX(y) FROM t GROUP BY x)

se mi nelíbí, co je její účel? Čím je maximální IdentifikatorRodica významný? To je nějaké hledání ve stromové struktuře? Pokud ano, asi se to rozbije, pokud se někdy záznamy přečíslují.

Příspěvek se rázem stává až o 37,5 % pravdivější, je-li pod ním napsáno reálné jméno.

6.9.2016 22:56 Tomáš
Rozbalit Rozbalit vše Re: Optimalizácia selectu s in klauzulou s veľa riadkami

in operátor je zakuklený join v případě kdy je na pravé straně nějaký výraz nad tabulkou (což máte). A join je relativně nejdražší operace ze všech. Pokud hledáte poslední záznam z každé skupiny IndentifikátorStromu zkuste použít OLAP funkce. Tedy asi takto:

select 
  T.ID
from 
  (
    select
      V.*
      ,rank() over (partition by IndentifikátorStromu order by IdentifikatorRodica desc) as rnk
    from Vydajka V
  ) T
where T.rnk=1 
  and Ciselnik_StavVyplnovania_ID="5" 
  and DatumVydania<=DATE_ADD(CURDATE(),INTERVAL -30 DAY)
;

Zavedení temp tabulky má smysl pouze v tom případě, že potřebujete data z ní použít 2x (což není Váš případ). Jinak optimizer si dělá temp tabulky automaticky vnitřně pokud nejdou operace seřadit do pipeline. Libovolná operace hash/merge join, group by,sort vede na vnitřní temp tabulky. Ale naopak nested loop join lze řadit do pipeline stejně jako where/having filtraci s konstantou-

Zkuste si rozmyslet zda by filtrační podmínky na Ciselnik_StavVyplnovania_ID a DatumVydania neměly být ve vnitřním selectu. Mnou uvedený přepis má stejnou sémantiku jako Váš select, ale možná chcete trošku něco jiného.

Pokud používáte mysql/maria/... tak ty, pokud si matně pamatuji, OLAP funkce neuměly. Tam by jste musel sáhnout po kurzoru.

Pokud by jste byl na Oracle tak by šlo použít ještě lepší optimalizaci pomocí konstrukce max(ID) keep (last order by IdentifikatorRodica)

7.9.2016 14:37 vlasta | skóre: 10 | Brno
Rozbalit Rozbalit vše Re: Optimalizácia selectu s in klauzulou s veľa riadkami

mozna bych zacal s tim, ze bych vyfiltroval zaznamy uz v tom group by poddotazu a ten nadrazeny bych pouzil jenom pro zjisteni id na zaklade te dvojice identifikatoru, bude mene dat na groupovani a za predpokladu, ze ta dvojice je indexovana, by to melo byt rychlejsi.

Lepsi by samozrejme bylo pouziti nejake rankovani pomoci analyticke funkce, nebo jak umi oracle keep(dense_rank), ale podle konstrukci predpokladam, ze se jedna o mysql a tam to resit pomoci lokalnich promennych s partitioningem bude asi necitelny opruz.

SELECT ID
  FROM Vydajka
 WHERE (IdentifikatorStromu, IdentifikatorRodica) IN (
   SELECT IdentifikatorStromu,
          MAX(IdentifikatorRodica)
     FROM Vydajka 
    WHERE Ciselnik_StavVyplnovania_ID = "5"
      AND DatumVydania <= DATE_ADD(CURDATE(),INTERVAL - 30 DAY)
    GROUP BY IdentifikatorStromu)

7.9.2016 14:50 krocan
Rozbalit Rozbalit vše Re: Optimalizácia selectu s in klauzulou s veľa riadkami

To je ovsem zcela jiny dotaz a bude mit jiny vysledek.

7.9.2016 15:30 vlasta | skóre: 10 | Brno
Rozbalit Rozbalit vše Re: Optimalizácia selectu s in klauzulou s veľa riadkami

Pravda, trosku jsem se nechal unest jako pentium, bylo by to rychlejsi, ale nejspis blbe, s takovymi vazbami bez analytickych funkci bude asi 1,5 minuty uspech ):

12.9.2016 17:41 kaaja | skóre: 24 | blog: Sem tam něco | Podbořany, Praha
Rozbalit Rozbalit vše Re: Optimalizácia selectu s in klauzulou s veľa riadkami

Problém je samozdřejmě v tom, že select IdentifikatorStromu,max(IdentifikatorRodica) from Vydajka group by IdentifikatorStromu musí projít celou tabulku Vydajka (případně pokud existuje index nad IdentifikatorStromu, IdentifikatorRodica tak projde tenhle index), což je pro něj dost složité.

Klidně je možné, že dotaz upravit moc nepůjde. Pokud není index nad (IdentifikatorStromu, IdentifikatorRodica) asi bych ho zavedl, ale nemusí to být řešení.

Teoreticky by například mohlo být řešení něco takového

select ID from Vydajka v
where 
 Ciselnik_StavVyplnovania_ID="5" and
  DatumVydania<=DATE_ADD(CURDATE(),INTERVAL -30 DAY)
and not exists (
     select 0 from Vydajka vp 
       where vp.IdentifikatorStromu = v.IdentifikatorStromu 
        and vp.IdentifikatorRodica > v.IdentifikatorRodica
)

ale fungovalo by to pouze pokud by podmínky na datum a stav nechali jen málo řádků, pak by se pomocí nestedloopů mohlo jen párkrát zeptat do případného indexu. Pokud se nelíbí not exists mělo by fungovat také toto

select v.ID from Vydajka v
left join Vydajka vp on vp.IdentifikatorStromu = v.IdentifikatorStromu and vp.IdentifikatorRodica > v.IdentifikatorRodica
where vp.ID is null and 
  v.Ciselnik_StavVyplnovania_ID="5" and
  v.DatumVydania<=DATE_ADD(CURDATE(),INTERVAL -30 DAY)

Asi bych také uvažoval o nějakém aplikačním řešení. Je možné, že tabulka Vydajka se plní tak, že by bylo možné si "výsledky" poddotazu někam průběžně ukládat při změně dat. Případně pokud nejsou vždy potřeba zcela aktuální data, tak by bylo možné na poddotaz udělat materializované view s nějakou dobou obnovování a do dotazu připojovat toto view.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje