abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 15:33 | IT novinky

    Po 26 letech od protiprávního policejního zásahu, který byl spuštěn na základě podnětu společnosti Microsoft, Obvodní soud pro Prahu 2 rozsudkem potvrdil, že Mironet prokázal významnou část svého nároku na náhradu škody vůči Ministerstvu spravedlnosti ČR. Soudem nyní přiznaná část nároku znamená rekordní odškodné, jaké kdy české soudy přiznaly za nesprávný postup státu. Spor byl rozdělen na několik škod, u pravomocně uzavřených částí

    … více »
    Ladislav Hagara | Komentářů: 15
    včera 15:22 | Nová verze

    Lehké desktopové prostředí LXQt bylo vydáno ve verzi 2.4.0. Jde o převážně opravné vydání s drobnými vylepšeními podpory Waylandu.

    |🇵🇸 | Komentářů: 0
    včera 12:44 | IT novinky

    Počítačová hra Kingdom Come: Deliverance 2 českého studia Warhorse získala cenu BAFTA v kategorii nejlepší příběh. V konkurenci pěti dalších nominovaných děl porazila i úspěšnou francouzskou hru Clair Obscur: Expedition 33, která v letošním ročníku získala cenu za nejlepší hru roku.

    Ladislav Hagara | Komentářů: 1
    včera 12:22 | Komunita

    Projekt KDE oslaví v říjnu 30 let. Matthias Ettrich poslal 14. října 1996 do diskusní skupiny comp.os.linux.misc zprávu, která započala historii projektu. Důležité milníky jsou zobrazeny na časové ose KDE.

    Ladislav Hagara | Komentářů: 2
    včera 02:55 | Komunita

    Byly vyhlášeny výsledky letošní volby vedoucí/ho projektu Debian (DPL, Wikipedie). Poprvé povede Debian žena. Novou vedoucí je Sruthi Chandran. Letos byla jedinou kandidátkou. Kandidovala již v letech 2020, 2021, 2024 a 2025. Na konferenci DebConf19 měla přednášku Is Debian (and Free Software) gender diverse enough?

    Ladislav Hagara | Komentářů: 16
    včera 00:55 | Nová verze

    Byla vydána nová verze 10.3 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Přidána byla podpora Orange Pi 4 LTS. Přibyl balíček Prometheus.

    Ladislav Hagara | Komentářů: 0
    19.4. 18:55 | Nová verze

    Implementace VPN softwaru WireGuard (Wikipedie) pro Windows, tj. WireGuard pro Windows a WireGuardNT, dospěly do verze 1.0.

    Ladislav Hagara | Komentářů: 2
    19.4. 16:11 | IT novinky

    V Pekingu dnes proběhl 2. ročník půlmaratonu humanoidních robotů. První 3 místa obsadili roboti Honor Lightning v různých týmech. Nový rekord autonomního robota je 50 minut a 26 sekund. Operátorem řízený robot to zvládl i s pádem za 48 minut a 19 sekund. Řízení roboti měli časovou penalizaci 20 %. Před rokem nejrychlejší robot zvládl půlmaraton za 2 hodiny 40 minut a 42 sekund. Aktuální lidský rekord drží Jacob Kiplimo z Ugandy s časem 57 minut a 20 sekund [𝕏].

    Ladislav Hagara | Komentářů: 6
    17.4. 17:11 | Zajímavý článek

    Stanislav Fort, vedoucí vědecký pracovník z Vlčkovy 'kyberbezpečnostní' firmy AISLE, zkoumal dopady Anthropic Mythos (nový AI model od Anthropicu zaměřený na hledání chyb, který před nedávnem vyplašil celý svět) a předvedl, že schopnosti umělé inteligence nejsou lineárně závislé na velikosti nebo ceně modelu a dokázal, že i některé otevřené modely zvládly v řadě testů odhalit ve zdrojových kódech stejné chyby jako Mythos (například FreeBSD CVE-2026-4747) a to s výrazně nižšími provozními náklady.

    MakeIranBombedAgain❗ | Komentářů: 8
    17.4. 12:44 | IT novinky

    Federální návrh zákona H.R.8250 'Parents Decide Act', 13. dubna předložený demokratem Joshem Gottheimerem a podpořený republikánkou Elise Stefanik coby spolupředkladatelkou (cosponsor), by v případě svého schválení nařizoval všem výrobcům operačních systémů při nastavování zařízení ověřovat věk uživatelů a při používání poskytovat tento věkový údaj aplikacím třetích stran. Hlavní rozdíl oproti kalifornskému zákonu AB 1043 a kolorádskému SB26-051 je ten, že federální návrh by platil rovnou pro celé USA.

    MakeIranBombedAgain❗ | Komentářů: 13
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (8%)
     (1%)
     (12%)
     (30%)
     (3%)
     (6%)
     (2%)
     (15%)
     (25%)
    Celkem 1367 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Prosba o pomoc s optimalizací databáze

    17.10.2005 22:27 | Přečteno: 1358× | Abíčko | poslední úprava: 17.10.2005 22:28

    Právě jsem si zkušebně zapnul logování SQL dotazů a mé černé představy se naplnily. Opravdu je načítání rubrik velmi neefektivní a pomalé. Viz bug 337. Z fleku mě napadl jedna optimalizace (o které přemýšlím ve skutečnosti už nějakou dobu), ale ta pomůže jen z části. A jelikož více hlav více ví, chci vás poprosit o radu. Třeba mi poradíte.

    Nejdříve krátce popíšu datový model. Na úrovni Javy je popsán v článku Strč prst skrz AbcLinuxu - I (a přes ta léta a spoustu nových služeb se prakticky nezměnil), o databázovém schématu se zmíním teď. Každý objekt má svou tabulku s číselným primárním klíčem. Pak je zde tabulka relace, která vytváří vztah rodič-potomek mezi dvěma řádkami libovolných tabulek pomocí kódu tabulky plus čísla řádky.

    Když načtu v Javě nějaký objekt, musím pro něj zjistit i jeho potomky. To zvládne jeden select do tebulky relace, kde vyplním identifikaci předka. Když mě zajímá potomek, už znám kód jeho tabulky a číslo řádky, není problém jej načíst. Tohle je velice jednoduchý a rozšiřitelný postup, který ale má své meze v efektivitě načítání.

    A teď konkrétně. Pro načtení rubriky musím nejdříve zvolit aktuální články a načíst jejich relace. Není problém. A pak pro každý článek načíst seznam jeho potomků, načíst dvě položky (honorář, hlavička diskuse), načíst záznam (obsah článku) a zjistit počet přečtení. Tedy čtyři dotazy na každý článek. Naštěstí používám efektivní cache, ale ta je k ničemu, když je prázdná nebo tu stránku ještě nikdo nenačetl.

    Dovedu si představit, jak načíst ve třech dotazu celkem všechny záznamy, položky i počty přečtení. Trocha kódování a je to. Jen musím být opatrný a nezaneřádit kód nějakým hackem. Ale neznám cestu, jak v jednom dotazu načíst potomky všech objektu a vyznat se ve výsledku, ke kterému výsledku co patří. A vůbec, jak zadat do jednoho dotazu N dvojic. Leda to shlukovat podle typu předka do tolika dotazů, kolik různých typů předků potřebuji načíst.

    Takže jsem si ujasnil myšlenky a nejspíše si na vše přišel sám :-). Ale možná vás napadne lepší způsob.

    CREATE TABLE relace (
     cislo INT AUTO_INCREMENT PRIMARY KEY,  -- identifikator vazby
     predchozi INT NOT NULL,                -- id predchozi vazby
     typ_predka CHAR(1) NOT NULL,           -- id tabulky predka
     predek INT NOT NULL,                   -- id predka
     typ_potomka CHAR(1) NOT NULL,          -- id tabulky obsahu
     potomek INT NOT NULL,                  -- id obsahu
     url VARCHAR(255) DEFAULT NULL,         -- URL stranky
     data TEXT DEFAULT NULL                 -- volitelne jmeno vazby
    );
    
    SELECT * FROM relace WHERE typ_predka=? AND predek=?
           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    17.10.2005 22:36 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    No možná sis ujasnil myšlenky, ale já jsem se v tomhle zápise dokonale ztratil :-). Co třeba napsat ty dotazy co provádíš?
    17.10.2005 22:45 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Nenapadlo mě podívat se do bugu a že tam bude ten log :-).
    17.10.2005 22:48 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    select * from relace where typ_predka='P' and predek=42802 
    select * from polozka where cislo in (42803,42831) order by cislo
    select * from zaznam where cislo in (57550) order by cislo
    select soucet from citac where typ like 'P' and cislo=42802
    

    Ctverice zminenych dotazu. Posledni tri by sly celkem snadno aplikovat hromadne na vsechny clanky. Proste by tam tech cisilek trosku pribudlo :-)

    Ale ten prvni je v obecnem pripade nejhorsi. Zde ale vim, ze se bude menit jen cislo predka. Jenze stejne radeji hledam obecne reseni. Takze kdyz mam treba dvojice (A,1), (A,2), (B,3), (C,1), IMHO by resenim bylo:

    select * from relace where typ_predka='A' and predek in (1,2)
    select * from relace where typ_predka='B' and predek in (3)
    select * from relace where typ_predka='C' and predek in (1)

    A pak rucne projit vracene radky a podle sloupecku predek rozhazet udaje ke spravnym objektum.

    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    17.10.2005 22:54 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    A potřebuješ vůbec všechny ty data? Potomci jsou diskuze?
    18.10.2005 10:14 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Tohle jde určitě zkrátit na
    select * from relace where
      (typ_predka='A' and predek in (1,2)) or
      (typ_predka='B' and predek in (3)) or
      (typ_predka='C' and predek in (1))
    
    Ale jinak se v tom zatím moc nevyznám :-) Je to tak, že v tabulce polozka je honorář a hlavička diskuze a v zaznam je obsah článku? Šlo by sem ještě dát create table pro polozka a zaznam?

    Předpokládám, že ta čísla (42803,42831) a (57550) jsou z relace, a které je nebo je polozka a zaznam se pozna podle typ_potomka?
    18.10.2005 12:03 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Aha, no jasne :-) Easy.

    Ta cisla jsou potomci v tabulce relace, tabulku urcuje sloupecek typ_potomka. Napriklad pro polozku je to 'P.

    Deleni obsahu clanku (zaznam) od hlavicky (polozka) je umyslne, mela to byt optimalizace, aby se dlouhy obsah nenacital pri listovani rubrik. Jak jsem vcera zjistil, tak se to nepovedlo ;-) Ale pujde to zoptimalizovat, kdyz uz o tom vim.

    Ted frcim na obed ..
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    18.10.2005 12:24 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Deleni obsahu clanku (zaznam) od hlavicky (polozka) je umyslne, mela to byt optimalizace, aby se dlouhy obsah nenacital pri listovani rubrik.

    Nestačilo by nepoužívat 'select *'? Navíc u databází bývá zvykem, že v záznamu nejsou celé BLOBy, ale jen jakési handly na ně, ale nevím, jestli to tak dělá i MySQL.

    18.10.2005 13:43 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Jenze ja si ihned nafetchuji cely obsah vcetne blobu a ulozim do cache.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    18.10.2005 12:39 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Otázka je, jak moc to optimalizovat na počet dotazů – ono by to samozřejmě šlo napsat jako jeden dotaz (OUTER JOIN), který bude v každém řádku ve spoustě sloupečků mít NULL, a pak si to v Javě rozebrat - jenže tím se IMHO moc neušetří. Předpokládám, že všechny dotazy běží nad jedním Connection – navázání spojení je pomalé, ale režie na dotaz/odpověď podle mne nebude tak velká, aby se vyplatilo vše uměle cpát do jednoho dotazu.

    No ale jak teď na to koukám, na vypsání seznamu článků v rubrice by měl stačit 1 SQL dotaz :-) Bez zdrojáků a struktury DB se to těžko odhaduje, ale zkusím to popsat abstraktně :-) Tož:
    SELECT *
    FROM relace AS Rserial, relace AS Rclanky
    WHERE Rserial.url = ? AND
      Rserial.cislo = Rclanky.cislo AND Rclanky.typ = 'P'
    ORDER BY Rclanky.cislo
    
    Tím bych měl získat čísla všech článků v seriálu. K nim potřebuji přidat obsah (zaznam) a třeba dvě položky z polozka – dejme tomu autor a honorar. Upravím tedy SELECT:
    SELECT *
    FROM relace AS Rserial, relace AS Rclanky, zaznam, polozka AS Pautor, polozka AS Phonorar
    WHERE Rserial.url = ? AND
      Rserial.cislo = Rclanky.cislo AND Rclanky.typ = 'P' AND
      zaznam.cislo = Rclanky.cislo AND
      Pautor.cislo = Rclanky.cislo AND
      Phonorar.cislo = Rclanky.cislo
    ORDER BY Rclanky.cislo
    
    Stejně by se do SELECTu přidal i počet položek. Na spojování tabulek jsou databáze optimalizované, pokud jsou na příslušných sloupečcích indexy, mělo by to být OK.

    Výsledkem SELECTu by měl být 1 řádek = 1 článek. Místo SELECT * si samozřejmě vyberu jen ty sloupečky, které potřebuji.

    Doufám, že tu nepíšu úplné nesmysly a půjde to na strukturu databáze napasovat :-)
    18.10.2005 12:46 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Jak tak koukám do toho logu, asi nejde pospojovat položku s článkem přímo, ale zase pře relaci. Tedy:
    SELECT *
    FROM
      relace AS Rserial,
      relace AS Rclanky,
      zaznam,
      polozka AS Pautor,
      polozka AS Phonorar,
      relace AS Rautor,
      relace AS Rhonorar
    WHERE Rserial.url = ? AND
      Rserial.cislo = Rclanky.cislo AND Rclanky.typ = 'P' AND
      zaznam.cislo = Rclanky.cislo AND
      Pautor.cislo = Rautor.cislo AND
      Rautor.predek = Rclanky.cislo AND
      Rautor.typ_predka = 'P' AND
      Phonorar.cislo = Rhonorar.cislo AND
      Rhonorar.predek = Rclanky.cislo AND
      Rhonorar.typ_predka = 'P'
    ORDER BY Rclanky.cislo
    
    18.10.2005 13:42 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Ono ani neni cilem mit vsechno v jedinem SQL dotazu. Pak by byl docela problem, jak cachovat vysledky a vubec, jak tvorit SQL dotazy a parsovat jejich vysledek. Preci jen univerzalni rozhrani ma vyhodu, ze jak se jednou napise, nemusi se o ne jiz starat, proste funguje. Takze ted tam vzdy je zaznam, ktery ale nepotrebuji a nekdy tam byvaji diskuse a honorare. V budoucnu muze pribyt janevimco a rozhodne nechci kvuli tomu studovat, co vsechno prestane fungovat.

    Takze spise mi jde o zefektivneni vrstvy persistence, aby zvladala hromadne nacitani dat nad skupinou vysledku. A to si myslim, ze zapis + diskuse uz resi.
    CREATE TABLE polozka (
     cislo INT AUTO_INCREMENT PRIMARY KEY,  -- jednoznacny identifikator
     typ SMALLINT,                          -- typ polozky (diskuse, faq, ..)
     podtyp VARCHAR(30) NULL,               -- podtyp
     data TEXT NOT NULL,                    -- XML 
     pridal INT(6) NOT NULL,                -- odkaz na uzivatele
     vytvoreno DATETIME,                    -- cas vytvoreni
     zmeneno TIMESTAMP NOT NULL             -- cas posledni zmeny
    );
    
    CREATE TABLE zaznam (
     cislo INT AUTO_INCREMENT PRIMARY KEY,  -- jednoznacny identifikator
     typ SMALLINT,                          -- typ zaznamu (HW, SW, clanek ..)
     podtyp VARCHAR(30) NULL,               -- podtyp
     data LONGTEXT NOT NULL,                -- XML 
     pridal INT(6) NOT NULL,                -- odkaz na uzivatele
     vytvoreno DATETIME,                    -- cas vytvoreni
     zmeneno TIMESTAMP NOT NULL             -- cas posledni zmeny
    );
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    22.10.2005 14:05 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Ted se nestahuji zaznamy. Celkove nacteni rubriky jadernych novin kleslo z 2403 ms na 1466 ms. 39% je slusny vysledek, ale mi nestaci, tudiz delam ted na hromadnem nacitani potomku. Pak budu moci hromadne nacist i diskuse a verim, ze se dostanu nekde k 750 milisekundam. A az nejak rozumne vyresim nacitani ctennosti clanku, mohlo by to klesnout na ctvrtinu skundy. Uvidime. Sledujte bug pro aktuality :-)
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    17.10.2005 22:48 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    • Proč text porovnáváš pomocí LIKE když ho nepotřebuješ?
    • Jaké tam jsou indexy? Některé dotazy mi připadají dost pomalé.
    • Zkoušel ses podívat na EXPLAIN u složitějších dotazů?
    17.10.2005 22:51 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    ALTER TABLE relace ADD INDEX in_potomek (typ_potomka,potomek);
    ALTER TABLE relace ADD INDEX in_predek (typ_predka,predek);
    ALTER TABLE relace ADD INDEX in_predchozi (predchozi);
    ALTER TABLE relace ADD INDEX in_url (url);

    Indexy jsem delal podle EXPLAIN, ale spise jen amatersky.

    Pokud jde o prvni dotaz, mas pravdu, take jsem si ted vsimnul, ze ten LIKE je zbytecny, kdyz znam presnou hdonotu. Ale bude to poznat na vykonnosti, kdyz ma sloupecek vzdy jediny znak a ten strcim do vyrazu? Pak snad nebude rozdil mezi porovnanim a LIKE, ne?

    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    17.10.2005 23:05 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Nevím nakolik je optimalizátor chytrý, jestli zkoumá že LIKE je zbytečný a nechce se mi generovat dost dat, abych to vyzkoušel :-).

    A vůbec co vnořené dotazy? Připadá mi, že by se tam daly použít a pak ti dotazů pár ubyde :-).
    18.10.2005 00:14 Martin Tůma | skóre: 39 | blog: RTFM | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze

    Chápu to dobře, že každej jednotlivej příspěvek v diskusi získáváš jedním SQL dotazem? V případě, že ano, nebylo by mnohem efektivnější získat všechny příspěvky z jednoho vlákna pomocí 1 dotazu (například podle UID prvního-kořenového záznamu) a ty pak srávně "pospojovat" podle nějakého identifikátoru udávající pozici ve stromu příspěvků u jednotlivých příspěvků až v aplikaci?

    Každý má právo na můj názor!
    18.10.2005 08:33 Zdeněk Štěpánek | skóre: 57 | blog: uz_mam_taky_blog | varnsdorf
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    Zdravim

    Nejsem zadny DB expert, ale jen premyslim nahlas. Ty tema dotazama nactes data a pak z nekolika nactenych tabulek vybiras data a spojujes je dohromady. Otazka je, zda je to zpomaleni v databazi nebo v jave (kde se ty data spojujou a vybiraj z nactenych tabulek).

    Osobne si myslim, ze nejdyl trva java, protoze ty dotazy opravdu nejsou zadny slozity veci. A jelikoz si myslim, ze prace s daty by mela byt v databazi rychlejsi nez to rucne kodovat v jave, nechal bych co nejvice hruby prace na databazi. Takze bych vyuzil spojovani tabulek a/nebo vnorene dotazy.

    Nevim ted co je to za databazi (nebudu to lovit, tipuju Postgres), neslo by si tam nadefinovat vlastni procedury, mohly by byt vykonnejsi nez java.

    Priklad na spojovani tabulek z praxe, prijde mi to skoro to samy. I kdyz nevim, jestli to zrovna tobe ma smysl vykladat.

    V jedny tabulce mam hash ID klienta a jeho IP adresu (id, ip). V druhe tabulce mam opet hash ID klienta a jeho cele jmeno (id, name). Ve vysledku potrebuju dvojice cele jmeno a ip adresa (name, ip). Klasicke reseni by bylo nacist tabulku s ip adresama, cyklicky parsovat radky a ziskane hash ID davat do dotazu do druhe tabulky (selectname from druha_tabulka where id=$id). Tohle funguje a na kazdy radek to sezere dva dotazy. Lze ale pouzit spojeni tabulek, sql dotaz vypadfa takhkle:

    select name,ip from prvni_tabulka, druha_tabulka where prvni_tabulka.id = druha_tabulka.id

    Co to vraci je snad videt jasne.

    Zdenek
    www.pirati.cz - s piráty do parlamentu i jinam www.gavanet.org - czfree varnsdorf
    22.10.2005 15:52 Honza Král | skóre: 3 | Praha
    Rozbalit Rozbalit vše Re: Prosba o pomoc s optimalizací databáze
    myslim, ze se jedna o MySQL, taky jak na to koukam, tak si rikam, ze by dost slo resit/zjednodusit pomoci ulozenych procedur a hlavne vhodne nadefinovane view...

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.