abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 18:55 | IT novinky

    Dnešním dnem lze již také v Česku nakupovat na Google Store (telefony a sluchátka Google Pixel).

    Ladislav Hagara | Komentářů: 4
    včera 18:33 | IT novinky

    Apple představil (keynote) iPad Pro s čipem Apple M4, předělaný iPad Air ve dvou velikostech a nový Apple Pencil Pro.

    Ladislav Hagara | Komentářů: 1
    včera 17:11 | Nová verze

    Richard Biener oznámil vydání verze 14.1 (14.1.0) kolekce kompilátorů pro různé programovací jazyky GCC (GNU Compiler Collection). Jedná se o první stabilní verzi řady 14. Přehled změn, nových vlastností a oprav a aktualizovaná dokumentace na stránkách projektu. Některé zdrojové kódy, které bylo možné přeložit s předchozími verzemi GCC, bude nutné upravit.

    Ladislav Hagara | Komentářů: 0
    včera 13:44 | Komunita

    Free Software Foundation zveřejnila ocenění Free Software Awards za rok 2023. Vybráni byli Bruno Haible za dlouhodobé příspěvky a správu knihovny Gnulib, nováček Nick Logozzo za front-end Parabolic pro yt-dlp a tým Mission logiciels libres francouzského státu za nasazování svobodného softwaru do praxe.

    Fluttershy, yay! | Komentářů: 0
    včera 13:11 | IT novinky

    Před 10 lety Microsoft dokončil akvizici divize mobilních telefonů společnosti Nokia a pod značkou Microsoft Mobile ji zanedlouho pohřbil.

    Ladislav Hagara | Komentářů: 2
    6.5. 21:33 | Komunita

    Fedora 40 release party v Praze proběhne v pátek 17. května od 18:30 v prostorách společnosti Etnetera Core na adrese Jankovcova 1037/49, Praha 7. Součástí bude program kratších přednášek o novinkách ve Fedoře.

    Ladislav Hagara | Komentářů: 5
    6.5. 21:11 | IT novinky

    Stack Overflow se dohodl s OpenAI o zpřístupnění obsahu Stack Overflow pro vylepšení OpenAI AI modelů.

    Ladislav Hagara | Komentářů: 1
    6.5. 17:55 | Nová verze

    AlmaLinux byl vydán v nové stabilní verzi 9.4 (Mastodon, 𝕏). S kódovým názvem Seafoam Ocelot. Přehled novinek v příspěvku na blogu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    6.5. 17:11 | IT novinky

    Před 50 lety, 5. května 1974 v žurnálu IEEE Transactions on Communications, Vint Cerf a Bob Kahn popsali protokol TCP (pdf).

    Ladislav Hagara | Komentářů: 0
    6.5. 13:44 | Zajímavý článek

    Bylo vydáno do češtiny přeložené číslo 717 týdeníku WeeklyOSM přinášející zprávy ze světa OpenStreetMap.

    Ladislav Hagara | Komentářů: 0
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (64%)
     (7%)
     (13%)
     (16%)
    Celkem 137 hlasů
     Komentářů: 9, poslední včera 22:07
    Rozcestník

    Dotaz: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

    Aleš Janda avatar 8.1.2020 13:29 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
    PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
    Přečteno: 2089×
    Chtěl bych se zeptat, jak nejlépe navrhnout databázi pro toto:

    V tabulce mám řádky, které jsou výsledkem nějakého postupného bádání. Jak bádání pokračuje, můžou být některé řádky zastaralé a nahrazeny jinými řádky. Například mám řádky A, B a C a nějakým algoritmem řeknu „z řádků A a C vyplývá nějaká nová informace D“, a nahradím řádky A a C jedním řádkem D (nebo i více řádky). Z řádků B a D třeba vyplyne něco dalšího, tak je nahradím řádkem E.

    No jo, ale občas si řeknu „tenhle algoritmus byl blbost“, smažu všechny řádky vyrobené tímto algoritmem, a měly by se smazat všechny řádky vyrobené tímto algoritmem, ale i všechny řádky, které vznikly na jejich základě. Například když smažu D, smaže se i E (a zase budou platné A, B a C).

    Na tohle můžu použít cizí klíč (foreign key) s ON DELETE CASCADE.

    No jo, ale jak efektivně hledat na aktuálními daty? Tedy nad daty, které nejsou referencovány jinými řádky (resp. nebyly překryty nějakým dalším algoritmem)? Jediné řešení, co jsem našel, je použít LEFT JOIN přes všechny řádky, ale to mi přijde strašně neefektivní; potřebuju jenom poslední verzi řádků (hodněkrát), a ty překryté jenom když se vracím k předchozím verzím (málokdy).

    Je tedy nějaký způsob indexu „tento řádek je indexován jiným“? Nebo celá ta úvaha je nesmyslná a měl bych to udělat jinak?

    Dělám v PostgreSQL.

    Díky.

    Odpovědi

    8.1.2020 14:10 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
    Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
    Tak předně tabulka může referencovat sama sebe a problém s tím není. A dále mi (letmým pohledem) přijde, že ta data chcete modelovat:
    • buď jako strom (jeden záznam může mít více potomků)
    • nebo jako revize (kdy jeden záznam má více revizí, z nichž platí ta s nejvyšším číslem)
    • anebo jako nějaký obecný graf, pokud má být více záznamů nahrazeno jediným záznamem
    Existují speciální grafové databáze, anebo k tomu můžete použít i sql. Záleží, jak hodně se nad těm daty bude operovat a kolik těch dat je. Hledejte něco jako "store graph data in sql database", "revisions model for data in sql database" nebo "graph database".
    -- OldFrog
    Aleš Janda avatar 10.1.2020 11:07 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
    Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
    Díky. Spíš se k tomu blíží nejvíc ten obecný graf, ale acyklický: novější záznamy ukazují na ty starší, ale starší nemůžou odkazovat na novější.

    Hledal jsem různé metody (třeba to číslo revize je super jednoduché, ale to nemůžu použít), ale moc jsem řešení zatím bohužel nenašel :-(

    Grafovou databázi použít asi můžu, ale PostgreSQL už mám na všechno ostatní, tak se mi nechce zavádět do projektu další závislosti (a další vrstvy komplexity).
    9.1.2020 12:36 gnat
    Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
    Pokud to má být optimalizováno na čtení, tak bych novou a tudíž poslední platnou informaci nastavil jako parenta těch zdrojových řádků. Znamená to při insertu i update zdrojových řádků, ale při selectu pak čtu jen to, co má parent_id null, což je levná podmínka.
    Aleš Janda avatar 10.1.2020 11:12 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
    Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
    Jo, tohle je docela dobrý hack. To parent_id má tedy být spíše child_id, trochu potíž je v tom, že jeden záznam může vygenerovat více různých, takže ty vazby musí být v tabulce vedle (ale to asi musí být tak jako tak).

    Není to optimální řešení z toho pohledu, že bych mohl napsat DELETE FROM … WHERE algoritmus = 'nefunguje' a ono to samo upravilo i ty sloupce child_id, ale tak lepší než nic :-)
    Josef Kufner avatar 10.1.2020 22:43 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
    Pokud algoritmů není mnoho, mohl bys u každého záznamu mít bitmapu značící algoritmy, které daný řádek ovlivnily. Při odvození nového řádku bys provedl OR bitmap všech použitých řádků a přidal bit aktuálního algoritmu.

    Pokud chceš indexovat, můžeš použít místo bitmapy samostatné indexované sloupečky. V takovém případě asi bude rozumné použít samostatnou tabulku s 1:1 relací na datovou tabulku.
    Hello world ! Segmentation fault (core dumped)
    13.1.2020 12:07 logik
    Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
    Pokud je "dětí" víc, tak si ukládej k rodičům pouze počet dětí (updatuj to třeba triggerem) a hledej ty s nulou dětí.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.