abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 04:00 | Komunita

S ukončením podpory Windows 7 spustila Nadace pro svobodný software (FSF) kampaň Upcycle Windows 7 s peticí žádající Microsoft, aby zveřejnil zdrojové kódy tohoto již nepodporovaného operačního systému pod svobodnou licencí. S uvedením Windows 7 v roce 2009 byla spuštěna kampaň Windows 7 Sins.

Ladislav Hagara | Komentářů: 17
dnes 03:00 | Komunita

Sedmý ročník největší české konference o redakčním systému WordPress WordCamp Praha 2020 se uskuteční v sobotu 29. února v pražském Cubex Centru na Pankráci. Na účastníky letos čekají tři tracky přednášek českých i zahraničních řečníků, několik workshopů, případových studií a samozřejmě i Happiness bar, kam se můžete přijít poradit s odborníky. Je to také ideální příležitost potkat stovky dalších WordPress nadšenců i profesionálů.

… více »
smíťa | Komentářů: 0
dnes 02:00 | IT novinky

Společnost Proton Technologies stojící za virtuální privátní sítí ProtonVPN otevřela všechny aplikace ProtonVPN pod licenci GPLv3. Současně oznámila, že tyto aplikace prošly bezpečnostním auditem. Také díky spolupráci s organizací Mozilla.

Fair | Komentářů: 0
včera 04:00 | Komunita

Na Youtube byl zveřejněn videozáznam jednání odvolacího soudu ve sporu Grsecurity (Open Source Security) vs. Bruce Perens [reddit].

Ladislav Hagara | Komentářů: 5
včera 03:00 | Komunita

Byl vyhlášen vítězný wallpaper soutěže o nejlepší wallpaper pro KDE Plasmu LTS 5.18. Vítězným a tedy výchozím wallpaperem je Volna. Autor wallpaperu Nikita Babin získává notebook od TUXEDO Computers.

Ladislav Hagara | Komentářů: 12
včera 02:00 | Nová verze

Nová verze ODF 1.3 (Open Document Format), výchozího formátu dokumentů LibreOffice, byla schválena standardizační komisí OASIS. Mezi novinky ve formátu patří digitální podpis a XML šifrování dokumentů založené na OpenPGP, plus několik vylepšení funkcí již dostupných v ODF 1.2, jako jsou nové typy regresních křivek pro grafy, nová specifikace počtu desetinných míst ve formátování čísel, speciální styl záhlaví/zápatí pro první

… více »
Zdeněk Crhonek | Komentářů: 0
24.1. 09:00 | Komunita

V Brně na FIT VUT probíhá DevConf.CZ 2020, již dvanáctý ročník jedné z největších akcí zaměřených na Linux a open source ve střední Evropě. Na programu je celá řada zajímavých přednášek a workshopů. Aktuální dění lze sledovat například na Twitteru.

Ladislav Hagara | Komentářů: 0
23.1. 23:44 | Komunita

Společnost Psyonix, v květnu 2019 koupena společností Epic Games, oznámila konec podpory počítačové hry Rocket League na Linuxu a macOS. Poslední aktualizace pro tyto operační systémy vyjde v březnu a odstraní možnost hrát tento automobilový fotbal online.

Ladislav Hagara | Komentářů: 13
23.1. 14:33 | Zajímavý článek

Nová čísla časopisů od nakladatelství Raspberry Pi: MagPi 89 (pdf), HackSpace 26 (pdf) a 27 (pdf) a Wireframe 28 (pdf), 29 (pdf) a 30 (pdf).

Ladislav Hagara | Komentářů: 0
23.1. 14:11 | Nová verze

Byla vydána nová verze 12.7 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab (Wikipedie). Představení nových vlastností v příspěvku na blogu.

Ladislav Hagara | Komentářů: 3
Zdají se vám sny s IT tématikou?
 (9%)
 (1%)
 (13%)
 (17%)
 (54%)
 (7%)
Celkem 270 hlasů
 Komentářů: 10, poslední 18.1. 16:18
Rozcestník

www.AutoDoc.Cz

Dotaz: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Aleš Janda avatar 8.1. 13:29 Aleš Janda | skóre: 22 | blog: kýblův blog | Kralupy nad Vltavou
PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
Přečteno: 362×
Chtěl bych se zeptat, jak nejlépe navrhnout databázi pro toto:

V tabulce mám řádky, které jsou výsledkem nějakého postupného bádání. Jak bádání pokračuje, můžou být některé řádky zastaralé a nahrazeny jinými řádky. Například mám řádky A, B a C a nějakým algoritmem řeknu „z řádků A a C vyplývá nějaká nová informace D“, a nahradím řádky A a C jedním řádkem D (nebo i více řádky). Z řádků B a D třeba vyplyne něco dalšího, tak je nahradím řádkem E.

No jo, ale občas si řeknu „tenhle algoritmus byl blbost“, smažu všechny řádky vyrobené tímto algoritmem, a měly by se smazat všechny řádky vyrobené tímto algoritmem, ale i všechny řádky, které vznikly na jejich základě. Například když smažu D, smaže se i E (a zase budou platné A, B a C).

Na tohle můžu použít cizí klíč (foreign key) s ON DELETE CASCADE.

No jo, ale jak efektivně hledat na aktuálními daty? Tedy nad daty, které nejsou referencovány jinými řádky (resp. nebyly překryty nějakým dalším algoritmem)? Jediné řešení, co jsem našel, je použít LEFT JOIN přes všechny řádky, ale to mi přijde strašně neefektivní; potřebuju jenom poslední verzi řádků (hodněkrát), a ty překryté jenom když se vracím k předchozím verzím (málokdy).

Je tedy nějaký způsob indexu „tento řádek je indexován jiným“? Nebo celá ta úvaha je nesmyslná a měl bych to udělat jinak?

Dělám v PostgreSQL.

Díky.

Odpovědi

8.1. 14:10 OldFrog {Ondra Nemecek} | skóre: 32 | blog: Žabákův notes | Praha
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
Tak předně tabulka může referencovat sama sebe a problém s tím není. A dále mi (letmým pohledem) přijde, že ta data chcete modelovat:
  • buď jako strom (jeden záznam může mít více potomků)
  • nebo jako revize (kdy jeden záznam má více revizí, z nichž platí ta s nejvyšším číslem)
  • anebo jako nějaký obecný graf, pokud má být více záznamů nahrazeno jediným záznamem
Existují speciální grafové databáze, anebo k tomu můžete použít i sql. Záleží, jak hodně se nad těm daty bude operovat a kolik těch dat je. Hledejte něco jako "store graph data in sql database", "revisions model for data in sql database" nebo "graph database".
-- OldFrog
Aleš Janda avatar 10.1. 11:07 Aleš Janda | skóre: 22 | blog: kýblův blog | Kralupy nad Vltavou
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
Díky. Spíš se k tomu blíží nejvíc ten obecný graf, ale acyklický: novější záznamy ukazují na ty starší, ale starší nemůžou odkazovat na novější.

Hledal jsem různé metody (třeba to číslo revize je super jednoduché, ale to nemůžu použít), ale moc jsem řešení zatím bohužel nenašel :-(

Grafovou databázi použít asi můžu, ale PostgreSQL už mám na všechno ostatní, tak se mi nechce zavádět do projektu další závislosti (a další vrstvy komplexity).
9.1. 12:36 gnat
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
Pokud to má být optimalizováno na čtení, tak bych novou a tudíž poslední platnou informaci nastavil jako parenta těch zdrojových řádků. Znamená to při insertu i update zdrojových řádků, ale při selectu pak čtu jen to, co má parent_id null, což je levná podmínka.
Aleš Janda avatar 10.1. 11:12 Aleš Janda | skóre: 22 | blog: kýblův blog | Kralupy nad Vltavou
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
Jo, tohle je docela dobrý hack. To parent_id má tedy být spíše child_id, trochu potíž je v tom, že jeden záznam může vygenerovat více různých, takže ty vazby musí být v tabulce vedle (ale to asi musí být tak jako tak).

Není to optimální řešení z toho pohledu, že bych mohl napsat DELETE FROM … WHERE algoritmus = 'nefunguje' a ono to samo upravilo i ty sloupce child_id, ale tak lepší než nic :-)
Josef Kufner avatar 10.1. 22:43 Josef Kufner | skóre: 69
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
Pokud algoritmů není mnoho, mohl bys u každého záznamu mít bitmapu značící algoritmy, které daný řádek ovlivnily. Při odvození nového řádku bys provedl OR bitmap všech použitých řádků a přidal bit aktuálního algoritmu.

Pokud chceš indexovat, můžeš použít místo bitmapy samostatné indexované sloupečky. V takovém případě asi bude rozumné použít samostatnou tabulku s 1:1 relací na datovou tabulku.
Hello world ! Segmentation fault (core dumped)
13.1. 12:07 logik
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč
Pokud je "dětí" víc, tak si ukládej k rodičům pouze počet dětí (updatuj to třeba triggerem) a hledej ty s nulou dětí.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.