Přihlášení | Registrace

napište » Zprávičky

včera 17:33 | Nová verze

Canonical vydal (email, blog, YouTube) Ubuntu 24.04 LTS Noble Numbat. Přehled novinek v poznámkách k vydání a také příspěvcích na blogu: novinky v desktopu a novinky v bezpečnosti. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu MATE, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 10. LTS verzi.

Ladislav Hagara | Komentářů: 4

Videozáznam z Czech Open Source Policy Forum 2024

včera 14:22 | Komunita

Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

Ladislav Hagara | Komentářů: 1

Fossil 2.24

včera 13:22 | Nová verze

Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

Ladislav Hagara | Komentářů: 0

Vivaldi 6.7

včera 12:44 | Nová verze

Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

Ladislav Hagara | Komentářů: 0

Node.js 22

včera 04:55 | Nová verze

OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

Ladislav Hagara | Komentářů: 0

Proxmox Virtual Environment 8.2

včera 04:22 | Nová verze

Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

Ladislav Hagara | Komentářů: 0

R 4.4.0 (Puppy Cup)

včera 04:11 | Nová verze

R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

Ladislav Hagara | Komentářů: 0

IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů

24.4. 22:44 | IT novinky

IBM kupuje společnost HashiCorp (Terraform, Packer, Vault, Boundary, Consul, Nomad, Waypoint, Vagrant, …) za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

Ladislav Hagara | Komentářů: 12

TrueNAS SCALE 24.04 “Dragonfish”

24.4. 15:55 | Nová verze

Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Raspberry Pi Compute Module 4S s 2 GB, 4 GB a 8 GB paměti

24.4. 13:44 | IT novinky

Oznámeny byly nové Raspberry Pi Compute Module 4S. Vedle původní 1 GB varianty jsou nově k dispozici také varianty s 2 GB, 4 GB a 8 GB paměti. Compute Modules 4S mají na rozdíl od Compute Module 4 tvar a velikost Compute Module 3+ a předchozích. Lze tak provést snadný upgrade.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (73%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (16%)

Celkem 765 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Články / Stromy v SQL

Štítky: AbcLinuxu, Content Management System, databáze, distribuce, KDE, kernel, Linux, Mandriva, MySQL, Unix, wiki, Windows

Stromy v SQL

11. 1. 2006 | Pavel Szalbot | Různé | 14567×

Stromy lze s pomocí jazyka SQL sázet, kácet i česat vícero způsoby. Ukážeme si jeden klasický a dva pokročilejší.

Stromy

Definice

Pojmem strom se zpravidla označuje neorientovaný graf, jehož každé dva vrcholy jsou spojeny právě jednou cestou (pokud nerozumíte, zkuste se podívat třeba do wiki - graf, strom).

Strom může reprezentovat vybranou hierarchickou (stromovou) strukturu a ta je předmětem toho článku. Kde že jste mohli strom mimo park zahlédnout? Zajisté jste se s nimi setkali minimálně v diskusních fórech ABCLinuxu.cz, nebo při nakupování v internetovém obchodě, na jehož kategoriích výrobků si budeme práci se stromovou strukturou prezentovat. Důvodem je několik "zajímavých" akcí, jež se v internetovém obchodě provádějí. Uložištěm našeho stromu bude RDBMS komunikující jazykem SQL (konkrétně MySQL a v jednom případě i PostgreSQL).

Jaký strom zasadit?

V perexu jsem naznačil, že si ukážeme celkem tři příklady reprezentace stromu v SQL. Než si z nich vůbec začneme vybírat, měli bychom si ujasnit to, co od stromu budeme očekávat. Aplikace typu internetový obchod může provádět následující akce:

základní práce se stromem - CRUD operace s uzly (kategoriemi) (Create, Retrieve, Update, Delete)
rozbalení stromu ve vybraném uzlu
nalezení všech "podkategorií" dané kategorie (pro různé filtry, ale také zobrazení všech výrobků z kategorie a jejich podkategorií)
zobrazení cesty k vybranému uzlu od kořene

Operací s hierarchickou strukturou bude pravděpodobně více a mnohé mohou být efektivněji provedeny na aplikační úrovni (např. načtením celé struktury a jejím zpracováním namísto několika SQL dotazů). Ponechme je ale stranou a zkusme se podívat, co nám nabízí samotné SQL. Vzhůru do lesů!

Sebereferenční tabulky

Prvním způsobem uložení hierarchické struktury v SQL tabulce budou tzv. sebereferenční tabulky, definující strom seznamem následníků. Sebereferenční tabulky využívají vazby rodič-syn/dcera v hierarchické struktuře přítomné. Pro jednoduchost budeme předpokládat, že každý uzel má nanejvýš jednoho rodiče.

Uvažujme následující hierarchii kategorií:

strom

SQL tabulka by mohla být vytvořena příkazem:

 CREATE TABLE categories(
  id INT NOT NULL PRIMARY KEY, 
  name VARCHAR(32), 
  parent INT NOT NULL);

a její obsah by vypadal takto:

+----+---------------------+--------+
| id | name                | parent |
+----+---------------------+--------+
|  1 | Operační systémy    |      0 |
|  2 | Unix                |      1 |
|  3 | Linux               |      1 |
|  4 | Windows             |      1 |
|  5 | Red Hat	    	   |	  3 |
|  6 | Mandriva            |      3 |
+----+---------------------+--------+

Jak vidíte, každý uzel má unikátní identifikátor (číslo ID) a také jsme mu přiřadili rodiče. Všimněte si, že kategorie "Operační systémy" má ve sloupci parent nulu, i když žádná taková kategorie v tabulce není. Její syny budeme označovat jako kořenové kategorie a pro ni samotnou nebudeme požadovat rodiče.

Podívejme se teď na operace, které nás při práci se stromovou strukturou budou otravovat.

CRUD operace jsou vcelku triviální. Vkládání zajistí prostý INSERT. Při odebírání bychom měli dbát na to, abychom dle potřeby rekurzivně smazali i uzly-syny, což je v košatém stromě docela náročné. Přesun uzlu (a celého jeho podstromu!) v rámci stromu, tj. změnu jeho rodiče, realizujeme jednoduchým UPDATE.

Zobrazení podstromu provedeme podobně jako smazání - rekurzivně vybereme všechny potomky právě zpracovávaného uzlu. Podotkněme, že výhoda načtení celého stromu a jeho zpracováním aplikací sice ušetří práci databázi, ale nelze ji dost dobře použít při získávání všech výrobků patřících do kategorií podstromu, kterých může být velmi mnoho.

Rozbalení stromu dle vybrané kategorie je variací na téma zobrazení podstromu s tím, že do hloubky jdeme jen po cestě od kořene k rozbalovanému uzlu. Nalezení této cesty je při této reprezentaci znovu náročné.

Předností sebereferenčních tabulky je jejich jednoduchost - při práci s ní si bohatě vystačíte se znalostí rekurze. Cenou ovšem bude neúměrné zatížení databázového serveru zvláště v případě, že se stromem budete pracovat často, což se u internetového obchodu děje obvykle s každou zobrazenou stránkou, či když strom bude hezky košatý (uzly mají mnoho potomků) a vysoký (mnoho generací potomků). Odlehčit si můžete jistou úrovní cachování stránek, nicméně časem se nejspíš poohlédnete po výkonnějším řešení.

Genealogické stromy

A narazíte možná na genealogické stromy. Genealogický strom také využívá vazbu rodič-syn mezi uzly, ale navíc pro každý uzel definuje i tzv. genealogický identifikátor. Tento identifikátor je unikátní pro každý uzel a dají se z něj vyčíst informace o jeho předcích (rodičích, prarodičích, prapra...) i potomcích. Identifikátor potomka totiž získáme tak, že za identifikátor předka připojíme identifikátor potomka.

Zvolíme-li za identifikátor písmeno abecedy, pak bude naše rozšířená tabulka obsahovat tyto záznamy:

+----+---------------------+--------+------+
| id | name                | parent | path |
+----+---------------------+--------+------+
|  1 | Operační systémy    |      0 |    A |
|  2 | Unix                |      1 |   AA |
|  3 | Linux               |      1 |   AB |
|  4 | Windows             |      1 |   AC |
|  5 | Red Hat      	   |	  3 |  ABA |
|  6 | Mandriva            |      3 |  ABB |
+----+---------------------+--------+------+

CRUD operace tentokrát váže několik nepříjemných podmínek. Jednou z nich je omezení počtu potomků dle volby uložení identifikátoru (v případě písmen abecedy smít uzel mít "jen" 26 přímých potomků). Vložení nového uzlu do stromu provedeme tak, že zjistíme genealogický identifikátor rodiče a za identifikátor uzlu zvolíme nejmenší možné písmeno abecedy, které je na dané úrovni volné (úrovní rozumíme množinu přímých potomků rodiče). Zaveďme proto požadavek, aby na sebe identifikátory sourozenců lexikálně navazovaly.

Odstraňení uzlu je velmi snadné. Stačí smazat všechny uzly, jejichž genealogický identifikátor začíná identifikátorem odstraňovaného uzlu. Pokud bychom v naší hierarchii chtěli z nabídky odstranit podstrom s kořenovou kategorií "Linux", provedli bychom SQL příkaz:

DELETE FROM categories WHERE genealogical LIKE 'AB%';

Tím nám ovšem může vzniknout mezera na úrovni mazaného uzlu (Linux), což si nepřejeme a musíme proto po smazaní uzlu aktualizovat identifikátory postižených uzlů.

Přesun uzlu provedeme příslušnou změnou umístění (změna rodiče) a následnou aktualizací identifikátorů.

Poznamenejme, že návaznost identifikátorů se nakonec zdá být spíše na škodu, jelikož nám práci docela komplikuje, nicméně se bez procedury na odstranění hluchých míst ve stromu nejspíš neobejdeme.

Zobrazení kompletního podstromu je poněkud svízelné. Sice nám postačí SELECT s klauzulí ORDER BY genealogical, aplikace ovšem často požaduje, aby byl výstup abecedně setříděn. Tuto komplikaci lze vyřešit už během CRUD operací, totiž vkládáním nových uzlů na správné místo. Cenou je bohužel režie spojená s tříděním a následnou aktualizací identifikátorů.

Chcete-li si ušetřit nepříjemnosti s nedostatkem písmen a přepočítáváním po mazání, můžete použít jiný identifikátor. V praxi se často používá např. speciální oddělovač následovaný číselnou sekvencí. Identifikátor uzlu Red Hat by byl "/1/3/5&qout;.

Konečně nalezení cesty k uzlu zařídí:

SELECT * FROM categories WHERE 'ABB' LIKE genealogical||'%'
nebo
SELECT * FROM categories WHERE 'ABB' LIKE concat(genealogical, '%')

Nested set aneb DFS strom

Posledním a dle mého názoru nejvýkonnějším řešením je tzv. nested set reprezentace stromu. (Pozn.: Tento název používá Joe Celko a z různých článku se zdá, že není sám. Ačkoli podstatu uložení informace o uzlech charakterizuje čitelně i pro základních grafových algoritmů neznalé, lepší název by mohl být DFS strom.) Podívejme se nejprve na tabulku:

+----+---------------------+--------+------+-------+
| id | name                | parent | left | right |
+----+---------------------+--------+------+-------+
|  1 | Operační systémy    |      0 |    1 |    12 |
|  2 | Unix                |      1 |    2 |     3 |
|  3 | Linux               |      1 |    4 |     9 |
|  4 | Windows             |      1 |   10 |    11 |
|  5 | Red Hat	    	   |	  3 |    5 |     6 |
|  6 | Mandriva            |      3 |    7 |     8 |
+----+---------------------+--------+------+-------+

Vychází ze sebereferenční tabulky, kterou rozšiřuje atributy left a right. Jejich hodnoty jsou získány průchodem stromu DFS (depth first search) algoritmem. Pseudokód algoritmu:

 DFS(graf)
  foreach uzly_grafu as uzel do
    uzel->barva = bila
  done
  cas = 0
  foreach uzly_grafu as uzel do
    if uzel->barva = bila
      DFS-PROJDI(uzel)
  done
  end

DFS-PROJDI(uzel)
  uzel->barva = seda
  cas = cas + 1
  uzel->nalezen = cas
  foreach sousede[uzel] as soused do
    if soused->barva = bila
      DFS-PROJDI(soused)
  done
  uzel->barva = cerna
  uzel->opusten = cas

Algoritmus začíná voláním funkce DFS, které je předán zkoumaný graf. Ta nastaví barvu všech uzlů na bílou (uzel dosud nebyl navštíven), seřídí čas a následně prochází uzly grafu s tím, že pokud je uzel bílý, zavolá funkci DFS-PROJDI. DFS-PROJDI přebarví uzel na šedou (byl navštíven, ale dosud se zpracovává), zvedne čas o jedničku a použije jej jako čas navštívení uzlu a poté rekurzivně prochází dosud nenavštívené sousedy uzlu předaného jako parametr. Jakmile jsou všichni sousedé zpracování, přebarví uzel na černou (zpracování dokončeno), nastaví čas opuštění uzlu a vrací se.

Čas navštívení a opuštění uzlu se použijí jako hodnoty atributů left resp. right v SQL tabulce. Lepší představu o výsledku můžete získat z obrázku.

DFS strom

Všimněte si, že interval <left;right> libovolného uzlu je podintervalem intervalu vlastního rodiče (odtud nested set = vnořené množiny). Tato vlastnost plyne z toho, jak DFS prochází strom a ukladá časy a právě ona nám ulehčí práci s hierarchickou strukturou v SQL.

Podívejme se na operace, které chceme nad strukturou provádět. Všechny podkategorie zvolené kategorie získame jednoduchým SELECTem:

SELECT * FROM categories WHERE left >=x AND right <=y

Oproti rekurzi sebereferenčních tabulek podmíněnou mnoha dotazy či spíše přenosem většího množství dat jsme ve výhodě, ovšem genealogický identifikátor umožňuje totéž, ač s nutností použití pomalejšího operátoru LIKE. Získat výstup setříděný podle názvu uzlů je tentokrát o něco jednodušší. Po každé CRUD operaci totiž musíme aplikovat DFS algoritmus na celý strom znovu. Aby DFS generoval časy s ohledem na abecední pořadí uzlů, stačí naštěstí jen vhodně připravit pořadí uzlů, ve kterém jsou algoritmem zpracovávány (nezapomeňte abecedně setřídit i pole sousede[uzel]).

Cestu k uzlu nalezneme také velmi jednoduše. Stačí si uvědomit, že každý předek uzlu byl navštíven dříve a opuštěn později než uvažovaný uzel.

SELECT * FROM categories WHERE left <= x AND right >=y

DFS strom se zdá být velmi vhodný pro statické, či málo upravované struktury. Uplatnění si však zajisté najde i v případě potřeby vyhledávání ve velmi rozsáhlých hierarchických strukturách.

Závěr

Předvedli jsme si tři možné reprezentace hierarchické struktury v SQL databázích. Jejich přednosti a nevýhody je třeba zvážit vždy s ohledem na konkrétní využití, přičemž společnou výhodou se jeví zvláště přenositelnost mezi různými databázovými servery. Dle předložených indicií a zdrojů na internetu si zajisté zvolité správnou reprezentaci pro požadované použití.

Hodnocení: 97 %

špatné • dobré

Nástroje: Tisk bez diskuse

Tiskni Sdílej:

Komentáře

Nástroje: Začni sledovat (2) ? , Tisk

Vložit další komentář

11.1.2006 00:50 diverman | skóre: 32 | blog: život s tučňáčkem
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Dobrej článek. Přidávám nějaké odkazy do slovníku:
SŘBD
RDBMS
PostgreSQL
MySQL

deb http://ftp.cz.debian.org/debian jessie main contrib non-free

11.1.2006 00:59 3018736794024648 | blog: plathel
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

<ohraný vtip> Proč pařez není strom?

Protože obsahuje kružnice. </ohraný vtip>

11.1.2006 07:46 Martin Beránek | skóre: 33 | blog: mousehouse | Brno
Rozbalit Rozbalit vše Re: Stromy v SQL

ale divil by ses kolik lidi to nezna :-)

never use rm after eight

11.1.2006 09:25 Věroš | skóre: 24 | blog: Co není v hlavě | 49.29 s.š., 16.54. v.d.
Rozbalit Rozbalit vše Re: Stromy v SQL

Moji kolegové ten vtip nejen neznají, ale ani se mu nesmějí :-(

A to jsem si na něj ráno taky vzpomněl.

Školím Ansible

15.1.2006 21:14 twain
Rozbalit Rozbalit vše Re: Stromy v SQL

A vite, ze strom neni nic jineho nez souvisly les? Miluju teorii grafu :).

11.1.2006 01:14 Jiří Hlinka | skóre: 29 | blog: zapisky | Teplice
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Díky za tenhle článek!
Jirka

11.1.2006 08:49 100rk | Ceskoslovensko
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Pred casem vysel podobny clanek na interval.cz: http://interval.cz/clanek.asp?article=3801

11.1.2006 08:54 Pavel 'lingeek' Szalbot | skóre: 54 | Třinec
Rozbalit Rozbalit vše Re: Stromy v SQL

Interval bohužel nečtu, to bych ten článek možná nedopsal. Ale zaujalo mě pojmenování "Modified Preorder Tree Traversal Algoritmus" :-)

Math, as Barbie says, is hard.

11.1.2006 09:00 Leoš Literák | skóre: 74 | blog: LL | Praha
Rozbalit Rozbalit vše Re: Stromy v SQL

Ze podobny clanek vysel jinde pro nas neni zadne kriterium. To bychom nemohli vydavat skoro nic, protoze vzdycky by se ve svete naslo neco podobneho. Dulezite ale je, aby clanek byl originalni. Coz Pavluv clanek je.

Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow

11.1.2006 09:07 100rk | Ceskoslovensko
Rozbalit Rozbalit vše Re: Stromy v SQL

Moje reakce byla myslena jen jako dalsi informacni zdroj na toto tema. Nepodsouvejte mi prosim jine umysly.

11.1.2006 10:38 Leoš Literák | skóre: 74 | blog: LL | Praha
Rozbalit Rozbalit vše Re: Stromy v SQL

Nic jsem vam nepodsouval. Jen jsem sdelil nase kriteria.

Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow

11.1.2006 09:04 Tom Hlava | skóre: 4
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Děkuji za pěkný článek.
Rád bych se zeptal:
Nebude u varianty "DFS" nutné zajistit, aby při CRUD operaci byl průchod stromem prováděn v jednom okamžiku pouze jedním procesem?
Stačí standardní trasakce, nebo nějaká vyšší úroveň izolace? - nebude nakonec potřeba zamknout na dobu průchodu celou tabulku?

11.1.2006 09:19 Pavel 'lingeek' Szalbot | skóre: 54 | Třinec
Rozbalit Rozbalit vše Re: Stromy v SQL

Záleží na tom, co potřebujete. Pokud vyloženě nesmí dojít k práci s nekonzistentními daty, zřejmě potřebujete buď exclusive (table) lock u InnoDB (MyISAM) tabulek MySQL, nebo serializable level u PostgreSQL. U jiných RDBMS analogicky...

Math, as Barbie says, is hard.

11.1.2006 09:08 Vladimir Kralik
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Velmi dobry clanok. Dakujem.

11.1.2006 10:07 hajma | skóre: 27 | blog: hajma | Říčany
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

oba odkazy na wiky jsou shodné, opravte si to

21 promarněných znaků

11.1.2006 10:10 Pavel 'lingeek' Szalbot | skóre: 54 | Třinec
Rozbalit Rozbalit vše Re: Stromy v SQL

Strom -> http://cs.wikipedia.org/wiki/Strom_%28graf%29

Math, as Barbie says, is hard.

11.1.2006 11:43 morpho | skóre: 4 | blog: morpho
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Zdravim, clanek je super. Dle meho nazoru by tohle meli vyucovat jiz na strednich technickych skolach. Obcas se v praci setkavam s novymi spolupracoviky kteri se honosi titulem ing, ale znaji jen Sebereferenční tabulky.

V Oracle jsou pro stromy primo embedded funkce, je neco podobneho i v MySQL nebo Postgree?

Morpho

To že daný produkt neumíme používat ještě neznamená že musi být bezpodmínečně špatný

11.1.2006 12:01 Pavel 'lingeek' Szalbot | skóre: 54 | Třinec
Rozbalit Rozbalit vše Re: Stromy v SQL

PostgreSQL má modul ltree v contribu viz třeba výborný článek na Rootu.

Math, as Barbie says, is hard.

11.1.2006 23:26 Pavel Janousek
Rozbalit Rozbalit vše Re: Stromy v SQL

No pokud vyuka abstraktnich datovych typu/struktur je v podani jisteho, dnes jiz Profesora, tak se ani k tem sebereferencnim tabulkam nedostanete...

15.1.2006 09:29 JP
Rozbalit Rozbalit vše Re: Stromy v SQL

Pan studoval v Brně, není-liž pravda? ;-)

16.1.2006 14:58 zde | skóre: 9 | blog: Linuch | Brno
Rozbalit Rozbalit vše Re: Stromy v SQL

Kterou školu? Tady je těch technik, kde se informatika učí, povícero...

Táto, ty de byl? V práci, já debil.

20.2.2006 10:37 Murdej
Rozbalit Rozbalit vše Re: Stromy v SQL

No to já znám jednoho ing co udělal strom který měl maximálně 3 úrovně a měl pro každou větev zvlášť tabulku :)

11.1.2006 14:18 Trained.Monkey | skóre: 12 | blog: monkey
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Diky za skvely clanek, jsem jeden z "PHP programatoru",ale snazim se polepsit, hlavne posledni algoritmus mi prijde docela vychytany.

12.1.2006 11:39 Honza
Rozbalit Rozbalit vše neorientovaný graf

Odpovědět | Sbalit | Link | Blokovat | Admin

Chtěl bych upozornit, že definujete strom jako speciální případ neorientovaného grafu, ale v databázi i na obrázku jej chápete jako orientovaný. V neorientovaném stromu nemají pojmy jako potomek nebo předek co dělat. Ale jinak zajímavý článek.

12.1.2006 12:24 Pavel 'lingeek' Szalbot | skóre: 54 | Třinec
Rozbalit Rozbalit vše Re: neorientovaný graf

Správně. Jsem rád, že si toho někdo všimnul. Orientaci jsem nakonec vypustil, abych to už nekomplikoval - nechtěl jsem zabřednout v definicích (i když by to vyspravila jedna věta). Hierarchická struktura už ovšem orientaci potřebuje a tu jsem spolu s označením "stromová" používal.

Math, as Barbie says, is hard.

16.1.2006 14:56 zde | skóre: 9 | blog: Linuch | Brno
Rozbalit Rozbalit vše DFS strom

Odpovědět | Sbalit | Link | Blokovat | Admin

Moc jsem nepochopil proč se pro DFS strom uzlům přiřazují DVĚ čísla. IMHO by úplně stačilo jen očíslovat uzly v depth-first pořadí, ušetří se jednak jeden sloupec, navíc doména toho zbylého bude poloviční (ušetří se jeden bit).

Pro vyhledání podstromu pak pro daný kořen X stačí vyhledat uzly x, pro které X <= x < Y, kde Y je nejmenší větší sybling k X. K jeho zjištění je sice potřeba dalšího dotazu, ale obvykle když potřebuji kompletní podstrom uzlu X, zobrazuji někde poblíž i všechny jeho syblings, takže je to zadarmo.

Jo a taky si myslím že i "hloupý" rekurzivní výpis by mohl být docela rychlý, kdyby se prováděl breadth-first. Lidé nemají rádi hluboké hierarchie, určitě ne při nakupování- hloubka stromu zřejmě nepřesáhne 4-5. Mějme dejmetomu strom hloubky 5, hledáme podstrom uzlu v hloubce 3 (uprostřed): stačí nám 2 dotazy! Nač to komplikovat?

Táto, ty de byl? V práci, já debil.

16.1.2006 15:09 zde | skóre: 9 | blog: Linuch | Brno
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Jo a vůbec- proč je strom při tom číslování barven? Vždyť je to úplně zbytečné. Jo a taky jednu z těch dvou inkrementací počitadla jde taky zrušit, tj 'right' jednoho node může být klidně rovno 'left' toho node, který v prohledávání do hloubky následuje.

def Renumber (node, counter):
    node.left = counter; counter++
    for i in node.get_child_list ():
        counter = Renumber (i, counter)
    node.right = counter; counter++
    return counter
Renumber (root, 1)

Táto, ty de byl? V práci, já debil.

27.1.2006 18:45 Fin
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

IMHO lepsi reseni lepsi nez DFS strom: Trees in SQL databases

2.1.2009 18:26 Andrej
Rozbalit Rozbalit vše Re: Stromy v SQL

Odpovědět | Sbalit | Link | Blokovat | Admin

Na začiatok sa chcem poďakovať za článok. Zhodou okolností práve píšem bakalársku prácu na rovnakú tému, preto by som sa chcel spýtať, či by mi niekto nevedel poradiť vhodnú literatúru. Vyšlo niečo k stromovým dátam aj v češtine alebo slovenčine?, za odpoveď vopred ďakujem.....

Založit nové vlákno • Nahoru

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje

Stromy v SQL

Stromy

Definice

Jaký strom zasadit?

Sebereferenční tabulky

Genealogické stromy

Nested set aneb DFS strom

Závěr

Nejčtenější články posledního měsíce

Nejkomentovanější články posledního měsíce

Další články z této rubriky

Hodnocení: 97 %

Komentáře