abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 06:33 | Komunita

    Přímý přenos (YouTube) z konference LinuxDays 2024, jež probíhá tento víkend v Praze v prostorách Fakulty informačních technologií Českého vysokého učení v Praze (FIT ČVUT). Na programu je spousta zajímavých přednášek.

    Ladislav Hagara | Komentářů: 0
    včera 07:11 | IT novinky

    Elon Musk na akci We, Robot (YouTube, 𝕏) představil Robotaxi, Robovan a vylepšeného Tesla Bota (Optimus).

    Ladislav Hagara | Komentářů: 32
    včera 06:33 | IT novinky

    Internet Archive je offline (𝕏, Bluesky, Mastodon‪). Unikly údaje 31 milionů uživatelů. Probíhal / probíhá na něj DDoS útok.

    Ladislav Hagara | Komentářů: 0
    včera 05:22 | Komunita

    Alyssa Rosenzweig se v příspěvku na svém blogu rozepsala o hraní AAA her na Asahi Linuxu. Na YouTube je záznam její včerejší přednášky na XDC 2024 (X.Org Developer's Conference).

    Ladislav Hagara | Komentářů: 7
    včera 04:55 | IT novinky

    Vláda schválila Národní polovodičovou strategii: Česká republika má velký potenciál stát se významným hráčem v oblasti výroby čipů, zejména v evropském měřítku. Využít tento potenciál je cílem Národní polovodičové strategie, kterou připravilo Ministerstvo průmyslu a obchodu ve spolupráci s experty, a která navazuje na evropský Akt o čipech.

    Ladislav Hagara | Komentářů: 2
    10.10. 18:11 | Zajímavý software

    V lete vyšiel Aeonwave 4.0, ktorý niekoľkonásobne menej vyťažuje procesor pri interpretácií priestorového zvuku než OpenAL Soft. Autor hľadá prispievateľov do knižnice libaaxopenal za účelom pridania ALC_EXT_EFX rozšírení využívaných napr. v hre Doom 3 cez port Dhewm3 v Linuxe.

    atirage21 | Komentářů: 5
    10.10. 15:33 | Nová verze

    Linuxová distribuce Ubuntu 24.10 „Oracular Oriole“ byla vydána. Jde o průběžné vydání s podporou 9 měsíců. Obsahuje mj. Linux 6.11 či GNOME 47 s několika odkazy na první vydání Ubuntu (4.10 „Warty Warthog“) před 20 lety. K dispozici jsou také oficiální deriváty s odlišnými výchozími desktopovými prostředími anebo balíky aplikací.

    Fluttershy, yay! | Komentářů: 2
    10.10. 13:55 | Nová verze

    Deno (Wikipedie), běhové prostředí (runtime) pro JavaScript, TypeScript a WebAssembly, bylo vydáno v nové major verzi 2.0 (YouTube). Důležité změny v Migration Guide.

    Ladislav Hagara | Komentářů: 3
    10.10. 13:33 | Nová verze

    Apache Tomcat (Wikipedie) slaví 25 let. Při té příležitosti byla vydána nová verze 11.0. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    10.10. 12:44 | Nová verze

    Open source 3D herní a simulační engine Open 3D Engine (O3DE) byl vydán v nové verzi 24.09.0. Přehled novinek v poznámkách k vydání. O3DE má nového maskota: Odie.

    Ladislav Hagara | Komentářů: 0
    Rozcestník

    Dotaz: Jakou databázi...

    11.1.2011 23:56 jojol
    Jakou databázi...
    Přečteno: 774×
    Předem se omlouvá za potencionálně trapný dotaz...

    Mám hodnoty například: 1025614 1365992 1625430 2113601 2136500 seřazené vzestupně

    Celkem těch hodnot je zhruba 3 000 000.

    Mno a když zadám například 140020 chci aby mi to vrátilo nejbližší vyšší položku a nejbližší nižší položku tedy 1365992 a 1625430.

    Dokázal by mi někdo naznačit jak by se toto řešilo? Jaká databáze/jaký druh databáze by byl pro to vhodný?

    Odpovědi

    12.1.2011 02:01 Messa | skóre: 39 | blog: Messa
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Skoro jakákoliv... Na jedné straně můžeš použít něco sofistikovaného, na druhé něco trapně jednoducného. Záleží, co od toho čekáš.

    Můžeš třeba čísla uložit do textového souboru, jedno číslo na řádek. Pětiřádkový program v Pythonu nebo i v bashi či awku ti pak bude umět najít nejbližší vyšší/nižší položku. Kdyby bylo zaručeno, že hledané číslo tam bude, stačilo by jen grep -C 1 :-)

    Tenhle jednoduchý přístup má ale nevýhody - vyhledávání není nejrychlejší (kdybys potřeboval třeba tisíc vyhledání za sekundu nebo tak nějak). Můžeš ty čísla pak třeba uložit do SQL databáze. Navíc k SQL databázi se dá (pokud to není sqlite) přistupovat po síti.

    Taky se dá udělat nějaké speciální řešení - třeba ukládat ty čísla za sebou do souboru v binární podobě (seřazená, což ale už jak říkáš jsou), zase, implementace samotného vyhledávání v takovém souboru v C++ je opět na pět řádků. To by bylo nejspíš nejefektivnější. Ale už to tu nechci dále komplikovat :)

    Napiš, jak by sis představoval používání té databáze, ať víme aspoň, jestli to má být stále běžící démon, nebo jednorázová konzolová utilitka, jak to má být rychlé...
    12.1.2011 09:04 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    "jak by se toto resilo" -- tohle je pripad pro trivialni B-tree, realne nechces nic jinyho. Typickej zastupce pro tohle je BDB, s tim, ze ti sam o sobe neposkytne sitovy rozhrani. Nicmene je to principialne daleko lepsi, nez to cpat do relacni databaze, pac tohle proste nejsou data vhodny do relacni databaze, obtezovat se s overheadem parsovani SQLka, atd. atd.

    Messa nahore nadhodil ideu vyhledavat ty hodnoty pres binarni vyhledavani, coz by sice slo, ale tim ze je to nad pomalym diskem, tak to neni tak docela winning strategy (proto ostatne B-tree vznikl). Dalo by se to zlepsit agresivnim aplikacnim cachovanim, ale v ten moment musis resit cache coherency kdyz by ti k tem datum pristupovalo vic instanci... neni to proste az tak trivialni;) Moje doporuceni: BerkeleyDB nad B-Tree, pokud nemas nejaky dodatecny pozadavky ktery jsi opomenul zminit.
    12.1.2011 09:31 l4m4
    Rozbalit Rozbalit vše Re: Jakou databázi...
    ale tim ze je to nad pomalym diskem
    Možná jsem něco přehlédl, ale dnes snad není problém mít 3M položek v paměti?
    12.1.2011 09:36 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Nene, to rozhodne neni, ale vychazel jsem z toho, ze nerekl skoro nic o tom, jak k tem datum planuje pristupovat. Bude existujici data menit? Mazat? Bude mit konkurencni pristup k datum? Ze to budou data serializovane do pajpy a nasledne z nich bude (zrejme) jen vyhledavat zminil az nasledne v komentari...
    12.1.2011 09:39 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Jeste dodam, ze minimalne na unixovejch OS bude (pocitam-li ze uklada 32b inty) tech 12MB velmi pravdepodobne kompletne nacachovany a I/O v ten moment taky nebude takovej bottleneck (a problem s koherenci dat mezi diskem a pameti se presouva pomerne pohodlne na vrstvu ktera je na to daleko lip vybavena).
    Heron avatar 12.1.2011 09:15 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Dotaz není ani tak trapný, jako zajímavý :-) Jak již napsali předřečníci, na toto se hodí prakticky cokoliv (můžeš si třeba napsat binární vyhledávání v C jako úlohu na víkend; osobně bych to také viděl na BerkleyDB). Co ta čísla znamenají a opravdu budou žít sama o sobě (ve smyslu, bude tam vztah ještě s jinými daty)? Napadá mě použití například v průmyslu jako nalezení nejbližší hodnoty z typové řady, ale toho nebude takový počet.
    12.1.2011 09:16 jojol
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Čísla se stejnou šířkou tedy od 1000000 do 9000000.

    Čísla budou řazená vzestupně, ale mezi položkami bude různý rozdíl, tedy někdy 1000000 1000001 10000002, jindy klidně 1001000 1020000 1029000.

    Vlastně popravdě rečeno ty čísla budou čas ve formátu YYYYMMDDHHMMSS.

    Měl by to být démon, data která se budou zapisovat do databáze bude číst z pojmenované roury. Čas potřebný k vyhledání nebližší polozky by měl být v řádu milisekund.
    12.1.2011 09:28 l4m4
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Je-li strom v paměti, je vlastní vyhledání nanejvýš v řádu mikrosekund.
    12.1.2011 11:09 jojol
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Nene, to rozhodne neni, ale vychazel jsem z toho, ze nerekl skoro nic o tom, jak k tem datum planuje pristupovat. Bude existujici data menit? Mazat? Bude mit konkurencni pristup k datum? Ze to budou data serializovane do pajpy a nasledne z nich bude (zrejme) jen vyhledavat zminil az nasledne v komentari...
    ano následně jen vyhledávat nebo mazat...
    Je-li strom v paměti, je vlastní vyhledání nanejvýš v řádu mikrosekund.
    Data budou na disku, v paměti by zabíraly hodně místa...

    Je tu nějaká databáze, která přímo zvládá data vyhledávat tak jak potřebuji, nebo se to bude muset řešit nějak složitěji?
    okbob avatar 12.1.2011 11:31 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Všechny db, které znají klauzuli LIMIT to zvládají
    SELECT * FROM tab WHERE cislo > konstanta LIMIT 1;
    SELECT * FROM tab WHERE cislo < konstanta LIMIT 1;
    
    12.1.2011 14:04 kuka
    Rozbalit Rozbalit vše Re: Jakou databázi...
    To nenajde nejblizsi mensi cislo ale nejake "nahodne" mensi cislo.
    Tarmaq avatar 12.1.2011 16:28 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    ne pokud tam bude pridano ORDER BY konstanta
    Don't panic!
    12.1.2011 16:41 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: Jakou databázi...
    A pokud se vymění pár písmenek a některé prohodí vypíše to: „pojďme na 1 malé pivo“. :)
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    Tarmaq avatar 12.1.2011 17:48 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    :D tak pojdme, ale tohle stejne nikdy u jednoho maleho piva neskonci ;]
    jinak niz jsem napsal cele reseni
    Don't panic!
    okbob avatar 12.1.2011 18:20 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Pravda chybí tam ORDER BY, sorry
    Heron avatar 12.1.2011 11:36 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Ach jo. Před chvílí jste psal, že máte pouze čísla, potom se z toho stala časová značka a teď se to najednou nevleze do paměti.

    Takže, pokud chcete vyhledávat nejbližší časovou značku provázanou s dalšími údaji, dejte to do relační DB, nad sloupcem časové značky si udělejte index (což je ten B-Strom, který nakonec bude v paměti) a dotazy na to budou velmi rychlé.
    12.1.2011 11:44 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Dost bych doporucil, abys prestal davat pozadavky a vlastnosti systemu iterativne a dal to vsechno najednou, jinak budes dostavat reseni na problem kterej vlastne nemas a lidi budes jen srat.

    Tri miliony celych cisel v rozsahu "1000000 do 9000000", kdyz z toho udelam 32b int, je 12MB. To je nic. Ale ocividne v tom rozsahu nebudou, kdyz rikas, ze "Vlastně popravdě rečeno ty čísla budou čas ve formátu YYYYMMDDHHMMSS." Pak rikas, ze se to nevejde do pameti. V puvodni otazce rikas, ze chces jen vyhledavat polozky, pak rikas, ze chces i mazat.

    Co teda sakra chces?
    12.1.2011 12:22 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Jakou databázi...
    +1
    Tarmaq avatar 12.1.2011 16:39 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    CREATE TABLE foo (
      id NUMBER(16) PRIMARY KEY
    );
    
    INSERT INTO foo VALUES (1025614);
    INSERT INTO foo VALUES (1365992);
    INSERT INTO foo VALUES (1625430);
    INSERT INTO foo VALUES (2113601);
    INSERT INTO foo VALUES (2136500);
    
    
    SELECT id FROM foo WHERE id > 1400200 AND ROWNUM = 1 ORDER BY id ASC;
    SELECT id FROM foo WHERE id < 1400200 AND ROWNUM = 1 ORDER BY id DESC;
    
    Tohle funguje na oraclu, na jinych dbms misto toho bude neco jako LIMIT 1 na konci..
    Don't panic!
    12.1.2011 19:22 jekub
    Rozbalit Rozbalit vše Re: Jakou databázi...
    tohle funguje na oraclu

    ani omylem. nejprve se provede where (id > 1400200 and rownum = 1) a az potom order. cili libovolny radek pro id > 1400200.

    kdyz uz, tak
    select id from(
       select id from foo where id > 1400200 order by id
    ) where rownum=1
    
    13.1.2011 10:32 kuka
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Nefunguje, viz uz prispevek vyse. Pokud by bylo opravdu potreba jen to id, bude z hlediska vykonu podstatne lepsi pouzit min(id)/max(id) misto order by.
    Tarmaq avatar 13.1.2011 11:53 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    takze tohle by mohlo byt univerzalni reseni ve vsech db:
    SELECT MIN(id) FROM foo WHERE id > 1400200;
    SELECT MAX(id) FROM foo WHERE id < 1400200;
    
    Don't panic!
    13.1.2011 00:05 VM
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Pole v paměti (pro 32bit čísla zabere 12MB), několikařádkový program v C to půlením intervalu najde v mikrosekundách. Použít databázi je zde kanón na vrabce, navíc by to fungovalo o několik řádů pomaleji.
    14.1.2011 02:24 jojol
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Dost bych doporucil, abys prestal davat pozadavky a vlastnosti systemu iterativne a dal to vsechno najednou, jinak budes dostavat reseni na problem kterej vlastne nemas a lidi budes jen srat.
    Ok chci udělat webovou aplikaci pro přehrávání obrázků pořízený programem motion.

    Motion obsahuje softwarovou detekci pohybu, takže nebude obrázky ukládat například každou sekundu, ale náhodně.

    Plánuji, že se obrázky budou ukládat do adresářový struktury ve formátu YYMMDD/HHMMSS.jpg

    Při každém uloženém obrázku motion pustí příkaz "echo 'YYMMDDHHMMSS NAZEV_KAMERY' > named_pype"

    No a nějaká aplikace bude z té pojmenované roury číst, a informace o obrázcích ukládat do nějakého vhodného úložiště.

    Jo a po zaplnění disku obrázky hodlám staré obrázky mazat, počítám se zhruba 30 dením záznamem - 3600*24*30 = 2592000.

    Ve webové aplikaci budu chtít přehrát obrázky od určitého data, tedy bude muset k tomu datu najít nejbližší uložený snímek, dále snímek co je hnedka po něm...

    Hodlám to spáchat v jazyce Erlang. Chci to napsat proto, abych tak nějak naučil v Erlangu programovat - tedy jakási cvičná/výuková aplikace.
    14.1.2011 09:21 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Za sebe doporučuji jednoznačně libovolnou DB (MySQL plně dostačuje) a udělat tabulky:

    camera
    cameraid_pk int autoincrement primary
    name varchar(64)
    description text/textblob/
    placement varchar(255)
    
    picture
    pictureid_pk bigint autoincrement primary
    cameraif_pk_fk int index (foreign key cameraid_pk)
    datetaken DATATIME index
    filename varchar(1024)
    
    picture2 (lepší)
    pictureid_pk bigint autoincrement primary
    cameraif_pk_fk int index (foreign key cameraid_pk)
    datetaken DATA index
    
    jinak dělení na YYMMDD a HHMMSS je nedostatečné bo tam musí být identifikátor camery:
    YYMMDD/HHMMSS_CAMERAID
    CAMERAID/YYMMDD/HHMMSS
    YYYY/MM/DD/CAMERAID_HHMMSS
    
    (přičemž CAMERAID jsou vždy 4 znaky/čísla - třeba)
    To vše za předpokladu, že lze vytvořit max 1 snímek/sec, jinak by tam musely být buď milisecundy, nebo nějaké pořadové číslo a v db by přibyl sloupec addnumber int.

    picture2 je lepší v tom, že má pevnou šířku záznamu a cestu získáváte pomocí:
    ('+' chápejte jako spojování řetězců a fci TIME že vrací opravdu HHMMSS)
    YEAR(datetaken) + '/' + LPAD('0',2,MONTH(datetaken)) + '/' + LPAD('0',2,DAY) + '/' + TIME(HHMMSS) + '_' + LPAD('0',4,cameraif_pk_fk).

    pak bych přidal tabulku:

    checkpoint
    cameraid_pk int autoincrement primary
    name varchar(64)
    cameraif_pk_fk int index (foreign key cameraid_pk)
    description text/textblob/
    

    ve které si sloučíte, kamery na jeden objekt (je-li to třeba)
    a cesta by mohla být, i když nemusí, přijde na to, jestli má být přímý přístup přehledný nějakým stylem:
    CHECKOPOINT/CAMERAID/YYYY/MM/DD/HHMMSS
    Výběr nad databází nejbližší vyšší/nižší a pod. je jednoduchá záležitost a tak jak jsem to popsal tak na MySQL i se stovkami milióny záznamů velmi rychlá záležitost.

    PS: To, že id-čka nemusí být zlobivé inkrementy, je jasné a záleží jak to chcete.
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.