abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:33 | IT novinky

    Po 26 letech od protiprávního policejního zásahu, který byl spuštěn na základě podnětu společnosti Microsoft, Obvodní soud pro Prahu 2 rozsudkem potvrdil, že Mironet prokázal významnou část svého nároku na náhradu škody vůči Ministerstvu spravedlnosti ČR. Soudem nyní přiznaná část nároku znamená rekordní odškodné, jaké kdy české soudy přiznaly za nesprávný postup státu. Spor byl rozdělen na několik škod, u pravomocně uzavřených částí

    … více »
    Ladislav Hagara | Komentářů: 5
    dnes 15:22 | Nová verze

    Lehké desktopové prostředí LXQt bylo vydáno ve verzi 2.4.0. Jde o převážně opravné vydání s drobnými vylepšeními podpory Waylandu.

    |🇵🇸 | Komentářů: 0
    dnes 12:44 | IT novinky

    Počítačová hra Kingdom Come: Deliverance 2 českého studia Warhorse získala cenu BAFTA v kategorii nejlepší příběh. V konkurenci pěti dalších nominovaných děl porazila i úspěšnou francouzskou hru Clair Obscur: Expedition 33, která v letošním ročníku získala cenu za nejlepší hru roku.

    Ladislav Hagara | Komentářů: 1
    dnes 12:22 | Komunita

    Projekt KDE oslaví v říjnu 30 let. Matthias Ettrich poslal 14. října 1996 do diskusní skupiny comp.os.linux.misc zprávu, která započala historii projektu. Důležité milníky jsou zobrazeny na časové ose KDE.

    Ladislav Hagara | Komentářů: 1
    dnes 02:55 | Komunita

    Byly vyhlášeny výsledky letošní volby vedoucí/ho projektu Debian (DPL, Wikipedie). Poprvé povede Debian žena. Novou vedoucí je Sruthi Chandran. Letos byla jedinou kandidátkou. Kandidovala již v letech 2020, 2021, 2024 a 2025. Na konferenci DebConf19 měla přednášku Is Debian (and Free Software) gender diverse enough?

    Ladislav Hagara | Komentářů: 15
    dnes 00:55 | Nová verze

    Byla vydána nová verze 10.3 z Debianu vycházející linuxové distribuce DietPi pro (nejenom) jednodeskové počítače. Přehled novinek v poznámkách k vydání. Přidána byla podpora Orange Pi 4 LTS. Přibyl balíček Prometheus.

    Ladislav Hagara | Komentářů: 0
    včera 18:55 | Nová verze

    Implementace VPN softwaru WireGuard (Wikipedie) pro Windows, tj. WireGuard pro Windows a WireGuardNT, dospěly do verze 1.0.

    Ladislav Hagara | Komentářů: 2
    včera 16:11 | IT novinky

    V Pekingu dnes proběhl 2. ročník půlmaratonu humanoidních robotů. První 3 místa obsadili roboti Honor Lightning v různých týmech. Nový rekord autonomního robota je 50 minut a 26 sekund. Operátorem řízený robot to zvládl i s pádem za 48 minut a 19 sekund. Řízení roboti měli časovou penalizaci 20 %. Před rokem nejrychlejší robot zvládl půlmaraton za 2 hodiny 40 minut a 42 sekund. Aktuální lidský rekord drží Jacob Kiplimo z Ugandy s časem 57 minut a 20 sekund [𝕏].

    Ladislav Hagara | Komentářů: 5
    17.4. 17:11 | Zajímavý článek

    Stanislav Fort, vedoucí vědecký pracovník z Vlčkovy 'kyberbezpečnostní' firmy AISLE, zkoumal dopady Anthropic Mythos (nový AI model od Anthropicu zaměřený na hledání chyb, který před nedávnem vyplašil celý svět) a předvedl, že schopnosti umělé inteligence nejsou lineárně závislé na velikosti nebo ceně modelu a dokázal, že i některé otevřené modely zvládly v řadě testů odhalit ve zdrojových kódech stejné chyby jako Mythos (například FreeBSD CVE-2026-4747) a to s výrazně nižšími provozními náklady.

    MakeIranBombedAgain❗ | Komentářů: 6
    17.4. 12:44 | IT novinky

    Federální návrh zákona H.R.8250 'Parents Decide Act', 13. dubna předložený demokratem Joshem Gottheimerem a podpořený republikánkou Elise Stefanik coby spolupředkladatelkou (cosponsor), by v případě svého schválení nařizoval všem výrobcům operačních systémů při nastavování zařízení ověřovat věk uživatelů a při používání poskytovat tento věkový údaj aplikacím třetích stran. Hlavní rozdíl oproti kalifornskému zákonu AB 1043 a kolorádskému SB26-051 je ten, že federální návrh by platil rovnou pro celé USA.

    MakeIranBombedAgain❗ | Komentářů: 13
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (8%)
     (1%)
     (12%)
     (30%)
     (3%)
     (6%)
     (2%)
     (15%)
     (25%)
    Celkem 1364 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: Jakou databázi...

    11.1.2011 23:56 jojol
    Jakou databázi...
    Přečteno: 864×
    Předem se omlouvá za potencionálně trapný dotaz...

    Mám hodnoty například: 1025614 1365992 1625430 2113601 2136500 seřazené vzestupně

    Celkem těch hodnot je zhruba 3 000 000.

    Mno a když zadám například 140020 chci aby mi to vrátilo nejbližší vyšší položku a nejbližší nižší položku tedy 1365992 a 1625430.

    Dokázal by mi někdo naznačit jak by se toto řešilo? Jaká databáze/jaký druh databáze by byl pro to vhodný?

    Odpovědi

    12.1.2011 02:01 Messa | skóre: 39 | blog: Messa
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Skoro jakákoliv... Na jedné straně můžeš použít něco sofistikovaného, na druhé něco trapně jednoducného. Záleží, co od toho čekáš.

    Můžeš třeba čísla uložit do textového souboru, jedno číslo na řádek. Pětiřádkový program v Pythonu nebo i v bashi či awku ti pak bude umět najít nejbližší vyšší/nižší položku. Kdyby bylo zaručeno, že hledané číslo tam bude, stačilo by jen grep -C 1 :-)

    Tenhle jednoduchý přístup má ale nevýhody - vyhledávání není nejrychlejší (kdybys potřeboval třeba tisíc vyhledání za sekundu nebo tak nějak). Můžeš ty čísla pak třeba uložit do SQL databáze. Navíc k SQL databázi se dá (pokud to není sqlite) přistupovat po síti.

    Taky se dá udělat nějaké speciální řešení - třeba ukládat ty čísla za sebou do souboru v binární podobě (seřazená, což ale už jak říkáš jsou), zase, implementace samotného vyhledávání v takovém souboru v C++ je opět na pět řádků. To by bylo nejspíš nejefektivnější. Ale už to tu nechci dále komplikovat :)

    Napiš, jak by sis představoval používání té databáze, ať víme aspoň, jestli to má být stále běžící démon, nebo jednorázová konzolová utilitka, jak to má být rychlé...
    12.1.2011 09:04 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    "jak by se toto resilo" -- tohle je pripad pro trivialni B-tree, realne nechces nic jinyho. Typickej zastupce pro tohle je BDB, s tim, ze ti sam o sobe neposkytne sitovy rozhrani. Nicmene je to principialne daleko lepsi, nez to cpat do relacni databaze, pac tohle proste nejsou data vhodny do relacni databaze, obtezovat se s overheadem parsovani SQLka, atd. atd.

    Messa nahore nadhodil ideu vyhledavat ty hodnoty pres binarni vyhledavani, coz by sice slo, ale tim ze je to nad pomalym diskem, tak to neni tak docela winning strategy (proto ostatne B-tree vznikl). Dalo by se to zlepsit agresivnim aplikacnim cachovanim, ale v ten moment musis resit cache coherency kdyz by ti k tem datum pristupovalo vic instanci... neni to proste az tak trivialni;) Moje doporuceni: BerkeleyDB nad B-Tree, pokud nemas nejaky dodatecny pozadavky ktery jsi opomenul zminit.
    12.1.2011 09:31 l4m4
    Rozbalit Rozbalit vše Re: Jakou databázi...
    ale tim ze je to nad pomalym diskem
    Možná jsem něco přehlédl, ale dnes snad není problém mít 3M položek v paměti?
    12.1.2011 09:36 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Nene, to rozhodne neni, ale vychazel jsem z toho, ze nerekl skoro nic o tom, jak k tem datum planuje pristupovat. Bude existujici data menit? Mazat? Bude mit konkurencni pristup k datum? Ze to budou data serializovane do pajpy a nasledne z nich bude (zrejme) jen vyhledavat zminil az nasledne v komentari...
    12.1.2011 09:39 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Jeste dodam, ze minimalne na unixovejch OS bude (pocitam-li ze uklada 32b inty) tech 12MB velmi pravdepodobne kompletne nacachovany a I/O v ten moment taky nebude takovej bottleneck (a problem s koherenci dat mezi diskem a pameti se presouva pomerne pohodlne na vrstvu ktera je na to daleko lip vybavena).
    Heron avatar 12.1.2011 09:15 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Dotaz není ani tak trapný, jako zajímavý :-) Jak již napsali předřečníci, na toto se hodí prakticky cokoliv (můžeš si třeba napsat binární vyhledávání v C jako úlohu na víkend; osobně bych to také viděl na BerkleyDB). Co ta čísla znamenají a opravdu budou žít sama o sobě (ve smyslu, bude tam vztah ještě s jinými daty)? Napadá mě použití například v průmyslu jako nalezení nejbližší hodnoty z typové řady, ale toho nebude takový počet.
    12.1.2011 09:16 jojol
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Čísla se stejnou šířkou tedy od 1000000 do 9000000.

    Čísla budou řazená vzestupně, ale mezi položkami bude různý rozdíl, tedy někdy 1000000 1000001 10000002, jindy klidně 1001000 1020000 1029000.

    Vlastně popravdě rečeno ty čísla budou čas ve formátu YYYYMMDDHHMMSS.

    Měl by to být démon, data která se budou zapisovat do databáze bude číst z pojmenované roury. Čas potřebný k vyhledání nebližší polozky by měl být v řádu milisekund.
    12.1.2011 09:28 l4m4
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Je-li strom v paměti, je vlastní vyhledání nanejvýš v řádu mikrosekund.
    12.1.2011 11:09 jojol
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Nene, to rozhodne neni, ale vychazel jsem z toho, ze nerekl skoro nic o tom, jak k tem datum planuje pristupovat. Bude existujici data menit? Mazat? Bude mit konkurencni pristup k datum? Ze to budou data serializovane do pajpy a nasledne z nich bude (zrejme) jen vyhledavat zminil az nasledne v komentari...
    ano následně jen vyhledávat nebo mazat...
    Je-li strom v paměti, je vlastní vyhledání nanejvýš v řádu mikrosekund.
    Data budou na disku, v paměti by zabíraly hodně místa...

    Je tu nějaká databáze, která přímo zvládá data vyhledávat tak jak potřebuji, nebo se to bude muset řešit nějak složitěji?
    okbob avatar 12.1.2011 11:31 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Všechny db, které znají klauzuli LIMIT to zvládají
    SELECT * FROM tab WHERE cislo > konstanta LIMIT 1;
    SELECT * FROM tab WHERE cislo < konstanta LIMIT 1;
    
    12.1.2011 14:04 kuka
    Rozbalit Rozbalit vše Re: Jakou databázi...
    To nenajde nejblizsi mensi cislo ale nejake "nahodne" mensi cislo.
    Tarmaq avatar 12.1.2011 16:28 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    ne pokud tam bude pridano ORDER BY konstanta
    Don't panic!
    12.1.2011 16:41 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: Jakou databázi...
    A pokud se vymění pár písmenek a některé prohodí vypíše to: „pojďme na 1 malé pivo“. :)
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    Tarmaq avatar 12.1.2011 17:48 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    :D tak pojdme, ale tohle stejne nikdy u jednoho maleho piva neskonci ;]
    jinak niz jsem napsal cele reseni
    Don't panic!
    okbob avatar 12.1.2011 18:20 okbob | skóre: 30 | blog: systemakuv_blog | Benešov
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Pravda chybí tam ORDER BY, sorry
    Heron avatar 12.1.2011 11:36 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Ach jo. Před chvílí jste psal, že máte pouze čísla, potom se z toho stala časová značka a teď se to najednou nevleze do paměti.

    Takže, pokud chcete vyhledávat nejbližší časovou značku provázanou s dalšími údaji, dejte to do relační DB, nad sloupcem časové značky si udělejte index (což je ten B-Strom, který nakonec bude v paměti) a dotazy na to budou velmi rychlé.
    12.1.2011 11:44 FooBar
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Dost bych doporucil, abys prestal davat pozadavky a vlastnosti systemu iterativne a dal to vsechno najednou, jinak budes dostavat reseni na problem kterej vlastne nemas a lidi budes jen srat.

    Tri miliony celych cisel v rozsahu "1000000 do 9000000", kdyz z toho udelam 32b int, je 12MB. To je nic. Ale ocividne v tom rozsahu nebudou, kdyz rikas, ze "Vlastně popravdě rečeno ty čísla budou čas ve formátu YYYYMMDDHHMMSS." Pak rikas, ze se to nevejde do pameti. V puvodni otazce rikas, ze chces jen vyhledavat polozky, pak rikas, ze chces i mazat.

    Co teda sakra chces?
    12.1.2011 12:22 dustin | skóre: 63 | blog: dustin
    Rozbalit Rozbalit vše Re: Jakou databázi...
    +1
    Tarmaq avatar 12.1.2011 16:39 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    CREATE TABLE foo (
      id NUMBER(16) PRIMARY KEY
    );
    
    INSERT INTO foo VALUES (1025614);
    INSERT INTO foo VALUES (1365992);
    INSERT INTO foo VALUES (1625430);
    INSERT INTO foo VALUES (2113601);
    INSERT INTO foo VALUES (2136500);
    
    
    SELECT id FROM foo WHERE id > 1400200 AND ROWNUM = 1 ORDER BY id ASC;
    SELECT id FROM foo WHERE id < 1400200 AND ROWNUM = 1 ORDER BY id DESC;
    
    Tohle funguje na oraclu, na jinych dbms misto toho bude neco jako LIMIT 1 na konci..
    Don't panic!
    12.1.2011 19:22 jekub
    Rozbalit Rozbalit vše Re: Jakou databázi...
    tohle funguje na oraclu

    ani omylem. nejprve se provede where (id > 1400200 and rownum = 1) a az potom order. cili libovolny radek pro id > 1400200.

    kdyz uz, tak
    select id from(
       select id from foo where id > 1400200 order by id
    ) where rownum=1
    
    13.1.2011 10:32 kuka
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Nefunguje, viz uz prispevek vyse. Pokud by bylo opravdu potreba jen to id, bude z hlediska vykonu podstatne lepsi pouzit min(id)/max(id) misto order by.
    Tarmaq avatar 13.1.2011 11:53 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Jakou databázi...
    takze tohle by mohlo byt univerzalni reseni ve vsech db:
    SELECT MIN(id) FROM foo WHERE id > 1400200;
    SELECT MAX(id) FROM foo WHERE id < 1400200;
    
    Don't panic!
    13.1.2011 00:05 VM
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Pole v paměti (pro 32bit čísla zabere 12MB), několikařádkový program v C to půlením intervalu najde v mikrosekundách. Použít databázi je zde kanón na vrabce, navíc by to fungovalo o několik řádů pomaleji.
    14.1.2011 02:24 jojol
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Dost bych doporucil, abys prestal davat pozadavky a vlastnosti systemu iterativne a dal to vsechno najednou, jinak budes dostavat reseni na problem kterej vlastne nemas a lidi budes jen srat.
    Ok chci udělat webovou aplikaci pro přehrávání obrázků pořízený programem motion.

    Motion obsahuje softwarovou detekci pohybu, takže nebude obrázky ukládat například každou sekundu, ale náhodně.

    Plánuji, že se obrázky budou ukládat do adresářový struktury ve formátu YYMMDD/HHMMSS.jpg

    Při každém uloženém obrázku motion pustí příkaz "echo 'YYMMDDHHMMSS NAZEV_KAMERY' > named_pype"

    No a nějaká aplikace bude z té pojmenované roury číst, a informace o obrázcích ukládat do nějakého vhodného úložiště.

    Jo a po zaplnění disku obrázky hodlám staré obrázky mazat, počítám se zhruba 30 dením záznamem - 3600*24*30 = 2592000.

    Ve webové aplikaci budu chtít přehrát obrázky od určitého data, tedy bude muset k tomu datu najít nejbližší uložený snímek, dále snímek co je hnedka po něm...

    Hodlám to spáchat v jazyce Erlang. Chci to napsat proto, abych tak nějak naučil v Erlangu programovat - tedy jakási cvičná/výuková aplikace.
    14.1.2011 09:21 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: Jakou databázi...
    Za sebe doporučuji jednoznačně libovolnou DB (MySQL plně dostačuje) a udělat tabulky:

    camera
    cameraid_pk int autoincrement primary
    name varchar(64)
    description text/textblob/
    placement varchar(255)
    
    picture
    pictureid_pk bigint autoincrement primary
    cameraif_pk_fk int index (foreign key cameraid_pk)
    datetaken DATATIME index
    filename varchar(1024)
    
    picture2 (lepší)
    pictureid_pk bigint autoincrement primary
    cameraif_pk_fk int index (foreign key cameraid_pk)
    datetaken DATA index
    
    jinak dělení na YYMMDD a HHMMSS je nedostatečné bo tam musí být identifikátor camery:
    YYMMDD/HHMMSS_CAMERAID
    CAMERAID/YYMMDD/HHMMSS
    YYYY/MM/DD/CAMERAID_HHMMSS
    
    (přičemž CAMERAID jsou vždy 4 znaky/čísla - třeba)
    To vše za předpokladu, že lze vytvořit max 1 snímek/sec, jinak by tam musely být buď milisecundy, nebo nějaké pořadové číslo a v db by přibyl sloupec addnumber int.

    picture2 je lepší v tom, že má pevnou šířku záznamu a cestu získáváte pomocí:
    ('+' chápejte jako spojování řetězců a fci TIME že vrací opravdu HHMMSS)
    YEAR(datetaken) + '/' + LPAD('0',2,MONTH(datetaken)) + '/' + LPAD('0',2,DAY) + '/' + TIME(HHMMSS) + '_' + LPAD('0',4,cameraif_pk_fk).

    pak bych přidal tabulku:

    checkpoint
    cameraid_pk int autoincrement primary
    name varchar(64)
    cameraif_pk_fk int index (foreign key cameraid_pk)
    description text/textblob/
    

    ve které si sloučíte, kamery na jeden objekt (je-li to třeba)
    a cesta by mohla být, i když nemusí, přijde na to, jestli má být přímý přístup přehledný nějakým stylem:
    CHECKOPOINT/CAMERAID/YYYY/MM/DD/HHMMSS
    Výběr nad databází nejbližší vyšší/nižší a pod. je jednoduchá záležitost a tak jak jsem to popsal tak na MySQL i se stovkami milióny záznamů velmi rychlá záležitost.

    PS: To, že id-čka nemusí být zlobivé inkrementy, je jasné a záleží jak to chcete.
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.