abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 18:33 | Nová verze Ladislav Hagara | Komentářů: 0
    dnes 12:55 | Zajímavý projekt

    TamaGo je open source framework pro programování ARM a RISC-V systémů na čipu (SoC) v programovacím jazyce Go. Prezentace projektu z OSFC (Open Source Firmware Conference) v pdf na GitHubu.

    Ladislav Hagara | Komentářů: 0
    včera 21:44 | Komunita

    Konference OpenAlt 2024 – jedinečné fórum, kde se každoročně sdružují lidé se zájmem o vývoj a využití svobodného a otevřeného softwaru a hardwaru, tvorbu, zpracování a zpřístupňování otevřených dat, svobodný přístup k informacím a vzdělávání – hledá přednášející, dobrovolníky a partnery. Konference proběhne 2. a 3. listopadu v prostorách FIT VUT v Brně. Vstup je zdarma.

    Ladislav Hagara | Komentářů: 0
    včera 19:44 | Nová verze

    Po 9 týdnech vývoje od vydání Linuxu 6.10 oznámil Linus Torvalds vydání Linuxu 6.11. Z Vídně, jelikož tam zítra začíná Open Source Summit Europe. Přehled novinek a vylepšení na LWN.net: první a druhá polovina začleňovacího okna. Později také na Linux Kernel Newbies.

    Ladislav Hagara | Komentářů: 0
    včera 12:00 | Zajímavý software

    Grocy je open source ERP systém. Ne však pro plánování zdrojů v podnicích ale v domácnostech. Spravovat lze zásoby, povinnosti a úkoly. Vytvářet nákupní seznamy. Ověřovat dostupnost surovin pro recepty. Plánovat jídelníčky. Vyzkoušet lze online demo. Vývoj probíhá na GitHubu.

    Ladislav Hagara | Komentářů: 5
    14.9. 19:44 | Komunita

    Na čem aktuálně pracují vývojáři GNOME a KDE? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE.

    Ladislav Hagara | Komentářů: 0
    13.9. 23:11 | IT novinky

    3D tiskárny Original Prusa MK4S (a MK4) v kombinaci s Prusamenty PLA a PETG mají mezinárodně uznávanou certifikaci UL 2904 GREENGUARD, která potvrzuje splnění přísných bezpečnostních standardů pro VOC a UFP.

    Ladislav Hagara | Komentářů: 2
    13.9. 22:11 | Nová verze

    Byla vydána verze R1/beta5 open source operačního systému Haiku (Wikipedie). Přehled novinek i s náhledy v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 7
    13.9. 16:33 | Komunita

    Sovereign Tech Fund (Wikipedie), tj. program financování otevřeného softwaru německým ministerstvem hospodářství a ochrany klimatu, podpoří Sambu částkou 688 800 eur.

    Ladislav Hagara | Komentářů: 50
    13.9. 13:11 | IT novinky

    Společnost OpenAI představila novou řadu svých AI modelů OpenAI o1 navržených tak, aby "strávily více času přemýšlením, než zareagují". Videoukázky na 𝕏 nebo YouTube.

    Ladislav Hagara | Komentářů: 6
    Rozcestník

    Dotaz: Jak zaindexovat správně sloupec kde se vyhledává pomocí like

    6.1.2011 16:04 urui
    Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    Přečteno: 437×
    Ahoj. Mám v mysql tabulce sloupec uzivatel. Tabulka bude obsahovat skoro milion záznamů. Zatím to mám udělané tak, že uzivatel je PK a nic víc. Má smysl na takový sloupec aplikovat fulltext index - nepřidělal bych si tím spíše problémy např. 50proc. práh apod. ? Jde o to, abych mohl pomocí selectu nad tabulkou typu ... where uzivatel like '%da_da_' apod. vybrat řádky co nejrychleji. Příp. jak to ještě zrychlit?

    Odpovědi

    Heron avatar 6.1.2011 16:11 Heron | skóre: 53 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like

    Ta tabulka bude obsahovat milion různých uživatelů? Copak to je za systém?

    Fulltext určitě ne, tím si nepomůžeš a už vůbec ne na vyhledávání userů, kde leze počítat v podstatě s náhodným stringem. Tam se uplatní klasický index. Jinak prefixové vyhledávání (to '%da_da_'), bude bez indexu a bude to vždy table scan.

    7.1.2011 00:16 urui
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like

    Ta tabulka bude obsahovat milion různých uživatelů? Copak to je za systém?

    Takový statistický PokusSoft. (Uzivatelska jmena jsou generovana nahodne)
    6.1.2011 17:07 Ivan
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    Pokud bys' o to hodne stal, tak bys' moh implementovat neco jako TRIE. Do druhy tabulky si ulozis pro kazdy userid vsechny rotace(suffixy) userid plus rowid z prvni tabulky. Pak muzes vyhledavat pres index v ty druhy tabuli. Tzn. pri uid 8 znaku a pul milionu uzivatelu budes mit pomocnou tabulku s 4mil radek.

    GeoRW avatar 8.1.2011 18:18 GeoRW | skóre: 13 | blog: GeoRW | Bratislava
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    query s "like '%da_da_' " ti cez index nepojde; klasicky B-tree index funguje ako strom a ked mas % na zaciatku, tak sa nema o co zachytit; fulltext index funguje na slova a pouziva sa pre polia typu TEXT, kde mas ulozene cele vety/clanky, namatchuje ti to iba cele slova nie casti slov; pre pripad, kde je (iba) na zaciatku % sa da este pouzit revers index, ale query s % na zaciatku sa radsej vyhni vzdy to pojde cez fullscan; v pripade, ze sa nemozes full scanu nijako vyhnut, mozes este tu tabulku rozdelit na particie; neviem ako v MySQL, ale po particiach by to potom malo hladat paralelne ak pouzijes lokalne indexy
    "This is to be taken with a grain of salt." ACBF - Advanced Comic Book Format
    GeoRW avatar 8.1.2011 18:26 GeoRW | skóre: 13 | blog: GeoRW | Bratislava
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    po particiach by to potom malo hladat paralelne ak pouzijes lokalne indexy
    teda samozrejme, by to malo ist paralelne aj ked tam indexy nemas, kedze to cez indexy ani nepojde:-)
    "This is to be taken with a grain of salt." ACBF - Advanced Comic Book Format
    8.1.2011 22:45 kuka
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    Mysql neznam, ale pocitam, ze provest paralelne fullscan by mela umet i bez patitions, pokud to umi s partitions. Pokud by ta tabulka obsahovala dalsi data nezanedbatelne velikosti (napriklad jmeno a prijmeni), ma smysl uvazovat o vytazeni (klidne redundantnim) username do samostatne tabulky, aby fullscan prochazel co nejmensi objem na disku - to muze predstavovat dramaticke zrychleni. Po urceni konkretnich matchujicich zaznamu se pak do hlavni tabulky uz muze pristupovat pres index.
    AraxoN avatar 9.1.2011 00:27 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    Teoreticky by "LIKE '%blabla'" mohlo ísť, ak by cez REVERSE() otočil reťazec a mal nad tým vytvorený funkcionálny index, alebo osobitný pomocný stĺpec, kde by to mal takto otočené.

    Potom by robil query takto:
    ... WHERE reverse_stlpec LIKE REVERSE('%blabla')
    Ale v jeho prípade by sa síce zbavil percenta na začiatku, ale mal by tam miesto toho zase podčiarnik. Full scanu by sa aj tak nevyhol.
    9.1.2011 09:49 FooBar
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    Nevim jak je to realne implementovany, obzvlast v MySQL, ale pokud je na zacatku match na "libovolne jedno pismeno", FTS se nemusi provadet, akorat se projde znacne vetsi cast toho indexu (orez prohledavanyho stavovyho prostoru zacne vyrazne pozdejc).
    Josef Kufner avatar 9.1.2011 06:11 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    Vyhni se LIKE s % na začátku. Pokud to nejde, pomoz tomu vyhledávání omezením velikosti prohledávaných dat. Třeba přidáním další podmínky, která už využije index, nebo, pokud jsou si dotazy velmi podobné, připrav si nějaká pomocná data, která vyhledávání urychlí – například prohledávaný text pozpátku, statistiky počtu písmen a podobně.
    Hello world ! Segmentation fault (core dumped)
    9.1.2011 09:51 FooBar
    Rozbalit Rozbalit vše Re: Jak zaindexovat správně sloupec kde se vyhledává pomocí like
    Krom toho, co tu bylo zmineno, je pomerne bezny reseni dvojity filtrovani.

    Prvni filtrovani je aproximativni, zalozeny napr. na porovnavani Ngramu v textu. To ti muze prinest hromadu false positives, ale vracena podmnozina bude typicky mensi, a z ni uz muzes exaktne filtrovat linearne bez vetsich problemu. Samozrejme, nefunguje to na velmi kratke vyhledavani jako napr. "%f%". Dalsi problem je implementacni, ponevadz netusim jak to realizovat na MySQL...

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.