Sqlite3 a funkcia regexp

Bude třeba do sqlite doimplementovat regexp asi nějak takto. Žel nikdy jsem se o takovou věc nepokoušel, tak víc neporadím.

Ohledně jiné db - takhle jednoduchou a rychlou asi nenajdete. IMHO HSQLDB nemůže konkurovat (zkoušel jsem a byl jsem ve srovnání s SQLite zklamán). Kdybych se chtěl vyhnout implementaci regexp a získat rychlost, asi bych si zjistil, jestli mám tabulky správně oindexované a také bych zvažoval, jestli nebude časově efektivní před dotazy zmigrovat tabulky do sqlite databáze v paměti (:memory: nebo tak nějak).

Zkuste, jestli máte čas, trochu víc popsat, Váš případ použití.

5.2.2009 16:14 vadimo | skóre: 14 | Liptovský Mikuláš
Rozbalit Rozbalit vše Re: Sqlite3 a funkcia regexp

Dakujem za odpoved.

Dnes este rano som skompiloval ten zdrojak ktory tu uvadzate, nachádzal sa priamo v src sqlite. Dostal som vysledok SqliteIcu.so, nakopiroval do /usr/lib/ (tam bolo aj sqlite.so). A nevedel som ako dalej. Podla toho co som cital v readme, tak staci len nakopirovat, ale nejak sa mi nedari s tym pracovat.

Mne sa zatial podarilo zistit aj dalsia moznost (ak som to dobre pochopil?), tak táto "fičurina" sa da zakomponovat priamo do sqlite úpravou func.c a znova skompilovat. Este su dalsie dve moznosti. Tou prvou je pysqlite, moc som o tom este nezistoval, ale je to connect na databazu, kde sa da aj nadefinovat vlastna funkcia. Potom dalsia moznost, do ktorej sa asi pustím je cely script z bash prepisat do PHP, kde sa tak isto da spravit connect na sqlite databazu a v php si nadefinovat vlastnu sqlite funkciu. Ale neviem aky to bude mat dopad na rychlost. (a ani neviem ako to vlastne funguje, ako sa sqlite dozvie o funckii?? asi nijak, skor si myslim, ze za budu vysledky potom filtrovat v PHP)

Co sa tyka pouzita, najst slovne spojenie a jeho variacie (coca.cola, coca-cola, coca_cola, coca&cola) v názve. Najprv, hladat s medzerou, potom s variaciami ako samostatny vyskyt, potom iba na zaciatku vety, potom kdekolvek vo vete, a nakoniec aj akekolvek spojene aj s inym slovom. Tj vytriedit podla revelancie. Zatial nemam s sqlite moc skusenosti, no viem, ze fungoval by nasledujuci sposob:

najst vsetky vyhovujuce vyskyty (LIKE '%coca_cola%' ,vysledok bude napr. 500 z 500.000), a vysledok ulozit ako csv, potom ho importovat ako samostatnu tabulku a az na novej tabulke viacnasobne podniknut rozne filtre cez REGEXP a vysledok postupne ukladat a tymto sposobom budem mat aj zotriedeny vysledok podla revelancie, tj to najvýstižnejšie na zaciatku, bordel na konci.

Ide o to, ze REGEXP zakomponovany priamo v sqlite bude o dost rychlejsi ako v PHP alebo pythone (myslim). Este dnes sa pokusim to nejak dostat priamo do sqlite, ak nie, zacnem testovat moznosti a rychlost v php.

PS: tak a mám to!! Ste ma nakopli :-) vyzera ze to pojde, tu je postup:

------>>

Stiahnut sqlite source (nie sqlite amalgamatio!)
skompilovat s podporou extension: (to som prvy krat neurobil a preto mi neslo natihanut rozsirenie)
./configure --enable-load-extension
make
make install (alebo checkinstall)

Skompilovat extension ICU (islo to v pohode, iba doinstalovat jeden balicek)
sudo apt-get install libicu36-dev
cd ext/icu
gcc -I ../../src -shared icu.c `icu-config --ldflags` -o libSqliteIcu.so
sudo cp libSqliteIcu.so /usr/lib/ (nakopirujeme to do systemu)
icu-config --ldflags

v sqlite natiahnut rozsierenie:
.load libSqliteIcu.so (no a toto mi neslo kvoli tomu, ze som nedal --enable-load-extension)

let's go!

5.2.2009 16:37 vadimo | skóre: 14 | Liptovský Mikuláš
Rozbalit Rozbalit vše Re: Sqlite3 a funkcia regexp

Tak som spokojny, funguje tak ako ma, je to rychle. Ale mam zas problem s tym, ze LIKE bolo case insensitive a rad by som tuto moznost vyuzil aj v REGEXP. A neviem ci je to vlastne mozne.

5.2.2009 16:54 vadimo | skóre: 14 | Liptovský Mikuláš
Rozbalit Rozbalit vše Re: Sqlite3 a funkcia regexp

OK, mam aj to. Staci pred vyraz pouzit (?i). Ináč za dva dni som nikde na nete nenasiel konkrétny návod ako na to. Mozno by nebolo odveci to niekde vypichnut, myslim ten regexp v sqlite.

5.2.2009 17:40 vadimo | skóre: 14 | Liptovský Mikuláš
Rozbalit Rozbalit vše Re: Sqlite3 a funkcia regexp

Je pekne ze to funguje ako ma, ale neviem ako docielit toho, aby som to natiahol jednym prikazom zo shellu. Ide o to, ze spustim sqlite a musim zadat prikaz .load libSqliteIcu.so

Ale ako to urobit jednym prikazom zo shellu? Toto by mi teraz nefungovalo, lebo musim to natiahnut. Ale ako? Nejak to tam naimplementovat.

sqlite3 -separator \| test.db "select * from zoznam where nazov regexp '^otazka.*';" > vysledok

5.2.2009 20:34 vadimo | skóre: 14 | Liptovský Mikuláš
Rozbalit Rozbalit vše Re: Sqlite3 a funkcia regexp

Na manualovej stranke sa pise o volbe -init za ktorou nasleduje nazov suboru, v ktorom mozu byt interne prikazy pre sqlite. Nasiel som aj "prikladny" subor, ktory mn vobec nefungoval, ale osvedcilo sa to takto:

Vytvorit subor napr. s menom commands, do neho vlozit tieto riadky:

.separator | .load libSqliteIcu.so

A príkaz v shelli vyzera nasledovne:

sqlite3 -init commands test.db "select * from zoznam where nazov regexp '^otazka.*';"

PS: Dnes budem spokojne spat

5.2.2009 21:27 neaktivni | skóre: 24 | blog: neaktivni
Rozbalit Rozbalit vše Re: Sqlite3 a funkcia regexp

teda smekam ))

28.2.2009 06:21 vadimo | skóre: 14 | Liptovský Mikuláš
Rozbalit Rozbalit vše Re: Sqlite3 a funkcia regexp

Este doplním, ze ve tom súbore s príkazmi mi nie vzdy (dve verzie OS) fungoval príkaz .quit (alebo .q). Jednoducho sa vsetko vykonalo ako malo, len nenastal exit z sqlite3.

Tak riesim to quitom v cli riadku:

sqlite3 -init commands test.db '.quit'

A este pridávam uplne na zaciatok súboru s príkazmy paramater .echo ON ,nech vidím co sa deje.

Este som sa dostal k dalsej moznosti rozsirena Sqlite3 a tou je fulltextové vyhladávanie pomocou funkcie FTS3. Tiež mi ju bolo treba "aktivovat" pri kompilácii. Tazke ak by sme chceli REGEXP a MATCH s FTS3, treba to nakonfigurovat pri kompilácii nasledovne:

CFLAGS="-DSQLITE_ENABLE_FTS3=1" ./configure --enable-load-extension

Nová tabulka:
CREATE VIRTUAL TABLE zoznam using FTS3(nazov, popis);

Full text search: (Viac moznosti syntaxe je v README syntax)

SELECT * FROM zoznam WHERE nazov MATCH 'otazka*';

Ale najlepsie na tom je moznost ulozenia vysledku do noveho pola(stlpca) a zvyraznenie vysledku pomocou HTML tagov pomocou snippet

SELECT *,snippet(zoznam,'<strong>','</strong>') FROM zoznam WHERE nazov MATCH 'cola*';

vysledok a match zvyrazneny:

coca cola | black accid | <strong>coca</strong> cola

Dotaz: Sqlite3 a funkcia regexp

Odpovědi