abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 07:12 | Zajímavý projekt
V nákupním centru Galerie Vaňkovka v Brně je nově v provozu patrně první bitcoinový ATM na Moravě.
Marcel Kolaja | Komentářů: 0
včera 18:52 | Nová verze
Byl vydán Mozilla Firefox 32.0. Z novinek lze zmínit například zobrazení počtu nalezených položek při vyhledávání na stránce, vylepšené kontextového menu (ikony pro přechod o jednu stránku zpět, na následující stránku, aktualizaci načtené stránky a přidání stránky do záložek), podporu mechanismu Public Key Pinning nebo Web Audio Editor. Řešeny jsou také bezpečnostní problémy. Podrobnější informace v poznámkách k vydání a na stránce věnované vývojářům. Současně s verzí 32.0 byly vydány také verze s prodlouženou podporou 31.1.0 a 24.8.0 (ESR).
Ladislav Hagara | Komentářů: 10
včera 14:47 | Pozvánky
O víkendu 13.-14. září se na Strahově v prostorách školícího centra Silicon Hill uskuteční opensource školení na téma ZeroMQ. Školení povede sám autor Pieter Hintjens. Zajímá-li vás jak si rychle posílat zprávy nejen po síti, přijďte i s notebookem na Strahov.
Miška | Komentářů: 1
včera 07:54 | Zajímavý software
Nadace Raspberry Pi představuje webový prohlížeč Epiphany optimalizovaný pro Raspberry Pi. Na optimalizaci pracovala společnost Collabora. Verze prohlížeče z prosince 2013 dokázala například přehrát video o velikosti 640×360 bodů pouze rychlostí 0,5 snímku za sekundu. Aktuální verze zvládne video 1280×720 rychlostí 25 snímku za sekundu. Podrobnosti uvádí Marco Barisione na svém blogu.
Ladislav Hagara | Komentářů: 0
1.9. 15:47 | Upozornění
Dnes je poslední den CfP na letošní LinuxDays. Přidávat můžete na OSEM - LinuxDays.
h0dy | Komentářů: 0
1.9. 15:44 | Zajímavý článek
Na blogu Lennarta Poetteringa vyšel článek, kde popisuje svůj pohled na budoucnost Linuxového user space. Revisiting How We Put Together Linux Systems
Ruenix | Komentářů: 150
1.9. 06:59 | Humor
Organizace Electronic Frontier Foundation (EFF) upozorňuje v rámci seriálu Stupidní patent měsíce (zprávička) na US Patent No. 8,609,158 z 17. prosince 2013. Vynálezkyně Diane Elizabeth Brooks jej pojmenovala Dianina mana. Předmětem vynálezu je lék na rakovinu. Složení léku: pupalkový olej, rýže, sezamová semínka, zelené fazolky, káva, maso, sýr, mléko, extrakt ze zeleného čaje, semena pupalky dvouleté a víno​​. EFF nepochybuje o … více »
Ladislav Hagara | Komentářů: 28
1.9. 06:57 | Zajímavý software
Minulý týden vyšla verze 1.0 open source diskusního fóra Discourse. Fórum je postaveno na Ruby on Rails, Ember.js, PostgreSQL a Redis. Zdrojové kódy jsou k dispozici na GitHubu pod licencí GNU GPLv2. Přispěvatelé musí podepsat CLA opravňující Civilized Discourse Construction Kit, Inc., společnost stojící za Discourse, kdykoli kód přelicencovat (FAQ). Diskusní fórum Discourse je používáno například na stránkách Atomu, Dockeru nebo také Ubuntu.
Ladislav Hagara | Komentářů: 0
31.8. 13:39 | Nová verze
Byla vydána nová verze PHP 5.6.0. Vedle oprav chyb mezi klíčové vlastnosti nové verze patří např. podpora pro nahrávání souborů větších než 2 GB, integrace debuggeru phpdbg, objevují se konstantní skalární výrazy nebo variadické funkce s proměnným počtem parametrů. Více v seznamu změn.
MMMMMMMMM | Komentářů: 14
29.8. 14:01 | IT novinky
28.8.2014 oficiálně zemřel ve věku 58 let Hal Finney na následky ALS. Jeho tělo bylo po smrti předáno společnosti Alcor Life Extension Foundation, která se zabývá kryonikou. … více »
Bystroushaak | Komentářů: 290
Hlasuji z:
 (84%)
 (11%)
 (2%)
 (1%)
 (0%)
 (0%)
Celkem 3129 hlasů
 Komentářů: 42, poslední 25.8. 11:10
Rozcestník
Reklama
Autoškola testy online Levný benzín
Štítky: není přiřazen žádný štítek

Vložit další komentář
davkol avatar 22.4.2012 22:18 davkol | skóre: 80 | blog: h8blog | Intipiland
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Blbec z Horní Dolní avatar 22.4.2012 22:21 Blbec z Horní Dolní | blog: blbeczhornidolni
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Outsourcuj to do Indie.
Patička je na dovolené.
23.4.2012 00:20 Adam
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
:-D Sa smejes ale ono pri CAPTCHA to funguje
22.4.2012 22:29 retroslava | skóre: 8 | blog: TryCatch | Žižkoff
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Třeba http://postgres.cz/wiki/Instalace_PostgreSQL#Instalace_Fulltextu ?
Pozor! Jsem naprostý idiot. Co jsem napsal včera dnes už dávno neplatí. Zavazuji se, že budu diskutovat nezávazně.
Johny z Podoli avatar 22.4.2012 22:36 Johny z Podoli | skóre: 26 | blog: rocfdebian
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
to už jsem viděl, bohužel mám firebird (interbase) ;-)
Můj web o táborech: Letní dětské tábory, Hudební tábor , Můj nový blog na Nul.cz
bazil avatar 22.4.2012 23:03 bazil | skóre: 33 | blog: sluje | Miroslav
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
No nevím, jak ve Firebirdu, nicméně v MySQL se to řeší buď: přidáním fulltextu nad sloupcem, což se může negativně projevit na výkonu dotazů nad danou tabulkou nebo (podle mě lepší řešení): se vytvoří v DB jedna tabulka navíc, každý text v DB má na ni vazbu a při každé úpravě textu se musí upravit i tabulka. Potom se vybuduje fulltext nad touto tabulkou. Prioritizace nadpisů by se dala zařídit vlastním sloupcem pro nadpisy v tabulce pro vyhledávání.

Nevýhodou tohoto řešení je vyšší režije při aktualizaci textu v DB (ale to se děje jen při vkládání nového článku, nebo úpravě starého), naopak výhodou je, že se zachová rychlost selectů nad stávajícími tabulkami s texty (při normálním prohlížení webu nejčastější dotaz) a zároveň se získá fulltextový klíč pro vyhledávací skript, který je tedy poté trochu pomalejší, ale zase vyhledávací select se nebude pouštět tak často.
22.4.2012 23:05 Martin B. | skóre: 28 | blog: hromada
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Kdybych si s tím chtěl hrát, zkusil bych provozovat vlastní instanci lucene, sphinx nebo nějakého jiného open source search engine.
I think warning here is a bug. The biggest cloud service provider. There is no point in being so cool in a cold world.
limit_false avatar 23.4.2012 12:52 limit_false | skóre: 20 | blog: limit_false
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Taky bych doporučil Sphinx. Ze začátku to bude trocha pruda, ale fungovalo to celkem rozumně, později se ladily jenom váhy a možná občas příliš pomalé dotazy.
22.4.2012 23:35 Ondra
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Josef Kufner avatar 22.4.2012 23:42 Josef Kufner | skóre: 63
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Kdysi na Rootovi a tuším, že i tady, vyšlo pár článků. Je to ale už hodně dávno... cca kolem roku 2005. Leoš tu tou dobou také řešil něco kolem Lucene.
Hello world ! Segmentation fault (core dumped)
22.4.2012 23:49 dad
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
my pouzivame mnogosearch
mess avatar 23.4.2012 00:25 mess | skóre: 43 | blog: bordel | Háj ve Slezsku - Smolkov
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
SELECT * FROM articles WHERE title LIKE %neco% AND content LIKE %neco%;
:-D
Cez párne mesiace zošíváš vaginy, cez neparne montuješ hajzle.
Johny z Podoli avatar 23.4.2012 00:41 Johny z Podoli | skóre: 26 | blog: rocfdebian
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
nojo, kdyby těch tabulek nebyly desítky, sloupců stovky a hromada dat není z databáze ale je generovaná onfly scrpty a podobně ;-) bohužel...
Můj web o táborech: Letní dětské tábory, Hudební tábor , Můj nový blog na Nul.cz
Migilenik avatar 23.4.2012 01:32 Migilenik | skóre: 58 | blog: Mig_Alley
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Off Topic:

Nevim už kde, ale nedavno jsem četl jakysi članek doporučující rodičům webové stránky s katalogy táborů. Takové ty články "kam poslat děti na prazdniny at maji rodiče pokoj".

Ten tvůj portál byl na prvním místě a dlužno říci že ze všech zmíněných webů působil naprosto nejšpičkověji.

Takže gratuluju k úspěchu a drceni konkurence :-) .
GIMP 2.8 Cage Transformation - what is it good for? http://www.youtube.com/watch?v=S4whULCb8t0
23.4.2012 07:31 JK
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Nepomuze starsi clanek? Cestinu jsem resil prevodem diakritiky na znaky bez diakritiky a s vyhledavanim jsem spokojen.
Aleš Janda avatar 23.4.2012 08:28 Aleš Janda | skóre: 20 | blog: programátorské hádanky a tak podobně | Kralupy nad Vltavou
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
http://search.seznam.cz/vlastni - ale vrchní reklama je tam taky (může se však strefovat do jiných slov než Google).

Anebo jsem kdysi zkoušel rozběhnout Sphinx, přičemž každé slovo se lemmatizovalo (tím se do značné míry vyřešilo skloňování a diakritika).
23.4.2012 08:39 Jan Grmela | skóre: 45 | blog: Kilo šťávy z lachtana | Brno
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Píšu pro Pivní recenze a protože mě to IT už fakt nebaví, tak jsme si s klukama postavili pivovar Lucky Bastard
pek avatar 23.4.2012 08:57 pek | skóre: 20
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Používám sphider, ale to je spíš pro menší weby.
23.4.2012 09:06 Sajfi | skóre: 5
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Ja si teď po večerech hraju s Sherlockem z nasi Ceske kotliny a je to moc hezká hračka :-).
xkucf03 avatar 23.4.2012 11:02 xkucf03 | skóre: 43 | blog: xkucf03
Rozbalit Rozbalit vše Diakritika
K té diakritice: skutečně je to nutné? Předpokládám, že v databázi máš obsah s diakritikou, takže jde o to, jak budou hledat uživatelé. Je lepší 1) vyhledávat i nesmysly a zatěžovat irelevantními výsledky uživatele, kteří si „dali tu práci“ se zadáváním hledaného textu s diakritikou nebo 2) dávat špatné výsledky uživatelům, kteří jsou líní/neschopní zadat hledaný text včetně háčků a čárek?
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-Výuka.cz, Nekuřák.net
Marek Stopka avatar 23.4.2012 12:17 Marek Stopka | skóre: 57 | blog: Paranoidní blog | London, United Kingdom
Rozbalit Rozbalit vše Re: Diakritika
3) podle toho jestli hledaný řetězec obsahuje nebo neobsahuje diakritiku vyhledávat v indexu s diakritikou, nebo ne (často potřebuju něco najít z blackberry, hledání pouze s diakritikou mě irituje :-) )
Josef Kufner avatar 23.4.2012 12:18 Josef Kufner | skóre: 63
Rozbalit Rozbalit vše Re: Diakritika
Obdobný problém je například se skloňováním a s překlepy. Jako rozumné se mi jeví přiřadit přesné shodě lepší skóre a částečné shodě (překlep, chybějící diakritika) nebo jinému tvaru stejného slova přiřadit skóre o něco horší. Takže irelevantní výsledky budou až za relevantními a líný uživatel dostane, co chtěl.

V praxi se mi osvědčilo (z pohledu uživatele) i vyhledávání podle začátků slov. Krásná ukázka toho je na wowhead.com.
Hello world ! Segmentation fault (core dumped)
23.4.2012 15:37 Roman Schulz | skóre: 8 | Brno
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Taky bych doporučil Sphinx, je snadno konfigurovatelný, indexace může probíhat pomocí zadaného SQL dotazu. Používáme ho i na velkých projektech k naprosté spokojenosti
Programování v OpenGL, můj Blog, linkedin.com profil
23.4.2012 17:33 joka x3m | skóre: 1
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Stiahnut obsah webu rekurzivne cez perl, natlacit texty do db, 2 stlpce, jeden s diakritikou, druhy bez, zapnut index pre fulltext na stlpci bez diakritiky, pri hladani ocistit diakritiku a zvazit jednoduchy fulltext select alebo rozsireny. Robil som specialne parsovanie webu, a vsetko mi funguje presne tak ako ja chcem :) ak chces napis na kalus bodka jozef zavinac gmail bodka com a mozem ti dat blizsie info o tom, nie je to az tak komplikovane ak tvoja db podporuje fulltext :)
23.4.2012 19:27 Kvakor
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
A pokud nejsou data čistý text (což většinou nejsou, buď je to (X)HTML nebo nějaký značkovací jazyk redakčího systému), tak se musí text prvně převést. Když je zdroj nějak strukturovaný, je ještě možné vytahat "zvýrazněné" části bokem do separátního sloupce, když jsem něco takového kdysi dělal, tak tam šlo všechno z <strong>, <em>, vnitřku nadpisů a toho, co se vkládalo do klíčových slov v hlavičce.

Zákazník chtěl ještě podporu skoňování a časování, ale protože se mi nepovedlo najít volně dostupná data, tak se to nakonec neřešilo. Stejně dodnes nevím, jak to elegantně řešit, návrh byl pro každé slovo, které se najde v "sloňovací/časovací" tabulce, provést dotazy na všechny další slova se stejným identifikátorem. V praxi to mohlo znamenat zhruba zdeseti-zdvacetinásobení dotazů, protože se počítalo i zahrnutí nespisovných tvarů (typu "myšmi/myšma/myšima/myšema/myšmami/myšmama"). Docela by mně zajímalo, jak tohle řeší hoši v Seznamu :-)
xkucf03 avatar 23.4.2012 19:49 xkucf03 | skóre: 43 | blog: xkucf03
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Stejně dodnes nevím, jak to elegantně řešit, návrh byl pro každé slovo, které se najde v "sloňovací/časovací" tabulce, provést dotazy na všechny další slova se stejným identifikátorem. V praxi to mohlo znamenat zhruba zdeseti-zdvacetinásobení dotazů
Proto se to řeší tak, že se do indexu ukládají pouze slova v základním tvaru a dotazy se převádějí opět na základní tvar (pokud např. nejsou v uvozovkách).
Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-Výuka.cz, Nekuřák.net
23.4.2012 21:10 Kvakor
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
To by šlo, sice by generování zabralo šíleně času, ale vyhledávání by to moc nezpomalilo. Ale tenkrát jsem to už neřešil, protože bych nakonec mohl skončit u implementovani plnohodnotného vyhledavaciho enginu jen kvůli pár stránkám :-)
24.4.2012 12:12 Ladicek | skóre: 28 | blog: variace | Havlíčkův brod
Rozbalit Rozbalit vše Re: Jak na vlastní fulltextové vyhledávání?
Obvykle úplně stačí jenom odřezávat přípony, na to není ani potřeba slovník, seznam českých přípon se dá najít někde v ispellu.
Ještě na tom nejsem tak špatně, abych četl Viewegha.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   Powered by Hosting 90 Server hosting
© 1999-2013 Argonit s. r. o. Všechna práva vyhrazena.