abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 21:44 | Komunita

    Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.

    Ladislav Hagara | Komentářů: 0
    dnes 14:22 | IT novinky

    Před 25 lety zaplavil celý svět virus ILOVEYOU. Virus se šířil e-mailem, jenž nesl přílohu s názvem I Love You. Příjemci, zvědavému, kdo se do něj zamiloval, pak program spuštěný otevřením přílohy načetl z adresáře e-mailové adresy a na ně pak „milostný vzkaz“ poslal dál. Škody vznikaly jak zahlcením e-mailových serverů, tak i druhou činností viru, kterou bylo přemazání souborů uložených v napadeném počítači.

    Ladislav Hagara | Komentářů: 8
    včera 22:33 | Nová verze

    Byla vydána nová major verze 5.0.0 svobodného multiplatformního nástroje BleachBit (GitHub, Wikipedie) určeného především k efektivnímu čištění disku od nepotřebných souborů.

    Ladislav Hagara | Komentářů: 2
    2.5. 22:22 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za duben (YouTube).

    Ladislav Hagara | Komentářů: 0
    2.5. 19:11 | IT novinky

    Provozovatel čínské sociální sítě TikTok dostal v Evropské unii pokutu 530 milionů eur (13,2 miliardy Kč) za nedostatky při ochraně osobních údajů. Ve svém oznámení to dnes uvedla irská Komise pro ochranu údajů (DPC), která jedná jménem EU. Zároveň TikToku nařídila, že pokud správu dat neuvede do šesti měsíců do souladu s požadavky, musí přestat posílat data o unijních uživatelích do Číny. TikTok uvedl, že se proti rozhodnutí odvolá.

    Ladislav Hagara | Komentářů: 3
    2.5. 11:22 | Zajímavý projekt

    Společnost JetBrains uvolnila Mellum, tj. svůj velký jazykový model (LLM) pro vývojáře, jako open source. Mellum podporuje programovací jazyky Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust a Ruby.

    Ladislav Hagara | Komentářů: 2
    2.5. 09:11 | Bezpečnostní upozornění

    Vývojáři Kali Linuxu upozorňují na nový klíč pro podepisování balíčků. K původnímu klíči ztratili přístup.

    Ladislav Hagara | Komentářů: 2
    1.5. 20:00 | Komunita

    V březnu loňského roku přestal být Redis svobodný. Společnost Redis Labs jej přelicencovala z licence BSD na nesvobodné licence Redis Source Available License (RSALv2) a Server Side Public License (SSPLv1). Hned o pár dní později vznikly svobodné forky Redisu s názvy Valkey a Redict. Dnes bylo oznámeno, že Redis je opět svobodný. S nejnovější verzí 8 je k dispozici také pod licencí AGPLv3.

    Ladislav Hagara | Komentářů: 3
    1.5. 19:22 | IT novinky

    Oficiální ceny Raspberry Pi Compute Modulů 4 klesly o 5 dolarů (4 GB varianty), respektive o 10 dolarů (8 GB varianty).

    Ladislav Hagara | Komentářů: 0
    30.4. 22:33 | Nová verze

    Byla vydána beta verze openSUSE Leap 16. Ve výchozím nastavení s novým instalátorem Agama.

    Ladislav Hagara | Komentářů: 0
    Jaký filesystém primárně používáte?
     (58%)
     (1%)
     (8%)
     (21%)
     (4%)
     (2%)
     (3%)
     (0%)
     (1%)
     (3%)
    Celkem 519 hlasů
     Komentářů: 19, poslední 30.4. 11:32
    Rozcestník

    Mocnější vyhledávání

    6.7.2005 17:48 | Přečteno: 1361× | Abíčko | poslední úprava: 8.7.2005 10:31

    Svátky pomalu končí a tak mám pro vás poslední novinku pro tento týden. A tou je předělání vyhledávání - hezčí vzhled i ukázka nalezených dokumentů.

    Po menších peripetiích jsem si stáhnul verzi modulu highlight, která je kompatibilní s verzi Lucene, kterou používám. Kupodivu to nebylo moc složité a máme zvýrazňování, tak jak jej znáte z googlu a spol. Přitom jsem předělal i vizuální podobu výsledků, aspoň mě to teď přijde hezčí. On si s tím určitě Robert pohraje.

    Odstranil jsem skóre, které spíše mátlo než pomáhalo. Také jsem zmenšil počet výsledků na stránce, vlastní hodnotu si můžete nastavit v profilu. Já si ji zmenším.

    Začal jsem indexovat datum vytvoření a poslední změny u všech objektů, zatím se mi ale nedaří podle nich hledat. Lépe jsem dopadl s tím, zda je diskuse vyřešena (vyreseno:ano/ne) a počtu odpovědí (odpovedi:cislo). Začal jsem psát i nápovědu, časem do ni přidám všechny informace.

    Teď se zrovna reindexuje databáze, změny byly nekompatibilní a tak teď hledání padá. Ale za deset minut si můžete hrát. Později přidám do výpisu více informací, hlavně datum vytvoření a/nebo poslední změny, u diskusí pak hodnoty zmíněných políček. Kousek kódu pro programátory, sám jsem něco podobného ráno potřeboval, protože ukázka v dokumentaci modulu highlight není úplná.

    AbcCzechAnalyzer analyzer = new AbcCzechAnalyzer();
    Query query = AbcQueryParser.parse(queryString, analyzer, types, newsCategories);
    IndexReader indexReader = IndexReader.open(CreateIndex.getIndexPath());
    query = query.rewrite(indexReader);
    Searcher searcher = new IndexSearcher(indexReader);
    Hits hits = searcher.search(query);
    int total = hits.length();
    
    SimpleHTMLFormatter formatter = new SimpleHTMLFormatter(
    "<span class=\"highlight\">", "</span>");
    Highlighter highlighter = new Highlighter(formatter, new QueryScorer(query));
    for ( int i=from,j=0; i<total && j<count; i++, j++ ) {
        Document doc = hits.doc(i);
        float score = (hits.score(i)>0.01) ? hits.score(i) : 0.01f;
        doc.add(Field.UnIndexed("score", percentFormat.format(score)));
    
        String text = hits.doc(i).get(MyDocument.CONTENT);
        TokenStream tokenStream = analyzer.tokenStream(MyDocument.CONTENT, 
                                  new StringReader(text));
        String result = highlighter.getBestFragments(tokenStream, text, 3, "...");
        doc.add(Field.UnIndexed("fragments", result));
    
        list.add(doc);
    }
           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    6.7.2005 18:10 © | skóre: 37 | blog: escaped
    Rozbalit Rozbalit vše Jen tak dál...
    ... a díky za každé nové vylepšení.
    6.7.2005 20:17 phax7 | skóre: 34 | blog: PhaX_blog
    Rozbalit Rozbalit vše Re: Jen tak dál...
    Abclinuxu.cz je nejvymakanější portál co znám - a to včetně zahraničních. Každý detail je odladěný a stále se vylepšuje... a važte si toho, chválím málo:)
    Ondrej avatar 6.7.2005 22:56 Ondrej | skóre: 20 | blog: darkblair_server | Praha
    Rozbalit Rozbalit vše Zajimave zmeny
    Velmi me potesil nahled nalezeneho prispevku, to muze opravdu pomoci pri proklikavani desitkami nalezu Co bych ale obnovil, to jsou hodnotici procenta - clovek pak hned na prvni pohled vedel, jestli je tam ten vyhledavany termin zastoupen casto nebo jesti je to jenom lehke dotknuti
    Nikdo neni nikdy lepsi nez ty! Pouze ty jsi obcas horsi nez ostatni.
    7.7.2005 08:33 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Zajimave zmeny
    Google take nezobrazuje relevanci a nikomu to nevadi. Nalezene prispevky jsou stejne razeny podle tech procent, akorat to nevidite.

    Vypocet tech cisel je dost velka magie, v dokumentaci Lucene najdete pekne nechutny vzorecek. Tezko z tech cisel neco poznate, proc ma jeden dokument skore 75% a jiny 12%. Pocita se nejen pocet vyskytu, ale treba i delka dokumentu hraje roli.

    Kdyz jste videli procenta, tak jste treba automaticky preskokovali objekty majici skore mensi nez 10%. Jenze ten dokument mohl mit reseni vaseho problemu, mel ale tu smulu, ze byl treba velmi dlouhy a hledany vyraz se v nem zopakoval jen nekolikrat. Ted kdyz cisla nevidite, proste budete klikat na dalsi stranku s vysledky a kliknete i na dokument, ktery byste jinak ignorovali.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    6.7.2005 23:43 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Hledání
    Hledání je pěkné, ale mám moc široký nebo moc úzký monitor?
    7.7.2005 08:27 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Jake mas rozliseni? Nicmene tohle asi budu muset resit, holt to hodim do dalsiho sloupecku, kdyz se text rozpadne, at je to pod sebou.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 08:58 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Mně to dělá taky když si zapnu sidebar, rozlišení 1280x800.
    7.7.2005 10:34 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: Hledání
    1280x1024, i když napravo mám gkrellm a mozillí tab bar, takže zbývající plocha pro stránku je široká něco přes 1 kpx.
    8.7.2005 10:33 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Me to vypadalo dobre v 1024x768 i v 800x600. Nicmene jsem to presunul pod formular. Je to tak lepsi? Mozna bych tam mohl soupnout i napovedu.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 09:11 mmrnda | skóre: 18 | blog: Pokusy | Liberec
    Rozbalit Rozbalit vše Paráda
    Je to paráda. :-)

    PS: Umístění by mohlo být vlevo jak bývalo. Teď mi to příjde takové nepřehledné, když je to až za názvem článku(diskuse).
    Učený člověk na zem nespadl.
    7.7.2005 09:18 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Paráda
    Nechapu to umisteni. Ceho se tyka? Formulare? Asi myslis typ objektu. Planuju, ze ten typ objektu (i s diakritikou) pujde na novy radek a zobrazi kontextove informace (pocet odpovedi, zda je vyresena, datum vytvoreni, datum posledni zmeny).
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 14:02 mmrnda | skóre: 18 | blog: Pokusy | Liberec
    Rozbalit Rozbalit vše Re: Paráda
    Omlouvám se, že jsem to tak špatně popsal. Myslel jsem to kde je článek umístěn (diskuse, článek, blog, zprávička).
    Učený člověk na zem nespadl.
    7.7.2005 09:16 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše hledani podle data
    Uz jsem na to prisel: nvidia vytvoreno:[1.7.2005 TO 7.7.2005]

    najde vsechno, co bylo vytvoreno v danem casovem useku a obsahuje slovo nvidia. U diskusi je lepsi pouzit policko zmeneno (pozor - je to datum posledni zmeny, ne ze v danem case se neco zmenilo).
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.