abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 03:33 | Bezpečnostní upozornění

    V dokumentově orientované databázi MongoDB byla nalezena a v upstreamu již opravena kritická bezpečností chyba CVE-2025-14847 aneb MongoBleed.

    Ladislav Hagara | Komentářů: 0
    včera 23:11 | IT novinky

    Při úklidu na Utažské univerzitě se ve skladovacích prostorách náhodou podařilo nalézt magnetickou pásku s kopií Unixu V4. Páska byla zaslána do počítačového muzea, kde se z pásky úspěšně podařilo extrahovat data a Unix spustit. Je to patrně jediný známý dochovaný exemplář tohoto 52 let starého Unixu, prvního vůbec programovaného v jazyce C.

    🇨🇽 | Komentářů: 0
    včera 15:55 | Komunita

    FFmpeg nechal kvůli porušení autorských práv odstranit z GitHubu jeden z repozitářů patřících čínské technologické firmě Rockchip. Důvodem bylo porušení LGPL ze strany Rockchipu. Rockchip byl FFmpegem na porušování LGPL upozorněn již téměř před dvěma roky.

    🇨🇽 | Komentářů: 5
    včera 15:44 | Zajímavý software

    K dispozici je nový CLI nástroj witr sloužící k analýze běžících procesů. Název je zkratkou slov why-is-this-running, 'proč tohle běží'. Klade si za cíl v 'jediném, lidsky čitelném, výstupu vysvětlit odkud daný spuštěný proces pochází, jak byl spuštěn a jaký řetězec systémů je zodpovědný za to, že tento proces právě teď běží'. Witr je napsán v jazyce Go.

    🇨🇽 | Komentářů: 0
    včera 15:33 | Zajímavý software

    Yazi je správce souborů běžící v terminálu. Napsán je v programovacím jazyce Rust. Podporuje asynchronní I/O operace. Vydán byl v nové verzi 25.12.29. Instalovat jej lze také ze Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    26.12. 18:44 | Komunita

    Od soboty do úterý probíhá v Hamburku konference 39C3 (Chaos Communication Congress) věnovaná také počítačové bezpečnosti nebo hardwaru. Program (jiná verze) slibuje řadu zajímavých přednášek. Streamy a záznamy budou k dispozici na media.ccc.de.

    Ladislav Hagara | Komentářů: 0
    26.12. 13:22 | Zajímavý software

    Byl představen nový Xserver Phoenix, kompletně od nuly vyvíjený v programovacím jazyce Zig. Projekt Phoenix si klade za cíl být moderní alternativou k X.Org serveru.

    🇨🇽 | Komentářů: 7
    26.12. 13:11 | Nová verze

    XLibre Xserver byl 21. prosince vydán ve verzi 25.1.0, 'winter solstice release'. Od založení tohoto forku X.Org serveru se jedná o vůbec první novou minor verzi (inkrementovalo se to druhé číslo v číselném kódu verze).

    🇨🇽 | Komentářů: 0
    26.12. 03:33 | Nová verze

    Wayback byl vydán ve verzi 0.3. Wayback je "tak akorát Waylandu, aby fungoval Xwayland". Jedná se o kompatibilní vrstvu umožňující běh plnohodnotných X11 desktopových prostředí s využitím komponent z Waylandu. Cílem je nakonec nahradit klasický server X.Org, a tím snížit zátěž údržby aplikací X11.

    Ladislav Hagara | Komentářů: 0
    25.12. 14:44 | Nová verze

    Byla vydána verze 4.0.0 programovacího jazyka Ruby (Wikipedie). S Ruby Box a ZJIT. Ruby lze vyzkoušet na webové stránce TryRuby. U příležitosti 30. narozenin, první veřejná verze Ruby 0.95 byla oznámena 21. prosince 1995, proběhl redesign webových stránek.

    Ladislav Hagara | Komentářů: 0
    Kdo vám letos nadělí dárek?
     (33%)
     (1%)
     (22%)
     (1%)
     (1%)
     (1%)
     (11%)
     (12%)
     (17%)
    Celkem 174 hlasů
     Komentářů: 18, poslední 24.12. 15:29
    Rozcestník

    Mocnější vyhledávání

    6.7.2005 17:48 | Přečteno: 1424× | Abíčko | poslední úprava: 8.7.2005 10:31

    Svátky pomalu končí a tak mám pro vás poslední novinku pro tento týden. A tou je předělání vyhledávání - hezčí vzhled i ukázka nalezených dokumentů.

    Po menších peripetiích jsem si stáhnul verzi modulu highlight, která je kompatibilní s verzi Lucene, kterou používám. Kupodivu to nebylo moc složité a máme zvýrazňování, tak jak jej znáte z googlu a spol. Přitom jsem předělal i vizuální podobu výsledků, aspoň mě to teď přijde hezčí. On si s tím určitě Robert pohraje.

    Odstranil jsem skóre, které spíše mátlo než pomáhalo. Také jsem zmenšil počet výsledků na stránce, vlastní hodnotu si můžete nastavit v profilu. Já si ji zmenším.

    Začal jsem indexovat datum vytvoření a poslední změny u všech objektů, zatím se mi ale nedaří podle nich hledat. Lépe jsem dopadl s tím, zda je diskuse vyřešena (vyreseno:ano/ne) a počtu odpovědí (odpovedi:cislo). Začal jsem psát i nápovědu, časem do ni přidám všechny informace.

    Teď se zrovna reindexuje databáze, změny byly nekompatibilní a tak teď hledání padá. Ale za deset minut si můžete hrát. Později přidám do výpisu více informací, hlavně datum vytvoření a/nebo poslední změny, u diskusí pak hodnoty zmíněných políček. Kousek kódu pro programátory, sám jsem něco podobného ráno potřeboval, protože ukázka v dokumentaci modulu highlight není úplná.

    AbcCzechAnalyzer analyzer = new AbcCzechAnalyzer();
    Query query = AbcQueryParser.parse(queryString, analyzer, types, newsCategories);
    IndexReader indexReader = IndexReader.open(CreateIndex.getIndexPath());
    query = query.rewrite(indexReader);
    Searcher searcher = new IndexSearcher(indexReader);
    Hits hits = searcher.search(query);
    int total = hits.length();
    
    SimpleHTMLFormatter formatter = new SimpleHTMLFormatter(
    "<span class=\"highlight\">", "</span>");
    Highlighter highlighter = new Highlighter(formatter, new QueryScorer(query));
    for ( int i=from,j=0; i<total && j<count; i++, j++ ) {
        Document doc = hits.doc(i);
        float score = (hits.score(i)>0.01) ? hits.score(i) : 0.01f;
        doc.add(Field.UnIndexed("score", percentFormat.format(score)));
    
        String text = hits.doc(i).get(MyDocument.CONTENT);
        TokenStream tokenStream = analyzer.tokenStream(MyDocument.CONTENT, 
                                  new StringReader(text));
        String result = highlighter.getBestFragments(tokenStream, text, 3, "...");
        doc.add(Field.UnIndexed("fragments", result));
    
        list.add(doc);
    }
           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    6.7.2005 18:10 © | skóre: 37 | blog: escaped
    Rozbalit Rozbalit vše Jen tak dál...
    ... a díky za každé nové vylepšení.
    6.7.2005 20:17 phax7 | skóre: 34 | blog: PhaX_blog
    Rozbalit Rozbalit vše Re: Jen tak dál...
    Abclinuxu.cz je nejvymakanější portál co znám - a to včetně zahraničních. Každý detail je odladěný a stále se vylepšuje... a važte si toho, chválím málo:)
    Ondrej avatar 6.7.2005 22:56 Ondrej | skóre: 20 | blog: darkblair_server | Praha
    Rozbalit Rozbalit vše Zajimave zmeny
    Velmi me potesil nahled nalezeneho prispevku, to muze opravdu pomoci pri proklikavani desitkami nalezu Co bych ale obnovil, to jsou hodnotici procenta - clovek pak hned na prvni pohled vedel, jestli je tam ten vyhledavany termin zastoupen casto nebo jesti je to jenom lehke dotknuti
    Nikdo neni nikdy lepsi nez ty! Pouze ty jsi obcas horsi nez ostatni.
    7.7.2005 08:33 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Zajimave zmeny
    Google take nezobrazuje relevanci a nikomu to nevadi. Nalezene prispevky jsou stejne razeny podle tech procent, akorat to nevidite.

    Vypocet tech cisel je dost velka magie, v dokumentaci Lucene najdete pekne nechutny vzorecek. Tezko z tech cisel neco poznate, proc ma jeden dokument skore 75% a jiny 12%. Pocita se nejen pocet vyskytu, ale treba i delka dokumentu hraje roli.

    Kdyz jste videli procenta, tak jste treba automaticky preskokovali objekty majici skore mensi nez 10%. Jenze ten dokument mohl mit reseni vaseho problemu, mel ale tu smulu, ze byl treba velmi dlouhy a hledany vyraz se v nem zopakoval jen nekolikrat. Ted kdyz cisla nevidite, proste budete klikat na dalsi stranku s vysledky a kliknete i na dokument, ktery byste jinak ignorovali.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    6.7.2005 23:43 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Hledání
    Hledání je pěkné, ale mám moc široký nebo moc úzký monitor?
    7.7.2005 08:27 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Jake mas rozliseni? Nicmene tohle asi budu muset resit, holt to hodim do dalsiho sloupecku, kdyz se text rozpadne, at je to pod sebou.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 08:58 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Mně to dělá taky když si zapnu sidebar, rozlišení 1280x800.
    7.7.2005 10:34 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: Hledání
    1280x1024, i když napravo mám gkrellm a mozillí tab bar, takže zbývající plocha pro stránku je široká něco přes 1 kpx.
    8.7.2005 10:33 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Me to vypadalo dobre v 1024x768 i v 800x600. Nicmene jsem to presunul pod formular. Je to tak lepsi? Mozna bych tam mohl soupnout i napovedu.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 09:11 mmrnda | skóre: 18 | blog: Pokusy | Liberec
    Rozbalit Rozbalit vše Paráda
    Je to paráda. :-)

    PS: Umístění by mohlo být vlevo jak bývalo. Teď mi to příjde takové nepřehledné, když je to až za názvem článku(diskuse).
    Učený člověk na zem nespadl.
    7.7.2005 09:18 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Paráda
    Nechapu to umisteni. Ceho se tyka? Formulare? Asi myslis typ objektu. Planuju, ze ten typ objektu (i s diakritikou) pujde na novy radek a zobrazi kontextove informace (pocet odpovedi, zda je vyresena, datum vytvoreni, datum posledni zmeny).
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 14:02 mmrnda | skóre: 18 | blog: Pokusy | Liberec
    Rozbalit Rozbalit vše Re: Paráda
    Omlouvám se, že jsem to tak špatně popsal. Myslel jsem to kde je článek umístěn (diskuse, článek, blog, zprávička).
    Učený člověk na zem nespadl.
    7.7.2005 09:16 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše hledani podle data
    Uz jsem na to prisel: nvidia vytvoreno:[1.7.2005 TO 7.7.2005]

    najde vsechno, co bylo vytvoreno v danem casovem useku a obsahuje slovo nvidia. U diskusi je lepsi pouzit policko zmeneno (pozor - je to datum posledni zmeny, ne ze v danem case se neco zmenilo).
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.