abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 21:11 | Zajímavý software

    Byla vydána verze 1.0 editoru kódů Gram. Jedná se o fork editoru Zed bez telemetrie a umělé inteligence.

    Ladislav Hagara | Komentářů: 0
    dnes 20:33 | IT novinky

    Byla oznámena spolupráce GrapheneOS s Motorolou. Podrobnosti v tiskové zprávě. GrapheneOS (Wikpedie) je varianta Androidu zaměřující se na bezpečnost a soukromí.

    Ladislav Hagara | Komentářů: 0
    dnes 02:22 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 26.2.1. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    dnes 02:11 | Komunita

    Volí se dvě místa v Radě openSUSE. Seznamte se se čtyřmi kandidáty. Členové projektu openSUSE mohou hlasovat od 1. do 8. března. Výsledky budou oznámeny 9. března.

    lkocman | Komentářů: 1
    včera 19:22 | IT novinky

    Společnost OpenAI uzavřela dohodu s americkým ministerstvem obrany o poskytování technologií umělé inteligence (AI) pro utajované sítě americké armády. Firma to oznámila několik hodin poté, co prezident Donald Trump nařídil vládě, aby přestala využívat služby společnosti Anthropic.

    Ladislav Hagara | Komentářů: 7
    včera 13:33 | IT novinky

    Technologická společnost Anthropic v noci na dnešek oznámila, že se obrátí na soud kvůli rozhodnutí ministerstva obrany označit ji za bezpečnostní riziko dodavatelského řetězce poté, co nevyhověla jeho požadavkům týkajícím se používání umělé inteligence (AI). Prezident Donald Trump krátce před tím uvedl, že nařídil federálním úřadům postupně ukončit využívání jejích AI technologií. Spor mezi firmou vyvíjející chatbot Claude a

    … více »
    Ladislav Hagara | Komentářů: 9
    28.2. 15:44 | Upozornění

    Zemřel Rob Grant, spolutvůrce kultovního sci-fi seriálu Červený trpaslík.

    Ladislav Hagara | Komentářů: 8
    27.2. 17:33 | IT novinky

    Apple oznámil, že iPhone a iPad jako první a jediná zařízení pro koncové uživatele splňují požadavky členských států NATO na zabezpečení informací. Díky tomu je možné je používat pro práci s utajovanými informacemi až do stupně „NATO Restricted“, a to bez nutnosti instalovat speciální software nebo měnit nastavení. Žádné jiné běžně dostupné mobilní zařízení tak vysokou úroveň státní certifikace dosud nezískalo.

    Ladislav Hagara | Komentářů: 20
    27.2. 13:00 | IT novinky

    Americký provozovatel streamovací platformy Netflix odmítl zvýšit nabídku na převzetí filmových studií a streamovací divize konglomerátu Warner Bros. Discovery (WBD). Netflix to ve čtvrtek oznámil v tiskové zprávě. Jeho krok po několikaměsíčním boji o převzetí otevírá dveře k akvizici WBD mediální skupině Paramount Skydance, a to zhruba za 111 miliard dolarů (2,28 bilionu Kč).

    Ladislav Hagara | Komentářů: 20
    27.2. 12:44 | IT novinky

    Americká společnosti Apple přesune část výroby svého malého stolního počítače Mac mini z Asie do Spojených států. Výroba v závodě v Houstonu by měla začít ještě v letošním roce, uvedla firma na svém webu. Apple také plánuje rozšířit svůj závod v Houstonu o nové školicí centrum pro pokročilou výrobu. V Houstonu by měly vzniknout tisíce nových pracovních míst.

    Ladislav Hagara | Komentářů: 21
    Které desktopové prostředí na Linuxu používáte?
     (17%)
     (6%)
     (0%)
     (11%)
     (27%)
     (2%)
     (5%)
     (2%)
     (13%)
     (26%)
    Celkem 990 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Mocnější vyhledávání

    6.7.2005 17:48 | Přečteno: 1426× | Abíčko | poslední úprava: 8.7.2005 10:31

    Svátky pomalu končí a tak mám pro vás poslední novinku pro tento týden. A tou je předělání vyhledávání - hezčí vzhled i ukázka nalezených dokumentů.

    Po menších peripetiích jsem si stáhnul verzi modulu highlight, která je kompatibilní s verzi Lucene, kterou používám. Kupodivu to nebylo moc složité a máme zvýrazňování, tak jak jej znáte z googlu a spol. Přitom jsem předělal i vizuální podobu výsledků, aspoň mě to teď přijde hezčí. On si s tím určitě Robert pohraje.

    Odstranil jsem skóre, které spíše mátlo než pomáhalo. Také jsem zmenšil počet výsledků na stránce, vlastní hodnotu si můžete nastavit v profilu. Já si ji zmenším.

    Začal jsem indexovat datum vytvoření a poslední změny u všech objektů, zatím se mi ale nedaří podle nich hledat. Lépe jsem dopadl s tím, zda je diskuse vyřešena (vyreseno:ano/ne) a počtu odpovědí (odpovedi:cislo). Začal jsem psát i nápovědu, časem do ni přidám všechny informace.

    Teď se zrovna reindexuje databáze, změny byly nekompatibilní a tak teď hledání padá. Ale za deset minut si můžete hrát. Později přidám do výpisu více informací, hlavně datum vytvoření a/nebo poslední změny, u diskusí pak hodnoty zmíněných políček. Kousek kódu pro programátory, sám jsem něco podobného ráno potřeboval, protože ukázka v dokumentaci modulu highlight není úplná.

    AbcCzechAnalyzer analyzer = new AbcCzechAnalyzer();
    Query query = AbcQueryParser.parse(queryString, analyzer, types, newsCategories);
    IndexReader indexReader = IndexReader.open(CreateIndex.getIndexPath());
    query = query.rewrite(indexReader);
    Searcher searcher = new IndexSearcher(indexReader);
    Hits hits = searcher.search(query);
    int total = hits.length();
    
    SimpleHTMLFormatter formatter = new SimpleHTMLFormatter(
    "<span class=\"highlight\">", "</span>");
    Highlighter highlighter = new Highlighter(formatter, new QueryScorer(query));
    for ( int i=from,j=0; i<total && j<count; i++, j++ ) {
        Document doc = hits.doc(i);
        float score = (hits.score(i)>0.01) ? hits.score(i) : 0.01f;
        doc.add(Field.UnIndexed("score", percentFormat.format(score)));
    
        String text = hits.doc(i).get(MyDocument.CONTENT);
        TokenStream tokenStream = analyzer.tokenStream(MyDocument.CONTENT, 
                                  new StringReader(text));
        String result = highlighter.getBestFragments(tokenStream, text, 3, "...");
        doc.add(Field.UnIndexed("fragments", result));
    
        list.add(doc);
    }
           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    6.7.2005 18:10 © | skóre: 37 | blog: escaped
    Rozbalit Rozbalit vše Jen tak dál...
    ... a díky za každé nové vylepšení.
    6.7.2005 20:17 phax7 | skóre: 34 | blog: PhaX_blog
    Rozbalit Rozbalit vše Re: Jen tak dál...
    Abclinuxu.cz je nejvymakanější portál co znám - a to včetně zahraničních. Každý detail je odladěný a stále se vylepšuje... a važte si toho, chválím málo:)
    Ondrej avatar 6.7.2005 22:56 Ondrej | skóre: 20 | blog: darkblair_server | Praha
    Rozbalit Rozbalit vše Zajimave zmeny
    Velmi me potesil nahled nalezeneho prispevku, to muze opravdu pomoci pri proklikavani desitkami nalezu Co bych ale obnovil, to jsou hodnotici procenta - clovek pak hned na prvni pohled vedel, jestli je tam ten vyhledavany termin zastoupen casto nebo jesti je to jenom lehke dotknuti
    Nikdo neni nikdy lepsi nez ty! Pouze ty jsi obcas horsi nez ostatni.
    7.7.2005 08:33 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Zajimave zmeny
    Google take nezobrazuje relevanci a nikomu to nevadi. Nalezene prispevky jsou stejne razeny podle tech procent, akorat to nevidite.

    Vypocet tech cisel je dost velka magie, v dokumentaci Lucene najdete pekne nechutny vzorecek. Tezko z tech cisel neco poznate, proc ma jeden dokument skore 75% a jiny 12%. Pocita se nejen pocet vyskytu, ale treba i delka dokumentu hraje roli.

    Kdyz jste videli procenta, tak jste treba automaticky preskokovali objekty majici skore mensi nez 10%. Jenze ten dokument mohl mit reseni vaseho problemu, mel ale tu smulu, ze byl treba velmi dlouhy a hledany vyraz se v nem zopakoval jen nekolikrat. Ted kdyz cisla nevidite, proste budete klikat na dalsi stranku s vysledky a kliknete i na dokument, ktery byste jinak ignorovali.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    6.7.2005 23:43 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Hledání
    Hledání je pěkné, ale mám moc široký nebo moc úzký monitor?
    7.7.2005 08:27 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Jake mas rozliseni? Nicmene tohle asi budu muset resit, holt to hodim do dalsiho sloupecku, kdyz se text rozpadne, at je to pod sebou.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 08:58 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Mně to dělá taky když si zapnu sidebar, rozlišení 1280x800.
    7.7.2005 10:34 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Re: Hledání
    1280x1024, i když napravo mám gkrellm a mozillí tab bar, takže zbývající plocha pro stránku je široká něco přes 1 kpx.
    8.7.2005 10:33 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Hledání
    Me to vypadalo dobre v 1024x768 i v 800x600. Nicmene jsem to presunul pod formular. Je to tak lepsi? Mozna bych tam mohl soupnout i napovedu.
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 09:11 mmrnda | skóre: 18 | blog: Pokusy | Liberec
    Rozbalit Rozbalit vše Paráda
    Je to paráda. :-)

    PS: Umístění by mohlo být vlevo jak bývalo. Teď mi to příjde takové nepřehledné, když je to až za názvem článku(diskuse).
    Učený člověk na zem nespadl.
    7.7.2005 09:18 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše Re: Paráda
    Nechapu to umisteni. Ceho se tyka? Formulare? Asi myslis typ objektu. Planuju, ze ten typ objektu (i s diakritikou) pujde na novy radek a zobrazi kontextove informace (pocet odpovedi, zda je vyresena, datum vytvoreni, datum posledni zmeny).
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
    7.7.2005 14:02 mmrnda | skóre: 18 | blog: Pokusy | Liberec
    Rozbalit Rozbalit vše Re: Paráda
    Omlouvám se, že jsem to tak špatně popsal. Myslel jsem to kde je článek umístěn (diskuse, článek, blog, zprávička).
    Učený člověk na zem nespadl.
    7.7.2005 09:16 Leoš Literák | skóre: 74 | blog: LL | Praha
    Rozbalit Rozbalit vše hledani podle data
    Uz jsem na to prisel: nvidia vytvoreno:[1.7.2005 TO 7.7.2005]

    najde vsechno, co bylo vytvoreno v danem casovem useku a obsahuje slovo nvidia. U diskusi je lepsi pouzit policko zmeneno (pozor - je to datum posledni zmeny, ne ze v danem case se neco zmenilo).
    Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.