abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 02:22 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 26.2.1. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    dnes 02:11 | Komunita

    Volí se dvě místa v Radě openSUSE. Seznamte se se čtyřmi kandidáty. Členové projektu openSUSE mohou hlasovat od 1. do 8. března. Výsledky budou oznámeny 9. března.

    lkocman | Komentářů: 0
    včera 19:22 | IT novinky

    Společnost OpenAI uzavřela dohodu s americkým ministerstvem obrany o poskytování technologií umělé inteligence (AI) pro utajované sítě americké armády. Firma to oznámila několik hodin poté, co prezident Donald Trump nařídil vládě, aby přestala využívat služby společnosti Anthropic.

    Ladislav Hagara | Komentářů: 7
    včera 13:33 | IT novinky

    Technologická společnost Anthropic v noci na dnešek oznámila, že se obrátí na soud kvůli rozhodnutí ministerstva obrany označit ji za bezpečnostní riziko dodavatelského řetězce poté, co nevyhověla jeho požadavkům týkajícím se používání umělé inteligence (AI). Prezident Donald Trump krátce před tím uvedl, že nařídil federálním úřadům postupně ukončit využívání jejích AI technologií. Spor mezi firmou vyvíjející chatbot Claude a

    … více »
    Ladislav Hagara | Komentářů: 7
    28.2. 15:44 | Upozornění

    Zemřel Rob Grant, spolutvůrce kultovního sci-fi seriálu Červený trpaslík.

    Ladislav Hagara | Komentářů: 8
    27.2. 17:33 | IT novinky

    Apple oznámil, že iPhone a iPad jako první a jediná zařízení pro koncové uživatele splňují požadavky členských států NATO na zabezpečení informací. Díky tomu je možné je používat pro práci s utajovanými informacemi až do stupně „NATO Restricted“, a to bez nutnosti instalovat speciální software nebo měnit nastavení. Žádné jiné běžně dostupné mobilní zařízení tak vysokou úroveň státní certifikace dosud nezískalo.

    Ladislav Hagara | Komentářů: 20
    27.2. 13:00 | IT novinky

    Americký provozovatel streamovací platformy Netflix odmítl zvýšit nabídku na převzetí filmových studií a streamovací divize konglomerátu Warner Bros. Discovery (WBD). Netflix to ve čtvrtek oznámil v tiskové zprávě. Jeho krok po několikaměsíčním boji o převzetí otevírá dveře k akvizici WBD mediální skupině Paramount Skydance, a to zhruba za 111 miliard dolarů (2,28 bilionu Kč).

    Ladislav Hagara | Komentářů: 19
    27.2. 12:44 | IT novinky

    Americká společnosti Apple přesune část výroby svého malého stolního počítače Mac mini z Asie do Spojených států. Výroba v závodě v Houstonu by měla začít ještě v letošním roce, uvedla firma na svém webu. Apple také plánuje rozšířit svůj závod v Houstonu o nové školicí centrum pro pokročilou výrobu. V Houstonu by měly vzniknout tisíce nových pracovních míst.

    Ladislav Hagara | Komentářů: 21
    27.2. 12:11 | Zajímavý článek

    Vědci Biotechnologické společnosti Cortical Labs vytvořili biopočítač nazvaný CL1, který využívá živé lidské mozkové buňky vypěstované z kmenových buněk na čipu. Po úspěchu se hrou PONG se ho nyní snaží naučit hrát DOOM. Neurony přijímají signály podle toho, co se ve hře děje, a jejich reakce jsou převáděny na akce jako pohyb nebo střelba. V tuto chvíli systém hraje velmi špatně, ale dokáže reagovat, trochu se učit a v reálném čase se hrou

    … více »
    karkar | Komentářů: 10
    27.2. 01:55 | Nová verze Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (17%)
     (6%)
     (0%)
     (11%)
     (27%)
     (2%)
     (5%)
     (2%)
     (13%)
     (26%)
    Celkem 988 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: nástroj pro vyhledávání ("lokální google")

    5.8.2005 09:46 deleted | skóre: 3 | blog: pnojmatika
    nástroj pro vyhledávání ("lokální google")
    Přečteno: 144×
    Mám na disku spoustu e-knih, manuálů a jiných textů (převážně v pdf a html). Potřeboval bych v nich nějak rozumně vyhledávat (např. zda obsahují slovo1 a zároveň slovo2). Je mi jasné, že to lze zařídit standardními prostředky. Např. AND realizuji takto (pdf mám převedené pomocí pdftotext):
    soubory=`grep -r -F -l -i -e $slovo1 ./`
    grep -F -l -i -e $slovo2 $soubory
    
    Jediná nevýhoda je, že je to pomalé. Takže potřebuji nějaký nástroj, který by uměl obsah indexovat a pak v něm vyhledávat tak jako google (tedy nepotřebuji regulární výrazy). Existuje něco?
    deleted

    Odpovědi

    5.8.2005 09:59 miso
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Potrebujes psa aby to vycuchal? ;-)
    beagle si prehladavane veci uchovava v sqlite3 subore, takze mozes pouzit aj sql
    http://beaglewiki.org/Main_Page
    5.8.2005 10:19 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    díky, něco míň "těžkotonážního" by nebylo?
    deleted
    5.8.2005 10:23 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Na Lupe vyšel v rámci jednoho seriálu zajímavý čánek.
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    5.8.2005 11:04 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Jestli to dobře chápu, tak pro každé slovo se vytvoří soubor na disku. Neovlivní velké množství malých souborů práci souborového systému?
    deleted
    5.8.2005 11:11 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Jak u kterého, třeba u Reiseru rozhodně ne.
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    5.8.2005 11:18 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    a u ext3 ?
    deleted
    5.8.2005 11:45 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Tam je to horší, ale záleží jaké objemy chceš zpracovávat. Pokud ti beagle přijde těžkotonážní, tak rozhoně nejsi v oblasti, kde by tě to mohlo trápit. Rozhodně to bude řádově rychlejší než grep a pokud by jsi měl problém s počtem inode, tak můžeš ten index přesunout na zvláštní svazek. Jen nesmíš do toho adresáře vlést nějakou hloupou GUI aplikací :-)
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    5.8.2005 11:55 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    bezva, dík moc za skvělé odpovědi
    deleted
    5.8.2005 11:34 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Kyž se tak koukám na ten kód, tak by to chtělo trošku vylepšit/opravit/zrychlit (krom toho, že je tam malý překlep)
    #!/bin/sh
    mkdir index
    
    for i in /usr/share/doc/xfig/html/*.html
    do
      lynx -dump $i |
      tr '[:upper:]' '[:lower:]' |
      tr -cs '[:alnum:]' '[\n*]' |
      sort | uniq -c |
      while read COUNT WORD
      do
        echo $COUNT $i >>index/$WORD
      done
    done
    a search
    #!/bin/sh
    
    WORD=$1
    
    ILIST=index/$WORD
    
    if [ ! -f $ILIST ]
    then
        echo "No match"
        exit 1
    fi
    
    sort -n -r $ILIST | sed 's/^ *\([0-9]*\)/(\1) /'
    
    aneb v jednoduchosti je krása. Ještě by neuškodilo to udělat na různé typy souborů (pomocí file, rozhodně ne podle přípony :-) ), inkrementace indexu atd.
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.