abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 18:55 | Nová verze

    Bylo vydáno Eclipse IDE 2025-12 aneb Eclipse 4.38. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.

    Ladislav Hagara | Komentářů: 0
    dnes 17:44 | Nová verze

    U příležitosti oslav osmi let prací na debianím balíčku vyšlo GPXSee 15.6. Nová verze přináší především podporu pro geotagované MP4 soubory, včetně GoPro videí. Kdo nechce čekat, až nová verze dorazí do jeho distribuce, nalezne zdrojové kódy na GitHubu.

    Martin Tůma | Komentářů: 0
    dnes 09:22 | Nová verze

    Monado, tj. multiplatformní open source implementace standardu OpenXR specifikujícího přístup k platformám a zařízením pro XR, tj. platformám a zařízením pro virtuální realitu (VR) a rozšířenou realitu (AR), bylo vydáno ve verzi 25.1.0. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    dnes 02:44 | Nová verze

    Byla vydána listopadová aktualizace aneb nová verze 1.107 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.107 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    včera 19:22 | Zajímavý článek

    Pornhub zveřejnil podrobné statistiky za rok 2025. V části věnované zařízením a technologiím se lze dočíst, že 87 % přenášených dat směrovalo na telefony, 2 % na tablety a 11 % na desktopy. Operační systém Linux běžel na 6,3 % desktopů. O 22,4 % více než před rokem. Firefox má na desktopu 8,4 % podíl.

    Ladislav Hagara | Komentářů: 7
    včera 13:11 | Pozvánky

    Chcete vědět, co se odehrálo ve světě techniky za poslední měsíc? Nebo si popovídat o tom, co zrovna bastlíte? Pak dorazte na prosincovou Virtuální Bastlírnu s mikrofonem a kamerou, nalijte si něco k pití a ponořte se s strahovskými bastlíři do diskuze u virtuálního piva o technice i všem možném okolo. O čem budou tentokrát strahováci referovat? Téměř každý už si všiml významného zdražení RAM a SSD, jsou zde ale i příjemnější zprávy. Průša uvádí

    … více »
    bkralik | Komentářů: 0
    včera 12:55 | Bezpečnostní upozornění

    Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) podporuje vyjádření partnerů ze Spojeného království, kteří upozorňují na škodlivé aktivity společností Anxun Information Technology (též „I-S00N“) (pdf) a Beijing Integrity Technology (též „Integrity Tech“) působících v kyberprostoru a sídlících v Čínské lidové republice (ČLR). Tyto společnosti jsou součástí komplexního ekosystému soukromých subjektů v ČLR,

    … více »
    Ladislav Hagara | Komentářů: 12
    včera 04:55 | IT novinky

    Společnost Pebble představila (YouTube) prsten s tlačítkem a mikrofonem Pebble Index 01 pro rychlé nahrávání hlasových poznámek. Prsten lze předobjednat za 75 dolarů.

    Ladislav Hagara | Komentářů: 7
    včera 04:22 | IT novinky

    Společnost JetBrains v listopadu 2021 představila nové IDE s názvem Fleet. Tento týden oznámila jeho konec. Od 22. prosince 2025 již nebude možné Fleet stáhnout.

    Ladislav Hagara | Komentářů: 3
    9.12. 21:22 | Nová verze

    Byl vydán Mozilla Firefox 146.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 146 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (48%)
     (19%)
     (17%)
     (22%)
     (15%)
     (24%)
     (15%)
     (17%)
    Celkem 454 hlasů
     Komentářů: 18, poslední 2.12. 18:34
    Rozcestník

    Dotaz: nástroj pro vyhledávání ("lokální google")

    5.8.2005 09:46 deleted | skóre: 3 | blog: pnojmatika
    nástroj pro vyhledávání ("lokální google")
    Přečteno: 141×
    Mám na disku spoustu e-knih, manuálů a jiných textů (převážně v pdf a html). Potřeboval bych v nich nějak rozumně vyhledávat (např. zda obsahují slovo1 a zároveň slovo2). Je mi jasné, že to lze zařídit standardními prostředky. Např. AND realizuji takto (pdf mám převedené pomocí pdftotext):
    soubory=`grep -r -F -l -i -e $slovo1 ./`
    grep -F -l -i -e $slovo2 $soubory
    
    Jediná nevýhoda je, že je to pomalé. Takže potřebuji nějaký nástroj, který by uměl obsah indexovat a pak v něm vyhledávat tak jako google (tedy nepotřebuji regulární výrazy). Existuje něco?
    deleted

    Odpovědi

    5.8.2005 09:59 miso
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Potrebujes psa aby to vycuchal? ;-)
    beagle si prehladavane veci uchovava v sqlite3 subore, takze mozes pouzit aj sql
    http://beaglewiki.org/Main_Page
    5.8.2005 10:19 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    díky, něco míň "těžkotonážního" by nebylo?
    deleted
    5.8.2005 10:23 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Na Lupe vyšel v rámci jednoho seriálu zajímavý čánek.
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    5.8.2005 11:04 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Jestli to dobře chápu, tak pro každé slovo se vytvoří soubor na disku. Neovlivní velké množství malých souborů práci souborového systému?
    deleted
    5.8.2005 11:11 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Jak u kterého, třeba u Reiseru rozhodně ne.
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    5.8.2005 11:18 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    a u ext3 ?
    deleted
    5.8.2005 11:45 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Tam je to horší, ale záleží jaké objemy chceš zpracovávat. Pokud ti beagle přijde těžkotonážní, tak rozhoně nejsi v oblasti, kde by tě to mohlo trápit. Rozhodně to bude řádově rychlejší než grep a pokud by jsi měl problém s počtem inode, tak můžeš ten index přesunout na zvláštní svazek. Jen nesmíš do toho adresáře vlést nějakou hloupou GUI aplikací :-)
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
    5.8.2005 11:55 deleted | skóre: 3 | blog: pnojmatika
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    bezva, dík moc za skvělé odpovědi
    deleted
    5.8.2005 11:34 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
    Rozbalit Rozbalit vše Re: nástroj pro vyhledávání ("lokální google")
    Kyž se tak koukám na ten kód, tak by to chtělo trošku vylepšit/opravit/zrychlit (krom toho, že je tam malý překlep)
    #!/bin/sh
    mkdir index
    
    for i in /usr/share/doc/xfig/html/*.html
    do
      lynx -dump $i |
      tr '[:upper:]' '[:lower:]' |
      tr -cs '[:alnum:]' '[\n*]' |
      sort | uniq -c |
      while read COUNT WORD
      do
        echo $COUNT $i >>index/$WORD
      done
    done
    a search
    #!/bin/sh
    
    WORD=$1
    
    ILIST=index/$WORD
    
    if [ ! -f $ILIST ]
    then
        echo "No match"
        exit 1
    fi
    
    sort -n -r $ILIST | sed 's/^ *\([0-9]*\)/(\1) /'
    
    aneb v jednoduchosti je krása. Ještě by neuškodilo to udělat na různé typy souborů (pomocí file, rozhodně ne podle přípony :-) ), inkrementace indexu atd.
    XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.