Portál AbcLinuxu, 12. května 2025 01:16
Neni. Pořádek se musí udržovat. Index slov udržuje Beagle sám.
Pokud není denní uklízení vaše hobby a máte vetší než malé množství dokumentů (ne vaší vinou) v různých formátech na disku pak je desktop serch jasná volba.
~/dokumenty/domaci-finance/uctenka-komoda-loznice.png
BTW by mne fakt děsně zajímalo, jak mi pomůže třeba Google Desktop při hledání oskenované účtenky, kterou jsem si blbě pojmenoval a uložil. A také nevím, proč bych měl ukládat oskenované věci do samostatného adresáře a komplikovat si tím život. To bych si mohl dělat samostatné adresáře pro odt, ods, doc, xls, pdf, jpg, png, tiff… až bych z toho úplně zmagořil.
Ani náhodou, k čemu by mi to bylo? Nejsem žádná databáze nebo co.
A jinak v anketě podle mě chybí Tracker.
Používal jsem Beagle, ale věčně byl zaseklý a žral spoustu výkonu, takže šel pryč.
Ke štěstí mi úplně stačí locate
slocate
+1
Presne tak, me taky
Jestli vám locate tak jste opravdu šťastlivec. Buď si poznámky si píšete na papír a vyhoje vám to, nemusíte denně zápasit s haldou dokumentů, nebo máte geniální systém třídění dokumentů na disku. Pak nebuďte soukromník a podělte se o zkušenosti.
Pokud vám stačí locate, pak vám stačí vyhledávat podle názvu souboru, tak to vám gratuluju. Pokud se nemýlím locate je jen kešovanou verzí findu a obsah souboru nedokáže naindexovat. Takže potřebujete mít všechna relevatní klíčová slova přímo v názvu souboru, geniální pamět, geniální systém třídění dokumentů nebo (nejlépe) nemít moc dokumentů.
Myslíte Strigi Lucene (originálné Strigi) nebo Strigi Nepomuk (ta ořezanina distribuovaná s KDE4)? První funguje ale chybí mu použitelné GUI, druhý GUI má, ale výsledky jsou bídné v porovnání s Beagle.
updatedb spada do kategorie "jinak" ?
NE , proč .. a indexování - opičení po slavném Indexing Service ve VISTA apod. ( i na Vista Business v práci to mám OFF )
No myslim, ze je to skor napodobnovanie Applieho spotlight (aspon teda myslim, ze to bol taky prvy bezne nasadeny tool na desktopoch) Kazdopadne Vista bola az omnoho omnoho neskor.
To je mozne, kazdopadne mi slo o to, ze sa urcite nikto neopicil po vyhladavani vo Viste, kedze MS toto okopiroval ako posledny.
Zkousel jsem tracker a beagle, ale ani jeden nefungoval tak jak by mel (nebo jak bych si pral?) - na spolehlivou indexaci obsahu souborů (k cemu je mi indexovac, kdyz nenajde pulku fajlu co najit ma).
Tak jsem to vsechno povyhazel pryc.
find
, příp. locate
a nic jiného ani nehledám.
První věc, co na novém linuxovém desktopu vypínám je všemožné indexování. - Zatím mi stačí ... locate
ehm ...
Hmm tak to mi potom musis poradit.... Presne rovnake dovody pre indexovanie som mal aj ja - na firemnom notase pod widlami som pouzival Google Desktop - nakoniec som ale prisiel nato, ze okrem toho ze mi zozral 2GB na Ccku mi nijak nevie pomoct - neovlada regexy - neovlada ani len obycajne stringy so specialnymi znakmi "&", "|", "~", atd... najcastejsie som totiz potreboval dohladat casti kodu (ked som zabudol kde som ho napisal...). No aj tak mi nikdy nic poriadne nevedel dohladat. Tak naco mi to je ?
Mozno som len zvolil nespravnu aplikaciu...
To bude nejspis tim, ze jsi se nesetkal s nejakym poradnym a funkcnim indexovanim. Mimochodem, jak pomoci find nebo locate najdes ebook, napriklad o Jave, v kterem se nejvic pise treba o junit testech? hm?
Tak to se omlouvam, netusil sem ze je mezi nama Buh co si pamatuje kompletni obsah treba 50 ebooku tykajicich se stejne oblasti. Ted me prosim omluvte, jdu na dvorek postavit oltar...
Jasne, ne kazdy to tak dela, ale ja si zkratka amoralne stahnu ebooky, a pak pres spotlight hledam slova. Mluvit o tom jako o nesmyslu je ale velmi prehnane.
Nemluve o tom, ze zmacknout klavesovou zkratku, napsat "karel n", "zivotopis" ci"1+1" a odbouchnout enterem, je rychlejsi nez poustet prislusnou aplikaci a resit to v ni. Chapu ale ze ne kazdymu to sedi, nekdo rad holky a jinej zas vdolky
/usr/bin/updatedb
a to dělám jen velmi málo často, nemám potřebu něco hledat na celém disku jelikož mám ve většině svého bordelu pořádek Záleží, co má člověk za data, když to jsou fotky, mp3, filmy a pár dalších souborů, tak je indexování zbytečné. Když si ale někdo dělá „výstřížky“ z webu (ukládá si zajímavé stránky) nebo zápisky ze školy nebo materiály z různých konferencí, tak se indexování hodí… Ale dneska už neindexuji ani to – buď je těch dat tolik, že indexace i hledání jsou zdlouhavé nebo je jich celkem málo a pak se v tom zvládnu vyznat sám.
Třeba na ty zápisky ze školy jsem si udělal složku „předměty“ a do ní si dal symbolické odkazy na předměty ze všech semestrů (samostatné adresáře). No a teď když něco hledám, tak mi stačí konqueror a Ctrl+I a zadat pár písmenek z názku předmětu → vyfiltrují se a stačí kliknout.
Webové stránky si už moc neukládám, buď si jen uložím odkaz nebo si ty hodně zajímavé věci přepíšu do blogu nebo do textového souboru s návody.
Možná zase nějakou indexaci vyzkouším, ale aby mi tu pořád drnčel disk, na to moc zvědavý nejsem
Jak se tam ten vir dostal a rozjel netusim...Beagle mi nesmí přes práh. Také jsem s ním kdysi bojoval, vždycky jsem ho vymlátil a za nějakou dobu tam byl zpět. Teď už mám naštěstí delší dobu pokoj.
Gnome-do a v něm jako plugin locate. Funguje to:)
updatedb
a locate
, to znam a pouzivam, ale ostatni mi nic nerika a nevim, k cemu bych to mel potrebovat.
Dal jsem NE, protože používám pouze locate, ale pro indexování by mi nejvíc vyhovovalo něco jako OpenBFS ;-)
tezko muzu indexovat neco, co neni namountovane...
Šanony?
Derne stitky?
Nevie niekto, ako by sa to vytazovanie dalo znizit?Nastavit I/O prioritu na třídu idle. Například takhle:
ionice -c3 -p89To "89" se samozřejmě nahradí skutečným PID (např. z PID souboru - nevím, jestli si GDS nějaký vytváří). Pokud běží více procesů nebo vláken, je potřeba to už se změněnou prioritou už spouštět (aby se to nemuselo upravovat všechno).
Na WinXP v práci mám Google Desktop Search, opravdu se vyplatí, mám zaindexováno několik stovek, možná tisíc PDF souborů (za těch let asi tisíce). Dělám v reklamce a potřebuju podle klíčových slov z obsahu souboru dohledat grafiky atd...k nezaplacení, 2-3 klíčová slova a požadovaný grafika nalezena za 2s :) Doma používám Tracker, ale abych pravdu řek, nepoužívám ho. Mám všechno srovnané..... (vlastně používám, ale jen proto že to jde, ne že to chci :D )
Pouzivam locate, ale v posledni dobe uvazuji nad fultextovym indexovanim mych ebooku
Rád bych se zeptal na trochu jinou věc, přesto související. Nevíte někdo náhodou o nějakém databázovém (tagovém) souborovém systému. To by bylo na klíčová slova nejlepší... žádné vyhledávání .
Podívej se o čem Zeitgeist je.No, nejdřív tam nějaký pán mluvil o bohu a o ďáblu, pak tam ukazovali nějaká letadla, která narazila do dvou věží, pak se třetí budova kus od těch věží sesula a pak tam bylo něco o takových malých zelených papírcích...
výše zmíněný BFS nevyhovuje?Rád bych se zeptal na trochu jinou věc, přesto související. Nevíte někdo náhodou o nějakém databázovém (tagovém) souborovém systému. To by bylo na klíčová slova nejlepší... žádné vyhledávání
.
Jenže takový systém musíte aktivně udržovat = moc práce. Index klíčových slov se udržuje sám. Mě statčí, že musím indexovat forky. Kdyby tak existoval indexer obsahu fotek a já jen mohl zadat "najdi já pohled zepředu" to by bylo super!
No jestli Beagle necháváte prohledávat /dev/random tak to je možné že ještě neskončil :) Jinak si vaše závěry ohledně Beagle nedovedu vysvětlit.
Ja dost pochybuji že Beagle (a podobné) vůbec regex podporují. Nepleťte si prosím grep a desktop search (beagle). Dost pochybuji, že MS Indexing Service regex podporuje. V desktop search nemá RE smyls. Řada příkazů RE nemá v inverzním indexu smysl, například konec a začátek řádky, u dokumentu to samé, v dokumentech ODF, PDF, HTML, .. je řádek dynamická věc, záleží na roztažení okna nebo nastavení tiskárny. Speciální znaky (&,_,*) nadbytečné mezery, white space, se z indexu vyhazují, jde o surový text, o pojmy ne o stringy!
U desktop search programu jsou důležité jiné věci:
automatický stemming - to je o gramamtice, Beagle má EN gramatiku, u češtiny vůbec pochybuji že něco takového lze udělat ("dance" will also match documents containing the words "dances", "dancing", and "dancer")
pravostranné a levostranné rozšíření - "black*" o find words like "black", "blackbird", and "blacksmith"
NEAR operátor - slova od sebe nesmí být dále než zadaný počet slov, luxusní výbava, velmi užitečné v dlouhých dokumentech, mám podezření, že Beagle nezvládá i když Lucene pro to podporu má, škoda.
exclude, NOR, OR, grupování - no to je jasné, to umí snad všechni
váhy - slovo v nadpisu má větší váhu než slovo v normálním textu, zvyšuje relevanci dokumentu. Také asi Beagle neumí. Vyžaduje pokročilé analyzéry textu binárních dokumentů.
atd. atd. snažil jsem se alespoň naznačit, o co v desktop search jde a že tam RE nemají moc užitek.
u češtiny vůbec pochybuji že něco takového lze udělatStemming se velmi často dělá pouhým odtrháváním koncovek, což pro češtinu lze samozřejmě triviálně udělat taky. No a i česká morfologická analýza je v podstatě vyřešený problém.
Máte nějaké bližší informace, odkazy, jak daleko je implementace, ideálně open source, českého stemmingu? Zase tak moc oblast nesleduji. Jednak některá slova mění i kořen, těch tolik nění, horší to je s množstvím koncovek a přiřazení správných k esprávnému slovu, pán, k páNOVI, žena, k žeNĚ a tak dále. žeNOVI je nesmyslný tvar a nemělo by to podle něj hledat. Volá to po masivní tabulce pro všechna slova. Nějak to spojit s spellcheckerem, hunspell, nebo tak, jestli to jde.
inuri:file:///franta/moje_projekty/tajné ext:cpp
Beagle toho umí opravdu hodně. Mrkněte na http://beagle-project.org/Searching_Data
S vyhledáváním specifických C/C++/Java konstruktů to bych ani od vyhledávače dokumentů nečekal, od toho jsou IDE :) Pro Windows jich také pár povedených je. Za sebe vám mohu doporučit Eclipse CDT, to vám spolehlivě a integrovaně struct __attribute__((packed)) najde. Pohání ho stejná technologie jako Beagle - Lucene engine. Samozřejmě optimalizované pro daný počítačový jazyk.
KIO Beagle (virtuální adresář s výsledky, záložky, historie ..):
http://www.kde-apps.org/content/show.php?content=28437 ..screenshoty napoví.Většině lidí ale asi bude bohatě stačit ten defaultní klient.
Ale copak, alergie na kávu? To vás lituju.
Pokud jste se už vrátil ze záchoda (spláchnuto? ruce umyty?) tak jen dodávám, že KIO (Konqueror) funguje jak pod Gnome tak FluxBoxu o stále nejlepší KDE3 ani nemluvě.
Ten klient, Kerry, základní věci umí, včetně zobrazní částí textu okolo hledaných výrazů, alá google, a základní souborové operace také. To je běžné používání víc než dost.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.