abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 14:22 | IT novinky

    V Lucemburku byly oznámeny výsledky posledního kola výzev na evropské továrny pro umělou inteligenci neboli AI Factories. Mezi úspěšné žadatele patří i Česká republika, potažmo konsorcium šesti partnerů vedené VŠB – Technickou univerzitou Ostrava. V rámci Czech AI Factory (CZAI), jak se česká AI továrna jmenuje, bude pořízen velmi výkonný superpočítač pro AI výpočty a vznikne balíček služeb poskytovaný odborníky konsorcia. Obojí bude sloužit malým a středním podnikům, průmyslu i institucím veřejného a výzkumného sektoru.

    Ladislav Hagara | Komentářů: 7
    dnes 01:22 | Nová verze

    Byla vydána (𝕏) zářijová aktualizace aneb nová verze 1.105 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.105 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    včera 15:33 | Komunita

    Ve Firefoxu bude lepší správa profilů (oddělené nastavení domovské stránky, nastavení lišt, instalace rozšíření, uložení hesla, přidání záložky atd.). Nový grafický správce profilů bude postupně zaváděn od 14.října.

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Nová verze

    Canonical vydal (email) Ubuntu 25.10 Questing Quokka. Přehled novinek v poznámkách k vydání. Jedná se o průběžné vydání s podporou 9 měsíců, tj. do července 2026.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Nová verze

    ClamAV (Wikipedie), tj. multiplatformní antivirový engine s otevřeným zdrojovým kódem pro detekci trojských koní, virů, malwaru a dalších škodlivých hrozeb, byl vydán ve verzi 1.5.0.

    Ladislav Hagara | Komentářů: 0
    včera 01:22 | Nová verze

    Byla vydána nová verze 1.12.0 dynamického programovacího jazyka Julia (Wikipedie) určeného zejména pro vědecké výpočty. Přehled novinek v příspěvku na blogu a v poznámkách k vydání. Aktualizována byla také dokumentace.

    Ladislav Hagara | Komentářů: 0
    8.10. 15:11 | Bezpečnostní upozornění

    V Redisu byla nalezena a v upstreamu již opravena kritická zranitelnost CVE-2025-49844 s CVSS 10.0 (RCE, vzdálené spouštění kódu).

    Ladislav Hagara | Komentářů: 5
    8.10. 14:00 | IT novinky

    Ministr a vicepremiér pro digitalizaci Marian Jurečka dnes oznámil, že přijme rezignaci ředitele Digitální a informační agentury Martina Mesršmída, a to k 23. říjnu 2025. Mesršmíd nabídl svou funkci během minulého víkendu, kdy se DIA potýkala s problémy eDokladů, které některým občanům znepříjemnily využití možnosti prokázat se digitální občankou u volebních komisí při volbách do Poslanecké sněmovny.

    Ladislav Hagara | Komentářů: 20
    8.10. 12:33 | Zajímavý software

    Společnost Meta představila OpenZL. Jedná se o open source framework pro kompresi dat s ohledem na jejich formát. Zdrojové kódy jsou k dispozici na GitHubu.

    Ladislav Hagara | Komentářů: 0
    8.10. 03:33 | IT novinky

    Google postupně zpřístupňuje českým uživatelům Režim AI (AI Mode), tj. nový režim vyhledávání založený na umělé inteligenci. Režim AI nabízí pokročilé uvažování, multimodalitu a možnost prozkoumat jakékoliv téma do hloubky pomocí dodatečných dotazů a užitečných odkazů na weby.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (38%)
     (46%)
     (16%)
     (18%)
     (21%)
     (16%)
     (18%)
     (16%)
     (16%)
    Celkem 205 hlasů
     Komentářů: 13, poslední 8.10. 07:41
    Rozcestník

    Žirafa - quick'n'dirty vyhledávač

    9.8.2007 08:55 | Přečteno: 1332× | Dev/Tech/Gnu | Výběrový blog

    Když jsem bydlel na koleji, napsal jsem vyhledávač, který běžel na kolejním serveru a indexoval obsah FTP serverů okolo (rozumněj, semestrálky a tak :-). Byla to Java+Tomcat+Lucene a s oblibou jsem ho používal na vyhledávání svých vlastních mptrojek.

    Už na koleji nebydlím a svou Lucernu (tak se to jmenovalo) používat nechci. Navíc mám mptrojky uložené na externím USB disku a nechci mást svého Trackera tím, že disk občas odpojím. Taky mám hrůzu z všelijakých media library přibalených k přehrávačům (oblíbený XMMS nic takového nemá, proto je taky oblíbený). Navíc chci indexovat i svou sbírku e-booků, i když jen názvy souborů. Locate se taky nehodí.

    Tak jsem si včera během tří hodin napsal v Pythonu vyhledávač Giraffe. Je to poctivý vyhledávač na bázi invertovaných seznamů, žádný humus jako grep se složitostí O(n). Mám k tomu i grafické rozhraní ala GTK. Zajímalo by mě, jak dlouho bych to psal v C++, v Pythonu to byla vážně radost.

    Funguje to tak, že se na začátku vytvoří index pro vybrané adresáře. Index se uloží a pak prohledává buď CLI utilitkou nebo grafickým klikátkem (search as you type).

    Udělal jsem k tomu i logo a stránku se screenshotem, návodem a stažením. Má to 260 řádek, licence je pochopitelně Public Domain.

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    9.8.2007 09:17 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    A proč si vlastně Pythonisté z Ruby ještě nenaportovali Ferret? V případě větších objemů dat by se asi stěží hledalo něco rychlejšího a určitě je to lepší než znovyvynalézat kolo (nebo GCJovat Lucene, brrr...).
    9.8.2007 09:37 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Lucene je super, PyLucene je fakt trochu přes ruku. O Ferret slyším poprvé, ale je to sympatické.

    Někdo by to přepsat mohl, ale já to nebudu. Jinak já jsem Pythonista z donucení, Ruby je krásnější :-). Síla obou jazyků je ale stejná. Jako Java vs C#.
    xpj avatar 9.8.2007 09:25 xpj | skóre: 22 | blog: Malé linuxové radosti... a strasti | Řevnice
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač

    žádný humus jako grep se složitostí O(n).

    To ale není zas tak hrozné, ne?

    9.8.2007 09:32 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Pro desetitisíce souborů (můj případ) nebo miliony (ty koleje) to jde. Ale když to trvá půl sekundy, tak už to na desktopové aplikaci může být nedostatek. Google pochopitelně O(n) být nemůže :-)

    Já navíc švindluju. Při startu aplikace se celý index načte do paměti, ale dotazy jsou v podstatě O(1). I když je to závislé na tom, jak je které klíčové slovo populární.
    9.8.2007 09:29 tired joe | skóre: 17 | blog: rootlet | Trenčín/Bratislava
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Páči sa mi logo/ikona.
    Človek sa riadi zdravým rozumom, až keď už nezostáva žiadne iné riešenie.
    9.8.2007 09:34 Lu-Tze | skóre: 15 | blog: Lu-Tzeho blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Ikona mate, skoro jsem se těšil, že to bude v Haskellu, jediném pořádném funkcionálním jazyce :-P
    10.8.2007 10:57 thingie
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    No taky mi to přišlo jako nějaká lambdažirafa.
    9.8.2007 09:37 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Díky, já žeru Inkscape a občas v něm něco splácám.
    brk avatar 10.8.2007 07:13 brk | skóre: 29 | blog: broukoviny
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Tak se mi líbí a obzvlášť u něčeho, co mělo vzniknout za tři hodinky. Působí to dojmem, že se tomu autor věnoval hodně dlouho, když měl čas i na takové detaily.
    USE="-qt -kde"
    10.8.2007 08:17 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    To logo jsem večer ještě předělával, původní verze jsou v tarballu. Ta první verze je trochu humpolácká.

    Když je inspirace, tak se to v Inkscape vyfikne za deset minut. Navíc je to otázka priorit - loga prostě kreslím rád.
    9.8.2007 09:32 Lu-Tze | skóre: 15 | blog: Lu-Tzeho blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Je to poctivý vyhledávač na bázi invertovaných seznamů, žádný humus jako grep se složitostí O(n).
    LOL. No ono taky ten hloupý grep může mít paměťovou složitost třeba O(1). Zatímco tvoje asociativní pole kdóvijakou. Nehledě na to, že kdyby to někdo používal tak, že by to spustil pro každé vyhledávání (a pak ukončil), tak jsme vzhledem ke způsobu uložení indexu zpátky na O(n) :-)

    Rozdíl o proti tomu zmíněnému C je v tom, ža tam bys moh implementovat aspoň paměťově úsporný prefixový strom, v pythonu by to možná věci jenom zhoršilo :-)
    9.8.2007 09:37 Kyosuke | skóre: 28 | blog: nalady_v_modre
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Hmm, a co sufixový strom, kdyby chtěl hledat opravdu pořádně? ;-)
    9.8.2007 09:44 Lu-Tze | skóre: 15 | blog: Lu-Tzeho blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač celých slov
    Znamená to, že třeba google nehledá opravdu pořádně?
    9.8.2007 12:52 Lu-Tze | skóre: 15 | blog: Lu-Tzeho blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač celých slov
    Nevíte někdo, co jsem tím chtěl říct?
    9.8.2007 13:03 thingie
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač celých slov
    Víme. Chceš číslo účtu?
    9.8.2007 16:14 Lu-Tze | skóre: 15 | blog: Lu-Tzeho blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač celých slov
    Ani ne. Informace o tom, že to víš ty, mi stačí k tomu, abych to věděl i já.
    9.8.2007 09:44 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Ale no tak, neber mě za slovo, s O-notací se dá čarovat všelijak. A že asociativní pole může mít k O(1) pěkně daleko? Who cares? Kdybych to implementoval hrubou silou, třeba by to bylo stejně rychlé, ale já tam mám invertovaný seznam pro radost :-)
    9.8.2007 09:57 fakenickname | skóre: 42 | blog: fakeblog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    pekny.. dobry projekt, libi se mi. pro me sice nic moc pouzitelny (davam prednost find), ale vazne pekne..
    9.8.2007 10:01 thingie
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Proč musí být každý kousek kódu hned *projekt*?
    9.8.2007 10:15 fakenickname | skóre: 42 | blog: fakeblog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    proc musi byt na abicku tolik zbytecnych komentaru?
    9.8.2007 10:16 Lu-Tze | skóre: 15 | blog: Lu-Tzeho blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Protože je píšeš.
    9.8.2007 10:18 tired joe | skóre: 17 | blog: rootlet | Trenčín/Bratislava
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Ignor, Ignor, toto bolo úplne zbytočné :D
    Človek sa riadi zdravým rozumom, až keď už nezostáva žiadne iné riešenie.
    9.8.2007 12:02 thingie
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Ale pravdivé.
    9.8.2007 10:06 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Find nesnáším. Nesnáším totiž zbytečně zaplácnutou cache :-)
    9.8.2007 11:16 Miloslav Ponkrác | blog: miloslavponkrac
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Jen bych zareagoval, pokud bys v C++ opravdu uměl, tak bys to nepsal o moc déle, než v Pythonu.
    9.8.2007 11:46 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    No, člověk, co v C++ opravdu pravidelně dělá by takovouhle tic-tac-tou blbost jistě napsal taky rychle. Nicméně na takovéhle prototypování jsou skriptovací jazyky určitě lepší. Nulový čas obrátky se prostě hodí, nepřemýšlet tolik nad typama se taky hodí, neřešit hlavičkové soubory se taky hodí. Takový slovník z Pythonu je něco dočista jiného než obdoba v STL.
    9.8.2007 20:09 Jan Kundrát (jkt) | skóre: 27 | blog: jkt | Praha - Bohnice
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    kdyz uz to pises v pythonu, proc znova reimplementujes os.path.walk()?
    9.8.2007 20:58 paskma | skóre: 13 | blog: Paskmův blog
    Rozbalit Rozbalit vše Re: Žirafa - quick'n'dirty vyhledávač
    Bateries included :-). Nevěděl jsem o tom a navíc jsem si to poprvé v životě rád napsal jako generátor.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.