abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:33 | Zajímavý projekt

    Kevin Lin zkouší využívat chytré brýle Mentra při hraní na piano. Vytváří aplikaci AugmentedChords, pomocí které si do brýlí posílá notový zápis (YouTube). Uvnitř brýlí běží AugmentOS (GitHub), tj. open source operační systém pro chytré brýle.

    Ladislav Hagara | Komentářů: 1
    dnes 12:11 | Pozvánky

    Jarní konference EurOpen.cz 2025 proběhne 26. až 28. května v Brandýse nad Labem. Věnována je programovacím jazykům, vývoji softwaru a programovacím technikám.

    Ladislav Hagara | Komentářů: 0
    včera 21:44 | Komunita

    Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.

    Ladislav Hagara | Komentářů: 0
    včera 14:22 | IT novinky

    Před 25 lety zaplavil celý svět virus ILOVEYOU. Virus se šířil e-mailem, jenž nesl přílohu s názvem I Love You. Příjemci, zvědavému, kdo se do něj zamiloval, pak program spuštěný otevřením přílohy načetl z adresáře e-mailové adresy a na ně pak „milostný vzkaz“ poslal dál. Škody vznikaly jak zahlcením e-mailových serverů, tak i druhou činností viru, kterou bylo přemazání souborů uložených v napadeném počítači.

    Ladislav Hagara | Komentářů: 28
    3.5. 22:33 | Nová verze

    Byla vydána nová major verze 5.0.0 svobodného multiplatformního nástroje BleachBit (GitHub, Wikipedie) určeného především k efektivnímu čištění disku od nepotřebných souborů.

    Ladislav Hagara | Komentářů: 2
    2.5. 22:22 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za duben (YouTube).

    Ladislav Hagara | Komentářů: 0
    2.5. 19:11 | IT novinky

    Provozovatel čínské sociální sítě TikTok dostal v Evropské unii pokutu 530 milionů eur (13,2 miliardy Kč) za nedostatky při ochraně osobních údajů. Ve svém oznámení to dnes uvedla irská Komise pro ochranu údajů (DPC), která jedná jménem EU. Zároveň TikToku nařídila, že pokud správu dat neuvede do šesti měsíců do souladu s požadavky, musí přestat posílat data o unijních uživatelích do Číny. TikTok uvedl, že se proti rozhodnutí odvolá.

    Ladislav Hagara | Komentářů: 5
    2.5. 11:22 | Zajímavý projekt

    Společnost JetBrains uvolnila Mellum, tj. svůj velký jazykový model (LLM) pro vývojáře, jako open source. Mellum podporuje programovací jazyky Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust a Ruby.

    Ladislav Hagara | Komentářů: 2
    2.5. 09:11 | Bezpečnostní upozornění

    Vývojáři Kali Linuxu upozorňují na nový klíč pro podepisování balíčků. K původnímu klíči ztratili přístup.

    Ladislav Hagara | Komentářů: 2
    1.5. 20:00 | Komunita

    V březnu loňského roku přestal být Redis svobodný. Společnost Redis Labs jej přelicencovala z licence BSD na nesvobodné licence Redis Source Available License (RSALv2) a Server Side Public License (SSPLv1). Hned o pár dní později vznikly svobodné forky Redisu s názvy Valkey a Redict. Dnes bylo oznámeno, že Redis je opět svobodný. S nejnovější verzí 8 je k dispozici také pod licencí AGPLv3.

    Ladislav Hagara | Komentářů: 3
    Jaký filesystém primárně používáte?
     (58%)
     (1%)
     (8%)
     (21%)
     (4%)
     (2%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 525 hlasů
     Komentářů: 22, poslední dnes 10:06
    Rozcestník

    Hledač v souborech

    11.3.2011 00:00 | Přečteno: 1335× | Jiné | poslední úprava: 11.3.2011 00:34

    Protože můj skriptík v bashi na hledání v obsahu souborů byl nechutně pomalý a už mě to štvalo, tak jsem upatlal narychlo jednu utilitku v C++. Je to trošku prasácky, ale pro mé účely to stačí. Ke stažení v příloze prvního komentáře, jak skriptík, tak program.

    Pokud vynalézám kolo, tak sry, já na to žádnou utilitku ve svém systému neznám.

    Rychlost hledání je na mém systému 0.6s vs. 13s v celém stromu téhle věci.

    Ještě jedna věc, kompilujte buď s parametrem -std=c++0x, nebo vyhoďte ten static_assert (ale ujistěte se, že je podmínka splněna, jinak to bude chybovat u velkých souborů, např, na x86-32 při definování _FILE_OFFSET_BITS=64)

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Jardík avatar 11.3.2011 00:00 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Přílohy:
    Tady
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 00:05 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    BTW pod licencí Do What The Fuck You Want To Public License, version 2
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 00:14 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Koukám, že jsem v tom C++ souboru zapomněl pár include souborů, co byly z pokusů (nejdříve tam byl read() ale protože to bylo moc na logiku, tam jsem tam prsknul nakonec mmap()).
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:47 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Příloha:
    Aktualizovaný zdroják, několikanásobné zrychlení.
    Věřím v jednoho Boha.
    11.3.2011 00:10 Ladicek | skóre: 28 | blog: variace | Havlíčkův brod
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Hledá to v Jiných Objektech?
    Ještě na tom nejsem tak špatně, abych četl Viewegha.
    Jardík avatar 11.3.2011 00:11 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Co? Hledá to jen v souborech (i binárních) text, co mu předáš jako argument.
    Věřím v jednoho Boha.
    11.3.2011 22:25 moira | skóre: 30 | blog: nesmysly
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Tohle souvisí s těmi Objekty. Aspoň doufám. Člověk si nemůže být jist, až po důkladném zkoumaní, které nechci absolvovat.
    Překladač ti nikdy neřekne: "budeme kamarádi"
    11.3.2011 08:59 Pindal
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Hehe. To mi připomíná, že mistr Hejl asi pořád hledá programátora a Jardík je bez práce, ne? Z jejich spolupráce by jistě vzešlo veledílo. Sice nedodělané, ale nejmíň 64-bitové! ;-)
    11.3.2011 12:29 manasekp | skóre: 29 | blog: manasekp | Brno
    Rozbalit Rozbalit vše Re: Hledač v souborech
    hejlovi se nahodou celkem dari, posledne sem se dival na jeho web a uz mel hotove logo Novy Hledac vytvorene ve wordu :-D
    BIOKOMP | Cas od casu se pokousim nekoho srazit k zemi abych se tam nevalel sam.
    11.3.2011 00:48 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    grep -r, alebo find a grep by postacil. alebo som to vobec nepochopil.
    David Watzke avatar 11.3.2011 01:30 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Měl by postačit grep s přepínači -r a -l.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
    David Watzke avatar 11.3.2011 01:32 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: Hledač v souborech
    A ještě asi -a pro hledání v binárních souborech.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
    11.3.2011 08:23 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Pochopil jsi to zrejme naprosto spravne, jenom proste Jardik nezna linuxove utility, takze se snazil to v shellu napsat tak, jak by to napsal v C. No a to je samozrejme pomaly, protoze shell je interpretovany, takze kazdy prikaz se znovu a znovu interpretuje.

    Samozrejme by ten shell skript mel byt pouze jeden grep prikaz grep -raliF 'hledany-text' directory, pripadne pokud Jardik zvlada regularni vyrazy, tak grep -raliE 'extended-regexp' directory.

    Docela by me zajimal rozdil oproti tomu tvymu CPP. Udelej benchmark. Zkus to s tim -raliF to hleda plain-text, zadny regexp (regexp bude zrejme o trosku pomalejsi).
    Jardík avatar 11.3.2011 11:56 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    time grep -raliF Sys_FullPath .
    ./branches/next_ghost/unix/system.cpp
    ./branches/next_ghost/unix/.svn/text-base/init.cpp.svn-base
    ./branches/next_ghost/unix/.svn/text-base/system.cpp.svn-base
    ./branches/next_ghost/unix/init.cpp
    ./branches/next_ghost/libs/system.h
    ./branches/next_ghost/libs/memman.cpp
    ./branches/next_ghost/libs/.svn/text-base/memman.cpp.svn-base
    ./branches/next_ghost/libs/.svn/text-base/system.h.svn-base
    ./branches/next_ghost/game/realgame.cpp
    ./branches/next_ghost/game/music.cpp
    ./branches/next_ghost/game/globmap.cpp
    ./branches/next_ghost/game/macros.cpp
    ./branches/next_ghost/game/gamesave.cpp
    ./branches/next_ghost/game/.svn/text-base/gamesave.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/skeldal.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/globmap.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/inv.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/dialogs.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/music.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/realgame.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/menu.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/book.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/macros.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/interfac.cpp.svn-base
    ./branches/next_ghost/game/interfac.cpp
    ./branches/next_ghost/game/dialogs.cpp
    ./branches/next_ghost/game/menu.cpp
    ./branches/next_ghost/game/inv.cpp
    ./branches/next_ghost/game/book.cpp
    ./branches/next_ghost/game/skeldal.cpp
    
    real    0m4.747s
    user    0m4.616s
    sys     0m0.127s
    [jardik@Jardik-ArchPC skeldal]$ time /home/jardik/Projects/FindInFiles/findinfiles Sys_FullPath
    ./branches/next_ghost/unix/system.cpp
    ./branches/next_ghost/unix/.svn/text-base/init.cpp.svn-base
    ./branches/next_ghost/unix/.svn/text-base/system.cpp.svn-base
    ./branches/next_ghost/unix/init.cpp
    ./branches/next_ghost/libs/system.h
    ./branches/next_ghost/libs/memman.cpp
    ./branches/next_ghost/libs/.svn/text-base/memman.cpp.svn-base
    ./branches/next_ghost/libs/.svn/text-base/system.h.svn-base
    ./branches/next_ghost/game/realgame.cpp
    ./branches/next_ghost/game/music.cpp
    ./branches/next_ghost/game/globmap.cpp
    ./branches/next_ghost/game/macros.cpp
    ./branches/next_ghost/game/gamesave.cpp
    ./branches/next_ghost/game/.svn/text-base/gamesave.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/skeldal.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/globmap.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/inv.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/dialogs.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/music.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/realgame.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/menu.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/book.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/macros.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/interfac.cpp.svn-base
    ./branches/next_ghost/game/interfac.cpp
    ./branches/next_ghost/game/dialogs.cpp
    ./branches/next_ghost/game/menu.cpp
    ./branches/next_ghost/game/inv.cpp
    ./branches/next_ghost/game/book.cpp
    ./branches/next_ghost/game/skeldal.cpp
    
    real    0m0.625s
    user    0m0.560s
    sys     0m0.063s
    [jardik@Jardik-ArchPC skeldal]$
    
    Můj se zdá být cca 7x rychlejší.
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:27 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Tak díky tomuto je mé řešení 55x rychlejší a to za to stojí :-)
    Věřím v jednoho Boha.
    11.3.2011 12:32 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    nepocitas do toho cas pisania programu
    11.3.2011 12:29 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    skus grep -m1 --mmap -ralF Sys_FullPath .

    dalsi rozdiel je, ze preskakujes symlinky, preto som navrhoval find
    11.3.2011 12:31 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    (nie, ze by spustanie procesov cez find bolo rychlejsie)
    11.3.2011 13:31 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Samozrejme, clovek nesmi napsat neco jako find . -type f -exec grep ....., ale spis find -type f -print0 | xargs -0r grep .... - to se pak spusti jeden grep s vice souborama najednou, kdyz tam neni extremne moc souboru (nenarazi se na limit delky parametru prikazu), tak se to spusti opravdu pouze jednou.
    Jardík avatar 11.3.2011 12:39 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Oni v tom adresáři stejně symlinky nejsou (teda alespoň myslím).
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:44 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Aha, to "i" pro grep (jak psal člověk výše) když vynechám, tak mám 0m0.132s, ignore case jsem nechtěl. Tak to se omlouvám za nařčení grepu z pomalosti, je jen o kousíček pomalejší. Ten --mmap pro grep nemá žádný přínost, je to furt stejný.
    Věřím v jednoho Boha.
    11.3.2011 13:29 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Tak samozrejme, zkus si jezte zmenit "F" na "E" a s tim "i" teprve uvidis pomalost:-) Samozrejme, hledani regexpu bude pomalejsi nez porovnavani znak po znaku, a ignore-case to taky zpomaluje.

    Na druhou stranu, grep ma mnoho dalsich funkci: puvodne grep vypisuje cely radek, kde se hledany vyraz vyskytuje, ale to jsem zablokoval pomoci "-l"; dale grep umoznuje vypsat radky, kde se hledany vyraz NEVYSKYTUJE "-v"; muzes si nechat zobrazit pouze pocet nalezenych radku; dale je mozne zobrazit X radku pred nalezenym a za nalezenym radkem "-B" a "-A" nebo "-C"; pak taky muzes zadat soubor, ktery obsahuje hledane texty "-F"; muzes si nechat vypsat cisla radek nebo byte offset radku s hledanym textem; muzes urcite, jestli se binarni soubory maji prohledavat nebo se maji brat jako ze text tam nelezen nebyl "-a" a "-I" resp. "--binary-files". Vetsina tehle prepinacu se musi behem behu nejakym zpusobem testovat, takze tam bude spousta dalsich "if" navic, nez ma tvuj programek, takze je samozrejme, ze tvuj program bude rychlejsi. Je to asi neco podobneho, jako kdybys zkousel srovna rychlost tveho programu, ktery spocita "1+1" a zobrazi vysledek a nejakeho jineho programu, ktery umi zpracovat a vypocitat jakykoliv zadany matematicky vyraz.

    Takze rychlostne sice grep nepredci, ale kdyz budes chtit pokazde hledat trosku jinym zpusobem (rozumej implementovat nejakou grep funkcionalitu), tak na tom stravic o hodne vic casu a navic skoncis mozna na stejne rychlosti jako grep, nebo mozna jeste hur.

    Lepsi nez neco zacnes bastlit, tak si projdi linuxove utilitky (tady tusim vychazel/vychazi nejakej serial o linuxovych utilitkach) a zkus najit nejakou, ktera umi to, co ty chces (v manu pak hledej detaily). Obcas musis svuj pozadavek rozlozit na mensi casti a pak to prohnat pres rouru nekolika utilitkama.
    11.3.2011 13:35 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    A jeste jedna vec. Asi by bylo lepsi opravdu pouzit find, protoze hledat neco v .svn je docela zbytecny. Takze final bych osobne udelal find KDE_HLEDAT -type f -not -path '*/.svn/*' -print0 | xargs -0r grep -lFI HLEDANY bez "-i" a s "-I" (binarni soubory ignorovat).
    11.3.2011 06:42 Radek Miček | skóre: 23 | blog: radekm_blog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Pro normální texty a delší vzorky by šel čas zlepšit použitím algoritmu Boyer–Moore–Horspool.
    Jardík avatar 11.3.2011 12:25 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Super, dík:
    real    0m0.141s
    
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:38 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    A to jsem nezapnul optimalizace, s -O2 tam je skoro přesně 0.100s.
    Věřím v jednoho Boha.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.