abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 14:11 | IT novinky

    Eric Migicovsky, zakladatel společnosti Pebble, v lednu oznámil, že má v plánu spustit výrobu nových hodinek Pebble s již open source PebbleOS. V březnu spustil předprodej hodinek Pebble Time 2 (tenkrát ještě pod názvem Core Time 2) za 225 dolarů s dodáním v prosinci. Včera představil jejich konečný vzhled (YouTube).

    Ladislav Hagara | Komentářů: 0
    dnes 12:44 | Zajímavý software

    Byla oznámena nativní podpora protokolu ACME (Automated Certificate Management Environment) ve webovém serveru a reverzní proxy NGINX. Modul nginx-acme je zatím v preview verzi.

    Ladislav Hagara | Komentářů: 0
    dnes 12:22 | Nová verze

    Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.08. Přehled novinek i s náhledy a videi v oficiálním oznámení.

    Ladislav Hagara | Komentářů: 0
    včera 11:55 | IT novinky

    Společnost Perplexity AI působící v oblasti umělé inteligence (AI) podala nevyžádanou nabídku na převzetí webového prohlížeče Chrome internetové firmy Google za 34,5 miliardy dolarů (zhruba 723 miliard Kč). Informovala o tom včera agentura Reuters. Upozornila, že výše nabídky výrazně převyšuje hodnotu firmy Perplexity. Společnost Google se podle ní k nabídce zatím nevyjádřila.

    Ladislav Hagara | Komentářů: 5
    včera 04:33 | Bezpečnostní upozornění

    Intel vydal 34 upozornění na bezpečnostní chyby ve svých produktech. Současně vydal verzi 20250812 mikrokódů pro své procesory řešící 6 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    včera 04:22 | Nová verze

    Byla vydána nová verze 1.25 programovacího jazyka Go (Wikipedie). Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 1
    12.8. 13:44 | Nová verze

    Byla vydána beta verze Linux Mintu 22.2 s kódovým jménem Zara. Podrobnosti v přehledu novinek a poznámkách k vydání. Vypíchnout lze novou XApp aplikaci Fingwit pro autentizaci pomocí otisků prstů nebo vlastní fork knihovny libAdwaita s názvem libAdapta podporující grafická témata. Linux Mint 22.2 bude podporován do roku 2029.

    Ladislav Hagara | Komentářů: 0
    12.8. 13:00 | IT novinky

    Provozovatel internetové encyklopedie Wikipedie prohrál v Británii soudní spor týkající se některých částí nového zákona o on-line bezpečnosti. Soud ale varoval britského regulátora Ofcom i odpovědné ministerstvo před zaváděním přílišných omezení. Legislativa zpřísňuje požadavky na on-line platformy, ale zároveň čelí kritice za možné omezování svobody slova. Společnost Wikimedia Foundation, která je zodpovědná za fungování

    … více »
    Ladislav Hagara | Komentářů: 2
    12.8. 12:55 | Nová verze

    Byla vydána verze 2.0.0 nástroje pro synchronizaci dat mezi vícero počítači bez centrálního serveru Syncthing (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 3
    12.8. 12:33 | IT novinky

    Americký prezident Donald Trump se v pondělí osobně setkal s generálním ředitelem firmy na výrobu čipů Intel Lip-Bu Tanem. Šéfa podniku označil za úspěšného, informují agentury. Ještě před týdnem ho přitom ostře kritizoval a požadoval jeho okamžitý odchod. Akcie Intelu v reakci na schůzku po oficiálním uzavření trhu zpevnily asi o tři procenta.

    Ladislav Hagara | Komentářů: 14
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (52%)
     (18%)
     (4%)
     (5%)
     (3%)
     (1%)
     (1%)
     (16%)
    Celkem 390 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Hledač v souborech

    11.3.2011 00:00 | Přečteno: 1337× | Jiné | poslední úprava: 11.3.2011 00:34

    Protože můj skriptík v bashi na hledání v obsahu souborů byl nechutně pomalý a už mě to štvalo, tak jsem upatlal narychlo jednu utilitku v C++. Je to trošku prasácky, ale pro mé účely to stačí. Ke stažení v příloze prvního komentáře, jak skriptík, tak program.

    Pokud vynalézám kolo, tak sry, já na to žádnou utilitku ve svém systému neznám.

    Rychlost hledání je na mém systému 0.6s vs. 13s v celém stromu téhle věci.

    Ještě jedna věc, kompilujte buď s parametrem -std=c++0x, nebo vyhoďte ten static_assert (ale ujistěte se, že je podmínka splněna, jinak to bude chybovat u velkých souborů, např, na x86-32 při definování _FILE_OFFSET_BITS=64)

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Jardík avatar 11.3.2011 00:00 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Přílohy:
    Tady
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 00:05 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    BTW pod licencí Do What The Fuck You Want To Public License, version 2
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 00:14 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Koukám, že jsem v tom C++ souboru zapomněl pár include souborů, co byly z pokusů (nejdříve tam byl read() ale protože to bylo moc na logiku, tam jsem tam prsknul nakonec mmap()).
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:47 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Příloha:
    Aktualizovaný zdroják, několikanásobné zrychlení.
    Věřím v jednoho Boha.
    11.3.2011 00:10 Ladicek | skóre: 28 | blog: variace | Havlíčkův brod
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Hledá to v Jiných Objektech?
    Ještě na tom nejsem tak špatně, abych četl Viewegha.
    Jardík avatar 11.3.2011 00:11 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Co? Hledá to jen v souborech (i binárních) text, co mu předáš jako argument.
    Věřím v jednoho Boha.
    11.3.2011 22:25 moira | skóre: 30 | blog: nesmysly
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Tohle souvisí s těmi Objekty. Aspoň doufám. Člověk si nemůže být jist, až po důkladném zkoumaní, které nechci absolvovat.
    Překladač ti nikdy neřekne: "budeme kamarádi"
    11.3.2011 08:59 Pindal
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Hehe. To mi připomíná, že mistr Hejl asi pořád hledá programátora a Jardík je bez práce, ne? Z jejich spolupráce by jistě vzešlo veledílo. Sice nedodělané, ale nejmíň 64-bitové! ;-)
    11.3.2011 12:29 manasekp | skóre: 29 | blog: manasekp | Brno
    Rozbalit Rozbalit vše Re: Hledač v souborech
    hejlovi se nahodou celkem dari, posledne sem se dival na jeho web a uz mel hotove logo Novy Hledac vytvorene ve wordu :-D
    BIOKOMP | Cas od casu se pokousim nekoho srazit k zemi abych se tam nevalel sam.
    11.3.2011 00:48 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    grep -r, alebo find a grep by postacil. alebo som to vobec nepochopil.
    David Watzke avatar 11.3.2011 01:30 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Měl by postačit grep s přepínači -r a -l.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
    David Watzke avatar 11.3.2011 01:32 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: Hledač v souborech
    A ještě asi -a pro hledání v binárních souborech.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
    11.3.2011 08:23 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Pochopil jsi to zrejme naprosto spravne, jenom proste Jardik nezna linuxove utility, takze se snazil to v shellu napsat tak, jak by to napsal v C. No a to je samozrejme pomaly, protoze shell je interpretovany, takze kazdy prikaz se znovu a znovu interpretuje.

    Samozrejme by ten shell skript mel byt pouze jeden grep prikaz grep -raliF 'hledany-text' directory, pripadne pokud Jardik zvlada regularni vyrazy, tak grep -raliE 'extended-regexp' directory.

    Docela by me zajimal rozdil oproti tomu tvymu CPP. Udelej benchmark. Zkus to s tim -raliF to hleda plain-text, zadny regexp (regexp bude zrejme o trosku pomalejsi).
    Jardík avatar 11.3.2011 11:56 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    time grep -raliF Sys_FullPath .
    ./branches/next_ghost/unix/system.cpp
    ./branches/next_ghost/unix/.svn/text-base/init.cpp.svn-base
    ./branches/next_ghost/unix/.svn/text-base/system.cpp.svn-base
    ./branches/next_ghost/unix/init.cpp
    ./branches/next_ghost/libs/system.h
    ./branches/next_ghost/libs/memman.cpp
    ./branches/next_ghost/libs/.svn/text-base/memman.cpp.svn-base
    ./branches/next_ghost/libs/.svn/text-base/system.h.svn-base
    ./branches/next_ghost/game/realgame.cpp
    ./branches/next_ghost/game/music.cpp
    ./branches/next_ghost/game/globmap.cpp
    ./branches/next_ghost/game/macros.cpp
    ./branches/next_ghost/game/gamesave.cpp
    ./branches/next_ghost/game/.svn/text-base/gamesave.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/skeldal.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/globmap.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/inv.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/dialogs.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/music.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/realgame.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/menu.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/book.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/macros.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/interfac.cpp.svn-base
    ./branches/next_ghost/game/interfac.cpp
    ./branches/next_ghost/game/dialogs.cpp
    ./branches/next_ghost/game/menu.cpp
    ./branches/next_ghost/game/inv.cpp
    ./branches/next_ghost/game/book.cpp
    ./branches/next_ghost/game/skeldal.cpp
    
    real    0m4.747s
    user    0m4.616s
    sys     0m0.127s
    [jardik@Jardik-ArchPC skeldal]$ time /home/jardik/Projects/FindInFiles/findinfiles Sys_FullPath
    ./branches/next_ghost/unix/system.cpp
    ./branches/next_ghost/unix/.svn/text-base/init.cpp.svn-base
    ./branches/next_ghost/unix/.svn/text-base/system.cpp.svn-base
    ./branches/next_ghost/unix/init.cpp
    ./branches/next_ghost/libs/system.h
    ./branches/next_ghost/libs/memman.cpp
    ./branches/next_ghost/libs/.svn/text-base/memman.cpp.svn-base
    ./branches/next_ghost/libs/.svn/text-base/system.h.svn-base
    ./branches/next_ghost/game/realgame.cpp
    ./branches/next_ghost/game/music.cpp
    ./branches/next_ghost/game/globmap.cpp
    ./branches/next_ghost/game/macros.cpp
    ./branches/next_ghost/game/gamesave.cpp
    ./branches/next_ghost/game/.svn/text-base/gamesave.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/skeldal.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/globmap.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/inv.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/dialogs.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/music.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/realgame.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/menu.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/book.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/macros.cpp.svn-base
    ./branches/next_ghost/game/.svn/text-base/interfac.cpp.svn-base
    ./branches/next_ghost/game/interfac.cpp
    ./branches/next_ghost/game/dialogs.cpp
    ./branches/next_ghost/game/menu.cpp
    ./branches/next_ghost/game/inv.cpp
    ./branches/next_ghost/game/book.cpp
    ./branches/next_ghost/game/skeldal.cpp
    
    real    0m0.625s
    user    0m0.560s
    sys     0m0.063s
    [jardik@Jardik-ArchPC skeldal]$
    
    Můj se zdá být cca 7x rychlejší.
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:27 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Tak díky tomuto je mé řešení 55x rychlejší a to za to stojí :-)
    Věřím v jednoho Boha.
    11.3.2011 12:32 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    nepocitas do toho cas pisania programu
    11.3.2011 12:29 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    skus grep -m1 --mmap -ralF Sys_FullPath .

    dalsi rozdiel je, ze preskakujes symlinky, preto som navrhoval find
    11.3.2011 12:31 disorder | blog: weblog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    (nie, ze by spustanie procesov cez find bolo rychlejsie)
    11.3.2011 13:31 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Samozrejme, clovek nesmi napsat neco jako find . -type f -exec grep ....., ale spis find -type f -print0 | xargs -0r grep .... - to se pak spusti jeden grep s vice souborama najednou, kdyz tam neni extremne moc souboru (nenarazi se na limit delky parametru prikazu), tak se to spusti opravdu pouze jednou.
    Jardík avatar 11.3.2011 12:39 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Oni v tom adresáři stejně symlinky nejsou (teda alespoň myslím).
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:44 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Aha, to "i" pro grep (jak psal člověk výše) když vynechám, tak mám 0m0.132s, ignore case jsem nechtěl. Tak to se omlouvám za nařčení grepu z pomalosti, je jen o kousíček pomalejší. Ten --mmap pro grep nemá žádný přínost, je to furt stejný.
    Věřím v jednoho Boha.
    11.3.2011 13:29 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Tak samozrejme, zkus si jezte zmenit "F" na "E" a s tim "i" teprve uvidis pomalost:-) Samozrejme, hledani regexpu bude pomalejsi nez porovnavani znak po znaku, a ignore-case to taky zpomaluje.

    Na druhou stranu, grep ma mnoho dalsich funkci: puvodne grep vypisuje cely radek, kde se hledany vyraz vyskytuje, ale to jsem zablokoval pomoci "-l"; dale grep umoznuje vypsat radky, kde se hledany vyraz NEVYSKYTUJE "-v"; muzes si nechat zobrazit pouze pocet nalezenych radku; dale je mozne zobrazit X radku pred nalezenym a za nalezenym radkem "-B" a "-A" nebo "-C"; pak taky muzes zadat soubor, ktery obsahuje hledane texty "-F"; muzes si nechat vypsat cisla radek nebo byte offset radku s hledanym textem; muzes urcite, jestli se binarni soubory maji prohledavat nebo se maji brat jako ze text tam nelezen nebyl "-a" a "-I" resp. "--binary-files". Vetsina tehle prepinacu se musi behem behu nejakym zpusobem testovat, takze tam bude spousta dalsich "if" navic, nez ma tvuj programek, takze je samozrejme, ze tvuj program bude rychlejsi. Je to asi neco podobneho, jako kdybys zkousel srovna rychlost tveho programu, ktery spocita "1+1" a zobrazi vysledek a nejakeho jineho programu, ktery umi zpracovat a vypocitat jakykoliv zadany matematicky vyraz.

    Takze rychlostne sice grep nepredci, ale kdyz budes chtit pokazde hledat trosku jinym zpusobem (rozumej implementovat nejakou grep funkcionalitu), tak na tom stravic o hodne vic casu a navic skoncis mozna na stejne rychlosti jako grep, nebo mozna jeste hur.

    Lepsi nez neco zacnes bastlit, tak si projdi linuxove utilitky (tady tusim vychazel/vychazi nejakej serial o linuxovych utilitkach) a zkus najit nejakou, ktera umi to, co ty chces (v manu pak hledej detaily). Obcas musis svuj pozadavek rozlozit na mensi casti a pak to prohnat pres rouru nekolika utilitkama.
    11.3.2011 13:35 CET
    Rozbalit Rozbalit vše Re: Hledač v souborech
    A jeste jedna vec. Asi by bylo lepsi opravdu pouzit find, protoze hledat neco v .svn je docela zbytecny. Takze final bych osobne udelal find KDE_HLEDAT -type f -not -path '*/.svn/*' -print0 | xargs -0r grep -lFI HLEDANY bez "-i" a s "-I" (binarni soubory ignorovat).
    11.3.2011 06:42 Radek Miček | skóre: 23 | blog: radekm_blog
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Pro normální texty a delší vzorky by šel čas zlepšit použitím algoritmu Boyer–Moore–Horspool.
    Jardík avatar 11.3.2011 12:25 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    Super, dík:
    real    0m0.141s
    
    Věřím v jednoho Boha.
    Jardík avatar 11.3.2011 12:38 Jardík | skóre: 40 | blog: jarda_bloguje
    Rozbalit Rozbalit vše Re: Hledač v souborech
    A to jsem nezapnul optimalizace, s -O2 tam je skoro přesně 0.100s.
    Věřím v jednoho Boha.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.