abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:44 | Zajímavý software

    Na WWDC25 byl představen balíček Containerization a nástroj container pro spouštění linuxových kontejnerů na macOS. Jedná se o open source software pod licencí Apache 2.0 napsaný v programovacím jazyce Swift.

    Ladislav Hagara | Komentářů: 0
    dnes 02:00 | IT novinky

    Do 16. června do 19:00 běží na Steamu přehlídka nadcházejících her Festival Steam Next | červen 2025 doplněná demoverzemi, přenosy a dalšími aktivitami. Demoverze lze hrát zdarma.

    Ladislav Hagara | Komentářů: 0
    včera 21:44 | IT novinky

    Apple na své vývojářské konferenci WWDC25 (Worldwide Developers Conference, keynote) představil řadu novinek: designový materiál Liquid Glass, iOS 26, iPadOS 26, macOS Tahoe 26, watchOS 26, visionOS 26, tvOS 26, nové funkce Apple Intelligence, …

    Ladislav Hagara | Komentářů: 0
    včera 20:44 | Komunita

    Organizátoři konference LinuxDays 2025, jež proběhne o víkendu 4. a 5. října 2025 v Praze na FIT ČVUT, spustili přihlašování přednášek (do 31. srpna) a sběr námětů na zlepšení.

    Ladislav Hagara | Komentářů: 0
    včera 19:11 | Nová verze

    Po roce byla vydána nová stabilní verze 25.6.0 svobodného multiplatformního multimediálního přehrávače SMPlayer (Wikipedie).

    Ladislav Hagara | Komentářů: 0
    včera 12:55 | IT novinky

    DNS4EU, tj. evropská infrastruktura služeb DNS založená na vysoce federovaném a distribuovaném ochranném ekosystému, byla spuštěna v testovacím režimu [𝕏]. Na výběr je 5 možností filtrování DNS.

    Ladislav Hagara | Komentářů: 15
    8.6. 22:44 | IT novinky

    Skriptovací programovací jazyk PHP (PHP: Hypertext Preprocessor, původně Personal Home Page) dnes slaví 30 let. Přesně před třiceti lety, 8. června 1995, oznámil Rasmus Lerdorf vydání PHP Tools (Personal Home Page Tools) verze 1.0.

    Ladislav Hagara | Komentářů: 12
    7.6. 23:55 | Humor

    Ve středu v 17:00 byl ve Francii zablokován přístup k PornHubu a dalším webům pro dospělé. K 17:30 došlo k nárůstu počtu registrací Proton VPN o 1 000 % [𝕏]. Dle nového francouzského zákona jsou provozovatelé těchto webů povinni ověřovat věk uživatelů prostřednictvím průkazu totožnosti nebo platební karty.

    Ladislav Hagara | Komentářů: 40
    6.6. 19:44 | Zajímavý článek

    Před 32 lety, 6. června 1993, byl spuštěn první český WWW server (ještě pod TLD .cs), pro potřeby fyziků zabývajících se problematikou vysokých energií.

    Ladislav Hagara | Komentářů: 7
    6.6. 16:11 | Zajímavý software

    Střílečku Borderlands 2 lze v rámci výprodeje série Borderlands na Steamu získat zdarma napořád, když aktivaci provedete do 8. června 19:00.

    Ladislav Hagara | Komentářů: 11
    Jaký je váš oblíbený skriptovací jazyk?
     (54%)
     (32%)
     (8%)
     (2%)
     (0%)
     (0%)
     (3%)
    Celkem 238 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    pdfgrep

    15.6.2009 18:47 | Výběrový blog | poslední úprava: 16.6.2009 16:43

    Konec procházení přednáškových slidů :). Trochu upravená verze z http://blog.rompe.org/pdfgrep.

    #!/bin/sh
    # 2004-06-22 Ulf Rompe
    
    if [[ $# -lt 2 ]]; then
        echo 'Syntax: pdfgrep [grep options] <pattern> <file> [file ...]'
        exit 1
    fi
    
    while [ ${1:0:1} == "-" ]; do
        GREP_OPTIONS="$GREP_OPTIONS $1"
        shift
    done
    
    pat="$1"
    shift
    
    if [[ $# -gt 1 ]]; then
      GREP_OPTIONS="-H $GREP_OPTIONS"
    fi
    export GREP_OPTIONS
    
    for file in "$@"; do
        pdftotext -layout "$file" - 2>/dev/null | egrep --label="$file" "$pat"
    done
    

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Aleš Janda avatar 15.6.2009 19:22 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
    Rozbalit Rozbalit vše Re: pdfgrep
    Na přednáškové slidy se mi nejvíce osvědčil starý dobrý Acroread - umí fulltextově prohledávat všechny PDF soubory v zadaném adresáři a podadresářích. Tak jen všechny přednášky + vše co má smysl naházím do jednoho adresáře a prohledávám podle toho. Dokonce to řadí i dle relevance :-)
    mutable avatar 15.6.2009 19:31 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Wow. Vyzkouším ASAP.

    Fluttershy, yay! avatar 15.6.2009 19:25 Fluttershy, yay! | skóre: 93 | blog:
    Rozbalit Rozbalit vše Re: pdfgrep
    Eh, co to dělá s obrázky?
    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána
    mutable avatar 15.6.2009 19:30 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Kašle to na ně.

    Fluttershy, yay! avatar 15.6.2009 19:34 Fluttershy, yay! | skóre: 93 | blog:
    Rozbalit Rozbalit vše Re: pdfgrep
    No právě...
    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána
    stativ avatar 15.6.2009 19:52 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: pdfgrep
    Pán by chtěl i OCR? :-D
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    15.6.2009 20:09 Václav HFechs Švirga | skóre: 26 | blog: HF | Kopřivnice
    Rozbalit Rozbalit vše Re: pdfgrep
    Ideálně umělou inteligenci. Prostě ji řeknu, ať mi v té kupě pdfek něco najde a až se vrátím z hospody, chcu to mít otevřené a důležité věci podtrhané. To je tak těžké?!!!
    Baník pyčo!
    15.6.2009 20:59 iin
    Rozbalit Rozbalit vše Re: pdfgrep

    Ano.

    15.6.2009 21:18 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
    Rozbalit Rozbalit vše Re: pdfgrep
    mozna blby dotaz, ale co dela tento kod: cut -c2 <<<x"$1" ?
    Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.
    Fuky avatar 15.6.2009 23:31 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep
    Vrátí Ti to první znak $1 tj. uvedený cyklus pokračuje dokud jsou předávány volby pro grep tj. argumenty na příkazové řádce začínají znakem -.
    Fuky avatar 15.6.2009 23:42 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep
    To samé dělá i ${1:0:1} (Bash umí, Dash nezná). ;-)
    mutable avatar 16.6.2009 02:23 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Hledají se přepínače pro grep (tj. znaky co začínají na -). V bash man stránce se <<< jmenuje "here string". Proč se před to dává xko? Zatím nevím, někdo to navrhl v komentáři (viz. zdroj), že prý to řeší problem s mezerami uvnitř názvů souborů, zatím sem nepřišel na to proč. :|

    Fuky avatar 16.6.2009 08:36 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep

    prý to řeší problem s mezerami uvnitř názvů souborů

    To by mě zajímalo kde jsi to vyčetl, v diskuzi to vysvětlili jasně:

    2. A small bug: if you pass a -e or -n as grep options, then the echo in the test of the first while loop thinks that it's an option for itself, for example echo -e outputs just a blank line.

    Tj. pokud $1 bude obsahovat volby, které jsou dostupné i v echo, tak si je vezme za své právě echo. Příklad:

    $ option="-n"
    
    $ echo $option
    
    $ echo x$option
    x-n
    
    

    Fuky avatar 16.6.2009 08:58 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep

    Pro udržení kontextu, bavíme se o:

    while [ `echo x$1 | cut -c2` == "-" ]; do
    

    U následujícího provedení má x jiný význam, pokud by $1 byl prázdný řetězec vypsal by skript chybové hlášení [: ==: unary operator expected, protože na levé straně porovnání by nebylo nic:

    while [[ $(cut -c2 <<<x"$1") == "-" ]]; do
    

    Ale když použijeme uvozovky, tak se můžeme zbavit x i tady (dávat do uvozovek i $1 je zbytečné):

    while [ "$(cut -c2 <<<$1)" == "-" ]; do
    

    Nebo to rovnou můžeme napsat bez zbytečného cut:

    while [ ${1:0:1} == "-" ]; do
    

    mutable avatar 16.6.2009 16:47 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Oh. Upraveno. Omlouvám se. Přiznám se, že jsem ty komentáře jenom zhruba prolít.

    Salutis avatar 16.6.2009 21:09 Salutis | skóre: 7 | blog: Salutis
    Rozbalit Rozbalit vše Re: pdfgrep
    Fuky, ty tu nemudruj a makaj na tých nových skriptoch. :)
    Najväčší dar je vedieť posúdiť hodnotu vecí.
    Salutis avatar 16.6.2009 21:08 Salutis | skóre: 7 | blog: Salutis
    Rozbalit Rozbalit vše Re: pdfgrep
    Len tak na okraj, tie podmienky sa dajú zjednodušiť z ...
    if [[ $# -gt 1 ]]; then
      GREP_OPTIONS="-H $GREP_OPTIONS"
    fi
    
    ... na ...
    [ $# -gt 1 ] && REP_OPTIONS="-H $GREP_OPTIONS"
    
    No a ten posledný cyklus čo ide po súboroch neberie názvy s medzerami.

    Asi by bolo lepšie použiť:
    ls ... | while read FILE; do
    
    Najväčší dar je vedieť posúdiť hodnotu vecí.
    Salutis avatar 16.6.2009 21:14 Salutis | skóre: 7 | blog: Salutis
    Rozbalit Rozbalit vše Re: pdfgrep
    Tú druhú pripomienku beriem späť. Zasa zom zabudol, že "$@" (s úvodzovkami) to zvláda v pohode.
    Najväčší dar je vedieť posúdiť hodnotu vecí.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.