abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 18:11 | IT novinky

    Dnes a zítra probíhá vývojářská konference Google I/O 2025. Sledovat lze na YouTube a na síti 𝕏 (#GoogleIO).

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | Komunita

    V Bostonu probíhá konference Red Hat Summit 2025. Vybrané přednášky lze sledovat na YouTube. Dění lze sledovat na síti 𝕏 (#RHSummit).

    Ladislav Hagara | Komentářů: 0
    včera 15:00 | Nová verze

    Společnost Red Hat oficiálně oznámila vydání Red Hat Enterprise Linuxu 10. Vedle nových vlastností přináší také aktualizaci ovladačů a předběžné ukázky budoucích technologií. Podrobnosti v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 2
    včera 12:22 | Pozvánky

    Tuto sobotu 24. května se koná historicky první komunitní den projektu Home Assistant. Zváni jsou všichni příznivci, nadšenci a uživatelé tohoto projektu. Pro účast je potřebná registrace. Odkazy na akce v Praze a v Bratislavě.

    jose17 | Komentářů: 0
    včera 04:44 | IT novinky

    Troy Hunt představil Have I Been Pwned 2.0, tj. nový vylepšený web služby, kde si uživatelé mohou zkontrolovat, zda se jejich hesla a osobní údaje neobjevily v únicích dat a případně se nechat na další úniky upozorňovat.

    Ladislav Hagara | Komentářů: 15
    19.5. 23:22 | Zajímavý software

    Microsoft představil open source textový editor Edit bežící v terminálu. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 7
    19.5. 22:22 | Zajímavý software

    V Seattlu a také online probíhá konference Microsoft Build 2025. Microsoft představuje své novinky. Windows Subsystem for Linux je nově open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 0
    19.5. 13:11 | Zajímavý článek

    Z příspěvku Turris Sentinel – co přinesl rok 2024 na blogu CZ.NIC: "Za poslední rok (únor 2024 – únor 2025) jsme zachytili 8,3 miliardy incidentů a to z 232 zemí a z jejich závislých území. Tyto útoky přišly od 6,2 milionu útočníků (respektive unikátních adres). SMTP minipot je stále nejlákavější pastí, zhruba 79 % útoků bylo směřováno na tento minipot, 16 % útoků směřovalo na minipot Telnet, 3 % útoků směřovaly na minipot HTTP a 2 % na minipot FTP. Dále jsme zaznamenali 3,2 milionu unikátních hesel a 318 tisíc unikátních loginů, které útočníci zkoušeli."

    Ladislav Hagara | Komentářů: 1
    19.5. 12:44 | Nová verze

    Byla vydána (Mastodon, 𝕏) nová verze 3.0.4 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP je již k dispozici také na Flathubu.

    Ladislav Hagara | Komentářů: 0
    19.5. 12:33 | Nová verze

    Byla vydána nová stabilní verze 7.4 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 136. Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    Jaký je váš oblíbený skriptovací jazyk?
     (60%)
     (23%)
     (9%)
     (2%)
     (0%)
     (0%)
     (6%)
    Celkem 47 hlasů
     Komentářů: 5, poslední včera 20:57
    Rozcestník

    pdfgrep

    15.6.2009 18:47 | Výběrový blog | poslední úprava: 16.6.2009 16:43

    Konec procházení přednáškových slidů :). Trochu upravená verze z http://blog.rompe.org/pdfgrep.

    #!/bin/sh
    # 2004-06-22 Ulf Rompe
    
    if [[ $# -lt 2 ]]; then
        echo 'Syntax: pdfgrep [grep options] <pattern> <file> [file ...]'
        exit 1
    fi
    
    while [ ${1:0:1} == "-" ]; do
        GREP_OPTIONS="$GREP_OPTIONS $1"
        shift
    done
    
    pat="$1"
    shift
    
    if [[ $# -gt 1 ]]; then
      GREP_OPTIONS="-H $GREP_OPTIONS"
    fi
    export GREP_OPTIONS
    
    for file in "$@"; do
        pdftotext -layout "$file" - 2>/dev/null | egrep --label="$file" "$pat"
    done
    

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Aleš Janda avatar 15.6.2009 19:22 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
    Rozbalit Rozbalit vše Re: pdfgrep
    Na přednáškové slidy se mi nejvíce osvědčil starý dobrý Acroread - umí fulltextově prohledávat všechny PDF soubory v zadaném adresáři a podadresářích. Tak jen všechny přednášky + vše co má smysl naházím do jednoho adresáře a prohledávám podle toho. Dokonce to řadí i dle relevance :-)
    mutable avatar 15.6.2009 19:31 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Wow. Vyzkouším ASAP.

    Fluttershy, yay! avatar 15.6.2009 19:25 Fluttershy, yay! | skóre: 93 | blog:
    Rozbalit Rozbalit vše Re: pdfgrep
    Eh, co to dělá s obrázky?
    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána
    mutable avatar 15.6.2009 19:30 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Kašle to na ně.

    Fluttershy, yay! avatar 15.6.2009 19:34 Fluttershy, yay! | skóre: 93 | blog:
    Rozbalit Rozbalit vše Re: pdfgrep
    No právě...
    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána
    stativ avatar 15.6.2009 19:52 stativ | skóre: 54 | blog: SlaNé roury
    Rozbalit Rozbalit vše Re: pdfgrep
    Pán by chtěl i OCR? :-D
    Ať sežeru elfa i s chlupama!!! ljirkovsky.wordpress.com stativ.tk
    15.6.2009 20:09 Václav HFechs Švirga | skóre: 26 | blog: HF | Kopřivnice
    Rozbalit Rozbalit vše Re: pdfgrep
    Ideálně umělou inteligenci. Prostě ji řeknu, ať mi v té kupě pdfek něco najde a až se vrátím z hospody, chcu to mít otevřené a důležité věci podtrhané. To je tak těžké?!!!
    Baník pyčo!
    15.6.2009 20:59 iin
    Rozbalit Rozbalit vše Re: pdfgrep

    Ano.

    15.6.2009 21:18 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
    Rozbalit Rozbalit vše Re: pdfgrep
    mozna blby dotaz, ale co dela tento kod: cut -c2 <<<x"$1" ?
    Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.
    Fuky avatar 15.6.2009 23:31 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep
    Vrátí Ti to první znak $1 tj. uvedený cyklus pokračuje dokud jsou předávány volby pro grep tj. argumenty na příkazové řádce začínají znakem -.
    Fuky avatar 15.6.2009 23:42 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep
    To samé dělá i ${1:0:1} (Bash umí, Dash nezná). ;-)
    mutable avatar 16.6.2009 02:23 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Hledají se přepínače pro grep (tj. znaky co začínají na -). V bash man stránce se <<< jmenuje "here string". Proč se před to dává xko? Zatím nevím, někdo to navrhl v komentáři (viz. zdroj), že prý to řeší problem s mezerami uvnitř názvů souborů, zatím sem nepřišel na to proč. :|

    Fuky avatar 16.6.2009 08:36 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep

    prý to řeší problem s mezerami uvnitř názvů souborů

    To by mě zajímalo kde jsi to vyčetl, v diskuzi to vysvětlili jasně:

    2. A small bug: if you pass a -e or -n as grep options, then the echo in the test of the first while loop thinks that it's an option for itself, for example echo -e outputs just a blank line.

    Tj. pokud $1 bude obsahovat volby, které jsou dostupné i v echo, tak si je vezme za své právě echo. Příklad:

    $ option="-n"
    
    $ echo $option
    
    $ echo x$option
    x-n
    
    

    Fuky avatar 16.6.2009 08:58 Fuky | skóre: 52 | blog: 4u
    Rozbalit Rozbalit vše Re: pdfgrep

    Pro udržení kontextu, bavíme se o:

    while [ `echo x$1 | cut -c2` == "-" ]; do
    

    U následujícího provedení má x jiný význam, pokud by $1 byl prázdný řetězec vypsal by skript chybové hlášení [: ==: unary operator expected, protože na levé straně porovnání by nebylo nic:

    while [[ $(cut -c2 <<<x"$1") == "-" ]]; do
    

    Ale když použijeme uvozovky, tak se můžeme zbavit x i tady (dávat do uvozovek i $1 je zbytečné):

    while [ "$(cut -c2 <<<$1)" == "-" ]; do
    

    Nebo to rovnou můžeme napsat bez zbytečného cut:

    while [ ${1:0:1} == "-" ]; do
    

    mutable avatar 16.6.2009 16:47 mutable | skóre: 7 | blog: mutable_the_mutative
    Rozbalit Rozbalit vše Re: pdfgrep

    Oh. Upraveno. Omlouvám se. Přiznám se, že jsem ty komentáře jenom zhruba prolít.

    Salutis avatar 16.6.2009 21:09 Salutis | skóre: 7 | blog: Salutis
    Rozbalit Rozbalit vše Re: pdfgrep
    Fuky, ty tu nemudruj a makaj na tých nových skriptoch. :)
    Najväčší dar je vedieť posúdiť hodnotu vecí.
    Salutis avatar 16.6.2009 21:08 Salutis | skóre: 7 | blog: Salutis
    Rozbalit Rozbalit vše Re: pdfgrep
    Len tak na okraj, tie podmienky sa dajú zjednodušiť z ...
    if [[ $# -gt 1 ]]; then
      GREP_OPTIONS="-H $GREP_OPTIONS"
    fi
    
    ... na ...
    [ $# -gt 1 ] && REP_OPTIONS="-H $GREP_OPTIONS"
    
    No a ten posledný cyklus čo ide po súboroch neberie názvy s medzerami.

    Asi by bolo lepšie použiť:
    ls ... | while read FILE; do
    
    Najväčší dar je vedieť posúdiť hodnotu vecí.
    Salutis avatar 16.6.2009 21:14 Salutis | skóre: 7 | blog: Salutis
    Rozbalit Rozbalit vše Re: pdfgrep
    Tú druhú pripomienku beriem späť. Zasa zom zabudol, že "$@" (s úvodzovkami) to zvláda v pohode.
    Najväčší dar je vedieť posúdiť hodnotu vecí.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.