abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:11 | IT novinky

    Společnost Jolla spustila kampaň na podporu svého nového telefonu Jolla Phone se Sailfish OS. Dodání je plánováno na první polovinu příštího roku. Pokud bude alespoň 2 000 zájemců. Záloha na telefon je 99 €. Cena telefonu v rámci kampaně je 499 €.

    Ladislav Hagara | Komentářů: 10
    včera 15:11 | IT novinky

    Netflix kupuje Warner Bros. včetně jejích filmových a televizních studií HBO Max a HBO. Za 72 miliard dolarů (asi 1,5 bilionu korun).

    Ladislav Hagara | Komentářů: 1
    včera 14:11 | IT novinky

    V Las Vegas dnes končí pětidenní konference AWS re:Invent 2025. Společnost Amazon Web Services (AWS) na ní představila celou řadu novinek. Vypíchnout lze 192jádrový CPU Graviton5 nebo AI chip Trainium3.

    Ladislav Hagara | Komentářů: 0
    včera 00:33 | Nová verze

    Firma Proxmox vydala novou serverovou distribuci Datacenter Manager ve verzi 1.0 (poznámky k vydání). Podobně jako Virtual Environment, Mail Gateway či Backup Server je založená na Debianu, k němuž přidává integraci ZFS, webové administrační rozhraní a další. Datacenter Manager je určený ke správě instalací právě ostatních distribucí Proxmox.

    |🇵🇸 | Komentářů: 6
    4.12. 23:44 | Nová verze

    Byla vydána nová verze 2.4.66 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 5 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    4.12. 14:00 | IT novinky

    Programovací jazyk JavaScript (Wikipedie) dnes slaví 30 let od svého oficiálního představení 4. prosince 1995.

    Ladislav Hagara | Komentářů: 0
    4.12. 04:22 | Bezpečnostní upozornění

    Byly zveřejněny informace o kritické zranitelnosti CVE-2025-55182 s CVSS 10.0 v React Server Components. Zranitelnost je opravena v Reactu 19.0.1, 19.1.2 a 19.2.1.

    Ladislav Hagara | Komentářů: 3
    4.12. 02:44 | Komunita

    Bylo rozhodnuto, že nejnovější Linux 6.18 je jádrem s prodlouženou upstream podporou (LTS). Ta je aktuálně plánována do prosince 2027. LTS jader je aktuálně šest: 5.10, 5.15, 6.1, 6.6, 6.12 a 6.18.

    Ladislav Hagara | Komentářů: 0
    4.12. 02:22 | Nová verze

    Byla vydána nová stabilní verze 3.23.0, tj. první z nové řady 3.23, minimalistické linuxové distribuce zaměřené na bezpečnost Alpine Linux (Wikipedie) postavené na standardní knihovně jazyka C musl libc a BusyBoxu. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 1
    3.12. 18:11 | Nová verze

    Byla vydána verze 6.0 webového aplikačního frameworku napsaného v Pythonu Django (Wikipedie). Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (47%)
     (19%)
     (18%)
     (22%)
     (15%)
     (25%)
     (16%)
     (18%)
    Celkem 432 hlasů
     Komentářů: 18, poslední 2.12. 18:34
    Rozcestník

    Dotaz: Hromadne vymazanie prazdnych stranok z PDF suboru pod Linuxom

    10.5.2017 16:59 Ladislav
    Hromadne vymazanie prazdnych stranok z PDF suboru pod Linuxom
    Přečteno: 268×
    Poznate nejaky nastroj pre Linux ktory umoznuje hromadne (z viacerych suborov napr. v adresari) vymazanie prazdnych stranok v PDF (OCRkovych) suboroch ? Dakujem

    Odpovědi

    Jendа avatar 10.5.2017 20:20 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Hromadne vymazanie prazdnych stranok z PDF suboru pod Linuxom
    O ničem hotovém nevím. Napsal bych si skript, který použije pdftk k rozdělení na stránky, pak se detekují a smažou prázdné, a ty ostatní se slepí (případně se vyříznou z původního dokumentu).
    10.5.2017 23:32 Ladislav
    Rozbalit Rozbalit vše Re: Hromadne vymazanie prazdnych stranok z PDF suboru pod Linuxom
    Takze som nieco nasiel na webe a podelim sa s komunitou s mojim riesenim: budeme potrebovat pythonovy skript nonblankpages.py
    #! /usr/bin/python3
    """Read text input and print non-blank page ranges
    (pages should be separated by ^L pagebreaks)"""
    
    import sys
    
    # find non-blank pages
    page = 1
    blank = True
    nonblanks = []
    for line in sys.stdin:
      for char in line:
        if char == "\x0c": # ^L, pagebreak
          if not blank:
            nonblanks.append(page)
          # new page
          page += 1
          blank = True
        else:
          blank = False
    
    # exit if no non-blank pages found
    if not nonblanks:
      exit(1)
    
    # print ranges of non-blank pages in format used by pdftk
    # (e.g. "1-3 5-8 10-10")
    ranges = []
    nonblanks = sorted(nonblanks)
    first_in_range = 0
    
    for i in range(1, len(nonblanks)):
      # if the page increased by more than 1 (i.e. at least one
      # page got skipped), append the current range and start a
      # new one
      if nonblanks[i] > nonblanks[i-1] + 1:
        ranges.append("{}-{}".format(nonblanks[first_in_range],
                                     nonblanks[i-1]))
        first_in_range = i
    
    # append the last range
    ranges.append("{}-{}".format(nonblanks[first_in_range],
                                 nonblanks[-1]))
    print(" ".join(ranges))
    
    potom si spravime bashovy skript ktory v aktualnom adresari vyhlada vyssie popisany pythonacky skript a na zaklade neho prehlada vsetky PDFka (taktiez v aktualnom adresari) a povyhadzuje z nich prazdne stranky (povodne subory s prazdnymi strankami ponecha ako *.old):
    #! /bin/bash
    
    for filename in *.pdf; do
        ranges="$(pdftotext "$filename" - | "./nonblankpages.py")"
        mv "$filename" "$filename.old" && pdftk "$filename.old" cat $ranges output "$filename"
    
    idealne riesenie pri adresaroch kde putuju vsetky sietove duplexne PDF skeny s nepotrebnymi prazdnymi strankami... dufam ze niekomu toto riesenie pomoze... :-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.