abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

dnes 06:55 | Zajímavý projekt

V Edici CZ.NIC vyšla kniha Průvodce labyrintem algoritmů. Kniha je ke stažení zcela zdarma (pdf) nebo lze objednat tištěnou verzi za 339 Kč (připojení přes IPv4) nebo 289 Kč (připojení přes IPv6).

Ladislav Hagara | Komentářů: 4
dnes 06:33 | Zajímavý software

Byla vydána verze 2.2.0 svobodného správce hesel KeePassXC (Wikipedie). Jedná se o komunitní fork správce hesel KeePassX s řadou vylepšení.

Ladislav Hagara | Komentářů: 0
dnes 06:11 | IT novinky

Vývojář Debianu Henrique de Moraes Holschuh upozorňuje v diskusním listu debian-devel na chybu v Hyper-Threadingu v procesorech Skylake a Kaby Lake od Intelu. Za určitých okolností může chyba způsobit nepředvídatelné chování systému. Doporučuje se aktualizace mikrokódu CPU nebo vypnutí Hyper-Threadingu v BIOSu nebo UEFI [reddit].

Ladislav Hagara | Komentářů: 0
24.6. 01:23 | Komunita

Phoronix spustil 2017 Linux Laptop Survey. Tento dotazník s otázkami zaměřenými na parametry ideálního notebooku s Linuxem lze vyplnit do 6. července.

Ladislav Hagara | Komentářů: 3
23.6. 22:44 | Nová verze

Po třech měsících vývoje od vydání verze 5.5.0 byla vydána verze 5.6.0 správce digitálních fotografií digiKam (digiKam Software Collection). Do digiKamu se mimo jiné vrátila HTML galerie a nástroj pro vytváření videa z fotografií. V Bugzille bylo uzavřeno více než 81 záznamů.

Ladislav Hagara | Komentářů: 1
23.6. 17:44 | Nová verze

Byla vydána verze 9.3 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab. Představení nových vlastností v příspěvku na blogu a na YouTube.

Ladislav Hagara | Komentářů: 3
23.6. 13:53 | Nová verze

Simon Long představil na blogu Raspberry Pi novou verzi 2017-06-21 linuxové distribuce Raspbian určené především pro jednodeskové miniaturní počítače Raspberry Pi. Společně s Raspbianem byl aktualizován také instalační nástroj NOOBS (New Out Of the Box Software). Z novinek lze zdůraznit IDE Thonny pro vývoj v programovacím jazyce Python a především offline verzi Scratche 2.0. Ten bylo dosud možné používat pouze online. Offline bylo možné používat pouze Scratch ve verzi 1.4. Z nového Scratchu lze ovládat také GPIO piny. Scratch 2.0 vyžaduje Flash.

Ladislav Hagara | Komentářů: 1
22.6. 14:24 | Nová verze

Opera 46, verze 46.0.2597.26, byla prohlášena za stabilní. Nejnovější verze tohoto webového prohlížeče je postavena na Chromiu 59. Z novinek lze zmínit například podporu APNG (Animated Portable Network Graphics). Přehled novinek pro vývojáře na blogu Dev.Opera. Oznámení o vydání zmiňuje také první televizní reklamu.

Ladislav Hagara | Komentářů: 0
22.6. 13:37 | IT novinky

I čtenáři AbcLinuxu před dvěma lety vyplňovali dotazníky věnované Retro ThinkPadu. Nyní bylo potvrzeno, že iniciativa Retro ThinkPad je stále naživu a Lenovo připravuje speciální edici ThinkPadu jako součást oslav jeho 25. výročí.

Ladislav Hagara | Komentářů: 34
22.6. 10:22 | Komunita

Bylo oznámeno, že frontend a runtime programovacího jazyka D bude začleněn do kolekce kompilátorů GCC (GNU Compiler Collection). Správcem byl ustanoven Iain Buclaw.

Ladislav Hagara | Komentářů: 7
Chystáte se pořídit CPU AMD Ryzen?
 (6%)
 (31%)
 (1%)
 (9%)
 (44%)
 (9%)
Celkem 840 hlasů
 Komentářů: 65, poslední 1.6. 19:16
    Rozcestník

    Dotaz: Python: jak spravne extrahovat nazvy souboru z adresare?

    29.3.2016 17:27 zdenek2008 | skóre: 20
    Python: jak spravne extrahovat nazvy souboru z adresare?
    Přečteno: 358×
    Prepisuji si z bashe do pythonu skript, pomoci ktereho generuji (krome jineho) lyx dokument. Do toho lyx dokumentu nacitam externi pdf dokumenty a uvadim je v obsahu (TOC). Zatim mam castecne vyreseny proces zapisovani do souboru (promenne v textu jsou jeste podle bashove syntaxe), ale iterovani v adresari s pdf soubory je jeste (bash) v zakomentovanych radkach. Nemeli byste nekdo tip na nejake elegantni reseni, abych treba nevynalezal nejake kostrbatiny? Predem diky za pripadne navrhy.
    file=open('../soubor.lyx','a')
    
    #for nazev_souboru in ../nejake_pdf_documenty/*.[pP][dD][fF]; do
    #nazev_souboru_bez_pripony=${nazev_souboru:25:-4}
    
    text=r"""\begin_layout Standard
    \begin_inset CommandInset label
    LatexCommand label
    name "${nazev_souboru_bez_pripony}"
    
    \end_inset
    
    
    \end_layout
    
    \begin_layout Standard
    \begin_inset External
    	template PDFPages
    	filename ${nazev_souboru:1}
    	extra LaTeX "pages=-, pagecommand={\thispagestyle{fancy}}, addtotoc={1,section,1,${nazev_souboru_bez_pripony},${nazev_souboru_bez_pripony}}"
    	scale 80
    
    \end_inset
    
    
    \end_layout
    
    """
    
    file.write(text)
    logging.debug('text: '+text)
    
    #done
    
    file.close()
    del file
    del text
    

    Řešení dotazu:


    Odpovědi

    Řešení 1× (zdenek2008 (tazatel))
    mika-talvinen avatar 29.3.2016 18:31 mika-talvinen | skóre: 23 | Plzeň
    Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?
    Ten kus LyX kódu bych hodil do jiného souboru, v kódu tohle obvykle není pěkné. Jestli tomu dobře rozumím, máš šablonu pro LyX, do které chceš nasázet hodnoty. To bych použil rovnou modul Jinja2.
    import glob
    import os
    from jinja2 import Environment
    
    # Načtení šablony do prom. tmp
    env = Environment()
    
    with open('cesta/k/templatu.lyx', 'r', encoding='utf8') as fread:
        tmp = env.from_string(fread.read())
    
    # dict s hodnotami
    content = {}
    
    # Pak tady budeš všechno možné, třeba to prolezení PDF souborů
    # Dejme tomu, že magicka_funkce vrací list s názvy PDF
    def magicka_funkce(path):
        files = glob.glob(path + '*.pdf')
    
        out = []
    
        # Ošklivé, ale takhle nějak
        for fl in files:
            out.append({'cesta': fl,
                        'nazev_souboru': os.path.basename(fl),
                        'nazev_souboru_bez_pripony': os.path.splitext(os.path.basename(fl))[0]})
    
        return out
    
    seznam_souboru = magicka_funkce('cesta/')
    content['seznam_souboru'] = seznam_souboru
    
    # Nakonec ten seznam pošleš šabloně
    vygenerovany_dokument_jako_string = tmp.render(content)
    
    with open('vysledny_soubor.lyx', 'r', encoding='utf8') as fwrite:
        fwrite.write(vygenerovany_dokument_jako_string)
    
    No a v té šabloně budeš mít už syntaxi Jinja:
    {% for pdf in seznam_souboru %}
    \begin_layout Standard
    \begin_inset CommandInset label
    LatexCommand label
    name "{{ pdf.nazev_souboru_bez_pripony }}"
    
    \end_inset
    
    
    \end_layout
    
    \begin_layout Standard
    \begin_inset External
    	template PDFPages
    	filename {pdf.nazev_souboru:1}
    	extra LaTeX "pages=-, pagecommand={\thispagestyle{fancy}}, addtotoc={1,section,1,{{ pdf.nazev_souboru_bez_pripony }}},{{ pdf.nazev_souboru_bez_pripony }}}"
    	scale 80
    
    \end_inset
    
    
    \end_layout
    {% endfor %}
    
    Jakmile generuju soubory, tak takhle. Než jsem se dostal k Jinja2, tak jsem to dělal stejně, jako to máš v otázce, tj. postupně zapisovat do souboru po kouskách. Ale tohle je o poznání jednodušší a čistší. Hlavně to podporuje cykly i podmínky (viz první řádek templatu).

    Kromě Jinja2 má python ve standardní knihovně string.Template. Což je něco podobného, ale spíš jen formou search & replace.
    29.3.2016 19:06 zdenek2008 | skóre: 20
    Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?
    Diky. Co se tyce te iterace tak zatim jsem se dostal k tomuhle:
    nejake_pdf_dokumenty=glob.glob('../nejake_pdf_dokumenty/*.[pP][dD][fF]')
    nejake_pdf_dokumenty.sort()
    logging.debug('nejake_pdf_dokumenty: '+str(nejake_pdf_dokumenty))
    
    for nazev_souboru in nejake_pdf_dokumenty:
      logging.debug('nazev_souboru: '+nazev_souboru)
      nazev_souboru_bez_pripony=nazev_souboru[25:-4]
      logging.debug('nazev_souboru_bez_pripony: '+nazev_souboru_bez_pripony)
    Tim bash skriptem jsem doposud vyplnoval pdf formulare a sadu lyx dokumentu ktere jsem jeste pak dodatecne rucne editoval (jejich obsah, ne kod) a nakonec vse zahrnul do jedineho lyx svazku a ten nakonec opet exportoval do pdf fasciklu pro konecne pouziti. Jak ten skript rostl tak vyslo najevo ze bash uz nevyhovuje a je treba prepsat do jineho jazyka, oddelit sablony od kodu (uz ted mi dochazi ke konfliktum syntaxi lyxu a pythonu, jako treba uvozovky) a pokud jde o kod samotny tak ten je potreba take restrukturalizovat, napsat funkce a rozdelit do vhodnych modulu. Navic bude asi potreba skript distribuovat takze je treba doresit i instalatory na jine OS. Diky za tip na reseni, toto vyuziju.
    mika-talvinen avatar 29.3.2016 20:42 mika-talvinen | skóre: 23 | Plzeň
    Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?
    Jinak jak koukám, vyhnul bych se tomuhle: nazev_souboru[25:-4]. Teď to třeba na 3 písmenné přípony funguje, ale projet složku s jpg/jpeg a už to fungovat nebude. Proto existuje funkce splitext. A jestli bude potřeba skript i na Win, tak v modulu os jsou fce na práci s cestami, které chápou / a \, není pak nutné ve skriptu detekovat os a ručně uplácávat cesty.
    29.3.2016 21:10 zdenek2008 | skóre: 20
    Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?
    Diky, to budu muset take predelat. S cestou k souboru potrebuji zachazet spis "systemove" nez jako s textovym retezcem. Nastesti cely skript uz konecne funguje v pythonu takze ted muzu zacit ladit.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.