Přihlášení | Registrace

napište » Zprávičky

Node.js 22

dnes 04:55 | Nová verze

OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

Ladislav Hagara | Komentářů: 0

Proxmox Virtual Environment 8.2

dnes 04:22 | Nová verze

Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

Ladislav Hagara | Komentářů: 0

R 4.4.0 (Puppy Cup)

dnes 04:11 | Nová verze

R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

Ladislav Hagara | Komentářů: 0

IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů

včera 22:44 | IT novinky

IBM kupuje společnost HashiCorp (Terraform, Packer, Vault, Boundary, Consul, Nomad, Waypoint, Vagrant, …) za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

Ladislav Hagara | Komentářů: 6

TrueNAS SCALE 24.04 “Dragonfish”

včera 15:55 | Nová verze

Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Raspberry Pi Compute Module 4S s 2 GB, 4 GB a 8 GB paměti

včera 13:44 | IT novinky

Oznámeny byly nové Raspberry Pi Compute Module 4S. Vedle původní 1 GB varianty jsou nově k dispozici také varianty s 2 GB, 4 GB a 8 GB paměti. Compute Modules 4S mají na rozdíl od Compute Module 4 tvar a velikost Compute Module 3+ a předchozích. Lze tak provést snadný upgrade.

Ladislav Hagara | Komentářů: 0

nginx 1.26.0

včera 04:44 | Nová verze

Po roce vývoje od vydání verze 1.24.0 byla vydána nová stabilní verze 1.26.0 webového serveru a reverzní proxy nginx (Wikipedie). Nová verze přináší řadu novinek. Podrobný přehled v souboru CHANGES-1.26.

Ladislav Hagara | Komentářů: 0

Tails 6.2

včera 04:33 | Nová verze

Byla vydána nová verze 6.2 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.14.

Ladislav Hagara | Komentářů: 0

Electron 30.0.0

včera 04:22 | Nová verze

Byla vydána nová verze 30.0.0 frameworku pro vývoj multiplatformních desktopových aplikací pomocí JavaScriptu, HTML a CSS Electron (Wikipedie, GitHub). Chromium bylo aktualizováno na verzi 124.0.6367.49, V8 na verzi 12.4 a Node.js na verzi 20.11.1. Electron byl původně vyvíjen pro editor Atom pod názvem Atom Shell. Dnes je na Electronu postavena celá řada dalších aplikací.

Ladislav Hagara | Komentářů: 2

QEMU 9.0.0

včera 04:11 | Nová verze

Byla vydána nová verze 9.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 220 vývojářů. Provedeno bylo více než 2 700 commitů. Přehled úprav a nových vlastností v seznamu změn.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (72%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (17%)

Celkem 739 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / Python: jak spravne extrahovat nazvy souboru z adresare?

Štítky: dokumenty, LaTeX, lyx, PDF, proces, prohlížeče, skript, standard, TeX

Dotaz: Python: jak spravne extrahovat nazvy souboru z adresare?

29.3.2016 17:27 zdenek2008 | skóre: 26
Python: jak spravne extrahovat nazvy souboru z adresare?

Přečteno: 442×

Odpovědět | Admin

Prepisuji si z bashe do pythonu skript, pomoci ktereho generuji (krome jineho) lyx dokument. Do toho lyx dokumentu nacitam externi pdf dokumenty a uvadim je v obsahu (TOC). Zatim mam castecne vyreseny proces zapisovani do souboru (promenne v textu jsou jeste podle bashove syntaxe), ale iterovani v adresari s pdf soubory je jeste (bash) v zakomentovanych radkach. Nemeli byste nekdo tip na nejake elegantni reseni, abych treba nevynalezal nejake kostrbatiny? Predem diky za pripadne navrhy.

file=open('../soubor.lyx','a')

#for nazev_souboru in ../nejake_pdf_documenty/*.[pP][dD][fF]; do
#nazev_souboru_bez_pripony=${nazev_souboru:25:-4}

text=r"""\begin_layout Standard
\begin_inset CommandInset label
LatexCommand label
name "${nazev_souboru_bez_pripony}"

\end_inset


\end_layout

\begin_layout Standard
\begin_inset External
	template PDFPages
	filename ${nazev_souboru:1}
	extra LaTeX "pages=-, pagecommand={\thispagestyle{fancy}}, addtotoc={1,section,1,${nazev_souboru_bez_pripony},${nazev_souboru_bez_pripony}}"
	scale 80

\end_inset


\end_layout

"""

file.write(text)
logging.debug('text: '+text)

#done

file.close()
del file
del text

Řešení dotazu:

Komentář #1 (xxxxxx, 1 hlasů)

Nástroje: Začni sledovat (0) ?

Odpovědi

Řešení 1× (zdenek2008 (tazatel))

29.3.2016 18:31 xxxxxx | skóre: 23
Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?

Ten kus LyX kódu bych hodil do jiného souboru, v kódu tohle obvykle není pěkné. Jestli tomu dobře rozumím, máš šablonu pro LyX, do které chceš nasázet hodnoty. To bych použil rovnou modul Jinja2.

import glob
import os
from jinja2 import Environment

# Načtení šablony do prom. tmp
env = Environment()

with open('cesta/k/templatu.lyx', 'r', encoding='utf8') as fread:
    tmp = env.from_string(fread.read())

# dict s hodnotami
content = {}

# Pak tady budeš všechno možné, třeba to prolezení PDF souborů
# Dejme tomu, že magicka_funkce vrací list s názvy PDF
def magicka_funkce(path):
    files = glob.glob(path + '*.pdf')

    out = []

    # Ošklivé, ale takhle nějak
    for fl in files:
        out.append({'cesta': fl,
                    'nazev_souboru': os.path.basename(fl),
                    'nazev_souboru_bez_pripony': os.path.splitext(os.path.basename(fl))[0]})

    return out

seznam_souboru = magicka_funkce('cesta/')
content['seznam_souboru'] = seznam_souboru

# Nakonec ten seznam pošleš šabloně
vygenerovany_dokument_jako_string = tmp.render(content)

with open('vysledny_soubor.lyx', 'r', encoding='utf8') as fwrite:
    fwrite.write(vygenerovany_dokument_jako_string)

No a v té šabloně budeš mít už syntaxi Jinja:

{% for pdf in seznam_souboru %}
\begin_layout Standard
\begin_inset CommandInset label
LatexCommand label
name "{{ pdf.nazev_souboru_bez_pripony }}"

\end_inset


\end_layout

\begin_layout Standard
\begin_inset External
	template PDFPages
	filename {pdf.nazev_souboru:1}
	extra LaTeX "pages=-, pagecommand={\thispagestyle{fancy}}, addtotoc={1,section,1,{{ pdf.nazev_souboru_bez_pripony }}},{{ pdf.nazev_souboru_bez_pripony }}}"
	scale 80

\end_inset


\end_layout
{% endfor %}

Jakmile generuju soubory, tak takhle. Než jsem se dostal k Jinja2, tak jsem to dělal stejně, jako to máš v otázce, tj. postupně zapisovat do souboru po kouskách. Ale tohle je o poznání jednodušší a čistší. Hlavně to podporuje cykly i podmínky (viz první řádek templatu).

Kromě Jinja2 má python ve standardní knihovně string.Template. Což je něco podobného, ale spíš jen formou search & replace.

29.3.2016 19:06 zdenek2008 | skóre: 26
Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?

Diky. Co se tyce te iterace tak zatim jsem se dostal k tomuhle:

nejake_pdf_dokumenty=glob.glob('../nejake_pdf_dokumenty/*.[pP][dD][fF]')
nejake_pdf_dokumenty.sort()
logging.debug('nejake_pdf_dokumenty: '+str(nejake_pdf_dokumenty))

for nazev_souboru in nejake_pdf_dokumenty:
  logging.debug('nazev_souboru: '+nazev_souboru)
  nazev_souboru_bez_pripony=nazev_souboru[25:-4]
  logging.debug('nazev_souboru_bez_pripony: '+nazev_souboru_bez_pripony)

Tim bash skriptem jsem doposud vyplnoval pdf formulare a sadu lyx dokumentu ktere jsem jeste pak dodatecne rucne editoval (jejich obsah, ne kod) a nakonec vse zahrnul do jedineho lyx svazku a ten nakonec opet exportoval do pdf fasciklu pro konecne pouziti. Jak ten skript rostl tak vyslo najevo ze bash uz nevyhovuje a je treba prepsat do jineho jazyka, oddelit sablony od kodu (uz ted mi dochazi ke konfliktum syntaxi lyxu a pythonu, jako treba uvozovky) a pokud jde o kod samotny tak ten je potreba take restrukturalizovat, napsat funkce a rozdelit do vhodnych modulu. Navic bude asi potreba skript distribuovat takze je treba doresit i instalatory na jine OS. Diky za tip na reseni, toto vyuziju.

29.3.2016 20:42 xxxxxx | skóre: 23
Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?

Jinak jak koukám, vyhnul bych se tomuhle: nazev_souboru[25:-4]. Teď to třeba na 3 písmenné přípony funguje, ale projet složku s jpg/jpeg a už to fungovat nebude. Proto existuje funkce splitext. A jestli bude potřeba skript i na Win, tak v modulu os jsou fce na práci s cestami, které chápou / a \, není pak nutné ve skriptu detekovat os a ručně uplácávat cesty.

29.3.2016 21:10 zdenek2008 | skóre: 26
Rozbalit Rozbalit vše Re: Python: jak spravne extrahovat nazvy souboru z adresare?

Diky, to budu muset take predelat. S cestou k souboru potrebuji zachazet spis "systemove" nez jako s textovym retezcem. Nastesti cely skript uz konecne funguje v pythonu takze ted muzu zacit ladit.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje