Portál AbcLinuxu, 8. května 2025 18:38

Dotaz: Nejdou hromadně překódovat texty

23.8.2013 10:59 DWD | skóre: 18 | blog: papiry
Nejdou hromadně překódovat texty
Přečteno: 325×
Odpovědět | Admin
Mám v adresáři více než 100 textových souborů a jsou psané ve znakové sadě iso-8859-2 a já bych to potřeboval ve znakové sadě utf-8. Jednotlivě to překódovat pomoci KWrite umím, ale neminím se s tím dřít a pojednom se piplat s několika sty souborů. Proto jsem použil skript (napsal jsem ho přímo do konzole)
for F in $(find $1 -iname "*")
do
        if [ -f $F ]; then
                iconv -f iso-8859-2 -t utf-8 $F > ${F}
                mv ${F}1 $F
        fi
done
, ale místo, aby se to překódovalo, tak se to akorát zkurvilo - vznikly prázdné textové soubory. Naštěstí mám ještě kopie původních souborů, tak jsem použil jiný skript (napsal jsem ho přímo do konzole)
while read file; do
        iconv -f iso-8859-2 -t UTF-8 $file -o /tmp/TMP
        mv /tmp/TMP $file
done
a zase se pendrek překódoval, akorát se mi vytvořilo několik kriplovských a nepoužitelných souborů navíc.

Tak potom jaký skript postavený na iconv mám použít?

Jsem kretén, který ví lautr hovno o Linuxu a o počítačích vůbec.

Řešení dotazu:


Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

23.8.2013 11:18 Kit
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zkus se ještě jednou zadívat na tento řádek. Snad pochopíš, že ti tam něco chybí. Asi nějaká jednička.
iconv -f iso-8859-2 -t utf-8 $F > ${F}
23.8.2013 11:43 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
… a roj uvozovek :).
To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
pavlix avatar 23.8.2013 14:35 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
Úplně se mi nezdá ani číst vstup ze souboru, který jsem si již otevřel pro zápis výstupu (a tudíž smazal jeho obsah). Nehledě na to, že mi není jasné, proč jednou píšeš $F a podruhé ${F}.
ale místo, aby se to překódovalo, tak se to akorát zkurvilo - vznikly prázdné textové soubory
Viz výše.
Tak potom jaký skript postavený na iconv mám použít?
Můžeš zkusit i:
bash -x cesta/ke/skriptu
Pak uvidíš víc informací o tom, co skript dělá.
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
Jendа avatar 23.8.2013 15:37 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
Úplně se mi nezdá ani číst vstup ze souboru, který jsem si již otevřel pro zápis výstupu (a tudíž smazal jeho obsah).
No proto píše, že tam chybí ta 1.
Nehledě na to, že mi není jasné, proč jednou píšeš $F a podruhé ${F}.
Tazatel totiž asi zamýšlel dát tam ${F}1.
pavlix avatar 23.8.2013 19:14 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
ok
Já už tu vlastně ani nejsem. Abclinuxu umřelo.
Řešení 1× (H0ax)
23.8.2013 11:21 Kit
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pro překódování všech souborů v adresáři se dá použít i recode:
recode l2..u8 *
23.8.2013 11:48 DWD | skóre: 18 | blog: papiry
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
Tu jedničku jsem doplnil, už to jde, ale ještě by to chtělo vylepšit. Chtěl bych totíž, aby ty překódované soubory měly původní název, čili aby se přepsaly původní překódovanými. Místo toho mi ve složkách vznikají další soubory a musel bych to ručně přebírat, třídit a přejmenovávat zpět. Nebo jsem udělal chybu, že pokaždé když se mi v konzoli zeptalo, jestli chci přepsat soubor, neodpověděl jsem, jenom jsem zmáčknul entr a držel, dokud se všechny soubory neopracují. Nebo mám skript upravit, ale jak?
Jsem kretén, který ví lautr hovno o Linuxu a o počítačích vůbec.
23.8.2013 11:56 panika
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
bud si ty soubory hazej do jinyho adresare pod puvodnim jmenem, anebo si k nim hazej nejakou priponu, kterou si pak umazes regexpem..
23.8.2013 12:01 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
…pokaždé když se mi v konzoli zeptalo, jestli chci přepsat soubor, neodpověděl jsem, jenom jsem zmáčknul entr a držel…
man mv.
To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
23.8.2013 12:14 DWD | skóre: 18 | blog: papiry
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
Skript jsem upravil na
for F in $(find $1 -iname "*")
do
        if [ -f $F ]; then
                iconv -f iso-8859-2 -t utf-8 $F > ${F}.kod
                mv ${F}.kod $F
        fi
done
takže mám v adresáři původní soubory a k tomu soubory upravené a k názvu přidaná přípona .kod. Teď budu muset hromadně odstranit ty původní soubory (bez přípony .kod) a potom u těch upravených souborů hromadně odstranit příponu .kod. Tyto dvě věci neumím.
Jsem kretén, který ví lautr hovno o Linuxu a o počítačích vůbec.
23.8.2013 12:30 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
…co tak si přečíst ten man mv a udělat to rovnou…
iconv -f iso-8859-2 -t utf-8 "${F}" > "${F}.kod"
mv -f "${F}.kod" "${F}"
To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
24.8.2013 10:07 DWD | skóre: 18 | blog: papiry
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
Takže výsledný skript nakonec vypadá
for F in $(find $1 -iname "*")
do
        if [ -f $F ]; then
                iconv -f puvodnisada -t novasada "${F}" > "${F}.kod"
                mv -f "${F}.kod" "${F}"
        fi
done
To funguje podle mého požadavku a je to vyřešené.
Jsem kretén, který ví lautr hovno o Linuxu a o počítačích vůbec.
24.8.2013 11:11 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: Nejdou hromadně překódovat texty
A kdyby ti to házelo chyby a něco chybělo (díky mezerám v názvech apod.), tak to předělej, třeba takto :-):
#!/bin/bash
puvodnisada="iso-8859-2"
novasada="utf-8"
mask="*"
path="$1"

if [ "$#" -gt 1 ]; then
  mask="$2"
fi

while IFS= read -r -d $'\0' F; do
  iconv -f "${puvodnisada}" -t "${novasada}" "${F}" > "${F}.kod"
  mv -f "${F}.kod" "${F}"
done < <(find "${path}" -type f -iname "${mask}" -print0)
…snad jsem se nesekl, jako komplet jsem to netestoval…
To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.