abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 21:11 | Nová verze

    Byl vydán Debian 13 s kódovým názvem Trixie. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 2
    včera 15:55 | Zajímavý software

    WLED je open-source firmware pro ESP8266/ESP32, který umožňuje Wi-Fi ovládání adresovatelných LED pásků se stovkami efektů, synchronizací, audioreaktivním módem a Home-Assistant integrací. Je založen na Arduino frameworku.

    Indiánský lotr | Komentářů: 0
    8.8. 15:33 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.8.

    Ladislav Hagara | Komentářů: 5
    8.8. 14:22 | IT novinky

    Herní studio Hangar 13 vydalo novou Mafii. Mafia: Domovina je zasazena do krutého sicilského podsvětí na začátku 20. století. Na ProtonDB je zatím bez záznamu.

    Ladislav Hagara | Komentářů: 1
    8.8. 13:22 | IT novinky

    Operátor O2 má opět problémy. Jako omluvu za pondělní zhoršenou dostupnost služeb dal všem zákazníkům poukaz v hodnotě 300 Kč na nákup telefonu nebo příslušenství.

    Ladislav Hagara | Komentářů: 8
    8.8. 05:55 | IT novinky

    Společnost OpenAI představila GPT-5 (YouTube).

    Ladislav Hagara | Komentářů: 2
    8.8. 05:00 | Nová verze

    Byla vydána (𝕏) červencová aktualizace aneb nová verze 1.103 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.103 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    7.8. 17:33 | IT novinky

    Americký prezident Donald Trump vyzval nového generálního ředitele firmy na výrobu čipů Intel, aby odstoupil. Prezident to zdůvodnil vazbami nového šéfa Lip-Bu Tana na čínské firmy.

    Ladislav Hagara | Komentářů: 10
    7.8. 16:55 | Nová verze

    Bylo vydáno Ubuntu 24.04.3 LTS, tj. třetí opravné vydání Ubuntu 24.04 LTS s kódovým názvem Noble Numbat. Přehled novinek a oprav na Discourse.

    Ladislav Hagara | Komentářů: 0
    7.8. 16:44 | Nová verze

    Byla vydána verze 1.89.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (46%)
     (20%)
     (4%)
     (5%)
     (3%)
     (1%)
     (1%)
     (18%)
    Celkem 319 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Dotaz: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    29.4.2018 12:31 hujer
    Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Přečteno: 255×

    Zdravím. Prvotní motivace pro tento dotaz je strojový překlad titulků ve formátu *.ass. Google umí jen *.srt a *.sub, pokud mu to naservíruju jako kompletní text, v překladu zmrší znakové sekvence.

    Takže mě napadlo (sekvence 0,0,0,, je před každým textem a nikde jinde):

     1. grep -oP '(?<=0,0,0,,).*' titulky.ass > vystup.txt

    2. Tím získám soubor, kde každá textová linka je na novém řádku. Ten můžu bez problémů prohnat překladačem.

    3. A teď musím přeloženými řádky nahradit ty původní. Pro každý řádek s 0,0,0,, v souboru titulky.ass nahraď to, co je za 0,0,0,, tím řádkem ze souboru vystup.txt.

    Pomohli byste mi prosím s třetím bodem? Díky.

    Odpovědi

    29.4.2018 12:53 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Zkusil bych AWK getline.
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 15:49 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Na getline jsem se díval, nepochopil jsem, jak jej v mém případě použít. Zatím umím přečíst řádek ve vystup a i pomocí sed to nahradit. Jenom to zatím ale nahrazuje úplně všechny, takže už mu jen nějak říct, aby nahradil pouze první výskyt po předchozím:

    cat vystup | while read -r line; do
    sed "s/0,0,0,,.*/0,0,0,,$line/" tit.ass > kontrolni
    done
    29.4.2018 17:15 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    awk '/0,0,0/{getline <"preklad.ass"} {print}' original.ass
    
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 19:00 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Díky. Tohle přepíše všechny řádky obsahující 0,0,0 na řádek z překladu. Je však potřeba zachovat původní řádek až po 0,0,0,, včetně a to za tím nahradit překladem. Např.

    originál:

    Dialogue: 0,0:00:07.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Simple original

    Dialogue: 0,0:00:09.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Two

    překlad:

    Jednoduchý originál

    Dva

    výsledek:

    Dialogue: 0,0:00:07.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Jednoduchý originál

    Dialogue: 0,0:00:09.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Dva

    29.4.2018 19:54 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Mohl jsi mi ten vzorek dat poslat rovnou, abych to měl na čem otestovat.
    awk '/0,0,0,,/{sub("0,0,0,,.*$", "0,0,0,,"); line=$0; getline <"preklad.ass"; $0=line $0;} {print}' original.ass
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 22:18 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Jo no. Chtěl jsem na to přijít, ale jak tak vidím, mám ve zpracování textu veliké mezery. Děkuji za to awk, funguje jak má. S malou úpravou jsem vytvořil skript, který všechny *.ass v dané složce přeloží pomocí Google translate na P-*.ass. Je nutné nainstalovat balík apt install translate-shell

    for file in *.ass; do
    grep -oP '(?<=,,).*' "$file" > vycuc.txt
    sed -i 's/\\N//g' vycuc.txt
    sed -i 's/^ *//' vycuc.txt
    trans sk:cs file://./vycuc.txt > preklad.txt
    awk '/,,/{sub(",,.*$", ",,"); line=$0; getline <"preklad.txt"; $0=line $0;} {print}' "$file" > "P-$file"
    done
    rm *.txt
    David Watzke avatar 29.4.2018 13:06 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Na to bych použil třeba python a procházel oba soubory po řádcích.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.