abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 13:44 | Nová verze

    Byla vydána beta verze Linux Mintu 22.2 s kódovým jménem Zara. Podrobnosti v přehledu novinek a poznámkách k vydání. Vypíchnout lze novou XApp aplikaci Fingwit pro autentizaci pomocí otisků prstů nebo vlastní fork knihovny libAdwaita s názvem libAdapta podporující grafická témata. Linux Mint 22.2 bude podporován do roku 2029.

    Ladislav Hagara | Komentářů: 0
    včera 13:00 | IT novinky

    Provozovatel internetové encyklopedie Wikipedie prohrál v Británii soudní spor týkající se některých částí nového zákona o on-line bezpečnosti. Soud ale varoval britského regulátora Ofcom i odpovědné ministerstvo před zaváděním přílišných omezení. Legislativa zpřísňuje požadavky na on-line platformy, ale zároveň čelí kritice za možné omezování svobody slova. Společnost Wikimedia Foundation, která je zodpovědná za fungování

    … více »
    Ladislav Hagara | Komentářů: 1
    včera 12:55 | Nová verze

    Byla vydána verze 2.0.0 nástroje pro synchronizaci dat mezi vícero počítači bez centrálního serveru Syncthing (Wikipedie). Přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 2
    včera 12:33 | IT novinky

    Americký prezident Donald Trump se v pondělí osobně setkal s generálním ředitelem firmy na výrobu čipů Intel Lip-Bu Tanem. Šéfa podniku označil za úspěšného, informují agentury. Ještě před týdnem ho přitom ostře kritizoval a požadoval jeho okamžitý odchod. Akcie Intelu v reakci na schůzku po oficiálním uzavření trhu zpevnily asi o tři procenta.

    Ladislav Hagara | Komentářů: 9
    11.8. 04:55 | Nová verze

    Byl vydán Debian GNU/Hurd 2025. Jedná se o port Debianu s jádrem Hurd místo obvyklého Linuxu.

    Ladislav Hagara | Komentářů: 6
    11.8. 02:44 | Komunita

    V sobotu 9. srpna uplynulo přesně 20 let od oznámení projektu openSUSE na konferenci LinuxWorld v San Franciscu. Pokuď máte archivní nebo nějakým způsobem zajímavé fotky s openSUSE, můžete se o ně s námi podělit.

    lkocman | Komentářů: 5
    9.8. 21:11 | Nová verze

    Byl vydán Debian 13 s kódovým názvem Trixie. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 8
    9.8. 15:55 | Zajímavý software

    WLED je open-source firmware pro ESP8266/ESP32, který umožňuje Wi-Fi ovládání adresovatelných LED pásků se stovkami efektů, synchronizací, audioreaktivním módem a Home-Assistant integrací. Je založen na Arduino frameworku.

    Indiánský lotr | Komentářů: 0
    8.8. 15:33 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.8.

    Ladislav Hagara | Komentářů: 11
    8.8. 14:22 | IT novinky

    Herní studio Hangar 13 vydalo novou Mafii. Mafia: Domovina je zasazena do krutého sicilského podsvětí na začátku 20. století. Na ProtonDB je zatím bez záznamu.

    Ladislav Hagara | Komentářů: 1
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (48%)
     (20%)
     (4%)
     (5%)
     (3%)
     (1%)
     (1%)
     (18%)
    Celkem 345 hlasů
     Komentářů: 23, poslední 4.8. 13:01
    Rozcestník

    Dotaz: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    29.4.2018 12:31 hujer
    Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Přečteno: 255×

    Zdravím. Prvotní motivace pro tento dotaz je strojový překlad titulků ve formátu *.ass. Google umí jen *.srt a *.sub, pokud mu to naservíruju jako kompletní text, v překladu zmrší znakové sekvence.

    Takže mě napadlo (sekvence 0,0,0,, je před každým textem a nikde jinde):

     1. grep -oP '(?<=0,0,0,,).*' titulky.ass > vystup.txt

    2. Tím získám soubor, kde každá textová linka je na novém řádku. Ten můžu bez problémů prohnat překladačem.

    3. A teď musím přeloženými řádky nahradit ty původní. Pro každý řádek s 0,0,0,, v souboru titulky.ass nahraď to, co je za 0,0,0,, tím řádkem ze souboru vystup.txt.

    Pomohli byste mi prosím s třetím bodem? Díky.

    Odpovědi

    29.4.2018 12:53 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Zkusil bych AWK getline.
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 15:49 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Na getline jsem se díval, nepochopil jsem, jak jej v mém případě použít. Zatím umím přečíst řádek ve vystup a i pomocí sed to nahradit. Jenom to zatím ale nahrazuje úplně všechny, takže už mu jen nějak říct, aby nahradil pouze první výskyt po předchozím:

    cat vystup | while read -r line; do
    sed "s/0,0,0,,.*/0,0,0,,$line/" tit.ass > kontrolni
    done
    29.4.2018 17:15 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    awk '/0,0,0/{getline <"preklad.ass"} {print}' original.ass
    
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 19:00 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Díky. Tohle přepíše všechny řádky obsahující 0,0,0 na řádek z překladu. Je však potřeba zachovat původní řádek až po 0,0,0,, včetně a to za tím nahradit překladem. Např.

    originál:

    Dialogue: 0,0:00:07.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Simple original

    Dialogue: 0,0:00:09.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Two

    překlad:

    Jednoduchý originál

    Dva

    výsledek:

    Dialogue: 0,0:00:07.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Jednoduchý originál

    Dialogue: 0,0:00:09.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Dva

    29.4.2018 19:54 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Mohl jsi mi ten vzorek dat poslat rovnou, abych to měl na čem otestovat.
    awk '/0,0,0,,/{sub("0,0,0,,.*$", "0,0,0,,"); line=$0; getline <"preklad.ass"; $0=line $0;} {print}' original.ass
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 22:18 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Jo no. Chtěl jsem na to přijít, ale jak tak vidím, mám ve zpracování textu veliké mezery. Děkuji za to awk, funguje jak má. S malou úpravou jsem vytvořil skript, který všechny *.ass v dané složce přeloží pomocí Google translate na P-*.ass. Je nutné nainstalovat balík apt install translate-shell

    for file in *.ass; do
    grep -oP '(?<=,,).*' "$file" > vycuc.txt
    sed -i 's/\\N//g' vycuc.txt
    sed -i 's/^ *//' vycuc.txt
    trans sk:cs file://./vycuc.txt > preklad.txt
    awk '/,,/{sub(",,.*$", ",,"); line=$0; getline <"preklad.txt"; $0=line $0;} {print}' "$file" > "P-$file"
    done
    rm *.txt
    David Watzke avatar 29.4.2018 13:06 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Na to bych použil třeba python a procházel oba soubory po řádcích.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.