abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 17:44 | Zajímavý článek

    Jak si zobrazit pomocí Chrome a na Chromiu založených webových prohlížečích stránky s neplatným certifikátem? Stačí napsat thisisunsafe.

    Ladislav Hagara | Komentářů: 0
    dnes 00:33 | Bezpečnostní upozornění

    V repozitáři AUR (Arch User Repository) linuxové distribuce Arch Linux byly nalezeny a odstraněny tři balíčky s malwarem. Jedná se o librewolf-fix-bin, firefox-patch-bin a zen-browser-patched-bin.

    Ladislav Hagara | Komentářů: 8
    dnes 00:22 | Komunita

    Dle plánu by Debian 13 s kódovým názvem Trixie měl vyjít v sobotu 9. srpna.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Komunita

    Vývoj linuxové distribuce Clear Linux (Wikipedie) vyvíjené společností Intel a optimalizováné pro jejich procesory byl oficiálně ukončen.

    Ladislav Hagara | Komentářů: 1
    18.7. 14:00 | Zajímavý článek

    Byl publikován aktuální přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie).

    Ladislav Hagara | Komentářů: 0
    18.7. 12:00 | Nová verze

    V programovacím jazyce Go naprogramovaná webová aplikace pro spolupráci na zdrojových kódech pomocí gitu Forgejo byla vydána ve verzi 12.0 (Mastodon). Forgejo je fork Gitei.

    Ladislav Hagara | Komentářů: 1
    17.7. 18:44 | Zajímavý článek

    Nová čísla časopisů od nakladatelství Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 155 (pdf) a Hello World 27 (pdf).

    Ladislav Hagara | Komentářů: 1
    17.7. 16:11 | Nová verze

    Hyprland, tj. kompozitor pro Wayland zaměřený na dláždění okny a zároveň grafické efekty, byl vydán ve verzi 0.50.0. Podrobný přehled novinek na GitHubu.

    Ladislav Hagara | Komentářů: 4
    17.7. 15:55 | Komunita

    Patrick Volkerding oznámil před dvaatřiceti lety vydání Slackware Linuxu 1.00. Slackware Linux byl tenkrát k dispozici na 3,5 palcových disketách. Základní systém byl na 13 disketách. Kdo chtěl grafiku, potřeboval dalších 11 disket. Slackware Linux 1.00 byl postaven na Linuxu .99pl11 Alpha, libc 4.4.1, g++ 2.4.5 a XFree86 1.3.

    Ladislav Hagara | Komentářů: 6
    16.7. 21:22 | IT novinky

    Ministerstvo pro místní rozvoj (MMR) jako první orgán státní správy v Česku spustilo takzvaný „bug bounty“ program pro odhalování bezpečnostních rizik a zranitelných míst ve svých informačních systémech. Za nalezení kritické zranitelnosti nabízí veřejnosti odměnu 1000 eur, v případě vysoké závažnosti je to 500 eur. Program se inspiruje přístupy běžnými v komerčním sektoru nebo ve veřejné sféře v zahraničí.

    Ladislav Hagara | Komentářů: 19
    Kolik tabů máte standardně otevřeno ve web prohlížeči?
     (22%)
     (19%)
     (4%)
     (7%)
     (4%)
     (7%)
     (4%)
     (33%)
    Celkem 27 hlasů
     Komentářů: 4, poslední dnes 16:33
    Rozcestník

    Dotaz: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    29.4.2018 12:31 hujer
    Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Přečteno: 254×

    Zdravím. Prvotní motivace pro tento dotaz je strojový překlad titulků ve formátu *.ass. Google umí jen *.srt a *.sub, pokud mu to naservíruju jako kompletní text, v překladu zmrší znakové sekvence.

    Takže mě napadlo (sekvence 0,0,0,, je před každým textem a nikde jinde):

     1. grep -oP '(?<=0,0,0,,).*' titulky.ass > vystup.txt

    2. Tím získám soubor, kde každá textová linka je na novém řádku. Ten můžu bez problémů prohnat překladačem.

    3. A teď musím přeloženými řádky nahradit ty původní. Pro každý řádek s 0,0,0,, v souboru titulky.ass nahraď to, co je za 0,0,0,, tím řádkem ze souboru vystup.txt.

    Pomohli byste mi prosím s třetím bodem? Díky.

    Odpovědi

    29.4.2018 12:53 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Zkusil bych AWK getline.
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 15:49 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Na getline jsem se díval, nepochopil jsem, jak jej v mém případě použít. Zatím umím přečíst řádek ve vystup a i pomocí sed to nahradit. Jenom to zatím ale nahrazuje úplně všechny, takže už mu jen nějak říct, aby nahradil pouze první výskyt po předchozím:

    cat vystup | while read -r line; do
    sed "s/0,0,0,,.*/0,0,0,,$line/" tit.ass > kontrolni
    done
    29.4.2018 17:15 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    awk '/0,0,0/{getline <"preklad.ass"} {print}' original.ass
    
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 19:00 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Díky. Tohle přepíše všechny řádky obsahující 0,0,0 na řádek z překladu. Je však potřeba zachovat původní řádek až po 0,0,0,, včetně a to za tím nahradit překladem. Např.

    originál:

    Dialogue: 0,0:00:07.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Simple original

    Dialogue: 0,0:00:09.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Two

    překlad:

    Jednoduchý originál

    Dva

    výsledek:

    Dialogue: 0,0:00:07.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Jednoduchý originál

    Dialogue: 0,0:00:09.50,0:00:09.90,film_Italics,Kaz,0,0,0,,Dva

    29.4.2018 19:54 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Mohl jsi mi ten vzorek dat poslat rovnou, abych to měl na čem otestovat.
    awk '/0,0,0,,/{sub("0,0,0,,.*$", "0,0,0,,"); line=$0; getline <"preklad.ass"; $0=line $0;} {print}' original.ass
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    29.4.2018 22:18 hujer
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass

    Jo no. Chtěl jsem na to přijít, ale jak tak vidím, mám ve zpracování textu veliké mezery. Děkuji za to awk, funguje jak má. S malou úpravou jsem vytvořil skript, který všechny *.ass v dané složce přeloží pomocí Google translate na P-*.ass. Je nutné nainstalovat balík apt install translate-shell

    for file in *.ass; do
    grep -oP '(?<=,,).*' "$file" > vycuc.txt
    sed -i 's/\\N//g' vycuc.txt
    sed -i 's/^ *//' vycuc.txt
    trans sk:cs file://./vycuc.txt > preklad.txt
    awk '/,,/{sub(",,.*$", ",,"); line=$0; getline <"preklad.txt"; $0=line $0;} {print}' "$file" > "P-$file"
    done
    rm *.txt
    David Watzke avatar 29.4.2018 13:06 David Watzke | skóre: 74 | blog: Blog... | Praha
    Rozbalit Rozbalit vše Re: Nahrazení části řádku v souboru řádkem z jiného souboru, aneb řešení strojového překladu *.ass
    Na to bych použil třeba python a procházel oba soubory po řádcích.
    “Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.