Portál AbcLinuxu, 1. května 2025 09:20

Universal Offline Translator (UOT)

23.3. 12:38 | Přečteno: 1336× | 2 | poslední úprava: 23.3. 12:40

Universal Offline Translator (UOT)
je nástroj príkazového riadku na preklad textov medzi jazykmi bez pripojenia na internet, založený na Argos Translate.

FUNKCIE INŠTALÁCIA Windows
git clone https://github.com/feckom/uot.git
cd uot
python -m venv venv
venv\Scripts\activate.bat
pip install -r requirements.txt
Linux / macOS
git clone https://github.com/feckom/uot.git
cd uot
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
POŽIADAVKY POUŽITIE

python uot.py [parametre] [text]

PARAMETRE
Parameter Popis
-il Vstupný jazyk (napr. en, sk)
-ol Výstupný jazyk (napr. sk, en)
-i Interaktívny režim (zobrazuje [INFO] logy)
-v Zobrazí verziu a informácie o autorovi
-im Inštaluje modely z Argos OpenTech indexu
PREMENNÉ PROSTREDIA
Premenná Popis
UOT_MODELS_DIR Vlastný adresár pre modely
PRÍKLADY Základný preklad
python uot.py -il en -ol sk Hello world
Preklad s výpisom informácií
python uot.py -il en -ol sk Hello world -i
Preklad zo stdin
echo "Hello world" | python uot.py -il en -ol sk
Inštalácia modelov z Argos indexu
python uot.py -im -i
Zobrazenie verzie
python uot.py -v
LICENCIA

MIT Licencia

       

Hodnocení: 100 %

        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Vložit další komentář

24.3. 15:31 kvr
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Odpovědět | Sbalit | Link | Blokovat | Admin
Umí to třeba pdf?
25.3. 14:22 PetebLazar | skóre: 34 | blog: l_eonardovo_odhodlani
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Nešlo by případnou neschopnost UOT číst strojově čitelné PDF odstranit např. zařazením python3-pdfminer do pipeline?
25.3. 20:25 kvr
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Ne úplně - typicky chceš přeložit PDF tak, jak je. Běžně bankovní výpisy apod, které mají výhodu v tom, že jde o krátké zprávy, které nerozbijí formátování. A nebo celé odstavce, které rozbijí formátování a musíš to upravit tak, aby to zůstalo přibližně stejné.

Transformace na text a následný překlad tak často nestačí.
26.3. 15:50 PetebLazar | skóre: 34 | blog: l_eonardovo_odhodlani
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Pokud budou výstupem jednotlivé samostatné textové elementy a ty se následně atomicky přeloží mohl by se asi jejich překlad použít k náhradě v PDF, na to jsou snad nástroje také. Prakticky s ohledem na často odlišnou délku originálu/překladu bych si od toho stějně moc nesliboval.
27.3. 05:10 kvr
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Pěkné, o tom jsem nevěděl. Kdysi jsem řešil PdfBox v Java, tam to asi taky jde, ale hledal jsem nějaké hotové řešení.

S tou délkou originálu bych si hlavu nelámal - typické použití bude bankovní výpisy apod. Samozřejmě na knížku bude potřeba něco chytřejšího, ale tam je obecně PDF nepoužitelné, bo je těžké rozlišit konec řádku a konec odstavce.
28.3. 10:08 PetebLazar | skóre: 34 | blog: l_eonardovo_odhodlani
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Nemají odstavce v beletrii na začátku odsazení a nekončí typicky tečkou na konci daleko před koncem řádku (před řádkem s odsazení)?

Pokud si vzpomínám tak u linotypu jsou mezery mezi slovy tvořeny typem ve tvaru klínu, takže když se vysází z liter řádek odstavce před jeho odlitím se na klíny mezer zatlačí tak, aby se pokud možno rovnoměrným zvětšením mezer mezi slovy docílilo zarovnaného textu obou stran bez dělení slov na konci řádku. U krátkých řádků na konci odstavců toho logicky nelze dostáhnout, ale takový výsledek je snad typograficky přípustný.

https://www.premocz.eu/cardfiles/card-premo/card-40/img/30bdaf977ed41ceb66219c70a9cf816b.jpg
28.3. 10:40 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
To je problém prasopsího formátu PDF.
28.3. 13:42 kvr
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
V češtině je to běžné, u anglického textu (aspoň amerického) ne. Přidej k tomu číslované a nečíslované seznamy, rozdělení slov a je z toho těžko detekovatelný chaos, nemluvě o header a footer na stránce. Je pravda, že většina PDF čteček se o to ani nesnaží (možná existují nějaké utility na spojení zkopírovaného textu - podívám se)... PDF je holt jenom výstupní papírový formát...
28.3. 16:59 Pavel Píša | skóre: 18 | blog: logic
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Odpovědět | Sbalit | Link | Blokovat | Admin
Podařilo se to někomu použít. Sám jsem trvale dostával hlášku, že adresář s modely neexistuje i při pokusu -im. Tak jsem přehodil
--- a/uot.py
+++ b/uot.py
@@ -267,9 +267,8 @@ def validate_language_code(code, available_languages):
 def main():
     global VERBOSE

-    available_languages = detect_available_languages()
-
     if len(sys.argv) == 1:
+        available_languages = detect_available_languages()
         print_help(available_languages)
         sys.exit(0)
Při -im se stáhlo 7.5G slovníků, nikoliv jen ty dva pro kombinaci, kterou jsem chtěl zkusit
python uot.py -im -il cs -ol en Ahoj
Nakonec jsem skončil
...
[ERROR] File not found (404): https://data.argosopentech.com/argospm/v1/translate-ur_en-1_9.argosmodel

Finished processing.

Total entries in index: 92
Packages found: 92
Packages downloaded: 0
Skipped invalid entries: 0
Packages skipped (already exist): 92
Při puštění bez -im končím na
[ERROR] Failed to install model 'translate-sq_en-1_9.argosmodel': module 'argostranslate.package' has no attribute 'install_from_pipe'
...
[ERROR] Failed to install model 'translate-cs_en-1_9_6.argosmodel': module 'argostranslate.package' has no attribute 'install_from_pipe'
...
[ERROR] Failed to install model 'translate-en_hi-1_1.argosmodel': module 'argostranslate.package' has no attribute 'install_from_pipe'
[ERROR] Failed to install model 'translate-en_cs-1_9_6.argosmodel': module 'argostranslate.package' has no attribute 'install_from_pipe'
[ERROR] Failed to install model 'translate-en_eo-1_5.argosmodel': module 'argostranslate.package' has no attribute 'install_from_pipe'
...
[ERROR] Failed to install model 'translate-tr_en-1_5.argosmodel': module 'argostranslate.package' has no attribute 'install_from_pipe'
[ERROR] Failed to install any models.
28.3. 17:26 Pavel Píša | skóre: 18 | blog: logic
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Tak (možná prasácky) vyřešeno

https://github.com/feckom/uot/pull/2

Obecně, bylo by pěkné, když je zadané -il a -ol tak na -im instalovat jen ty potřebné jazyky.
Michal Fecko avatar 28.3. 23:59 Michal Fecko | skóre: 31 | blog: Poznámkový blog
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Tak ono tie slovniky by malo logicky fakt asi sťahovať podľa toho čo chcem použiť. Ja som to tam hodil všetko. Mea culpa.
Michal Fecko avatar 29.3. 00:28 Michal Fecko | skóre: 31 | blog: Poznámkový blog
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Spravil som verziu 1.16 - opravil nejaké chyby, budem rád keď to otestujete. Ďakujem.
29.3. 17:07 Ja osobne
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Odpovědět | Sbalit | Link | Blokovat | Admin
Veľmi zaujimavé :)
(venv)python uot.py -il es -ol en -i Se denomina artes decorativas a todas aquellas actividades relacionadas con el arte o la artesanía destinadas a producir objetos con una finalidad a la vez utilitaria y ornamental. Son por lo general obras realizadas con una elaboración industrial o artesanal pero persiguiendo una cierta finalidad estética. El concepto es sinónimo de las llamadas artes aplicadas o artes industriales, también llamadas a veces artes menores en contraposición a las artes mayores o bellas artes. | python uot.py -il en -ol sk -i
[INFO] Looking for translation path: es → en
[INFO] Translating: 'Se denomina artes decorativas a todas aquellas actividades relacionadas con el arte o la artesanía destinadas a producir objetos con una finalidad a la vez utilitaria y ornamental. Son por lo general obras realizadas con una elaboración industrial o artesanal pero persiguiendo una cierta finalidad estética. El concepto es sinónimo de las llamadas artes aplicadas o artes industriales, también llamadas a veces artes menores en contraposición a las artes mayores o bellas artes.'
[INFO] Translation took 1.96 seconds, uses 605.8 MB RAM
[INFO] Looking for translation path: en → sk
[INFO] Translating: 'Decorative arts are known as all activities related to art or crafts intended to produce objects for both utilitarian and ornamental purposes. They are usually works made with an industrial or artisan production but pursuing a certain aesthetic purpose. The concept is synonymous with so-called applied arts or industrial arts, also sometimes called minor arts as opposed to major or fine arts.'
[INFO] Translation took 1.40 seconds, uses 380.1 MB RAM
Dekoratívne umenie je známe ako všetky činnosti súvisiace s umením alebo remeslami určené na výrobu predmetov na úžitkové aj okrasné účely. Zvyčajne sú to práce vyrobené s priemyselnou alebo remeselnou výrobou, ale sledujú určitý estetický účel. Koncept je synonymom takzvaného úžitkového umenia alebo priemyselného umenia, ktoré sa niekedy nazýva aj menej významné umenie na rozdiel od hlavného alebo výtvarného umenia.
30.3. 19:57 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)

Hm. Co je na tom zajímavého?

Osobně využívám pro automatické překlady on-line translator od google. Ne proto, že by byl nejlepší, ale proto že podporuje širokou škálu jazyků a nevyžaduje žádnou registraci. Podle mne jednoduše proto, že si to vybere jinak. Ale texty, u kterých mi opravdu záleží na porozumění, jsou překládané jinak. A to porovnáním automatického překladu do cílového jazyka jiných jazykových verzí. Ale pouze text, který ve všech případech dává stejný smysl, je základem pro korektora, aby ho upravil tak, aby to nepíchalo do očí. A je dokonce lepší, když korektor nezná originální text. Pokud ho zná, tak má mimoděk tendenci používat výrazy a jazykové obraty, které nejsou cílovému jazyku vlastní, aniž by si to uvědomoval.

V průběhu 90. let jsem spolupracoval s chlapíkem, který ve spolupráci s manželkou a ještě jedním přítelem přeložil několik knih do polštiny. Nebyl rodilý mluvčí, stejně jako já, ale ona a ten přítel ano. Jenže za ty roky přestali ty drobné jazykové nuance vnímat. A co hůř. Nechtěli si to připustit. Já samozřejmě tyhle jazykové „přešlapy” nevnímal, ale čtenáři bohužel ano. A výsledek na některé působil nejspíš jak první verze Blaskowitzovy vyhlášky na Pražany.

30.3. 21:15 Mladý komsomolec
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Karasku, chybels´nam tu, kluku zvedava!
31.3. 07:14 Radovan
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Nojo, ta druhá verze se mi vždycky líbila víc :-D
4.4. 13:53 karkar | skóre: 7 | blog: Kartrolling
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Dneska je dobrý si na pomoc zavolat nějakou AI. Pokud máš nějaký odstavec textu, hodíš mu ten google translator překlad (s správnýma termitama třeba) se žádostí o opravu angličtiny a povětšinou to vyplodí celkem pěkný anglický výstup.
Dobrý je to na mejly, podhodíš mu svůj čengliš výplod a on ti to opraví do slušný angličtiny.
4.4. 17:35 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Universal Offline Translator (UOT)
Až na to, že to jsou překlady ze slušné angličtiny, které nemají být čengliš, ani cucy z prstu GTP.

Založit nové vláknoNahoru

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.