Tým Qwen (Alibaba Cloud) uvolnil jako open-source své modely Qwen3‑TTS pro převádění textu na řeč. Sada obsahuje modely VoiceDesign (tvorba hlasu dle popisu), CustomVoice (stylizace) a Base (klonování hlasu). Modely podporují syntézu deseti různých jazyků (čeština a slovenština chybí). Stránka projektu na GitHubu, natrénované modely jsou dostupné na Hugging Face. Distribuováno pod licencí Apache‑2.0.
Svobodný citační manažer Zotero (Wikipedie, GitHub) byl vydán v nové major verzi 8. Přehled novinek v příspěvku na blogu.
Byla vydána verze 1.93.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.
Svobodný operační systém ReactOS (Wikipedie), jehož cílem je kompletní binární kompatibilita s aplikacemi a ovladači pro Windows, slaví 30. narozeniny.
Společnost Raspberry Pi má nově v nabídce flash disky Raspberry Pi Flash Drive: 128 GB za 30 dolarů a 256 GB za 55 dolarů.
Technologie Skip pro multiplatformní mobilní vývoj, která umožňuje vývojářům vytvářet iOS a Android aplikace z jediné Swift a SwiftUI kódové základny, se s vydáním verze 1.7 stala open source.
Na GitHubu byl zveřejněn algoritmus "Pro vás" sociální sítě 𝕏.
Byla vydána nová major verze 34.0.0 webového prohlížeče Pale Moon (Wikipedie) vycházejícího z Firefoxu. Přehled novinek v poznámkách k vydání.
Win8DE je desktopové prostředí pro Wayland, inspirované nechvalně proslulým uživatelským rozhraním Metro z Windows 8. Nabízí dlaždicové rozhraní s velkými tlačítky a jednoduchou navigací, optimalizované pro dotyková zařízení. Cílem projektu je přetvořit design operačního systému Windows 8 do funkčního a minimalistického rozhraní vhodného pro každodenní použití na Linuxu.
Laboratoře CZ.NIC vydaly Datovku 4.28.0 a Mobilní Datovku 2.6.0. Hlavní novinkou je ukládání rozpracovaných datových zpráv do konceptů. Datovka je svobodné multiplatformní aplikace pro přístup k datovým schránkám a k trvalému uchovávání datových zpráv v lokální databázi.
Zdar a sílu,
řeším následující problém: Mám program v Pythonu 3, který mj. potřebuje načíst nějaká data z CSV souboru. Python 3 normálně používá pro řetězce Unicode a zjevně vyžaduje UTF-8 (u souborů) na vstupu (když jsem mu předhodil soubor s diakritikou v kódování windows-1250, zařval, že chce utf8). Na několika linuxových mašinách s Pythonem 3.1.3 a UTF-8 nebyl problém se vstupním souborem v UTF-8, ale na MS Windows Vista prý řve:
Traceback (most recent call last): File "tui.py", line 91, in <module> deck.csv_import(filename) File "D:\zima\backend.py", line 83, in csv_import for row in reader: File "c:\Python31\lib\encodings\cp1250.py", line 23, in decode return codecs.charmap_decode(input,self.errors,decoding_table)[0] UnicodeDecodeError: 'charmap' codec can't decode byte 0x88 in position 118: character maps to <undefined>
Ta (ne)zajímavá část programu je jednoduché:
reader = csv.reader(open(filename)) for row in reader: self.add(Card(row[0], row[1]))
Dělám někde chybu já? Nebo je chyba v Pythonu/jehoVistách? Jak zařídit nějakou použitelnou automatickou detekci kódování?
Řešení dotazu:
open lze předat parametr encoding, asi by tedy pomohlo něco takového: csv.reader(open(filename, 'utf8'))
Automatická detekce není stoprocentní, ale můžeš zkusit chardet. Asi jediné kódování, které lze přesně detekovat, je UTF-16, protože text v UTF-16 by měl na začátku obsahovat BOM (byte order mark).
python 3 nevyzaduje utf-8, on ho pouze predpoklada .... a jak bylo receno vyse funkce open() ma parametr encoding ...
a dobre je se podivat obcas zde : http://docs.python.org/py3k/
a zapomnel sem dodat ze widle jsou vnitrne UTF-16 a;e kvuli spetne kompaktibilite ukladaji vse v narodnim WIN kodovani .. --> u CZ varianty WIN-1250 ...
Tiskni
Sdílej: