abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:11 | IT novinky

    Společnost Proton AG stojící za Proton Mailem a dalšími službami přidala do svého portfolia online tabulky Proton Sheets v Proton Drive.

    Ladislav Hagara | Komentářů: 0
    včera 15:55 | Komunita

    O víkendu (15:00 až 23:00) probíha EmacsConf 2025, tj. online konference vývojářů a uživatelů editoru GNU Emacs. Sledovat ji lze na stránkách konference. Záznamy budou k dispozici přímo z programu.

    Ladislav Hagara | Komentářů: 0
    včera 15:44 | Komunita

    Provozovatel internetové encyklopedie Wikipedia jedná s velkými technologickými firmami o uzavření dohod podobných té, kterou má s Googlem. Snaží se tak zpeněžit rostoucí závislost firem zabývajících se umělou inteligencí (AI) na svém obsahu. Firmy využívají volně dostupná data z Wikipedie k trénování jazykových modelů, což zvyšuje náklady, které musí nezisková organizace provozující Wikipedii sama nést. Automatické programy

    … více »
    Ladislav Hagara | Komentářů: 19
    včera 15:22 | IT novinky

    Evropská komise obvinila síť 𝕏 z porušení unijních pravidel, konkrétně nařízení Evropské unie o digitálních službách (DSA). Vyměřila jí za to pokutu 120 milionů eur (2,9 miliardy Kč). Pokuta je podle názoru amerického ministra zahraničí útokem zahraničních vlád na americký lid. K pokutě se vyjádřil i americký viceprezident: „EU by měla podporovat svobodu projevu, a ne útočit na americké společnosti kvůli nesmyslům“.

    Ladislav Hagara | Komentářů: 14
    5.12. 17:11 | IT novinky

    Společnost Jolla spustila kampaň na podporu svého nového telefonu Jolla Phone se Sailfish OS. Dodání je plánováno na první polovinu příštího roku. Pokud bude alespoň 2 000 zájemců. Záloha na telefon je 99 €. Cena telefonu v rámci kampaně je 499 €.

    Ladislav Hagara | Komentářů: 30
    5.12. 15:11 | IT novinky

    Netflix kupuje Warner Bros. včetně jejích filmových a televizních studií HBO Max a HBO. Za 72 miliard dolarů (asi 1,5 bilionu korun).

    Ladislav Hagara | Komentářů: 2
    5.12. 14:11 | IT novinky

    V Las Vegas dnes končí pětidenní konference AWS re:Invent 2025. Společnost Amazon Web Services (AWS) na ní představila celou řadu novinek. Vypíchnout lze 192jádrový CPU Graviton5 nebo AI chip Trainium3.

    Ladislav Hagara | Komentářů: 0
    5.12. 00:33 | Nová verze

    Firma Proxmox vydala novou serverovou distribuci Datacenter Manager ve verzi 1.0 (poznámky k vydání). Podobně jako Virtual Environment, Mail Gateway či Backup Server je založená na Debianu, k němuž přidává integraci ZFS, webové administrační rozhraní a další. Datacenter Manager je určený ke správě instalací právě ostatních distribucí Proxmox.

    |🇵🇸 | Komentářů: 12
    4.12. 23:44 | Nová verze

    Byla vydána nová verze 2.4.66 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 5 bezpečnostních chyb.

    Ladislav Hagara | Komentářů: 0
    4.12. 14:00 | IT novinky

    Programovací jazyk JavaScript (Wikipedie) dnes slaví 30 let od svého oficiálního představení 4. prosince 1995.

    Ladislav Hagara | Komentářů: 1
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (48%)
     (19%)
     (17%)
     (22%)
     (15%)
     (24%)
     (16%)
     (18%)
    Celkem 437 hlasů
     Komentářů: 18, poslední 2.12. 18:34
    Rozcestník

    Dotaz: Python 3 a kódování

    |🇵🇸 avatar 11.2.2011 20:23 |🇵🇸 | skóre: 93 | blog:
    Python 3 a kódování
    Přečteno: 4548×

    Zdar a sílu,

    řeším následující problém: Mám program v Pythonu 3, který mj. potřebuje načíst nějaká data z CSV souboru. Python 3 normálně používá pro řetězce Unicode a zjevně vyžaduje UTF-8 (u souborů) na vstupu (když jsem mu předhodil soubor s diakritikou v kódování windows-1250, zařval, že chce utf8). Na několika linuxových mašinách s Pythonem 3.1.3 a UTF-8 nebyl problém se vstupním souborem v UTF-8, ale na MS Windows Vista prý řve:

    Traceback (most recent call last):
     File "tui.py", line 91, in <module>
       deck.csv_import(filename)
     File "D:\zima\backend.py", line 83, in csv_import
       for row in reader:
     File "c:\Python31\lib\encodings\cp1250.py", line 23, in decode
       return codecs.charmap_decode(input,self.errors,decoding_table)[0]
    UnicodeDecodeError: 'charmap' codec can't decode byte 0x88 in position 118: character maps to <undefined>

    Ta (ne)zajímavá část programu je jednoduché:

    reader = csv.reader(open(filename))
    for row in reader:
      self.add(Card(row[0], row[1]))

    Dělám někde chybu já? Nebo je chyba v Pythonu/jehoVistách? Jak zařídit nějakou použitelnou automatickou detekci kódování?

    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána

    Řešení dotazu:


    Odpovědi

    |🇵🇸 avatar 11.2.2011 20:30 |🇵🇸 | skóre: 93 | blog:
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    Koukám, jak to řešit v Pythonu 2, jenže to mi ohledně Pythonu 3 nepomůže, tam prý problém není.
    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána
    Řešení 2× (mimi.vx, pavlix)
    11.2.2011 21:33 Messa | skóre: 39 | blog: Messa
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    Funkci open lze předat parametr encoding, asi by tedy pomohlo něco takového: csv.reader(open(filename, 'utf8'))

    Automatická detekce není stoprocentní, ale můžeš zkusit chardet. Asi jediné kódování, které lze přesně detekovat, je UTF-16, protože text v UTF-16 by měl na začátku obsahovat BOM (byte order mark).
    Řešení 1× (mimi.vx)
    11.2.2011 21:44 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
    Rozbalit Rozbalit vše Re: Python 3 a kódování

    python 3 nevyzaduje utf-8, on ho pouze predpoklada .... a jak bylo receno vyse funkce open() ma parametr encoding ...

     

    a dobre je se podivat obcas zde : http://docs.python.org/py3k/

    USE="-gnome -kde";turris
    11.2.2011 22:11 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
    Rozbalit Rozbalit vše Re: Python 3 a kódování

    a zapomnel sem dodat ze widle jsou vnitrne UTF-16 a;e kvuli spetne kompaktibilite ukladaji vse v narodnim WIN kodovani .. --> u CZ varianty WIN-1250 ...

    USE="-gnome -kde";turris
    |🇵🇸 avatar 13.2.2011 00:59 |🇵🇸 | skóre: 93 | blog:
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    Prosimtě, co je to kompaktibilita?

    Jestliže tam UTF-8 je a on ho předpokládá, ale spadne na tom, že se snaží ho interpretovat jako windows-1250, je někde chyba. Kódování mu vnutit můžu, ale nebude se pak bránit (odpovím si sám: bude), když si uživatel ten soubor s daty upraví nebo rovnou vytvoří na wokenících s windows-1250...?

    Jinak do dokumentace jsem se koukal, ale na špatný roh.
    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána
    pavlix avatar 11.3.2017 15:28 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    Zrovna jsem na stejný problém narazil na školení. Není pravda, že Python obecně vyžaduje či předpokládá UTF-8, naopak se snaží použít systémové kódování. To je na Windows trochu problém, protože nová textová API fungují na Windows obecně v Unicode (dekódování řeší systém), zatímco v Pythonu až po 3.5 se používá staré API a tím pádem se může dít ledacos. Řešením je podle mě si kódování explicitně říct, explicitně překódovat binární string nebo používat Python 3.6.

    Co se týče verze 3.6, nezkoušel jsem to, ale píše se o tom v changelogu, který se odkazuje na následující dokumenty.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    k3dAR avatar 12.3.2017 00:01 k3dAR | skóre: 63
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    mam tai takovej pocit, ze v dobe zalozeni tohoto vlakna v unoru 2011 jeste python 3.6 nebyl ;)
    Python 3.6 was released on December 23, 2016
    porad nemam telo, ale uz mam hlavu... nobody
    pavlix avatar 12.3.2017 10:42 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    Na tom tak úplně nesejde, jestli byl nebo nebyl, spíš by mě zajímalo, proč mi ábíčko tenhle dotaz vůbec nabízelo.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    xxxs avatar 12.3.2017 19:14 xxxs | skóre: 25 | blog: vetvicky
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    mozno je to vlastnost, obcas sa objavia na vrchu stare problemy.

    toto sa ti nezobrazilo?: "Pozor, chystáte se komentovat 2220 dní starý dotaz. Pokud se nechystáte vložit či doplnit řešení tohoto dotazu, ale naopak se chcete na něco zeptat, položte raději nový dotaz."
    pavlix avatar 12.3.2017 20:37 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Python 3 a kódování
    Nezobrazilo kupodivu. Zobrazuje se mi to až teď. :D Asi skvrny na slunci.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.