abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 18:00 | Nová verze

    Byla vydána (Mastodon, 𝕏) nová stabilní verze 2.0 otevřeného operačního systému pro chytré hodinky AsteroidOS (Wikipedie). Přehled novinek v oznámení o vydání a na YouTube.

    Ladislav Hagara | Komentářů: 1
    dnes 16:00 | Zajímavý software

    WoWee je open-source klient pro MMORPG hru World of Warcraft, kompatibilní se základní verzí a rozšířeními The Burning Crusade a Wrath of the Lich King. Klient je napsaný v C++ a využívá vlastní OpenGL renderer, pro provoz vyžaduje modely, grafiku, hudbu, zvuky a další assety z originální kopie hry od Blizzardu. Zdrojový kód je na GitHubu, dostupný pod licencí MIT.

    NUKE GAZA! 🎆 | Komentářů: 3
    dnes 13:33 | IT novinky

    Byl představen ICT Supply Chain Security Toolbox, společný nezávazný rámec EU pro posuzování a snižování kybernetických bezpečnostních rizik v ICT dodavatelských řetězcích. Toolbox identifikuje možné rizikové scénáře ovlivňující ICT dodavatelské řetězce a na jejich podkladě nabízí koordinovaná doporučení k hodnocení a mitigaci rizik. Doporučení se dotýkají mj. podpory multi-vendor strategií a snižování závislostí na vysoce

    … více »
    Ladislav Hagara | Komentářů: 4
    dnes 12:22 | Humor

    Nizozemský ministr obrany Gijs Tuinman prohlásil, že je možné stíhací letouny F-35 'jailbreaknout stejně jako iPhony', tedy upravit jejich software bez souhlasu USA nebo spolupráce s výrobcem Lockheed Martin. Tento výrok zazněl v rozhovoru na BNR Nieuwsradio, kde Tuinman naznačil, že evropské země by mohly potřebovat větší nezávislost na americké technologii. Jak by bylo jailbreak možné technicky provést pan ministr nijak nespecifikoval, nicméně je známé, že izraelské letectvo ve svých modifikovaných stíhačkách F-35 používá vlastní software.

    NUKE GAZA! 🎆 | Komentářů: 10
    dnes 06:00 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 162 (pdf).

    Ladislav Hagara | Komentářů: 0
    dnes 05:55 | IT novinky

    Sdružení CZ.NIC, správce české národní domény, zveřejnilo Domain Report za rok 2025 s klíčovými daty o vývoji domény .CZ. Na konci roku 2025 bylo v registru české národní domény celkem 1 515 860 s koncovkou .CZ. Průměrně bylo měsíčně zaregistrováno 16 222 domén, přičemž nejvíce registrací proběhlo v lednu (18 722) a nejméně pak v červnu (14 559). Podíl domén zabezpečených pomocí technologie DNSSEC se po několika letech stagnace výrazně

    … více »
    Ladislav Hagara | Komentářů: 9
    včera 18:33 | IT novinky

    Google představil telefon Pixel 10a. S funkci Satelitní SOS, která vás spojí se záchrannými složkami i v místech bez signálu Wi-Fi nebo mobilní sítě. Cena telefonu je od 13 290 Kč.

    Ladislav Hagara | Komentářů: 7
    včera 16:22 | Komunita

    Byl publikován přehled dění a novinek z vývoje Asahi Linuxu, tj. Linuxu pro Apple Silicon. Fedora 43 Asahi Remix s KDE Plasma už funguje na M3. Zatím ale bez GPU akcelerace. Vývojáře lze podpořit na Open Collective a GitHub Sponsors.

    Ladislav Hagara | Komentářů: 0
    včera 14:00 | IT novinky

    Red Hat představil nový nástroj Digital Sovereignty Readiness Assessment (GitHub), který organizacím umožní vyhodnotit jejich aktuální schopnosti v oblasti digitální suverenity a nastavit strategii pro nezávislé a bezpečné řízení IT prostředí.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Zajímavý software

    BarraCUDA je neoficiální open-source CUDA kompilátor, ale pro grafické karty AMD (CUDA je proprietární technologie společnosti NVIDIA). BarraCUDA dokáže přeložit zdrojové *.cu soubory (prakticky C/C++) přímo do strojového kódu mikroarchitektury GFX11 a vytvořit tak ELF *.hsaco binární soubory, spustitelné na grafické kartě AMD. Zdrojový kód (převážně C99) je k dispozici na GitHubu, pod licencí Apache-2.0.

    NUKE GAZA! 🎆 | Komentářů: 1
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (6%)
     (0%)
     (11%)
     (27%)
     (3%)
     (4%)
     (2%)
     (12%)
     (27%)
    Celkem 907 hlasů
     Komentářů: 25, poslední 3.2. 19:50
    Rozcestník

    Dotaz: Zjištění kódování souboru

    15.9.2015 12:28 Petr
    Zjištění kódování souboru
    Přečteno: 2025×
    Dobrý den, existuje spolehlivý nástroj v linuxu na zjištění v jakém kódování je soubor uložen. Co se týče zjištění našel jsem nejoblíbenější příkaz
    file -bi <filename>
    
    Tak jsem si vytvořil ve windows php soubor v pspadu s kováním cp1250. Uložil jsem ho a zavolal tento příkaz. Odpověd je: text/x-php; charset=unknown-8bit To mě tedy moc neuspokojuje. Představovl bych si že odpověd bude cp1250. Proč to pspad dokáže a příkaz "file" nikoliv? A existuje nástroj který to dokáže? Díky za rady.

    Řešení dotazu:


    Odpovědi

    15.9.2015 12:38 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Spolehlivý příkaz neexistuje z jednoho důvodu textový soubor v sobě nenese žádnou informaci o kodování.

    Kodování se hádá podle slov z diakritikou zda dávají smysl a zda jsou tam platné znaky z nějakého kodování.
    15.9.2015 13:23 Petr
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    A jak to ten pspad teda dělá že když uložím i třeba prázdný soubor a pak ho znovu otevřu tak je tam to kódování, které jsem tam nastavil. On si tam ukládá nějakou meta informaci nebo co? Díky
    15.9.2015 14:10 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    To já nevím windows soubory nepoužívám takže nevím co tam ukládají, ale pak to asi nebude textový soubor.
    15.9.2015 14:48 R
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    V prazdnom subore sa dost tazko ukladaju nejake informacie, takze jedine vysvetlenie je: ten editor si niekam mimo uklada informacie o otvorenych suboroch a nastavenych kodovaniach.
    Josef Kufner avatar 15.9.2015 15:04 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    ... a poslední poloze kurzoru.
    Hello world ! Segmentation fault (core dumped)
    15.9.2015 16:37 tydyt
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Ty taky děláš v Redhatu?
    Josef Kufner avatar 15.9.2015 17:11 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Ne, proč?
    Hello world ! Segmentation fault (core dumped)
    15.9.2015 16:33 tydyt
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Tak proč děláš hned chytrýho, když to sám nevíš! že to není viditelně vidět po otevření třeba ve vi nebo Emacsu? To je tím, že asi není sw pro Linux, který umí zobrazit informaci ze sektoru na disku a třeba i upravit jedinej bit na něm. A kdybys náhodou o nějakém věděl, pak nechápu tvoji odpověď.
    15.9.2015 18:22 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Už jsem odpověděl jak se to dělá - prostě to hádá podle toho jaké znaky se v souboru vyskytují.

    Jinak speciální editory si můžou různé údaje někam ukládat, z prázdného souboru nelze určit typ kodování pokud to není někde uložené a nebo pokud ten editor nepoužije kodování co bylo naposledy nebo co používá default OS a pod.....

    Aby jsi to zjistil jak to pspad dělá tak koukni do jeho zdrojáků.
    16.9.2015 09:02 leste
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Už jsem odpověděl jak se to dělá - prostě to hádá podle toho jaké znaky se v souboru vyskytují.

    Přesně tak to dělá, prohlíží prvních nevímkolik (zapomněl jsem) znaků a podle toho hádá.

    Na začátek všech souborů psaných v pspadu vrážím poznámku obsahující žš, abych mu to usnadnil. Vrazil bych tam i ť, ale kombinace vok+pspad mi pak nabídne nějakou blbost s velkými písmeny.

    Jendа avatar 16.9.2015 21:35 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    To je tím, že asi není sw pro Linux, který umí zobrazit informaci ze sektoru na disku a třeba i upravit jedinej bit na něm.
    dd + blhexflip
    15.9.2015 17:25 j
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Dela to presne tak, ze to hada. Co na tom nechapes? Algoritmus hadani muze byt slusne uspesny, ale neni to proste 100%. V utf8 txt souboru muze (ale nemusi) byt Byte order mark. Jinak se to dela tak, ze proste vemes ASCII znaky, a vemes ostatni nonASCII, a udelas analyzu. Pokud je text dostatecne dlouhy a obsahuje pokud mozno vsechny hackocarkove znaky, tak se da s pomerne slusnou jistotou urcit, o jake kodovani jde. Predevsim proto, ze ac jsou nektere znaky kodovany trebas stejne, tak nektere jsou kodovany jinak => pokud najdu cojavim 9E ... tak sem na dobry ceste k tomu, rict, ze je to win-1250.
    15.9.2015 16:22 tydyt
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Kodování se hádá podle slov z diakritikou zda dávají smysl a zda jsou tam platné znaky z nějakého kodování.
    zdroj?
    Josef Kufner avatar 15.9.2015 17:13 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Viz zdrojáky programů file a enca.
    Hello world ! Segmentation fault (core dumped)
    Josef Kufner avatar 15.9.2015 12:39 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Zkus tam nakopírovat kus českého textu a uvidíš, jestli to trefí líp.
    Hello world ! Segmentation fault (core dumped)
    15.9.2015 12:47 blondak | skóre: 36 | blog: Blondak | Čáslav
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Zkus enca.
    Každý problém ma své logické, snadno pochopitelné nesprávné řešení.
    15.9.2015 12:54 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Enca je docela úspěšná, pokud není text příliš krátký:
    $ cat /etc/motd 
    Dobrý den, existuje spolehlivý nástroj v linuxu na zjištění v jakém kódování je soubor uložen? Co se týče zjištění našel jsem nejoblíbenější příkaz.
    
    $ enca -L czech /etc/motd 
    Universal transformation format 8 bits; UTF-8
    
    -- OldFrog
    15.9.2015 14:46 R
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    CP1250 v PHP je brutalna prasacina. Zial, niektori ludia dodnes taketo veci robia.
    15.9.2015 16:07 Vasek
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru

    Taky nechápu lidi, kteří v době znakové sady Unicode, resp. v jejím nejčastěji používaném kódování UTF-8, stále ještě použivájí takovouto "prasečinu.

    15.9.2015 16:36 tydyt
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Další pitomec! Na to se nikdo neptá!
    15.9.2015 16:40 Vasek
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru

    To už ani nemůže člověk napsat vlastní názor, aniž by byl nazván pitomcem?

    15.9.2015 18:14 Peter Golis | skóre: 65 | blog: Bežné záležitosti | Bratislava
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Toho si nevšímaj, to je miestne zvieratko pavelka, ňupáč a stoinýchmien. Toho si tu pestujú cenzori ako domáce zvieratko, aby mohli vykazovať nejakú činnosť. Obvykle inkllinujúcu k nule.
    16.9.2015 11:55 Kit | skóre: 46 | Brno
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    Zjišťování kódování českého textu je spíše hádáním.
    $ echo "příšerně žluťoučký kůň úpěl ďábelské ódy" >text
    $ file -bi text
    text/plain; charset=utf-8
    
    $ recode u8..1250 text
    $ file -bi text
    text/plain; charset=unknown-8bit
    
    $ recode 1250..l2 text
    $ file -bi text
    text/plain; charset=iso-8859-1
    
    $ recode l2..UTF-16 text
    $ file -bi text
    text/plain; charset=utf-16be
    
    Jak je vidět, příkaz file spolehlivě detekuje pouze Unicode. Dnes už vlastně ostatní kódování postrádají na významu.

    Poslední dobou do PHP pro jistotu české texty vůbec nedávám. Pouze do šablon - tam je při vynechání deklarace automaticky předpokládáno UTF-8 či UTF-16 s automatickou detekcí. A protože UTF-8 používám nativně, vůbec to nemusím řešit.
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    16.9.2015 12:11 neklan | skóre: 11 | blog: neklan_no_clan
    Rozbalit Rozbalit vše Re: Zjištění kódování souboru
    pokud predpokladas jazyk pomuze enca
    cat cp1250file.txt | enca -L czech -g -c -x UTF-8
    
    prevede cesky text do UTF-8.

    nedavno jsem se prehraboval ve starych archivech pdb knizek a tohle mi pomohlo. zjevne to nemusi fungovat vzdycky. nektere soubory jsou dojebane totalne, napr. obsahuji vice ruznych kodovani, kdy je ruzni lide otevirali a ukladali jen casti a na zbytek kaslali. V tom pripade uz asi jedine rucne.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.