abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 21:22 | Nová verze

    Bylo vydáno Eclipse IDE 2025-09 aneb Eclipse 4.37. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.

    Ladislav Hagara | Komentářů: 0
    včera 18:22 | IT novinky

    T-Mobile od 15. září zpřístupňuje RCS (Rich Communication Services) zprávy i pro iPhone.

    Ladislav Hagara | Komentářů: 1
    včera 13:22 | IT novinky

    Společnost ARM představila platformu Arm Lumex s Arm C1 CPU Cluster a Arm Mali G1-Ultra GPU pro vlajkové chytré telefony a počítače nové generace.

    Ladislav Hagara | Komentářů: 0
    včera 05:44 | Nová verze

    Unicode Consortium, nezisková organizace koordinující rozvoj standardu Unicode, oznámila vydání Unicode 17.0. Přidáno bylo 4 803 nových znaků. Celkově jich je 159 801. Přibylo 7 nových Emoji.

    Ladislav Hagara | Komentářů: 0
    9.9. 21:00 | IT novinky Ladislav Hagara | Komentářů: 10
    9.9. 18:33 | Nová verze

    Realtimová strategie Warzone 2100 (Wikipedie) byla vydána ve verzi 4.6.0. Podrobný přehled novinek, změn a oprav v ChangeLogu na GitHubu. Nejnovější verzi Warzone 2100 lze již instalovat také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 1
    9.9. 12:22 | IT novinky

    Polské vývojářské studio CD Projekt Red publikovalo na Printables.com 3D modely z počítačové hry Cyberpunk 2077.

    Ladislav Hagara | Komentářů: 1
    9.9. 11:44 | Pozvánky

    Organizátoři konference LinuxDays 2025 vydali program a zároveň otevřeli registrace. Akce se uskuteční 4. a 5. října na FIT ČVUT v pražských Dejvicích, kde vás čekají přednášky, workshopy, stánky a spousta šikovných lidí. Vstup na akci je zdarma.

    Petr Krčmář | Komentářů: 7
    8.9. 22:00 | IT novinky

    Uživatelé komunikátoru Signal si mohou svá data přímo v Signalu bezpečně zálohovat a v případě rozbití nebo ztráty telefonu následně na novém telefonu obnovit. Zálohování posledních 45 dnů je zdarma. Nad 45 dnů je zpoplatněno částkou 1,99 dolaru měsíčně.

    Ladislav Hagara | Komentářů: 0
    8.9. 18:44 | Zajímavý článek

    Server Groklaw, zaměřený na kauzy jako právní spory SCO týkající se Linuxu, skončil před 12 lety, resp. doména stále existuje, ale web obsahuje spam propagující hazardní hry. LWN.net proto v úvodníku připomíná důležitost zachovávání komunitních zdrojů a upozorňuje, že Internet Archive je také jen jeden.

    🇵🇸 | Komentářů: 29
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (83%)
     (7%)
     (2%)
     (2%)
     (4%)
     (2%)
    Celkem 161 hlasů
     Komentářů: 12, poslední včera 13:00
    Rozcestník

    Dotaz: Hromadné zjištění kódování souborů

    3.4.2015 16:25 Marek
    Hromadné zjištění kódování souborů
    Přečteno: 391×
    Ahoj, poradí nějaký profík prosím jak zjistit z příkazové řádky kódování souboru ? Potřebuji zkontrolovat cca 8000 souborů zda mají kódování UTF-8. Děkuji za pomoc. M.

    Odpovědi

    Jendа avatar 3.4.2015 16:45 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    Někdy to řekne příkaz file, jinak bych zkoušel detekovat četnost jednotlivých znaků pokud znáš alespoň jazyk/rodinu jazyků. A pak to můžeš zkusit jako UTF8 dekódovat jestli to bude validní. Ale obecně taková věc udělat nejde.
    3.4.2015 16:56 Jindřich Makovička | skóre: 17
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    iconv -f utf-8 -t ucs-4 filename.txt > /dev/null

    pokud ve filename.txt není validní utf8, iconv vrátí chybu
    3.4.2015 16:57 Masca
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    enca (např. v Debianu je v repozitáři)
    alles32 avatar 3.4.2015 17:57 alles32 | skóre: 15 | Evropa
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    pic.

    tohle zobrazi vsechny ne utf-8 soubory v aktualnim adresari.

    $ find . -type f | xargs -I '{}' bash -c "iconv -f utf-8 -t utf-16 '{}' &>/dev/null || echo '{}'"
    wamba avatar 4.4.2015 04:37 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    pomocí Perlu s příslušnou knihovnou
    find .|perl -MFile::LibMagic -nE 'chomp; my @coding= ("utf-8","us-ascii");my $magic = File::LibMagic->new();  say  $_ if ! $magic->info_from_filename("$_")->{encoding} ~~ @coding'
    
    zkoušel jsem to na cca 15k souborech(i s netextovými 17k) a trvalo to nějakých 30s.(problém dělali symlinky na nexistující soubory, u těch to házelo chybu)
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    alles32 avatar 4.4.2015 07:48 alles32 | skóre: 15 | Evropa
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    find zna file -type. '-type f' odfiltruje vse krom normalniho souboru ;].
    4.4.2015 11:40 Marek
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    Moc děkuji všem za tipy. Použil jsem kompletní řešení od alles32. Projde to celý strom což je super. Snažil jsem se to použít jen na php soubory a sustit příkaz odkudkoli ale nedaří se...
    $ find . -type f /var/www/*.php | xargs -I '{}' bash -c "iconv -f utf-8 -t utf-16 '{}' &>/dev/null || echo '{}'"
    alles32 avatar 4.4.2015 12:53 alles32 | skóre: 15 | Evropa
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    find umi -name. odkudkoli to jde taky, jen to chce zamenit cestu kde se ma findovat, napr.
    ~$ find /var/www -name *php -type f ......
    4.4.2015 13:09 chrono
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    Nemá ísť to *php do apostrofov?
    4.4.2015 15:25 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    ~$ find /var/www -name "*.php" -type f ......
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    4.4.2015 18:01 Radovan Garabik
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    man isutf8:

    isutf8 - check whether files are valid UTF-8

    Balíček moreutils.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.