abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

    dnes 21:55 | Zajímavý článek

    Oliver Smith z Canonicalu shrnuje základní vlastnosti „neměnné“ distribuce Ubuntu Core také ve srovnání s protějšky Chrome OS, Fedora Silverblue a MicroOS. Canonical připravuje desktopovou variantu Ubuntu Core vedle dosavadní serverové/embedded.

    Fluttershy, yay! | Komentářů: 0
    dnes 13:33 | Upozornění

    Z aktualizovaného seznamu chyb (pdf) procesoru AMD EPYC 7002: #1474 - procesor se po 1044 dnech od posledního resetu zasekne [reddit].

    Ladislav Hagara | Komentářů: 6
    dnes 13:00 | Nová verze

    Fossil (Wikipedie) byl vydán ve verzi 2.22. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

    Ladislav Hagara | Komentářů: 0
    dnes 12:22 | Zajímavý článek

    David Malcolm se ve svém příspěvku na blogu vývojářů Red Hatu rozepsal o vylepšeních statické analýzy (volba -fanalyzer) v GCC 13.

    Ladislav Hagara | Komentářů: 1
    dnes 12:00 | Nová verze

    Byla vydána nová stabilní verze 23.05 linuxové distribuce NixOS (Wikipedie). Její kódové označení je Stoat. Podrobný přehled novinek v poznámkách k vydání. O balíčky se v NixOS stará správce balíčků Nix.

    Ladislav Hagara | Komentářů: 0
    dnes 11:44 | Bezpečnostní upozornění

    Příspěvek na blogu CZ.NIC upozorňuje na nový útok na weby v Česku. Na honeypotech na Turrisech byla zaznamenána nová aktivita útočníků - probíhající útok na FTP servery, které se vyskytují na stejné IP adrese, jako aktivní WEB server.

    Ladislav Hagara | Komentářů: 0
    včera 23:44 | Nová verze

    Rakudo (Wikipedie), tj. překladač programovacího jazyka Raku (Wikipedie), byl vydán ve verzi 2023.05. Programovací jazyk Raku byl dříve znám pod názvem Perl 6.

    Ladislav Hagara | Komentářů: 0
    včera 20:22 | IT novinky

    Linux Foundation Europe představila projekt RISE (RISC-V Software Ecosystem), jehož cílem je urychlit vývoj open source softwaru pro architekturu RISC-V.

    Ladislav Hagara | Komentářů: 0
    včera 14:55 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu pro jednodeskové počítače na platformě ARM, byl vydán ve verzi 23.05. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    včera 12:33 | Komunita

    Minulý týden proběhla openSUSE Conference 2023. Mimo jiné bylo oznámeno přejmenování systému MicroOS Desktop. MicroOS Desktop GNOME byl přejmenován na openSUSE Aeon a MicroOS Desktop Plasma na openSUSE Kalpa.

    Ladislav Hagara | Komentářů: 0
    Twitter (nejen pro příležitostné čtení)
     (70%)
     (20%)
     (10%)
    Celkem 10 hlasů
     Komentářů: 0
    Rozcestník

    Dotaz: Hromadné zjištění kódování souborů

    3.4.2015 16:25 Marek
    Hromadné zjištění kódování souborů
    Přečteno: 333×
    Ahoj, poradí nějaký profík prosím jak zjistit z příkazové řádky kódování souboru ? Potřebuji zkontrolovat cca 8000 souborů zda mají kódování UTF-8. Děkuji za pomoc. M.

    Odpovědi

    Jendа avatar 3.4.2015 16:45 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    Někdy to řekne příkaz file, jinak bych zkoušel detekovat četnost jednotlivých znaků pokud znáš alespoň jazyk/rodinu jazyků. A pak to můžeš zkusit jako UTF8 dekódovat jestli to bude validní. Ale obecně taková věc udělat nejde.
    3.4.2015 16:56 Jindřich Makovička | skóre: 17
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    iconv -f utf-8 -t ucs-4 filename.txt > /dev/null

    pokud ve filename.txt není validní utf8, iconv vrátí chybu
    3.4.2015 16:57 Masca
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    enca (např. v Debianu je v repozitáři)
    alles32 avatar 3.4.2015 17:57 alles32 | skóre: 15 | Evropa
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    pic.

    tohle zobrazi vsechny ne utf-8 soubory v aktualnim adresari.

    $ find . -type f | xargs -I '{}' bash -c "iconv -f utf-8 -t utf-16 '{}' &>/dev/null || echo '{}'"
    wamba avatar 4.4.2015 04:37 wamba | skóre: 38 | blog: wamba
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    pomocí Perlu s příslušnou knihovnou
    find .|perl -MFile::LibMagic -nE 'chomp; my @coding= ("utf-8","us-ascii");my $magic = File::LibMagic->new();  say  $_ if ! $magic->info_from_filename("$_")->{encoding} ~~ @coding'
    
    zkoušel jsem to na cca 15k souborech(i s netextovými 17k) a trvalo to nějakých 30s.(problém dělali symlinky na nexistující soubory, u těch to házelo chybu)
    This would have been so hard to fix when you don't know that there is in fact an easy fix.
    alles32 avatar 4.4.2015 07:48 alles32 | skóre: 15 | Evropa
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    find zna file -type. '-type f' odfiltruje vse krom normalniho souboru ;].
    4.4.2015 11:40 Marek
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    Moc děkuji všem za tipy. Použil jsem kompletní řešení od alles32. Projde to celý strom což je super. Snažil jsem se to použít jen na php soubory a sustit příkaz odkudkoli ale nedaří se...
    $ find . -type f /var/www/*.php | xargs -I '{}' bash -c "iconv -f utf-8 -t utf-16 '{}' &>/dev/null || echo '{}'"
    alles32 avatar 4.4.2015 12:53 alles32 | skóre: 15 | Evropa
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    find umi -name. odkudkoli to jde taky, jen to chce zamenit cestu kde se ma findovat, napr.
    ~$ find /var/www -name *php -type f ......
    4.4.2015 13:09 chrono
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    Nemá ísť to *php do apostrofov?
    4.4.2015 15:25 Kit | skóre: 45 | Brno
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    ~$ find /var/www -name "*.php" -type f ......
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    4.4.2015 18:01 Radovan Garabik
    Rozbalit Rozbalit vše Re: Hromadné zjištění kódování souborů
    man isutf8:

    isutf8 - check whether files are valid UTF-8

    Balíček moreutils.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.