abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
3.12. 16:24 | Nová verze

Byla vydána Mageia 5.1. Jedná se o první opravné vydání verze 5, jež vyšla v červnu loňského roku (zprávička). Uživatelům verze 5 nepřináší opravné vydání nic nového, samozřejmě pokud pravidelně aktualizují. Vydání obsahuje všechny aktualizace za posledního téměř půldruhého roku. Mageia 5.1 obsahuje LibreOffice 4.4.7, Linux 4.4.32, KDE4 4.14.5 nebo GNOME 3.14.3.

Ladislav Hagara | Komentářů: 4
3.12. 13:42 | Pozvánky

V Praze probíhá konference Internet a Technologie 16.2, volné pokračování jarní konference sdružení CZ.NIC. Konferenci lze sledovat online na YouTube. K dispozici je také archiv předchozích konferencí.

Ladislav Hagara | Komentářů: 0
2.12. 22:44 | Komunita

Joinup informuje, že Mnichov používá open source groupware Kolab. V srpnu byl dokončen dvouletý přechod na toto řešení. V provozu je asi 60 000 poštovních schránek. Nejenom Kolabu se věnoval Georg Greve ve své přednášce Open Source: the future for the European institutions (SlideShare) na konferenci DIGITEC 2016, jež proběhla v úterý 29. listopadu v Bruselu. Videozáznam přednášek z hlavního sálu je ke zhlédnutí na Livestreamu.

Ladislav Hagara | Komentářů: 22
2.12. 15:30 | Zajímavý projekt

Společnost Jolla oznámila v příspěvku Case study: Sailfish Watch na svém blogu, že naportovala Sailfish OS na chytré hodinky. Využila a inspirovala se otevřeným operačním systémem pro chytré hodinky AsteroidOS. Použita je knihovna libhybris. Ukázka ovládání hodinek na YouTube.

Ladislav Hagara | Komentářů: 8
2.12. 14:15 | Nová verze

Byla vydána verze 7.1.0 skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Jedná se o první stabilní verzi nejnovější větvě 7.1. Přehled novinek v dokumentaci. Podrobnosti v ChangeLogu. K dispozici je také příručka pro přechod z PHP 7.0.x na PHP 7.1.x.

Ladislav Hagara | Komentářů: 3
2.12. 12:55 | Nová verze

Google Chrome 55 byl prohlášen za stabilní. Nejnovější stabilní verze 55.0.2883.75 tohoto webového prohlížeče přináší řadu oprav a vylepšení (YouTube). Opraveno bylo také 36 bezpečnostních chyb. Mariusz Mlynski si například vydělal 22 500 dolarů za 3 nahlášené chyby (Universal XSS in Blink).

Ladislav Hagara | Komentářů: 4
2.12. 11:55 | Pozvánky

Máte rádi svobodný software a hardware nebo se o nich chcete něco dozvědět? Přijďte na 135. sraz spolku OpenAlt, který se bude konat ve čtvrtek 8. prosince od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Sraz bude tentokrát tématický. Bude retro! K vidění budou přístroje jako Psion 5mx nebo Palm Z22. Ze svobodného hardwaru pak Openmoko nebo čtečka WikiReader. Přijďte se i vy pochlubit svými legendami, nebo alespoň na pivo. Moderní hardware má vstup samozřejmě také povolen.

xkucf03 | Komentářů: 1
2.12. 00:10 | Nová verze

Byla vydána verze 3.2 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata. Z novinek lze zmínit například podporu protokolů DNP3 a CIP/ENIP, vylepšenou podporu TLS a samozřejmě také aktualizovanou dokumentaci.

Ladislav Hagara | Komentářů: 0
1.12. 21:00 | Nová verze

Byla vydána beta verze Linux Mintu 18.1 s kódovým jménem Serena. Na blogu Linux Mintu jsou hned dvě oznámení. První o vydání Linux Mintu s prostředím MATE a druhé o vydání Linux Mintu s prostředím Cinnamon. Stejným způsobem jsou rozděleny také poznámky k vydání (MATE, Cinnamon) a přehled novinek s náhledy (MATE, Cinnamon). Linux Mint 18.1 bude podporován až do roku 2021.

Ladislav Hagara | Komentářů: 0
1.12. 16:42 | Nová verze

Byl vydán Devuan Jessie 1.0 Beta 2. Jedná se o druhou beta verzi forku Debianu bez systemd představeného v listopadu 2014 (zprávička). První beta verze byla vydána v dubnu letošního roku (zprávička). Jedna z posledních přednášek věnovaných Devuanu proběhla v listopadu na konferenci FSCONS 2016 (YouTube, pdf).

Ladislav Hagara | Komentářů: 2
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 771 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: Zjištění kódování souboru

15.9.2015 12:28 Petr
Zjištění kódování souboru
Přečteno: 641×
Dobrý den, existuje spolehlivý nástroj v linuxu na zjištění v jakém kódování je soubor uložen. Co se týče zjištění našel jsem nejoblíbenější příkaz
file -bi <filename>
Tak jsem si vytvořil ve windows php soubor v pspadu s kováním cp1250. Uložil jsem ho a zavolal tento příkaz. Odpověd je: text/x-php; charset=unknown-8bit To mě tedy moc neuspokojuje. Představovl bych si že odpověd bude cp1250. Proč to pspad dokáže a příkaz "file" nikoliv? A existuje nástroj který to dokáže? Díky za rady.

Řešení dotazu:


Odpovědi

15.9.2015 12:38 Petr Šobáň | skóre: 79 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Spolehlivý příkaz neexistuje z jednoho důvodu textový soubor v sobě nenese žádnou informaci o kodování.

Kodování se hádá podle slov z diakritikou zda dávají smysl a zda jsou tam platné znaky z nějakého kodování.
15.9.2015 13:23 Petr
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
A jak to ten pspad teda dělá že když uložím i třeba prázdný soubor a pak ho znovu otevřu tak je tam to kódování, které jsem tam nastavil. On si tam ukládá nějakou meta informaci nebo co? Díky
15.9.2015 14:10 Petr Šobáň | skóre: 79 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
To já nevím windows soubory nepoužívám takže nevím co tam ukládají, ale pak to asi nebude textový soubor.
15.9.2015 14:48 R
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
V prazdnom subore sa dost tazko ukladaju nejake informacie, takze jedine vysvetlenie je: ten editor si niekam mimo uklada informacie o otvorenych suboroch a nastavenych kodovaniach.
Josef Kufner avatar 15.9.2015 15:04 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
... a poslední poloze kurzoru.
Hello world ! Segmentation fault (core dumped)
15.9.2015 16:37 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Ty taky děláš v Redhatu?
Josef Kufner avatar 15.9.2015 17:11 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Ne, proč?
Hello world ! Segmentation fault (core dumped)
15.9.2015 16:33 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Tak proč děláš hned chytrýho, když to sám nevíš! že to není viditelně vidět po otevření třeba ve vi nebo Emacsu? To je tím, že asi není sw pro Linux, který umí zobrazit informaci ze sektoru na disku a třeba i upravit jedinej bit na něm. A kdybys náhodou o nějakém věděl, pak nechápu tvoji odpověď.
15.9.2015 18:22 Petr Šobáň | skóre: 79 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Už jsem odpověděl jak se to dělá - prostě to hádá podle toho jaké znaky se v souboru vyskytují.

Jinak speciální editory si můžou různé údaje někam ukládat, z prázdného souboru nelze určit typ kodování pokud to není někde uložené a nebo pokud ten editor nepoužije kodování co bylo naposledy nebo co používá default OS a pod.....

Aby jsi to zjistil jak to pspad dělá tak koukni do jeho zdrojáků.
16.9.2015 09:02 leste
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Už jsem odpověděl jak se to dělá - prostě to hádá podle toho jaké znaky se v souboru vyskytují.

Přesně tak to dělá, prohlíží prvních nevímkolik (zapomněl jsem) znaků a podle toho hádá.

Na začátek všech souborů psaných v pspadu vrážím poznámku obsahující žš, abych mu to usnadnil. Vrazil bych tam i ť, ale kombinace vok+pspad mi pak nabídne nějakou blbost s velkými písmeny.

Jendа avatar 16.9.2015 21:35 Jendа | skóre: 73 | blog: Výlevníček | JO70FB
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
To je tím, že asi není sw pro Linux, který umí zobrazit informaci ze sektoru na disku a třeba i upravit jedinej bit na něm.
dd + blhexflip
15.9.2015 17:25 j
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Dela to presne tak, ze to hada. Co na tom nechapes? Algoritmus hadani muze byt slusne uspesny, ale neni to proste 100%. V utf8 txt souboru muze (ale nemusi) byt Byte order mark. Jinak se to dela tak, ze proste vemes ASCII znaky, a vemes ostatni nonASCII, a udelas analyzu. Pokud je text dostatecne dlouhy a obsahuje pokud mozno vsechny hackocarkove znaky, tak se da s pomerne slusnou jistotou urcit, o jake kodovani jde. Predevsim proto, ze ac jsou nektere znaky kodovany trebas stejne, tak nektere jsou kodovany jinak => pokud najdu cojavim 9E ... tak sem na dobry ceste k tomu, rict, ze je to win-1250.
15.9.2015 16:22 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Kodování se hádá podle slov z diakritikou zda dávají smysl a zda jsou tam platné znaky z nějakého kodování.
zdroj?
Josef Kufner avatar 15.9.2015 17:13 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Viz zdrojáky programů file a enca.
Hello world ! Segmentation fault (core dumped)
Josef Kufner avatar 15.9.2015 12:39 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Zkus tam nakopírovat kus českého textu a uvidíš, jestli to trefí líp.
Hello world ! Segmentation fault (core dumped)
Řešení 1× (Petr Tomášek)
15.9.2015 12:47 blondak | skóre: 36 | blog: Blondak | Čáslav
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Zkus enca.
Každý problém ma své logické, snadno pochopitelné nesprávné řešení.
15.9.2015 12:54 OldFrog {Ondra Nemecek} | skóre: 25 | blog: Žabákův notes | Praha
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Enca je docela úspěšná, pokud není text příliš krátký:
$ cat /etc/motd 
Dobrý den, existuje spolehlivý nástroj v linuxu na zjištění v jakém kódování je soubor uložen? Co se týče zjištění našel jsem nejoblíbenější příkaz.

$ enca -L czech /etc/motd 
Universal transformation format 8 bits; UTF-8
-- OldFrog
15.9.2015 14:46 R
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
CP1250 v PHP je brutalna prasacina. Zial, niektori ludia dodnes taketo veci robia.
15.9.2015 16:07 Vasek
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Taky nechápu lidi, kteří v době znakové sady Unicode, resp. v jejím nejčastěji používaném kódování UTF-8, stále ještě použivájí takovouto "prasečinu.

15.9.2015 16:36 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Další pitomec! Na to se nikdo neptá!
15.9.2015 16:40 Vasek
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

To už ani nemůže člověk napsat vlastní názor, aniž by byl nazván pitomcem?

15.9.2015 18:14 Peter Golis | skóre: 53 | Bratislava
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Toho si nevšímaj, to je miestne zvieratko pavelka, ňupáč a stoinýchmien. Toho si tu pestujú cenzori ako domáce zvieratko, aby mohli vykazovať nejakú činnosť. Obvykle inkllinujúcu k nule.
16.9.2015 11:55 Kit | skóre: 36 | Brno
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
Zjišťování kódování českého textu je spíše hádáním.
$ echo "příšerně žluťoučký kůň úpěl ďábelské ódy" >text
$ file -bi text
text/plain; charset=utf-8

$ recode u8..1250 text
$ file -bi text
text/plain; charset=unknown-8bit

$ recode 1250..l2 text
$ file -bi text
text/plain; charset=iso-8859-1

$ recode l2..UTF-16 text
$ file -bi text
text/plain; charset=utf-16be
Jak je vidět, příkaz file spolehlivě detekuje pouze Unicode. Dnes už vlastně ostatní kódování postrádají na významu.

Poslední dobou do PHP pro jistotu české texty vůbec nedávám. Pouze do šablon - tam je při vynechání deklarace automaticky předpokládáno UTF-8 či UTF-16 s automatickou detekcí. A protože UTF-8 používám nativně, vůbec to nemusím řešit.
Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
Řešení 1× (Petr Tomášek)
16.9.2015 12:11 neklan | skóre: 11 | blog: neklan_no_clan
Rozbalit Rozbalit vše Re: Zjištění kódování souboru
pokud predpokladas jazyk pomuze enca
cat cp1250file.txt | enca -L czech -g -c -x UTF-8
prevede cesky text do UTF-8.

nedavno jsem se prehraboval ve starych archivech pdb knizek a tohle mi pomohlo. zjevne to nemusi fungovat vzdycky. nektere soubory jsou dojebane totalne, napr. obsahuji vice ruznych kodovani, kdy je ruzni lide otevirali a ukladali jen casti a na zbytek kaslali. V tom pripade uz asi jedine rucne.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.