Přihlášení | Registrace

napište » Zprávičky

inzerujte » Pracovní nabídky

IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů

dnes 22:44 | IT novinky

IBM kupuje společnost HashiCorp za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

Ladislav Hagara | Komentářů: 0

TrueNAS SCALE 24.04 “Dragonfish”

dnes 15:55 | Nová verze

Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Raspberry Pi Compute Module 4S s 2 GB, 4 GB a 8 GB paměti

dnes 13:44 | IT novinky

Oznámeny byly nové Raspberry Pi Compute Module 4S. Vedle původní 1 GB varianty jsou nově k dispozici také varianty s 2 GB, 4 GB a 8 GB paměti. Compute Modules 4S mají na rozdíl od Compute Module 4 tvar a velikost Compute Module 3+ a předchozích. Lze tak provést snadný upgrade.

Ladislav Hagara | Komentářů: 0

nginx 1.26.0

dnes 04:44 | Nová verze

Po roce vývoje od vydání verze 1.24.0 byla vydána nová stabilní verze 1.26.0 webového serveru a reverzní proxy nginx (Wikipedie). Nová verze přináší řadu novinek. Podrobný přehled v souboru CHANGES-1.26.

Ladislav Hagara | Komentářů: 0

Tails 6.2

dnes 04:33 | Nová verze

Byla vydána nová verze 6.2 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.14.

Ladislav Hagara | Komentářů: 0

Electron 30.0.0

dnes 04:22 | Nová verze

Byla vydána nová verze 30.0.0 frameworku pro vývoj multiplatformních desktopových aplikací pomocí JavaScriptu, HTML a CSS Electron (Wikipedie, GitHub). Chromium bylo aktualizováno na verzi 124.0.6367.49, V8 na verzi 12.4 a Node.js na verzi 20.11.1. Electron byl původně vyvíjen pro editor Atom pod názvem Atom Shell. Dnes je na Electronu postavena celá řada dalších aplikací.

Ladislav Hagara | Komentářů: 1

QEMU 9.0.0

dnes 04:11 | Nová verze

Byla vydána nová verze 9.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 220 vývojářů. Provedeno bylo více než 2 700 commitů. Přehled úprav a nových vlastností v seznamu změn.

Ladislav Hagara | Komentářů: 0

Evropský parlament: Právo na opravu

včera 23:22 | IT novinky

Evropský parlament dnes přijal směrnici týkající se tzv. práva spotřebitele na opravu. Poslanci ji podpořili 584 hlasy (3 bylo proti a 14 se zdrželo hlasování). Směrnice ujasňuje povinnosti výrobců opravovat zboží a motivovat spotřebitele k tomu, aby si výrobky nechávali opravit a prodloužili tak jejich životnost.

Ladislav Hagara | Komentářů: 6

Fedora Linux 40 a Slimbook Fedora 2

včera 16:11 | Nová verze

Bylo oznámeno (cs) vydání Fedora Linuxu 40. Přehled novinek ve Fedora Workstation 40 a Fedora KDE 40 na stránkách Fedora Magazinu. Současně byl oznámen notebook Slimbook Fedora 2.

Ladislav Hagara | Komentářů: 21

Smyšlené texty na ČTK

včera 13:44 | Upozornění

ČTK (Česká tisková kancelář) upozorňuje (X), že na jejím zpravodajském webu České noviny byly dnes dopoledne neznámým útočníkem umístěny dva smyšlené texty, které nepocházejí z její produkce. Jde o text s titulkem „BIS zabránila pokusu o atentát na nově zvoleného slovenského prezidenta Petra Pelligriniho“ a o údajné mimořádné prohlášení ministra Lipavského k témuž. Tyto dezinformace byly útočníky zveřejněny i s příslušnými notifikacemi v mobilní aplikaci Českých novin. ČTK ve svém zpravodajském servisu žádnou informaci v tomto znění nevydala.

Ladislav Hagara | Komentářů: 28

Centrum | Napsat | Starší

navrhněte » Anketa

KDE Plasma 6

už používám (72%)

čekám, až se dostane do mé distibuce (9%)

čekám na pozdější vydání v řadě (2%)

preferuji jiné desktopové prostředí (17%)

Celkem 720 hlasů

Komentářů: 4, poslední 6.4. 15:51

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Zjištění kódování souboru

Štítky: kódování, PHP, programování, vytvořil, Windows

Dotaz: Zjištění kódování souboru

15.9.2015 12:28 Petr
Zjištění kódování souboru

Přečteno: 1932×

Odpovědět | Admin

Dobrý den, existuje spolehlivý nástroj v linuxu na zjištění v jakém kódování je soubor uložen. Co se týče zjištění našel jsem nejoblíbenější příkaz

file -bi <filename>

Tak jsem si vytvořil ve windows php soubor v pspadu s kováním cp1250. Uložil jsem ho a zavolal tento příkaz. Odpověd je: text/x-php; charset=unknown-8bit To mě tedy moc neuspokojuje. Představovl bych si že odpověd bude cp1250. Proč to pspad dokáže a příkaz "file" nikoliv? A existuje nástroj který to dokáže? Díky za rady.

Řešení dotazu:

Nástroje: Začni sledovat (0) ?

Odpovědi

15.9.2015 12:38 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Spolehlivý příkaz neexistuje z jednoho důvodu textový soubor v sobě nenese žádnou informaci o kodování.

Kodování se hádá podle slov z diakritikou zda dávají smysl a zda jsou tam platné znaky z nějakého kodování.

15.9.2015 13:23 Petr
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

A jak to ten pspad teda dělá že když uložím i třeba prázdný soubor a pak ho znovu otevřu tak je tam to kódování, které jsem tam nastavil. On si tam ukládá nějakou meta informaci nebo co? Díky

15.9.2015 14:10 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

To já nevím windows soubory nepoužívám takže nevím co tam ukládají, ale pak to asi nebude textový soubor.

15.9.2015 14:48 R
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

V prazdnom subore sa dost tazko ukladaju nejake informacie, takze jedine vysvetlenie je: ten editor si niekam mimo uklada informacie o otvorenych suboroch a nastavenych kodovaniach.

15.9.2015 15:04 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

... a poslední poloze kurzoru.

Hello world ! Segmentation fault (core dumped)

15.9.2015 16:37 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Ty taky děláš v Redhatu?

15.9.2015 17:11 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Ne, proč?

Hello world ! Segmentation fault (core dumped)

15.9.2015 16:33 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Tak proč děláš hned chytrýho, když to sám nevíš! že to není viditelně vidět po otevření třeba ve vi nebo Emacsu? To je tím, že asi není sw pro Linux, který umí zobrazit informaci ze sektoru na disku a třeba i upravit jedinej bit na něm. A kdybys náhodou o nějakém věděl, pak nechápu tvoji odpověď.

15.9.2015 18:22 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Už jsem odpověděl jak se to dělá - prostě to hádá podle toho jaké znaky se v souboru vyskytují.

Jinak speciální editory si můžou různé údaje někam ukládat, z prázdného souboru nelze určit typ kodování pokud to není někde uložené a nebo pokud ten editor nepoužije kodování co bylo naposledy nebo co používá default OS a pod.....

Aby jsi to zjistil jak to pspad dělá tak koukni do jeho zdrojáků.

16.9.2015 09:02 leste
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Už jsem odpověděl jak se to dělá - prostě to hádá podle toho jaké znaky se v souboru vyskytují.

Přesně tak to dělá, prohlíží prvních nevímkolik (zapomněl jsem) znaků a podle toho hádá.

Na začátek všech souborů psaných v pspadu vrážím poznámku obsahující žš, abych mu to usnadnil. Vrazil bych tam i ť, ale kombinace vok+pspad mi pak nabídne nějakou blbost s velkými písmeny.

16.9.2015 21:35 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

To je tím, že asi není sw pro Linux, který umí zobrazit informaci ze sektoru na disku a třeba i upravit jedinej bit na něm.

dd + blhexflip

Já to s tou denacifikací Slovenska myslel vážně.

15.9.2015 17:25 j
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Dela to presne tak, ze to hada. Co na tom nechapes? Algoritmus hadani muze byt slusne uspesny, ale neni to proste 100%. V utf8 txt souboru muze (ale nemusi) byt Byte order mark. Jinak se to dela tak, ze proste vemes ASCII znaky, a vemes ostatni nonASCII, a udelas analyzu. Pokud je text dostatecne dlouhy a obsahuje pokud mozno vsechny hackocarkove znaky, tak se da s pomerne slusnou jistotou urcit, o jake kodovani jde. Predevsim proto, ze ac jsou nektere znaky kodovany trebas stejne, tak nektere jsou kodovany jinak => pokud najdu cojavim 9E ... tak sem na dobry ceste k tomu, rict, ze je to win-1250.

15.9.2015 16:22 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Kodování se hádá podle slov z diakritikou zda dávají smysl a zda jsou tam platné znaky z nějakého kodování.

zdroj?

15.9.2015 17:13 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Viz zdrojáky programů file a enca.

Hello world ! Segmentation fault (core dumped)

15.9.2015 12:39 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Zkus tam nakopírovat kus českého textu a uvidíš, jestli to trefí líp.

Hello world ! Segmentation fault (core dumped)

15.9.2015 12:47 blondak | skóre: 36 | blog: Blondak | Čáslav
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Zkus enca.

Každý problém ma své logické, snadno pochopitelné nesprávné řešení.

15.9.2015 12:54 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Enca je docela úspěšná, pokud není text příliš krátký:

$ cat /etc/motd 
Dobrý den, existuje spolehlivý nástroj v linuxu na zjištění v jakém kódování je soubor uložen? Co se týče zjištění našel jsem nejoblíbenější příkaz.

$ enca -L czech /etc/motd 
Universal transformation format 8 bits; UTF-8

-- OldFrog

15.9.2015 14:46 R
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

CP1250 v PHP je brutalna prasacina. Zial, niektori ludia dodnes taketo veci robia.

15.9.2015 16:07 Vasek
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Taky nechápu lidi, kteří v době znakové sady Unicode, resp. v jejím nejčastěji používaném kódování UTF-8, stále ještě použivájí takovouto "prasečinu.

15.9.2015 16:36 tydyt
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Další pitomec! Na to se nikdo neptá!

15.9.2015 16:40 Vasek
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

To už ani nemůže člověk napsat vlastní názor, aniž by byl nazván pitomcem?

15.9.2015 18:14 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Toho si nevšímaj, to je miestne zvieratko pavelka, ňupáč a stoinýchmien. Toho si tu pestujú cenzori ako domáce zvieratko, aby mohli vykazovať nejakú činnosť. Obvykle inkllinujúcu k nule.

16.9.2015 11:55 Kit | skóre: 45 | Brno
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

Zjišťování kódování českého textu je spíše hádáním.

$ echo "příšerně žluťoučký kůň úpěl ďábelské ódy" >text
$ file -bi text
text/plain; charset=utf-8

$ recode u8..1250 text
$ file -bi text
text/plain; charset=unknown-8bit

$ recode 1250..l2 text
$ file -bi text
text/plain; charset=iso-8859-1

$ recode l2..UTF-16 text
$ file -bi text
text/plain; charset=utf-16be

Jak je vidět, příkaz file spolehlivě detekuje pouze Unicode. Dnes už vlastně ostatní kódování postrádají na významu.

Poslední dobou do PHP pro jistotu české texty vůbec nedávám. Pouze do šablon - tam je při vynechání deklarace automaticky předpokládáno UTF-8 či UTF-16 s automatickou detekcí. A protože UTF-8 používám nativně, vůbec to nemusím řešit.

Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.

16.9.2015 12:11 neklan | skóre: 11 | blog: neklan_no_clan
Rozbalit Rozbalit vše Re: Zjištění kódování souboru

pokud predpokladas jazyk pomuze enca

cat cp1250file.txt | enca -L czech -g -c -x UTF-8

prevede cesky text do UTF-8.

nedavno jsem se prehraboval ve starych archivech pdb knizek a tohle mi pomohlo. zjevne to nemusi fungovat vzdycky. nektere soubory jsou dojebane totalne, napr. obsahuji vice ruznych kodovani, kdy je ruzni lide otevirali a ukladali jen casti a na zbytek kaslali. V tom pripade uz asi jedine rucne.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje