abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
dnes 16:00 | Nová verze

Byla vydána verze 0.98 svobodného nelineárního video editoru Pitivi. Z novinek lze zmínit například přizpůsobitelné klávesové zkratky. Videoukázka práce s nejnovější verzí Pitivi na YouTube.

Ladislav Hagara | Komentářů: 0
dnes 15:00 | Zajímavý software

Stop motion je technika animace, při níž je reálný objekt mezi jednotlivými snímky ručně upravován a posouván o malé úseky, tak aby po spojení vyvolala animace dojem spojitosti. Jaký software lze pro stop motion použít na Linuxu? Článek na OMG! Ubuntu! představuje Heron Animation. Ten bohužel podporuje pouze webové kamery. Podpora digitálních zrcadlovek je začleněna například v programu qStopMotion.

Ladislav Hagara | Komentářů: 1
včera 21:21 | Nová verze Ladislav Hagara | Komentářů: 0
včera 11:44 | Zajímavý projekt

Na Indiegogo byla spuštěna kampaň na podporu herní mini konzole a multimediálního centra RetroEngine Sigma od Doyodo. Předobjednat ji lze již od 49 dolarů. Požadovaná částka 20 000 dolarů byla překonána již 6 krát. Majitelé mini konzole si budou moci zahrát hry pro Atari VCS 2600, Sega Genesis nebo NES. Předinstalováno bude multimediální centrum Kodi.

Ladislav Hagara | Komentářů: 0
včera 00:10 | Nová verze

Byla vydána verze 4.7 redakčního systému WordPress. Kódové označením Vaughan bylo vybráno na počest americké jazzové zpěvačky Sarah "Sassy" Vaughan. Z novinek lze zmínit například novou výchozí šablonu Twenty Seventeen, náhledy pdf souborů nebo WordPress REST API.

Ladislav Hagara | Komentářů: 4
6.12. 12:00 | Zajímavý projekt

Projekt Termbox umožňuje vyzkoušet si linuxové distribuce Ubuntu, Debian, Fedora, CentOS a Arch Linux ve webovém prohlížeči. Řešení je postaveno na projektu HyperContainer. Podrobnosti v často kladených dotazech (FAQ). Zdrojové kódy jsou k dispozici na GitHubu [reddit].

Ladislav Hagara | Komentářů: 27
6.12. 11:00 | Bezpečnostní upozornění

Byly zveřejněny informace o bezpečnostní chybě CVE-2016-8655 v Linuxu zneužitelné k lokální eskalaci práv. Chyba se dostala do linuxového jádra v srpnu 2011. V upstreamu byla opravena minulý týden [Hacker News].

Ladislav Hagara | Komentářů: 2
5.12. 22:00 | Komunita

Přibližně před měsícem bylo oznámeno, že linuxová distribuce SUSE Linux Enterprise Server (SLES) běží nově také Raspberry Pi 3 (dokumentace). Obraz verze 12 SP2 pro Raspberry Pi 3 je ke stažení zdarma. Pro registrované jsou po dobu jednoho roku zdarma také aktualizace. Dnes bylo oznámeno, že pro Raspberry Pi 3 je k dispozici také nové openSUSE Leap 42.2 (zprávička). K dispozici je hned několik obrazů.

Ladislav Hagara | Komentářů: 6
5.12. 06:00 | Zajímavý software

OMG! Ubuntu! představuje emulátor terminálu Hyper (GitHub) postavený na webových technologiích (HTML, CSS a JavaScript). V diskusi k článku je zmíněn podobný emulátor terminálu Black Screen. Hyper i Black Screen používají framework Electron, stejně jako editor Atom nebo vývojové prostředí Visual Studio Code.

Ladislav Hagara | Komentářů: 50
5.12. 06:00 | Zajímavý článek

I letos vychází řada ajťáckých adventních kalendářů. QEMU Advent Calendar 2016 přináší každý den nový obraz disku pro QEMU. Programátoři se mohou potrápit při řešení úloh z kalendáře Advent of Code 2016. Kalendáře Perl Advent Calendar 2016 a Perl 6 Advent Calendar přinášejí každý den zajímavé informace o programovacím jazyce Perl. Stranou nezůstává ani programovací jazyk Go.

Ladislav Hagara | Komentářů: 10
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (23%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 792 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: neznámé kódování v XML

10.11.2010 20:34 Ladislav Nešněra | skóre: 30 | blog: ..+2
neznámé kódování v XML
Přečteno: 693×
Potřeboval bych analyzovat záznamy v HelpDesku. Neboť umožňuje výstup v XML, zvolil jsem cestu transformace do csv a pak zpracování v tabulkovém procesoru. Žel narazil jsem na dvojí kódování ve vstupním souboru a ten druhý navíc nepoznávám. Tušíte někdo, co je to zač? Díky


Řešení dotazu:


Odpovědi

10.11.2010 20:45 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Druhý řádek je asi 2× překódovaný & = &, tudíž &#FD = &#FD = ý
To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
10.11.2010 20:51 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Opravička: …tudíž: &#xFD = &#xFD = ý
Hexadecimální zápis a navíc překódovaný.
To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
10.11.2010 20:50 Filip Jirsák | skóre: 66 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Kdyby tady ten soubor byl přiložen, můžeme se na to třeba zkusit podívat. Ale křišťálovou kouli, abychom to poznali bez ukázky, asi nikdo nemá. Nebo zkuste použít nástroj Enca.
10.11.2010 21:00 Ladislav Nešněra | skóre: 30 | blog: ..+2
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Jasně že by to s originálním XML šlo líp, ale jsem vázán mlčenlivostí. Měl jsem to uvést už v dotazu. Omlouvám se ;?)
10.11.2010 21:16 Filip Jirsák | skóre: 66 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Stačilo by kousek. Až po odeslání komentáře jsem zjistil, že součástí dotazu je obrázek – já mám obrázky v komentářích zakázané, takže tam nic nevidím. kdybyste místo toho obrázku přiložil textový soubor s jeho obsahem, bylo by to lepší. Ostatně ten obsah šlo vložit i přímo do textu dotazu.
10.11.2010 22:16 Ladislav Nešněra | skóre: 30 | blog: ..+2
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Příloha:
nakonec jsem nějaký nezávadný kousek jsem našel. Snad bude stačit ;?)

To přímé vložení jsem zkoušel, ale co je UTF8 v HTML, je přímo nahrazeno, proto ty přílohy/obrázky..
10.11.2010 22:57 Filip Jirsák | skóre: 66 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Některé znaky musely už v tom vstupu být zakódovány jako XML entity, a v tom dokumentu jsou pak zakódovány podruhé. Jiné znaky s diakritiky jsou ale zakódovány jen jednou. Každopádně když ten obsah načtete jako XML text, dostanete z toho tohle:
Při uzavírání spisu XXX se objevila chyba v synchronizaci, která není specifikována, pro nevím, jak ji odstranit. Prosím o nápravu. Povšimla jsem si (jedná se o toitž již o třetí případ), že chyba se objeví vždy, když chci uložit změny do karty případu.
To je pak znova potřeba interpretovat jako zdrojový kód XML v kódování Windows-1250, tj. třeba okolo toho znova přidat nějaké XML značky.

Můžete si to vyzkoušet třeba ve webovém prohlížeči, který umí zobrazovat i XML – zobrazit původní dokument jako XML v kódování Windows-1250, okopírujte si zobrazený obsah do schránky, vložte v textovém editoru do souboru, přidejte na začátek <a> a na konec </a>, uložte, a výsledek znova zobrazte v prohlížeči v kódování Windows-1250.
11.11.2010 19:46 Ladislav Nešněra | skóre: 30 | blog: ..+2
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Potvrzení pravděpodobné teorie, jak k této podivnosti dochází jsem našel zde

Jak věští ve své reakci Šangala, kódování je utf-8 s hex zápisem entity.

Ruční postup pomocí browseru funguje, ale v zamýšlená transformaci se mi těch entit zbavit nepodařilo (prakticky nulové zkušenosti s XSL)
11.11.2010 19:44 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Jak jsem Vám hned napsal, je to 2× překódované - klasika...
Anebo to není 2× překódované, ale je to tak správně - je to věcí pohledu:
Máte HTML validní data (řetězce) a ty používají pro diakritiku hexadecimální zápis znaků tj. &xXX.
A ty data uložíte do XML dokumentu a v XML dokumentu se znak & nahradí za &amp;, protože tak je to správně. - HA! :)

Když ta data vytahujete libovolným parsrem XML, měl by vám vrátit, validní HTML kód (tj. &xXX)
Prostě jsou to HTML data uložena v XML.
Je to obdoba, jako když se do DB ukládají HTML data, jenže tam to netrkne, bo se to tam zapisuje tak jak to je, ale XML dokument má některá pravidla.

Pokud to parsujete „nějak“ partyzánsky, lze udělat prasárny typu:
Vem hodnotu (řetězec) a zaměň:
&amp; za &
&amp;lt; za &lt;
&amp;gt; za &gt;
&amp;quot; za &quot;
&amp;apos; za &apos;
Pak z toho dostanete normální HTML řetězce no a musíte si zaměnit sekvence:
&lt; za <
&gt; za >
&quot; za "
&apos; za '
&xXX za chr(hextodec(XX))
A asi tímto divným postupem z toho vyleze normální string.
To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
16.11.2010 00:40 Ladislav Nešněra | skóre: 30 | blog: ..+2
Rozbalit Rozbalit vše Re: neznámé kódování v XML
Oběma ještě jednou díky za pomoc

Neb si potřebuji připomenout Python, řešil jsem to v něm. Po prvním kole mi XSL transformace nechala nečitelné jen ty hexadecimálně zapsané entity. Těch jsem se následně zbavil kódem inspirovaným tímto.

Ještě jsem narazil na docela zajímavý projekt, žel hexadecimální entity také neumí.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.