abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 18:33 | Nová verze

    Realtimová strategie Warzone 2100 (Wikipedie) byla vydána ve verzi 4.6.0. Podrobný přehled novinek, změn a oprav v ChangeLogu na GitHubu. Nejnovější verzi Warzone 2100 lze již instalovat také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 0
    dnes 12:22 | IT novinky

    Polské vývojářské studio CD Projekt Red publikovalo na Printables.com 3D modely z počítačové hry Cyberpunk 2077.

    Ladislav Hagara | Komentářů: 0
    dnes 11:44 | Pozvánky

    Organizátoři konference LinuxDays 2025 vydali program a zároveň otevřeli registrace. Akce se uskuteční 4. a 5. října na FIT ČVUT v pražských Dejvicích, kde vás čekají přednášky, workshopy, stánky a spousta šikovných lidí. Vstup na akci je zdarma.

    Petr Krčmář | Komentářů: 4
    včera 22:00 | IT novinky

    Uživatelé komunikátoru Signal si mohou svá data přímo v Signalu bezpečně zálohovat a v případě rozbití nebo ztráty telefonu následně na novém telefonu obnovit. Zálohování posledních 45 dnů je zdarma. Nad 45 dnů je zpoplatněno částkou 1,99 dolaru měsíčně.

    Ladislav Hagara | Komentářů: 0
    včera 18:44 | Zajímavý článek

    Server Groklaw, zaměřený na kauzy jako právní spory SCO týkající se Linuxu, skončil před 12 lety, resp. doména stále existuje, ale web obsahuje spam propagující hazardní hry. LWN.net proto v úvodníku připomíná důležitost zachovávání komunitních zdrojů a upozorňuje, že Internet Archive je také jen jeden.

    🇵🇸 | Komentářů: 5
    včera 14:22 | Nová verze

    Jakub Vrána vydal Adminer ve verzi 5.4.0: "Delší dobu se v Admineru neobjevila žádná závažná chyba, tak jsem nemusel vydávat novou verzi, až počet změn hodně nabobtnal."

    Ladislav Hagara | Komentářů: 1
    včera 13:22 | IT novinky

    V Německu slavnostně uvedli do provozu (en) nejrychlejší počítač v Evropě. Superpočítač Jupiter se nachází ve výzkumném ústavu v Jülichu na západě země, podle německého kancléře Friedricha Merze otevírá nové možnosti pro trénování modelů umělé inteligence (AI) i pro vědecké simulace. Superpočítač Jupiter je nejrychlejší v Evropě a čtvrtý nejrychlejší na světě (TOP500). „Chceme, aby se z Německa stal národ umělé inteligence,“ uvedl na

    … více »
    Ladislav Hagara | Komentářů: 16
    7.9. 04:11 | Komunita

    V Berlíně probíhá konference vývojářů a uživatelů desktopového prostředí KDE Plasma Akademy 2025. Při té příležitosti byla oznámena alfa verze nové linuxové distribuce KDE Linux.

    Ladislav Hagara | Komentářů: 1
    6.9. 17:11 | Nová verze

    Byl vydán Debian 13.1, tj. první opravná verze Debianu 13 s kódovým názvem Trixie a Debian 12.12, tj. dvanáctá opravná verze Debianu 12 s kódovým názvem Bookworm. Řešeny jsou především bezpečnostní problémy, ale také několik vážných chyb. Instalační média Debianu 13 a Debianu 12 lze samozřejmě nadále k instalaci používat. Po instalaci stačí systém aktualizovat.

    Ladislav Hagara | Komentářů: 2
    5.9. 23:44 | IT novinky

    Evropská komise potrestala Google ze skupiny Alphabet pokutou 2,95 miliardy eur (71,9 miliardy Kč) za porušení antimonopolní legislativy. Podle EK, která mimo jiné plní funkci antimonopolního orgánu EU, se Google dopustil protisoutěžních praktik ve svém reklamním byznysu. Google v reakci uvedl, že rozhodnutí považuje za chybné a hodlá se proti němu odvolat. EK ve věci rozhodovala na základě stížnosti Evropské rady vydavatelů. Podle

    … více »
    Ladislav Hagara | Komentářů: 47
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (83%)
     (7%)
     (2%)
     (3%)
     (3%)
     (2%)
    Celkem 157 hlasů
     Komentářů: 11, poslední 4.9. 16:12
    Rozcestník

    Dotaz: neznámé kódování v XML

    10.11.2010 20:34 Ladislav Nešněra | skóre: 30 | blog: ..+2
    neznámé kódování v XML
    Přečteno: 771×
    Potřeboval bych analyzovat záznamy v HelpDesku. Neboť umožňuje výstup v XML, zvolil jsem cestu transformace do csv a pak zpracování v tabulkovém procesoru. Žel narazil jsem na dvojí kódování ve vstupním souboru a ten druhý navíc nepoznávám. Tušíte někdo, co je to zač? Díky


    Řešení dotazu:


    Odpovědi

    10.11.2010 20:45 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Druhý řádek je asi 2× překódovaný & = &, tudíž &#FD = &#FD = ý
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    10.11.2010 20:51 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Opravička: …tudíž: &#xFD = &#xFD = ý
    Hexadecimální zápis a navíc překódovaný.
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    10.11.2010 20:50 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Kdyby tady ten soubor byl přiložen, můžeme se na to třeba zkusit podívat. Ale křišťálovou kouli, abychom to poznali bez ukázky, asi nikdo nemá. Nebo zkuste použít nástroj Enca.
    10.11.2010 21:00 Ladislav Nešněra | skóre: 30 | blog: ..+2
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Jasně že by to s originálním XML šlo líp, ale jsem vázán mlčenlivostí. Měl jsem to uvést už v dotazu. Omlouvám se ;?)
    10.11.2010 21:16 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Stačilo by kousek. Až po odeslání komentáře jsem zjistil, že součástí dotazu je obrázek – já mám obrázky v komentářích zakázané, takže tam nic nevidím. kdybyste místo toho obrázku přiložil textový soubor s jeho obsahem, bylo by to lepší. Ostatně ten obsah šlo vložit i přímo do textu dotazu.
    10.11.2010 22:16 Ladislav Nešněra | skóre: 30 | blog: ..+2
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Příloha:
    nakonec jsem nějaký nezávadný kousek jsem našel. Snad bude stačit ;?)

    To přímé vložení jsem zkoušel, ale co je UTF8 v HTML, je přímo nahrazeno, proto ty přílohy/obrázky..
    10.11.2010 22:57 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Některé znaky musely už v tom vstupu být zakódovány jako XML entity, a v tom dokumentu jsou pak zakódovány podruhé. Jiné znaky s diakritiky jsou ale zakódovány jen jednou. Každopádně když ten obsah načtete jako XML text, dostanete z toho tohle:
    Při uzavírání spisu XXX se objevila chyba v synchronizaci, která není specifikována, pro nevím, jak ji odstranit. Prosím o nápravu. Povšimla jsem si (jedná se o toitž již o třetí případ), že chyba se objeví vždy, když chci uložit změny do karty případu.
    To je pak znova potřeba interpretovat jako zdrojový kód XML v kódování Windows-1250, tj. třeba okolo toho znova přidat nějaké XML značky.

    Můžete si to vyzkoušet třeba ve webovém prohlížeči, který umí zobrazovat i XML – zobrazit původní dokument jako XML v kódování Windows-1250, okopírujte si zobrazený obsah do schránky, vložte v textovém editoru do souboru, přidejte na začátek <a> a na konec </a>, uložte, a výsledek znova zobrazte v prohlížeči v kódování Windows-1250.
    11.11.2010 19:46 Ladislav Nešněra | skóre: 30 | blog: ..+2
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Potvrzení pravděpodobné teorie, jak k této podivnosti dochází jsem našel zde

    Jak věští ve své reakci Šangala, kódování je utf-8 s hex zápisem entity.

    Ruční postup pomocí browseru funguje, ale v zamýšlená transformaci se mi těch entit zbavit nepodařilo (prakticky nulové zkušenosti s XSL)
    11.11.2010 19:44 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Jak jsem Vám hned napsal, je to 2× překódované - klasika...
    Anebo to není 2× překódované, ale je to tak správně - je to věcí pohledu:
    Máte HTML validní data (řetězce) a ty používají pro diakritiku hexadecimální zápis znaků tj. &xXX.
    A ty data uložíte do XML dokumentu a v XML dokumentu se znak & nahradí za &amp;, protože tak je to správně. - HA! :)

    Když ta data vytahujete libovolným parsrem XML, měl by vám vrátit, validní HTML kód (tj. &xXX)
    Prostě jsou to HTML data uložena v XML.
    Je to obdoba, jako když se do DB ukládají HTML data, jenže tam to netrkne, bo se to tam zapisuje tak jak to je, ale XML dokument má některá pravidla.

    Pokud to parsujete „nějak“ partyzánsky, lze udělat prasárny typu:
    Vem hodnotu (řetězec) a zaměň:
    &amp; za &
    &amp;lt; za &lt;
    &amp;gt; za &gt;
    &amp;quot; za &quot;
    &amp;apos; za &apos;
    
    Pak z toho dostanete normální HTML řetězce no a musíte si zaměnit sekvence:
    &lt; za <
    &gt; za >
    &quot; za "
    &apos; za '
    &xXX za chr(hextodec(XX))
    
    A asi tímto divným postupem z toho vyleze normální string.
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†
    16.11.2010 00:40 Ladislav Nešněra | skóre: 30 | blog: ..+2
    Rozbalit Rozbalit vše Re: neznámé kódování v XML
    Oběma ještě jednou díky za pomoc

    Neb si potřebuji připomenout Python, řešil jsem to v něm. Po prvním kole mi XSL transformace nechala nečitelné jen ty hexadecimálně zapsané entity. Těch jsem se následně zbavil kódem inspirovaným tímto.

    Ještě jsem narazil na docela zajímavý projekt, žel hexadecimální entity také neumí.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.