abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:44 | IT novinky

    Společnost Valve aktualizovala přehled o hardwarovém a softwarovém vybavení uživatelů služby Steam. Podíl uživatelů Linuxu dosáhl v březnu 5,33 % (Windows -4,28 %, OSX +1,19 %, Linux +3,10 %). Nejčastěji používané linuxové distribuce jsou Arch Linux, Linux Mint a Ubuntu. Při výběru jenom Linuxu vede SteamOS Holo s 24,48 %. Procesor AMD používá 67,48 % hráčů na Linuxu.

    Ladislav Hagara | Komentářů: 0
    včera 23:22 | IT novinky

    Společnost Apple slaví padesáté narozeniny. Založena byla 1. dubna 1976.

    Ladislav Hagara | Komentářů: 0
    včera 22:33 | Nová verze

    FreeTube, desktopový klient pro YouTube využívající lokální API, byl vydán ve verzi 0.24.0. Toto velké opravné vydání implementuje SABR (Server-Based Adaptive Bit Rate), což řeší část nedávných problémů s načítáním videí z YouTube, a aktualizuje základní komponenty jako Electron nebo přehrávač Shaka Player.

    |🇵🇸 | Komentářů: 0
    včera 16:33 | Humor

    Je tu opět apríl. O víkendu zmizel kamion s 12 tunami tyčinek KitKat. Firmy to využívají k aprílovým žertům. Groupon má super akci. Koupíte 1 tyčinku a dostanete 100 zdarma. Ryanair si přelepil letadla. Šéf Outlooku se ptá, proč mají v baráku 14 beden tyčinek KitKat (𝕏). Prusa Research představuje Prusa Pro ACU a vysvětluje proč přílišné sušení škodí vaším filamentům. Telefon Sony Xperia má miliónnásobný zoom (𝕏). PC.net představil Super Ultrabox 2600 se zajímavými parametry. Další aprílové novinky například na April Fools' Day On The Web.

    Ladislav Hagara | Komentářů: 2
    včera 13:22 | IT novinky

    Společnost OpenAI, která stojí za chatovacím robotem s umělou inteligencí (AI) ChatGPT, získala od investorů 122 miliard USD (2,6 bilionu Kč). Hodnota společnosti tak dosáhla 852 miliard dolarů (více než 18 bilionů Kč). Nejnovější kolo investování se stalo největší, jaké zatím firma uskutečnila, a peníze mají posílit ambiciózní plány rozšíření výpočetní kapacity, datových center a nábor talentů.

    Ladislav Hagara | Komentářů: 9
    včera 13:11 | IT novinky

    Nástroj k identifikaci občanů v on-line komunikaci s úřady byl dnes dopoledne zhruba dvě hodiny částečně nedostupný. Problém se objevil kolem 09:00 a podařilo se ho vyřešit kolem 11:00. Částečně nedostupná byla služba Národní identitní autority (NIA), problémy podle DIA (Digitální a informační agentura) ovlivňovaly přihlašování například i přes bankovní identitu. „Dostupnost NIA byla plně obnovena, přihlášení k digitálním službám

    … více »
    Ladislav Hagara | Komentářů: 3
    včera 13:00 | IT novinky

    Eben Upton oznámil další zdražení počítačů Raspberry Pi kvůli růstu cen pamětí a představil Raspberry Pi 4 s 3 GB RAM za 83,75 dolarů.

    Ladislav Hagara | Komentářů: 0
    včera 04:33 | Humor

    Anthropic patrně omylem zveřejnil celý zdrojový kód svého CLI nástroje Claude Code prostřednictvím přiloženého sourcemap souboru v npm balíčku. Únik odhalil doposud nijak nezveřejněné funkce jako je například režim v utajení, autonomní agent 'KAIROS', orchestrace multi‑agentů, režim snění nebo dokonce virtuální mazlíček Buddy. Zajímavostí je detekce naštvání uživatele pomocí obyčejného regexpu. Anthropic rychle odstranil sourcemap a vydal opravu, nicméně kopie kódu se již stihly na GitHubu rozšířit mezi prostým lidem.

    NUKE GAZA! 🎆 | Komentářů: 12
    31.3. 14:33 | Humor

    Copilot automaticky vkládal do pull requestů 'propagační tipy', reklamní text se na GitHubu objevil ve více než jedenácti tisících pull requestech. Po vlně kritiky byla tato funkce zablokována a produktový manažer Tim Rogers připustil, že umožnit Copilotovi upravovat cizí pull requesty bez vědomí autorů byla chyba.

    NUKE GAZA! 🎆 | Komentářů: 4
    31.3. 12:55 | Upozornění

    Je 31. března a tedy Světový den zálohování (World Backup Day). Co by se stalo, kdyby Vám právě teď odešel počítač, tablet nebo telefon, který používáte?

    Ladislav Hagara | Komentářů: 4
    Které desktopové prostředí na Linuxu používáte?
     (15%)
     (7%)
     (1%)
     (12%)
     (30%)
     (3%)
     (5%)
     (1%)
     (14%)
     (23%)
    Celkem 1203 hlasů
     Komentářů: 29, poslední 31.3. 11:17
    Rozcestník

    Dotaz: latin1 a latin2 do utf8

    mahoney avatar 23.12.2011 20:36 mahoney | Pelhřimov
    latin1 a latin2 do utf8
    Přečteno: 1038×
    dobry den,

    mam tady jeden dump stare databaze, kde jsou namichane znaky z latin1 i latin2.

    neznate prosim nekdo postup, jak takovy soubor prevest do utf8?

    dekuji


    Řešení dotazu:


    Odpovědi

    23.12.2011 20:39 lightbringer
    Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8
    Iconv?
    mahoney avatar 23.12.2011 20:46 mahoney | Pelhřimov
    Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8
    :-) no jo, ale jak?

    $ iconv -f latin1 -t latin2 dump.sql > /dev/null

    iconv: illegal input sequence at position 2471

    $ iconv -f latin2 -t latin1 dump.sql > /dev/null

    iconv: illegal input sequence at position 2471

    ja spis myslim, ze bude potreba nejakeho skriptu, ktery _selektivne_ prevede znaky na jedno spolecne kodovani. a mozna uz takovy skript nekdo napsal. jenomze se mi ho nedari vygooglit

    Josef Kufner avatar 23.12.2011 21:32 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8
    iconv -f latin1 -t utf8 ...
    iconv -f latin2 -t utf8 ...
    Latin1 a Latin2 nelze bezeztráty převádět tam a zpět, protože ty kódování prostě obsahují každé něco jiného.

    Pokud chceš ztrátový převod, tak:
    iconv -f neco -t neco_jineho//translit ...
    Vybírá to vizuálně podobné znaky.
    Hello world ! Segmentation fault (core dumped)
    Řešení 1× (mahoney (tazatel))
    23.12.2011 21:49 l0gik | skóre: 22
    Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8
    Jestli to chápu, tak máš ve stejném sloupci různé znakové sady (pokud je vždy sloupec stejný, tak pomocí SQL příkazů to před exportem opravíš snadno, to asi víš). Navíc evidentně to není jen "cestina" v latin1, protože ta by šla zkonvertovat do latin2, opravdu se tam využívají znaky z obou znakových sad. V tu chvíli seš prostě "v kopru", protože principiálně nejde rozlišit, kterej řádek je v kterym kódování. Jak bys to chtěl udělat? To jde udělat jen podle významu a není vyloučeno, že ta samá posloupnost bytů bude mít význa v obou kódováních.

    Jediný, co můžeš, je udělat nějakou fci, která se to pokusí heuristicky poznat, např. tak, že nadefinuješ "raritu znaků", podle toho jak často se (ne)vyskytují v daném jazyce a nějakou hodnotící fci (např. sumu kvadrátů rarity) se pokusíš odhadnout, jestli je danej řádek v tom nebo v tom kódování a převíst řádek po řádce nějakym skriptem (iconv je i např. v php). Nebo zkusit lookup jednotlivých slov proti slovníku - pokud nějakej máš, popř. nastudovat formát mozilly.

    Jinak samozřejmě latin1 a latin2 jsou nepoměřitelné množiny kódování, takže nemůžeš konvertovat jednu do druhý, musíš je vždy konvertovat na nějakou nadmnožinu (čili utf8). Konverze z latin1 do latin2 ti selže na znacích, které jsou v latin1 ale ne v latin2. Zdali to selže ale nemůžeš brát jako bernou minci pro to, jaké je to kódování: selhání Ti pouze vybere řádky, u kterých je třeba rozhodnout, zdali jsou v latin1 nebo latin2, protože prostě v těch řádkách je znak, kterej má jinej "smysl" v latin1 a v latin2 - nijak z toho nepoznáš, jestli tam má bejt ř, nebo ø.

    Teoreticky bys teda moh udělat dump s tím, že každej řádek bude na novym řádku (popř. nahradit ), ( za novej řádek), provýst konverzi pomocí iconv s iconv -f latin1 -t latin2//ignore || iconv -t latin1 -f latin2 a pak diffem porovnat. A pokud bude jen málo lišících se řádek (tzn většina bude "cesky"), tak to rozhodnout manuálně. Ale pokud je v databázi čeština, tak se Ti bude lišit každej řádek, kde je např. š.

    23.12.2011 21:00 Kit
    Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8
    Používám recode. S parametrem -f občas snese i divné vstupní kódování. Rozhodně bych se nepokoušel převádět latin2 do latin1, protože tím přijdeš o všechny znaky s háčky. Spíš bych konvertoval latin2 do utf8 a pak teprve řešil zbytek.

    Můžeš zkusit i standardní utilitu tr, ale asi ti dá trochu víc zabrat konfigurace parametrů.
    Řešení 1× (mahoney (tazatel))
    23.12.2011 22:39 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
    Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8
    Podle mě nelze obecně převést text mixovaný z latin1 a latin2 do utf-8.
    Ale tipl bych si, že jsou to různé sloupce s různým kováním, pak je tedy nutné takto je překládat.
    Nejsnazší je asi dump binárně nahrnou do DB s tím, že struktura se před sypáním dat opraví tak, aby jednotlivé sloupce měli patřičné kódování latin1, latin2 a pak se to dumpne ven v UTF-8.
    Jinak by se musel parsovat dump a to by mě teda nebavilo :-).
    To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.