abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:55 | Zajímavý software

    Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT. Ve stejném repozitáři se nacházejí i před lety zveřejněné zdrojové k kódy MS-DOSu 1.25 a 2.0.

    Ladislav Hagara | Komentářů: 0
    včera 17:33 | Nová verze

    Canonical vydal (email, blog, YouTube) Ubuntu 24.04 LTS Noble Numbat. Přehled novinek v poznámkách k vydání a také příspěvcích na blogu: novinky v desktopu a novinky v bezpečnosti. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu MATE, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 10. LTS verzi.

    Ladislav Hagara | Komentářů: 8
    včera 14:22 | Komunita

    Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

    Ladislav Hagara | Komentářů: 1
    včera 13:22 | Nová verze

    Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Nová verze

    Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

    Ladislav Hagara | Komentářů: 0
    včera 04:55 | Nová verze

    OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

    Ladislav Hagara | Komentářů: 0
    včera 04:22 | Nová verze

    Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

    Ladislav Hagara | Komentářů: 0
    včera 04:11 | Nová verze

    R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

    Ladislav Hagara | Komentářů: 0
    24.4. 22:44 | IT novinky

    IBM kupuje společnost HashiCorp (Terraform, Packer, Vault, Boundary, Consul, Nomad, Waypoint, Vagrant, …) za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

    Ladislav Hagara | Komentářů: 13
    24.4. 15:55 | Nová verze

    Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    KDE Plasma 6
     (73%)
     (9%)
     (2%)
     (16%)
    Celkem 773 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    Administrace komentářů

    Jste na stránce určené pro řešení chyb a problémů týkajících se diskusí a komentářů. Můžete zde našim administrátorům reportovat špatně zařazenou či duplicitní diskusi, vulgární či osočující příspěvek a podobně. Děkujeme vám za vaši pomoc, více očí více vidí, společně můžeme udržet vysokou kvalitu AbcLinuxu.cz.

    Příspěvek
    23.12.2011 21:49 l0gik | skóre: 22
    Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8
    Jestli to chápu, tak máš ve stejném sloupci různé znakové sady (pokud je vždy sloupec stejný, tak pomocí SQL příkazů to před exportem opravíš snadno, to asi víš). Navíc evidentně to není jen "cestina" v latin1, protože ta by šla zkonvertovat do latin2, opravdu se tam využívají znaky z obou znakových sad. V tu chvíli seš prostě "v kopru", protože principiálně nejde rozlišit, kterej řádek je v kterym kódování. Jak bys to chtěl udělat? To jde udělat jen podle významu a není vyloučeno, že ta samá posloupnost bytů bude mít význa v obou kódováních.

    Jediný, co můžeš, je udělat nějakou fci, která se to pokusí heuristicky poznat, např. tak, že nadefinuješ "raritu znaků", podle toho jak často se (ne)vyskytují v daném jazyce a nějakou hodnotící fci (např. sumu kvadrátů rarity) se pokusíš odhadnout, jestli je danej řádek v tom nebo v tom kódování a převíst řádek po řádce nějakym skriptem (iconv je i např. v php). Nebo zkusit lookup jednotlivých slov proti slovníku - pokud nějakej máš, popř. nastudovat formát mozilly.

    Jinak samozřejmě latin1 a latin2 jsou nepoměřitelné množiny kódování, takže nemůžeš konvertovat jednu do druhý, musíš je vždy konvertovat na nějakou nadmnožinu (čili utf8). Konverze z latin1 do latin2 ti selže na znacích, které jsou v latin1 ale ne v latin2. Zdali to selže ale nemůžeš brát jako bernou minci pro to, jaké je to kódování: selhání Ti pouze vybere řádky, u kterých je třeba rozhodnout, zdali jsou v latin1 nebo latin2, protože prostě v těch řádkách je znak, kterej má jinej "smysl" v latin1 a v latin2 - nijak z toho nepoznáš, jestli tam má bejt ř, nebo ø.

    Teoreticky bys teda moh udělat dump s tím, že každej řádek bude na novym řádku (popř. nahradit ), ( za novej řádek), provýst konverzi pomocí iconv s iconv -f latin1 -t latin2//ignore || iconv -t latin1 -f latin2 a pak diffem porovnat. A pokud bude jen málo lišících se řádek (tzn většina bude "cesky"), tak to rozhodnout manuálně. Ale pokud je v databázi čeština, tak se Ti bude lišit každej řádek, kde je např. š.

    V tomto formuláři můžete formulovat svou stížnost ohledně příspěvku. Nejprve vyberte typ akce, kterou navrhujete provést s diskusí či příspěvkem. Potom do textového pole napište důvody, proč by měli admini provést vaši žádost, problém nemusí být patrný na první pohled. Odkaz na příspěvek bude přidán automaticky.

    Vaše jméno
    Váš email
    Typ požadavku
    Slovní popis
    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.