Inzerujte na AbcPráce.cz od 950 Kč

napište » Zprávičky

Jak tým Chrome Security pomocí AI zvyšuje bezpečnost Chrome

dnes 04:22 | Zajímavý článek

Příspěvek na blogu Google Security popisuje, jak tým Chrome Security využívá umělou inteligenci k zásadnímu zrychlení a zlepšení procesu odhalování, třídění a opravování bezpečnostních chyb v prohlížeči Chrome. Díky AI byla nalezena kritická chyba, která byla v kódu přes 13 let. Ve verzích Chrome 149 a 150 bylo opraveno více chyb než v předchozích 23 verzích dohromady.

Ladislav Hagara | Komentářů: 0

Firmy v EU musí označovat obsah vytvořený umělou inteligencí

včera 13:11 | IT novinky

Firmy v EU musí počínaje dnešním dnem označovat obsah vytvořený umělou inteligencí. Znamená to povinnost informovat uživatele, že člověk komunikuje s chatbotem či jiným systémem AI. Rovněž obrázky, audia či videa, které jsou vytvořené nebo zmanipulované pomocí umělé inteligence a které mohou působit jako autentické, musejí být jasně označeny jako uměle vytvořené.

Ladislav Hagara | Komentářů: 2

NetBSD 11.0

včera 04:11 | Nová verze

Byla vydána nová major verze 11.0 open source unixového operačního systému NetBSD (Wikipedie). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

NÚKIB podpořil mezinárodní doporučení pro lepší přehled o složení softwaru

1.8. 19:55 | IT novinky

Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) se zapojil do mezinárodní iniciativy vedené americkou agenturou CISA (Cybersecurity and Infrastructure Security Agency) a dalšími partnery, jejímž cílem je stanovit minimální náležitosti pro tzv. Software Bill of Materials (SBOM). Nový dokument přináší praktická doporučení, jak by měl vypadat přehled komponent softwaru a jak s ním v praxi pracovat. SBOM lze

… více »

Ladislav Hagara | Komentářů: 1

Servo 0.4.0

1.8. 03:00 | Nová verze

V aktuálním přehledu vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) bylo oznámeno vydání nové verze 0.4.0. Výrazně se zlepšilo vykreslování stránek jako lichess.org, Zulip nebo Speedtest.

Ladislav Hagara | Komentářů: 0

Kritické zranitelnosti v produktech VMware: CVE-2026-59309, CVE-2026-59310 a CVE-2026-47876

31.7. 19:22 | Bezpečnostní upozornění

Vládní CERT upozorňuje (𝕏) na kritické zranitelnosti v produktech VMware: CVE-2026-59309, CVE-2026-59310 a CVE-2026-47876. Zranitelnosti v VMware vCenter umožňují vzdálenému útočníkovi se síťovým přístupem obejít autentizaci a získat neoprávněný přístup k vCenter, případně zneužít directory traversal ke spuštění libovolného kódu na vCenter.

Ladislav Hagara | Komentářů: 1

Bezpečnostní chyba hardwarových kryptopeněženek Coldcard

31.7. 18:33 | Bezpečnostní upozornění

Společnost Coinkite upozorňuje na bezpečnostní chybu svých hardwarových kryptopeněženek Coldcard. Jedná se o kritickou chybu v generování náhodných čísel (RNG). Místo hardwarového generátoru náhodných čísel (TRNG) byl omylem používán softwarový fallback (PRNG).

Ladislav Hagara | Komentářů: 4

Shadowfetch Linux, nová distribuce s důrazem na lokální umělou inteligenci

31.7. 14:11 | Zajímavý projekt

Představena byla nová linuxová distribuce Shadowfetch Linux. Na rozdíl od mnoha nováčků, které nabízejí převážně jiné téma a výběr softwaru, tato distribuce založená na Debianu Testing s desktopovým prostředím KDE Plasma 6.6, klade lokálně běžící umělou inteligenci do centra svého desktopového zážitku.

Pinhead | Komentářů: 0

Max Leiter: Wayland, X11, GNOME a KDE nativně na iPadu

30.7. 17:22 | Zajímavý projekt

Max Leiter v roce 2019 zkusil zprovoznit X server na iPadu (iOS). Nyní se k tématu vrátil a s pomocí LLM a balíčkovacích nástrojů Procursus rozběhl desktop s X11 i Waylandem. Jeho balíčky jsou dostupné v repozitáři xiOS.

|🇵🇸 | Komentářů: 27

Google Cloud získal certifikaci pro český veřejný sektor

30.7. 13:33 | IT novinky

Společnost Google Cloud dnes oznámila, že její infrastruktura a služby byly oficiálně zařazeny do Katalogu cloud computingu vedeného Digitální a informační agenturou (DIA). Tato certifikace potvrzuje, že infrastruktura a služby Google Cloud splňují přísné bezpečnostní a regulační požadavky České republiky pro provoz cloudových služeb ve veřejném sektoru.

Ladislav Hagara | Komentářů: 6

Centrum | Napsat | Starší

navrhněte » Anketa

Komentářů: 30, poslední 3.4. 20:20

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / latin1 a latin2 do utf8

Štítky: databáze

Dotaz: latin1 a latin2 do utf8

23.12.2011 20:36 mahoney | Pelhřimov
latin1 a latin2 do utf8

Přečteno: 1103×

Odpovědět | Admin

dobry den,

mam tady jeden dump stare databaze, kde jsou namichane znaky z latin1 i latin2.

neznate prosim nekdo postup, jak takovy soubor prevest do utf8?

dekuji

Řešení dotazu:

Komentář #6 (Šangala, 1 hlasů)
Komentář #5 (l0gik, 1 hlasů)

Nástroje: Začni sledovat (0) ?

Odpovědi

23.12.2011 20:39 lightbringer
Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8

Iconv?

23.12.2011 20:46 mahoney | Pelhřimov
Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8

no jo, ale jak?

$ iconv -f latin1 -t latin2 dump.sql > /dev/null

iconv: illegal input sequence at position 2471

$ iconv -f latin2 -t latin1 dump.sql > /dev/null

iconv: illegal input sequence at position 2471

ja spis myslim, ze bude potreba nejakeho skriptu, ktery _selektivne_ prevede znaky na jedno spolecne kodovani. a mozna uz takovy skript nekdo napsal. jenomze se mi ho nedari vygooglit

23.12.2011 21:32 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8

iconv -f latin1 -t utf8 ...
iconv -f latin2 -t utf8 ...

Latin1 a Latin2 nelze bezeztráty převádět tam a zpět, protože ty kódování prostě obsahují každé něco jiného.

Pokud chceš ztrátový převod, tak:

iconv -f neco -t neco_jineho//translit ...

Vybírá to vizuálně podobné znaky.

Hello world ! Segmentation fault (core dumped)

Řešení 1× (mahoney (tazatel))

23.12.2011 21:49 l0gik | skóre: 22
Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8

Jestli to chápu, tak máš ve stejném sloupci různé znakové sady (pokud je vždy sloupec stejný, tak pomocí SQL příkazů to před exportem opravíš snadno, to asi víš). Navíc evidentně to není jen "cestina" v latin1, protože ta by šla zkonvertovat do latin2, opravdu se tam využívají znaky z obou znakových sad. V tu chvíli seš prostě "v kopru", protože principiálně nejde rozlišit, kterej řádek je v kterym kódování. Jak bys to chtěl udělat? To jde udělat jen podle významu a není vyloučeno, že ta samá posloupnost bytů bude mít význa v obou kódováních.

Jediný, co můžeš, je udělat nějakou fci, která se to pokusí heuristicky poznat, např. tak, že nadefinuješ "raritu znaků", podle toho jak často se (ne)vyskytují v daném jazyce a nějakou hodnotící fci (např. sumu kvadrátů rarity) se pokusíš odhadnout, jestli je danej řádek v tom nebo v tom kódování a převíst řádek po řádce nějakym skriptem (iconv je i např. v php). Nebo zkusit lookup jednotlivých slov proti slovníku - pokud nějakej máš, popř. nastudovat formát mozilly.

Jinak samozřejmě latin1 a latin2 jsou nepoměřitelné množiny kódování, takže nemůžeš konvertovat jednu do druhý, musíš je vždy konvertovat na nějakou nadmnožinu (čili utf8). Konverze z latin1 do latin2 ti selže na znacích, které jsou v latin1 ale ne v latin2. Zdali to selže ale nemůžeš brát jako bernou minci pro to, jaké je to kódování: selhání Ti pouze vybere řádky, u kterých je třeba rozhodnout, zdali jsou v latin1 nebo latin2, protože prostě v těch řádkách je znak, kterej má jinej "smysl" v latin1 a v latin2 - nijak z toho nepoznáš, jestli tam má bejt ř, nebo ø.

Teoreticky bys teda moh udělat dump s tím, že každej řádek bude na novym řádku (popř. nahradit ), ( za novej řádek), provýst konverzi pomocí iconv s iconv -f latin1 -t latin2//ignore || iconv -t latin1 -f latin2 a pak diffem porovnat. A pokud bude jen málo lišících se řádek (tzn většina bude "cesky"), tak to rozhodnout manuálně. Ale pokud je v databázi čeština, tak se Ti bude lišit každej řádek, kde je např. š.

23.12.2011 21:00 Kit
Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8

Používám recode. S parametrem -f občas snese i divné vstupní kódování. Rozhodně bych se nepokoušel převádět latin2 do latin1, protože tím přijdeš o všechny znaky s háčky. Spíš bych konvertoval latin2 do utf8 a pak teprve řešil zbytek.

Můžeš zkusit i standardní utilitu tr, ale asi ti dá trochu víc zabrat konfigurace parametrů.

Řešení 1× (mahoney (tazatel))

23.12.2011 22:39 Šangala | skóre: 56 | blog: Dutá Vrba - Wally
Rozbalit Rozbalit vše Re: latin1 a latin2 do utf8

Podle mě nelze obecně převést text mixovaný z latin1 a latin2 do utf-8.
Ale tipl bych si, že jsou to různé sloupce s různým kováním, pak je tedy nutné takto je překládat.
Nejsnazší je asi dump binárně nahrnou do DB s tím, že struktura se před sypáním dat opraví tak, aby jednotlivé sloupce měli patřičné kódování latin1, latin2 a pak se to dumpne ven v UTF-8.
Jinak by se musel parsovat dump a to by mě teda nebavilo :-)

To, že trpíš stihomamem, ještě neznamená, že po tobě nejdou. ⰞⰏⰉⰓⰀⰜⰉ ⰗⰞⰅⰜⰘ ⰈⰅⰏⰉ ⰒⰑⰎⰉⰁⰕⰅ ⰏⰉ ⰒⰓⰄⰅⰎ ·:⁖⁘⁙†

Založit nové vlákno • Nahoru

Tiskni Sdílej: