abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 17:11 | Nová verze

    Byl vydán Nextcloud Hub 8. Představení novinek tohoto open source cloudového řešení také na YouTube. Vypíchnout lze Nextcloud AI Assistant 2.0.

    Ladislav Hagara | Komentářů: 0
    dnes 13:33 | Nová verze

    Vyšlo Pharo 12.0, programovací jazyk a vývojové prostředí s řadou pokročilých vlastností. Krom tradiční nadílky oprav přináší nový systém správy ladících bodů, nový způsob definice tříd, prostor pro objekty, které nemusí procházet GC a mnoho dalšího.

    Pavel Křivánek | Komentářů: 4
    dnes 04:55 | Zajímavý software

    Microsoft zveřejnil na GitHubu zdrojové kódy MS-DOSu 4.0 pod licencí MIT. Ve stejném repozitáři se nacházejí i před lety zveřejněné zdrojové k kódy MS-DOSu 1.25 a 2.0.

    Ladislav Hagara | Komentářů: 30
    včera 17:33 | Nová verze

    Canonical vydal (email, blog, YouTube) Ubuntu 24.04 LTS Noble Numbat. Přehled novinek v poznámkách k vydání a také příspěvcích na blogu: novinky v desktopu a novinky v bezpečnosti. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu MATE, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 10. LTS verzi.

    Ladislav Hagara | Komentářů: 13
    včera 14:22 | Komunita

    Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

    Ladislav Hagara | Komentářů: 2
    včera 13:22 | Nová verze

    Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

    Ladislav Hagara | Komentářů: 0
    včera 12:44 | Nová verze

    Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

    Ladislav Hagara | Komentářů: 0
    včera 04:55 | Nová verze

    OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

    Ladislav Hagara | Komentářů: 0
    včera 04:22 | Nová verze

    Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

    Ladislav Hagara | Komentářů: 0
    včera 04:11 | Nová verze

    R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

    Ladislav Hagara | Komentářů: 0
    KDE Plasma 6
     (74%)
     (9%)
     (2%)
     (16%)
    Celkem 797 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    Dotaz: mysqldump | iconv > vysledok.txt (pamäť)

    20.1.2006 09:08 Stanislav Motyčka | skóre: 9 | Revúca
    mysqldump | iconv > vysledok.txt (pamäť)
    Přečteno: 428×
    Zdravim Vas

    Vcera som nechal urobit nasl. prikaz:
    nohup mysqldump --user='user' --password='password' --databases DB1 | iconv -c -f"CP852" -t"ISO-8859-2" > /opt2/DB1.txt &
    
    Nakolko sa jednalo o 1,3 GB databazu, zrejme to system nestravil, proces zabil a dnes som si nasiel od neho pozdrav:
    Jan 19 15:48:08 LINUX-server kernel: oom-killer: gfp_mask=0x601d2, order=0
    Jan 19 15:48:09 LINUX-server kernel: Mem-info:
    Jan 19 15:48:09 LINUX-server kernel: DMA per-cpu:
    Jan 19 15:48:09 LINUX-server kernel: cpu 0 hot: low 2, high 6, batch 1 used:5
    Jan 19 15:48:09 LINUX-server kernel: cpu 0 cold: low 0, high 2, batch 1 used:1
    Jan 19 15:48:09 LINUX-server kernel: Normal per-cpu:
    Jan 19 15:48:09 LINUX-server kernel: cpu 0 hot: low 62, high 186, batch 31 used:80
    Jan 19 15:48:09 LINUX-server kernel: cpu 0 cold: low 0, high 62, batch 31 used:48
    Jan 19 15:48:09 LINUX-server kernel: HighMem per-cpu: empty
    Jan 19 15:48:09 LINUX-server kernel: Free pages:        5264kB (0kB HighMem)
    Jan 19 15:48:09 LINUX-server kernel: Active:60900 inactive:60734 dirty:0 writeback:0 unstable:0 free:1316 slab:2998 mapped:120948 pagetables:841
    Jan 19 15:48:09 LINUX-server kernel: DMA free:2072kB min:88kB low:108kB high:132kB active:5500kB inactive:4992kB present:16384kB pages_scanned:11437 all_unreclaimable? yes
    Jan 19 15:48:09 LINUX-server kernel: lowmem_reserve[]: 0 496 496
    Jan 19 15:48:11 LINUX-server kernel: Normal free:3192kB min:2804kB low:3504kB high:4204kB active:238100kB inactive:237944kB present:507904kB pages_scanned:608421 all_unreclaimable? no
    Jan 19 15:48:11 LINUX-server kernel: lowmem_reserve[]: 0 0 0
    Jan 19 15:48:12 LINUX-server kernel: HighMem free:0kB min:128kB low:160kB high:192kB active:0kB inactive:0kB present:0kB pages_scanned:0 all_unreclaimable? no
    Jan 19 15:48:12 LINUX-server kernel: lowmem_reserve[]: 0 0 0
    Jan 19 15:48:12 LINUX-server kernel: DMA: 0*4kB 1*8kB 1*16kB 0*32kB 0*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB 0*4096kB = 2072kB
    Jan 19 15:48:12 LINUX-server kernel: Normal: 116*4kB 5*8kB 0*16kB 0*32kB 12*64kB 1*128kB 1*256kB 1*512kB 1*1024kB 0*2048kB 0*4096kB = 3192kB
    Jan 19 15:48:12 LINUX-server kernel: HighMem: empty
    Jan 19 15:48:12 LINUX-server kernel: Swap cache: add 1188494, delete 1185783, find 604335/681068, race 0+0
    Jan 19 15:48:12 LINUX-server kernel: Free swap  = 0kB
    Jan 19 15:48:12 LINUX-server kernel: Total swap = 1060280kB
    Jan 19 15:48:12 LINUX-server kernel: Free swap:            0kB
    Jan 19 15:48:12 LINUX-server kernel: 131072 pages of RAM
    Jan 19 15:48:12 LINUX-server kernel: 0 pages of HIGHMEM
    Jan 19 15:48:12 LINUX-server kernel: 2260 reserved pages
    Jan 19 15:48:13 LINUX-server kernel: 6322 pages shared
    Jan 19 15:48:13 LINUX-server kernel: 2711 pages swap cached
    Jan 19 15:48:13 LINUX-server kernel: 0 pages dirty
    Jan 19 15:48:13 LINUX-server kernel: 0 pages writeback
    Jan 19 15:48:13 LINUX-server kernel: 120948 pages mapped
    Jan 19 15:48:13 LINUX-server kernel: 2998 pages slab
    Jan 19 15:48:13 LINUX-server kernel: 841 pages pagetables
    Jan 19 15:48:14 LINUX-server kernel: Out of Memory: Killed process 6623 (iconv).
    
    Ako teda urobit dump (objemnej) celej databazy do 1 suboru avsak uz v inej znakovej sade. Do 1 preto, aby som zbytocne nezaprataval miesto 2 velkymi subormi.

    Odpovědi

    20.1.2006 10:19 cronin | skóre: 49
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Njn, docasne subory sa pouzivaju, ked objem dat nezvlada pamat. Je ale diskutabilne, co tu zralo pamat, a ci to nebude rovnako zrat pamat aj v pripade, ked sa budu spracovavat udaje pomocou docasnych suborov, nie cez ruru.
    20.1.2006 10:41 Semo | skóre: 45 | blog: Semo
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Velmi divne, ze iconv pri prudovom spracovani zozral vela pamate. Nemohlo to byt, ze pamat zozralo mysql, ale system zabil hlavny proces skupiny, co je pri kolone posledny prikaz? (toto je skor otazka na niekoho dobre znaleho systemu, nez na Vas).

    Ako pokus, ci sa iconv nechova divne mozete skusit ten text na konvertovanie z niecoho iba generovat. Napr cyklom vypisovat par kilovy textovy subor a posielat to do iconvu, ci bude rast jeho spotreba pamate. Ak hej, tak je potom podla mna iconv vadny.
    If you hold a Unix shell up to your ear, you can you hear the C.
    20.1.2006 11:26 Semo | skóre: 45 | blog: Semo
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    No, spravil som si vlastny pokus, pockal 4 minuty, nez OOMK zauradoval a tvrdim, ze iconv je BLBY!

    Mam 512MB pamate a podarilo sa mi do iconvu natlacit cca 450MB textu a potom zacal system swapovat. Mam skoro taky isty velky swap (nieco na nom uz bolo, ale nie vela). Celkovo sa mi podarilo do iconvu natlacit cca 800MB textu. Potom sa nic nedialo, potom OOMK zabil iconv. File, do ktoreho bol vystup presmerovany bol prazdny. Takze iconv si cely text natiahne do pamate a zacne tam robit konverziu. K tej sa nedostal, pretoze bol zostreleny.

    Po tomto si o iconve myslim, ze je dobry tak akurat na prekodovanie titulkov k filmu, ale inac je na prd.

    Pouzite ine konvertovatko (napr. cstocs), alebo tych par znakov v com sa to lisi si najdite a napiste ich ako pravidla pre sed.
    If you hold a Unix shell up to your ear, you can you hear the C.
    20.1.2006 12:05 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Ono to kvůli multi byte kódováním jinak nejde. Pokud vstup bude soubor, tak se mmapne a neměl by s pamětí být problém.
    we have a problem with reading from a desriptor since we must not provide the iconv() function an incomplete character or shift sequence at the end of the buffer. Since we have to deal with arbitrary encodings we must read the whole text in a buffer and process it in one step.
    Jinak pro tento případ je nejrozumnější nastavit kódování přímo mysqldumpu...
    20.1.2006 12:13 Semo | skóre: 45 | blog: Semo
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Ak to chapem spravne, tak ide o to, ze ak nacitaju do buffera 1000 znakov, tak pocet vystupnych znakov moze byt mensi alebo rovny alebo vacsi ako 1000 a v 1. pripade by vystupny buffer obsahoval menej platnych znakov ako vstupny a v 3. pripade by im ostavali nejake zvysky bufferu neprekodovane, ktore by museli konvertovat v dalsom cykle.

    Chapem, ze sa to nepogramuje nejak prijemne, ale da sa. A trebars za cenu isteho zpomalenia by vedel konvertovat aj z deskriptoru lubovolne vleky file. Mal by tam na taketo spravanie prinajmensom option.
    If you hold a Unix shell up to your ear, you can you hear the C.
    20.1.2006 12:19 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Nejde o počet ale o to, že je potřeba zajistit aby v bufferu nebyla jenom část multi byte znaku. Taky by se to dalo napsat, ale znamenalo by to v podstatě duplikovat dekódování multi byte znaků při plnění bufferu.
    20.1.2006 12:29 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Neřekl bych. Prostě si načtu (např. 64 KB) buffer, zkonvertuji z něj, co se dá, zbytek přesunu na začátek, načtu zbytek bufferu atd. Nebo to napíšu v C++ a budu číst z std::wifstream rovnou wchar_t.
    20.1.2006 12:37 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Nemůžu číst wchar_t, protože nevím jak to kódování vypadá.

    Postupná konverze by fungovala, akorát se to s iconvem hůř implementuje.
    20.1.2006 13:39 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)

    To samozřejmě musíte vědět (nebo aspoň předpokládat), jinak jste namydlený i s klasickým postupem. Když půjdu do extrému, jednoduchý filtr by mohl vypadat asi takto (pro jednoduchost a přehlednost jsem vynechal zpracování chyb):

    #include <iostream>
    #include <locale>
    
    int main(int argc, char* argv[])
    {
      if (argc < 3) return 1;
      std::ios_base::sync_with_stdio(false);
      std::wcin.imbue(std::locale(argv[1]));
      std::wcout.imbue(std::locale(argv[2]));
      std::wcout << std::wcin.rdbuf();
      return 0;
    }
    
    (jako argument se tomu musí dát celé jméno locale, ne jen kódování).
    20.1.2006 14:20 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Protože to chce locale, tak to nejspíš nebude fungovat pro všechna kódování (a vůbec nevím jestli existuje rozumný způsob jak převést kódování na nějaké locale).

    Taky to bude určitě pomalejší, protože se dvakrát dekódují multibyte znaky.

    Stejně je lepší použít recode, které to umí rovnou a nepoužívat iconv.
    20.1.2006 14:52 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Taky to bude určitě pomalejší, protože se dvakrát dekódují multibyte znaky. … Stejně je lepší použít recode, které to umí rovnou a nepoužívat iconv.

    Tak jsem to zkusil a výsledky vás asi nemile překvapí:

    • iconv: user 5.24 s, system 0.56 s
    • cvt: user 6.60 s, system 0.29 s
    • recode: user 59.4 s, system 1.34 s
    (cvt je ten instantní prográmek z minulého příspěvku). Šlo o konverzi klasické věty "Příliš žluťoučký kůň úpěl ďábelské ódy.\n" (v počtu 10 milionů exemplářů) z UTF-8 do ISO-8859-2. Těch 20 procent ve prospěch iconv sice může někdy hrát roli, ale rozhodně se nedá říci, že řešení standardními prostředky libstdc++ je nějak výrazně pomalejší. Navíc pokud iconv opravdu nejdřív nabufferuje celý vstup, tak pro velké množství dat těch 20 procent rád obětuji a pro malé je to stejně jedno. No a recode, který jste propagoval, je úplně někde jinde…
    20.1.2006 12:29 Michal Čihař | skóre: 61 | blog: Bláboly | Praha
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Jinými slovy: API iconvu na toto není navržené. Recode je na tom lépe a IMHO by nemělo načítat celý soubor.
    20.1.2006 13:06 razor | skóre: 33
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Co takhle parametr mysqldumpu --default-character-set=... ?
    20.1.2006 14:10 Stanislav Motyčka | skóre: 9 | Revúca
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    dobry nápad, táto možnosť ma nenapadla hm ... ALE !!! nie som až taký znalec znakových sád, ale -> http://www.abclinuxu.cz/forum/show/117672
    Pomocou PHP-skriptu som presypal data z 6000 DBF-súborov do MySQL (kde sa podla štruktúry (je tam 9 rôznych typov dbf-súborov, čo sa týka štruktúry) nahádzali do 9 tabuliek).
    Vsadil som na možnosť, že urobim najprv konverziu dbf-súborov, ktoré boli v znakovej sade CP-852 (Vych.Europa) do ISO-8859-2, avšak konverzia 'iconv'-ertom nedopadla dobre, ako by preštruktúrovalo (Zbadal som to pri prehadzovani dat do MySQL).
    Tak som teda presyp stopol databázu vyprázdnil, a nasáčkoval som ich do DB v ich pôvodnej znakovej sade (CP-852).
    No a teraz nadviažem na začiatok (prečo rovno nedumpovať do chcenej znakovej sady (ISO-8859-2)?). Pretože v DB sú dáta (pre MySQL asi neznámej) znakovej sade CP-852.
    Možno sa mýlim. ???
    20.1.2006 14:40 razor | skóre: 33
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    No moje instalce mysql cp852 má. Dostupné sady zjistíš: show character set;.
    20.1.2006 14:54 razor | skóre: 33
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    Protože si asi při insertování dat nestanovoval v jakém jsou kódování, tak mysql si myslí (defaultně), že ty data jsou v latin1. Čili možná by se hodilo, ty data do mysql znova narvat, a řict mysql, že jsou v cp852. No a pak kdyby si chtěl dump v latin2, tak by měl fungovat ten parametr --default-character-set= bez problémů. Možná akorát budeš muset ještě použít parametr mysqldumpu --character-sets-dir=.... U mě ty sady jsou v /usr/share/mysql/charsets
    20.1.2006 15:01 hele
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    nevim presne zda to treba neni problem v tom mysqldump/mysqld. ja obvykle na rapidne velke databaze uzivam mysqldump --quick ..............

    ale mozna v novych verzi mysqld uz je quick detailne a necacheuje se vysledek.
    20.1.2006 15:12 Stanislav Motyčka | skóre: 9 | Revúca
    Rozbalit Rozbalit vše Re: mysqldump | iconv > vysledok.txt (pamäť)
    myslím, že nie, pretože ak cez rúru prevádzam dump všetkých databáz '--all-databases' do 'gzip'-u, tak je to v poriadku.
    No a tu zlyhal za rúrou 'iconv'.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.