AbcLinuxu:/ Zprávičky / Qt SDK 1.1

Štítky: desktop, grafické toolkity, knihovna, Qt

Qt SDK 1.1

Vyšlo Qt SDK verze 1.1, tato nová verze sjednocuje dříve rozdělená SDK pro desktop a mobilní platformy. Dále nově umožňuje zveřejňovat aplikace na Ovi Store. V rámci SDK 1.1 vychází knihovna Qt 4.7.3, Qt Mobility 1.1.3, Qt Creator 2.1/2.2RC a Qt Simulator 1.1. Více informací také v Qt blogu.

4.5.2011 21:50 | kralyk z abclinuxu | Nová verze

Tiskni Sdílej:

Komentáře

Nástroje: Začni sledovat (2) ? , Tisk

Vložit další komentář

4.5.2011 23:09 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Odpovědět | Sbalit | Link | Blokovat | Admin

nejakou dobu sem pracoval s qt a vetsina veci me tam prijde navrzena celkem dobre, ale pres utf16 se proste neprenesu... :-(

5.5.2011 00:57 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Proč ti utf16 vadí? To jsou imho v Qt horší věci :-D

SPD vůbec není proruská

5.5.2011 07:51 wtfjakovocode
Rozbalit Rozbalit vše Re: Qt SDK 1.1

je to to nejhorsi z unicode. utf-8 je kompatibilni s ascii, a utf-32 ma vsechny znaky stejne dlouhy. utf-16 nema ani jedno.

5.5.2011 12:05 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Utf-16 prakticky má taky všechny znaky stejně dlouhý. Teda jasně, ty rozšiřující části zaberou 2*16, ale ruku na srdce; viděl jsi někdy v praxi znaky textu z Mykénského Řecka nebo hudební symboly ze staré Byzance? :-D

Ono utf-16 je především výkonostně-paměťovým kompromisem. Utf-8 je pomalé, utf-32 zabere šílený paměti. Utf-16 je rychlý, ale přitom nezabírá příliš paměti. Proto je v Qt.

SPD vůbec není proruská

5.5.2011 12:42 wtfjakovocode
Rozbalit Rozbalit vše Re: Qt SDK 1.1

To s tou rychlosti by me zajimalo. Moc tomu neverim - predpokladam, ze zpomaleni je zpusobeny nestalou delkou znaku. Nicmene pro utf-16 mas ten samej problem (2/4 byty).

5.5.2011 14:58 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Nicmene pro utf-16 mas ten samej problem (2/4 byty).

Nemas, protoze to nastane v minimu pripadu. Cili ano, v kodu ten if bude, ale oznaci se za nepravedopodobny a branch prediction to vezme jakoze nenastane...

SPD vůbec není proruská

6.5.2011 02:12 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Máš sice stejný problém, ale ten if je jen jeden pro každý znak, kdežto v utf8 jich máš hned několik.

6.5.2011 11:22 Jindřich Makovička | skóre: 17
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Mohu se zeptat, kde? ;) http://bjoern.hoehrmann.de/utf-8/decoder/dfa/

6.5.2011 11:48 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Máš tam jeden table lookup (v té funkci decode), tunu bitových operací a 2 podmínky:

      if (decode(&state, &codepoint, *s++))
        continue;

      if (codepoint > 0xffff) {
        *d++ = (uint16_t)(0xD7C0 + (codepoint >> 10));
        *d++ = (uint16_t)(0xDC00 + (codepoint & 0x3FF));
      } else {
        *d++ = (uint16_t)codepoint;
      }

5.5.2011 13:32 Miloslav Ponkrác
Rozbalit Rozbalit vše UTF-16

UTF-16 je nejhorší kódování internetu jaké existuje.

Jestli tu chcete udělat dojem, že UTF-16 je nějakým kompromisem, tak lžete. UTF-16 je největší z nouze ctnost.

Unicode kdysi žilo představou, že Unicode se jim vejde do 65535 znaků, což se ukázalo jako utopie. Mezitím se BOHUŽEL rychle Unicode uchytlo a velcí hráči, jako je Microsoft, nebo Sun, nebo IBM tvrdě zadrátovalo do sw 16bitové kódování znaků. Například Windows, Java, ICU a další.

Když se zjistilo, že je 16bitový prostor nestačí, bylo nutné nějak řešit kompatiblitu s již rozšířeným 16 bitových kódováním a vymyslelo se UTF-16.

UTF-16 není žádným kompromisem, je to to nejblbější, nejhloupější a nejméně výhodné kódování, které na Unicode existuje. Důvodem jeho existence je iluze Unicode konsortia, že 16 bitů bude pro Unicode dost a také obrovská rychlost přijetí Unicode na 16 bitech velkými hráči tak, že se to už nedá změnit.

UTF-16 samo o sobě je brzda internetu. Aby vůbec fungovalo, bylo nutné rezervovat 1024 kódů v Unicode tabulce jen proto, aby UTF-16 fungovalo a vyčlenit je a zbytečně zabrat jen pro účely přepínačů v UTF-16.

Dále bylo nutné omezit Unicode z 32 bitů na pouhých 21 bitů, protože debilní UTF-16 kódování víc nezvládne. Nutnost debilního UTF-16 je jediným důvodem, proč Unicode je omezeno na 21 bitů a není využíváno a počítáno z 32 bity.

UTF-16 navíc má problém s little/big endian, takže navíc řešíte pořadí bajtů – to už samotné Vám rychlost vystřílí slušně směrem dolů natolik, aby to výhodné rozhodně nebylo. Kromě toho existuje BOM znak pro detekci, v jakém endianu to je – takže UTF-16 na rozdíl třeba od UTF-8, nebo UTF-32/USC4 nelze procházet zprostředka, ale je nutné vědět, kde je začátek.

UTF-16 nemá žádnou výhodu. Je to to nejhorší co vzniklo. Má všechny nevýhody, které lze nabrat. Je to nalepovák nutný pro kompatibilitu s Javou a Windows, které si bohužel své znaky definovali jako 16 bitové unsigned integery.

Miloslav Ponkrác
www.ponkrac.net

5.5.2011 15:00 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: UTF-16

Jestli tu chcete udělat dojem, že UTF-16 je nějakým kompromisem, tak lžete.

A nejaky argument?
Jinak z toho zbytku je evidentni, ze utf-16 nemas rad, coz je emoce, kterou ti neberu, ale zaroven nebudu brat emoci jako racionalni argument...

SPD vůbec není proruská

6.5.2011 02:35 __dark__
Rozbalit Rozbalit vše Re: UTF-16

Ponkrác a argument? Vždyť to byl naprosto učebnicový výlev:) Ještě chyběla kritika linuxového jádra, která je pro změnu na rootu :)

PS: Měl jsem už napsanou reakci, ale rozmyslel jsem si to:)

5.5.2011 13:38 Miloslav Ponkrác
Rozbalit Rozbalit vše Re: Qt SDK 1.1

„Ono utf-16 je především výkonostně-paměťovým kompromisem. Utf-8 je pomalé, utf-32 zabere šílený paměti. Utf-16 je rychlý, ale přitom nezabírá příliš paměti. Proto je v Qt.“

Ale prdlajs.

Pokud máte Qt posazené nad Windows, které nativně pracuje s UTF-16, pak je UTF-16 výhodné proto, že odpadají konverze.

Stejně tak při použití UTF-16 může Qt použít kódy z IBMovského ICU, které slušně pokrývá vše co s Unicode můžete potřebovat a také pracuje s UTF-16.

Je ale roztomilé, jak z nouze ctnosti a rozhodnutí z lenosti děláte nejlepší rozhodnutí – byl by z Vás skvělý tiskový mluvčí či markeťák.

5.5.2011 15:02 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Sorry, ale ad hominem diskutovat nebudu - o tom se bez pobavit s Jilkem...

SPD vůbec není proruská

6.5.2011 02:12 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

5.5.2011 18:11 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

je to takovy kockopes, ktery kombinuje to nejhorsi z utf8 a ucs32...

Jinak to ze vetsina znaku se vejde do jednoho 16bit slova ti nepomuze, protoze i kdyby to porusoval jenom 1 znak z milionu, tak stejne musis nahradit indexaci (s konstantni slozitosti) za pruchod (s linearni slozitosti)... A branch prediction taky nepomuze, tady jde o slozitost algoritmu, ne o zkraceni jedny operace.

6.5.2011 12:36 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Jinak to ze vetsina znaku se vejde do jednoho 16bit slova ti nepomuze, protoze i kdyby to porusoval jenom 1 znak z milionu, tak stejne musis nahradit indexaci (s konstantni slozitosti) za pruchod (s linearni slozitosti)...

To není pravda, stačí si někde udržovat bool (v případě Qt v QStringu), který bude indikovat, jestli se ve stringu vyskytuje surrogate pair. A když ne, což je většinou, stačí indexace.
Ten bool se aktualizuje při změně dat, kdy se string prochází lineárně tak jako tak.

Nekoukal jsem zatím do zdrojáků Qt, ale předpokládám, že tak nějak to bude...

SPD vůbec není proruská

6.5.2011 13:12 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

jeste lepsi, takze vlastne uz z principu nemuzes vedet jakou ta operace bude mit slozitost... Doma v laboratornich podminkach ti bude vsechno perfektne fungovat, pak se to dostane k nejakymu zakaznikovi do asie a ten ti to omlati o hlavu ;-)

6.5.2011 13:44 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

este lepsi, takze vlastne uz z principu nemuzes vedet jakou ta operace bude mit slozitost...

O(n), Omega(1), průměrně něco jako 1.

pak se to dostane k nejakymu zakaznikovi do asie a ten ti to omlati o hlavu

Se koukni, co všechno je v BMP (ie. v jednom 16-bit znaku) - skoro všechny světový jazyky včetně afaik většiny čínštiny a podobně. Vždyť v tom je i Hlaholice :-D

. V tý supplementary plane jsou fakt hodně specielní věci...
Ale i kdyby, proč by mi to měl omlátit o hlavu? S utf-8 by na tom nebyl líp, naopak...

SPD vůbec není proruská

6.5.2011 14:11 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Problém je, že tvoje představa o unicode je neúplná, přečti si třeba unicode normalization. Ty řeči o surrogate pair jsou úplně zbytečné, protože až začneš psát soft, který bude podporovat RTL text, skripty, atd, tak zjistíš, že utf8 vs utf16 je ten nejtriviálnější problém. BTW: Zkus si napsat funkci tolower(), která bude používat UTF8, a pak funkci, co bude používat UTF16. A zkus to bez použití maker a dalších nesmyslů jako jsou lookup tables.

6.5.2011 17:09 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Problém je, že tvoje představa o unicode je neúplná, přečti si třeba unicode normalization.

no to je prasarna, o tom radsi nechcu nic vedet... :-)

Zkus si napsat funkci tolower(), která bude používat UTF8, a pak funkci, co bude používat UTF16. A zkus to bez použití maker a dalších nesmyslů jako jsou lookup tables.

Ta funkce by vypadala nejak takhle:

void tolower(str const &input, str &output)
{
        for (iter i : str)
        {
                output.write_next(char_tolower(*i));
        }
}

predpokladam tam ze iter je forward iterator co cte znaky z retezce a ze existuje char_tolower().

Jinak ten kod by vypadal stejne pro utf8 a utf16. Ono v podstate jekejkoli algoritmus by mel vypadat skoro stejne pro utf8 a utf16, protoze obe jsou kodovani s promennou delkou...

6.5.2011 19:09 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Pokud to chceš řešit takto vysokoúrovňovým iterátorem, tak je přece nepodstatné se zabývat kódováním :-)

6.5.2011 20:21 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

a o tom prave mluvim. Kdyz ty algoritmy budou stejne stejny, tak je zvrhlost pouzit utf16 misto utf8... :-)

6.5.2011 20:29 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Kdyz ty algoritmy budou stejne stejny

No ty právě stejný nebudou.

tak je zvrhlost pouzit utf16 misto utf8...

A to proč? Mně přijde, že zatím všechny argumenty proti utf-16 v této diskusi by se daly shrnout do "Nemám rád utf-16."

SPD vůbec není proruská

6.5.2011 21:04 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

No ty právě stejný nebudou.

ty stejny budou protoze oboji jsou kodovani s promennou delkou. A pokud stejny nebudou tak v tom utf16 algoritmu je chyba... (napr programator zapomel ze utf16 != ucs2)

A to proč? Mně přijde, že zatím všechny argumenty proti utf-16 v této diskusi by se daly shrnout do "Nemám rád utf-16."

1. zbytecne spotrebujes dvojnasobek pameti na ascii

2. zrusis si kompatibilitu s programama co pracujou s ascii

3. problemy s little/big endian

A nic tim neziskas. Kdyby ti slo a maximalni rychost a pouzivals kvuli tomu ucs4 tak to pochopim, ale utf16 jenom kombinuje nevyhody ostatnich kodovani - je stejne pomaly jako utf8, ale zabere mnohem vic pameti...

6.5.2011 23:36 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

ty stejny budou protoze oboji jsou kodovani s promennou delkou. A pokud stejny nebudou tak v tom utf16 algoritmu je chyba... (napr programator zapomel ze utf16 != ucs2)

Ale blbost. Sis asi nepřečet tohle... I při správné implementaci utf-16 je průměrná složitost přístupu ke znaku ve stringu konstatní, ve vzácných případech lineární. V utf-8 je lineární buď vždycky, nebo často.

zrusis si kompatibilitu s programama co pracujou s ascii

No, tak si třeba text tohoto příspěvku ulož do utf-8 a zobraz v programu, co pracuje z ascii, schválně, co uvidíš :-D

problemy s little/big endian

Jo, tohle se dá celkem brát jako nevýhoda utf-16.

ale utf16 jenom kombinuje nevyhody ostatnich kodovani - je stejne pomaly jako utf8, ale zabere mnohem vic pameti...

Nikoli, utf16 je celkově vzato téměř stejně rychlý jako utf-32, ale zabírá téměř dvakrát miň paměti.

Řekl bych to asi takhle: utf-16 je pro svou informační efektivitu mnohem vhodnější při zpracovávání (Ie ve frameworcích jako Qt, v OS, apod.), utf-8 je pro úspornost, odolnost proti endianitě a případně tu ascii-"kompatibilitu" zas vhodnější pro ukládání a výměnu dat.

SPD vůbec není proruská

7.5.2011 01:11 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

No, tak si třeba text tohoto příspěvku ulož do utf-8 a zobraz v programu, co pracuje z ascii, schválně, co uvidíš

nejde jenom o to co uvidis. Treba ascii filesystem ti utf8 zvladne bez uprav. utf16 tezko...

Řekl bych to asi takhle: utf-16 je pro svou informační efektivitu mnohem vhodnější při zpracovávání (Ie ve frameworcích jako Qt, v OS, apod.),

v tech frameworcich se ale pouziva z historickych duvodu (puvodne si najivne mysleli ze ucs2 bude stacit), ne proto ze by byl vyhodnejsi...

7.5.2011 13:05 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Treba ascii filesystem ti utf8 zvladne bez uprav. utf16 tezko...

Tohle vysvětli, proč by to měl být s utf-16 větší problém, než s utf-8?
(Krom toho, tenhle problém není dnes zrovna aktuální, a nebyl snad ani 10 let zpět...)

v tech frameworcich se ale pouziva z historickych duvodu (puvodne si najivne mysleli ze ucs2 bude stacit), ne proto ze by byl vyhodnejsi...

Ne, ne, třeba v tom Qt by to změnili, kdyby jim to vadilo. Před časem jsme se o tom bavili na irc #qt a utf-16 tam je právě z výkonostních/paměťových důvodů. Se jich běž zeptat ;-)

SPD vůbec není proruská

7.5.2011 01:23 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

ty stejny budou protoze oboji jsou kodovani s promennou delkou. A pokud stejny nebudou tak v tom utf16 algoritmu je chyba... (napr programator zapomel ze utf16 != ucs2)

Tuto odpověď nechápu. Pokud použiješ ten iterátor, tak konverzi zařídí ten právě on, takže by byla chyba v iterátoru. Toto je ale argument spíš proti tobě, protože pokud zavedeš takovou abstrakci, tak se nemá cenu bavit o kódování.

1. zbytecne spotrebujes dvojnasobek pameti na ascii

To sice ano, ale pořád je to jen 2x víc vs 4x víc (UTF-32). Na druhou stranu spotřebuju míň paměti na znaky, které se do 2-bytů UTF-8 nevlezou (japonština a čínština?). Statisticky bude spotřeba paměti stabilnější než případě UTF-8.

2. zrusis si kompatibilitu s programama co pracujou s ascii

Ale UTF-8 a ASCII není kompatibilní, a pokud myslíš byte-streamy, tak tam se používá 8bitové kódování by-design, o tom nemá cenu se bavit.

3. problemy s little/big endian

Interní reprezentace vždycky používá native-endian. Neřešíme IO, kde se nejspíš použíje UTF-8.

A nic tim neziskas. Kdyby ti slo a maximalni rychost a pouzivals kvuli tomu ucs4 tak to pochopim, ale utf16 jenom kombinuje nevyhody ostatnich kodovani - je stejne pomaly jako utf8, ale zabere mnohem vic pameti...

UTF16 spotřebuje v 99.9% případech polovinu paměti co UCS4, takže máš větší šanci, že se vlezeš do cache. UTF-8 je zase velmi náročné na výkon, a paměť ušetří pouze v případě, že se jedná o znaky < 128 (ASCII). UTF-16 je kompromis, sice je to variable-length, ale ten jeden if, co je potřeba, je snadno předvídatelný, a případy, kdy je potřeba použít surrogate pair, jsou výjimečné.

7.5.2011 00:33 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Tak pokud se tu bavíme celou dobu o tom, že máš komplex z UTF-16, tak to máš říct hned :)

7.5.2011 01:07 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

to neni komplex, ale zdravej rozum ;-)

6.5.2011 14:54 Jindřich Makovička | skóre: 17
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Podle zdrojáků Qt mi přijde, že to neřeší nijak, ale možná se mýlím...

QString QString::right(int n) const { if (n >= d->size || n < 0) return *this; return QString((const QChar*) d->data + d->size - n, n); }

6.5.2011 16:52 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

jo, to je dalsi problem utf16. Spousta programatoru si vubec neuvedomuje (nebo nepripousti) ze je to kodovani s promennou delkou. A potom to dopada takhle...

6.5.2011 17:25 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Problém utf-16 je, že programátoři si něco neuvědomují? Meh... :-D

SPD vůbec není proruská

6.5.2011 18:12 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

no nevim jestli je to primo chyba utf16, nebo jeho propagatoru, nebo tvurcu knihoven (viz ten schizofrernni QString), ale nekdo nebo neco zrejme tyhle programatory uvadi v omyl... ;-)

btw. vubec bych se nezdrahal verit tomu ze m$ a sun pote co naivne presli na ucs2 a zjistili ze to nestaci, tak vymysleli a rozsirili tenhle mytus ve snaze svoje rozhodnuti nejak racionalizovat...

6.5.2011 19:18 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

No já bych spíš řekl, že v diskuzi je potřeba použít argumenty místo spekulací. Mě se s UTF-16 pracuje celkem dobře (rozhodně líp než s UTF-8), paměťová náročnost je akceptovatelná a podle mě i předvídatelná. Mezi další výhody řadím to, že toto kódování je hodně používané v dalších knihovnách / prostředích (ať už je to UCS2 (WinMobile) nebo UTF-16).

6.5.2011 17:22 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Podle zdrojáků Qt mi přijde, že to neřeší nijak, ale možná se mýlím...

Máš recht, dokumentace:

QString::length() represents the number of QChars. Thus, it can be that the length does not actually refer to number of actual characters (when the string contains supplementary characters).

[odtud].

SPD vůbec není proruská

5.5.2011 01:23 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

A čem pracuješ teď? :)

5.5.2011 23:17 ::: | skóre: 14 | blog: e_lama
Rozbalit Rozbalit vše Re: Qt SDK 1.1

no ja se celkove snazim programovani gui vyhybat, ale kdyz neni jina moznost tak gtk...

6.5.2011 02:05 __dark__
Rozbalit Rozbalit vše Re: Qt SDK 1.1

Takže utf8 ti připadá lepší než utf16?

Založit nové vlákno • Nahoru