Inzerujte na AbcPráce.cz od 950 Kč

napište » Zprávičky

včera 17:22 | Nová verze

Raspberry Pi Connect, tj. oficiální služba Raspberry Pi pro vzdálený přístup k jednodeskovým počítačům Raspberry Pi z webového prohlížeče, byla vydána v nové verzi 2.5. Nejedná se už o beta verzi.

Ladislav Hagara | Komentářů: 0

1272 projektů (vývojářů) přijatých do Google Summer of Code 2025

včera 15:22 | Komunita

Google zveřejnil seznam 1272 projektů (vývojářů) od 185 organizací přijatých do letošního, již jednadvacátého, Google Summer of Code. Plánovaným vylepšením v grafických a multimediálních aplikacích se věnuje článek na Libre Arts.

Ladislav Hagara | Komentářů: 0

Visual Studio Code a VSCodium 1.100

8.5. 19:22 | Nová verze

Byla vydána (𝕏) dubnová aktualizace aneb nová verze 1.100 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.100 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

Ladislav Hagara | Komentářů: 0

Home Assistant 2025.5

8.5. 18:00 | Nová verze

Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.5.

Ladislav Hagara | Komentářů: 0

OpenSearch 3.0

8.5. 01:22 | Nová verze

OpenSearch (Wikipedie) byl vydán ve verzi 3.0. Podrobnosti v poznámkách k vydání. Jedná se o fork projektů Elasticsearch a Kibana.

Ladislav Hagara | Komentářů: 0

PyXL - Python procesor

8.5. 00:55 | Zajímavý projekt

PyXL je koncept procesora, ktorý dokáže priamo spúštat Python kód bez nutnosti prekladu ci Micropythonu. Podľa testov autora je pri 100 MHz približne 30x rýchlejší pri riadeni GPIO nez Micropython na Pyboard taktovanej na 168 MHz.

vlk | Komentářů: 0

Grafana 12.0

7.5. 19:44 | Nová verze

Grafana (Wikipedie), tj. open source nástroj pro vizualizaci různých metrik a s ní související dotazování, upozorňování a lepší porozumění, byla vydána ve verzi 12.0. Přehled novinek v aktualizované dokumentaci.

Ladislav Hagara | Komentářů: 0

Raspberry Pi OS 2025-05-06

7.5. 17:33 | Nová verze

Raspberry Pi OS, oficiální operační systém pro Raspberry Pi, byl vydán v nové verzi 2025-05-06. Přehled novinek v příspěvku na blogu Raspberry Pi a poznámkách k vydání. Pravděpodobně se jedná o poslední verzi postavenou na Debianu 12 Bookworm. Následující verze by již měla být postavena na Debianu 13 Trixie.

Ladislav Hagara | Komentářů: 0

Richard Stallman dnes v Liberci přednáší o svobodném softwaru a svobodě v digitální společnosti

7.5. 05:33 | Komunita

Richard Stallman dnes v Liberci přednáší o svobodném softwaru a svobodě v digitální společnosti. Od 16:30 v aule budovy G na Technické univerzitě v Liberci. V anglickém jazyce s automaticky generovanými českými titulky. Vstup je zdarma i pro širokou veřejnost.

Ladislav Hagara | Komentářů: 17

sudo-rs nahradí v Ubuntu 25.10 klasické sudo

7.5. 03:55 | Komunita

sudo-rs, tj. sudo a su přepsáné do programovacího jazyka Rust, nahradí v Ubuntu 25.10 klasické sudo. V plánu je také přechod od klasických coreutils k uutils coreutils napsaných v Rustu.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Komentářů: 26, poslední 8.5. 09:58

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / C++ zjistit počet znaků ve stringu (UTF8)

Štítky: bez, C++, programování

Dotaz: C++ zjistit počet znaků ve stringu (UTF8)

28.2.2012 09:13 Smíšek
C++ zjistit počet znaků ve stringu (UTF8)

Přečteno: 1191×

Odpovědět | Admin

Ahoj, jak už název říká, potřeboval bych v c++ zjistit ze zadaného stringu počet znaků. Funkce .size() i .length() mi dávají špatné odpovědi při použití diakritiky (ěščřžýáíé,..), počítám s tím že znaky s diakritikou v UTF8 zabírají 2bajty, bez nich 1bajt. Nemáte nějakou odzkoušenou funkci která mi to správně spočítá. Chvíli už hledám, ale na nic kloudného jsem nenarazil. Použitý kompilátor: g++ (Debian 4.6.2-16) 4.6.2

Řešení dotazu:

Komentář #1 (Kit, 2 hlasů)

Nástroje: Začni sledovat (0) ?

Odpovědi

Řešení 2× (Vašek Lorenc, Vojtěch Horký)

28.2.2012 09:48 Kit
Rozbalit Rozbalit vše Re: C++ zjistit počet znaků ve stringu (UTF8)

Utf8StringSize()

28.2.2012 10:04 Smíšek
Rozbalit Rozbalit vše Re: C++ zjistit počet znaků ve stringu (UTF8)

Díky

funguje parádně

28.2.2012 14:02 Sten
Rozbalit Rozbalit vše Re: C++ zjistit počet znaků ve stringu (UTF8)

Dovoluju si upozornit, že nejde o počet znaků, ale o počet code pointů. Sice se u českého uživatele většinou nesetkáte s tím, že by jeden znak byl zapsán více code pointy, ale pokud jde o ochranu vstupu, může někdo podle napsat č místo jednoho code pointu U+010D dvěma code pointy U+0063 U+030C, a pak vám ta funkce vrátí, že tam jsou znaky dva, i když je jeden. Zjistit skutečný počet znaků je ale kvůli tomu v Unicode velmi obtížné a musel byste na to použít třeba knihovnu ICU.

28.2.2012 14:37 Ivan
Rozbalit Rozbalit vše Re: C++ zjistit počet znaků ve stringu (UTF8)

Dik za tip. Tohle jsem netusil. Hadam ze to co popisujes se muze stat pokud uzivatel pouzije Ctrl+C Ctrl+V z PDF.

29.2.2012 15:05 Sten
Rozbalit Rozbalit vše Re: C++ zjistit počet znaků ve stringu (UTF8)

U PDF to IMO nehrozí, ale třeba MacOS X používá interně (např. na souborovém systému) ty znaky dekomponované (rozložené), i když pro komunikaci by je měl zase složit.

29.2.2012 10:47 lofcek
Rozbalit Rozbalit vše Re: C++ zjistit počet znaků ve stringu (UTF8)

A ja viem este o dalsich "bonusoch" vyplyvajucich z pouzivania Unicode (nie len utf-8).

1. Ja uplne jedno, ci mam retazec ulozeny ako "wchar_t*", alebo utf-8 char* - aj tak vo funkciach ako printf sa sirka pocita v znakoch utf-8. Cize printf("%.4ls\n", L"ažšČľňť"); pochopi ako 4 utf-8 znaky - cize: a = 1 znak ž = 2 znaky š = 2 znaky, to by uz nevyslo cele .. takze z neho sa uz neypise nic.

2. Znaky v korejcine/japoncine a cinstine sice zaberaju len jeden wchar_t, ale v terminale zaberaju sirku 2 znakov. Potom, ked sme robili korejsku lokalizaciu produktu, tak sme zistili, ze existuje wcwidth a wcswidth.

29.2.2012 16:02 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: C++ zjistit počet znaků ve stringu (UTF8)

A ja viem este o dalsich "bonusoch" vyplyvajucich z pouzivania Unicode (nie len utf-8).

Možná jsi zmaten tím, že v začátcích Unicode existovalo kódování Unicode, které se jmenovalo stejně jako znaková sada Unicode. Ale to už strašně moc dlouho neplatí.

Unicode má hodně přes sto tisíc definovaných znaků a teoreticky cca dvě miliardy, takže na uložení obecného codepointu do 16bit číselné proměnné zapomeň. Standard definuje 31-bitové codepointy, aby byly totožné v signed i unsigned 32-bit proměnných.

UTF-8 je jedno z možných kódování (formátů serializace) znakové sady Unicode. Znaková sada je v tomhle případě abstraktní věc, seznam codepointů (obvykle) pro jednotlivé znaky.

S tou korejštinou dobrá poznámka.

Já už tu vlastně ani nejsem. Abclinuxu umřelo.

Založit nové vlákno • Nahoru

Tiskni Sdílej: