Inzerujte na AbcPráce.cz od 950 Kč

napište » Zprávičky

11 zapomenutých UEFI shim zavaděčů, které umožňují útočníkům obejít Secure Boot

dnes 02:55 | Bezpečnostní upozornění

Výzkumníci ze společnosti ESET objevili 11 zapomenutých UEFI shim zavaděčů, které byly podepsány společností Microsoft, a které umožňují útočníkům obejít ochranu UEFI Secure Boot na většině zařízení. Microsoft je zneplatnil (přidal jejich hash do databáze dbx) v rámci aktualizace Patch Tuesday dne 9. června 2026. Uživatelé Linuxu mohou databází aktualizovat pomocí LVFS. Ověřit zneplatnění zavaděčů lze pomocí skriptu uefi-dbx-audit. Jedná se o CVE-2026-8863 a CVE-2026-10797.

Ladislav Hagara | Komentářů: 0

pico-usb-wifi

včera 16:55 | Zajímavý software

pico-usb-wifi je open source firmware pro Raspberry Pi Pico W, který jej promění v USB Wi-Fi adaptér. Po připojení k počítači se objeví jako zařízení USB CDC-NCM.

Ladislav Hagara | Komentářů: 0

Google bude muset v EU otevřít služby konkurenci v AI, rozhodla komise

včera 16:00 | IT novinky

Americká společnost Google ze skupiny Alphabet bude muset podle nových požadavků Evropské unie umožnit společnosti OpenAI i dalším konkurentům v oblasti umělé inteligence (AI) a internetových vyhledávačů přístup ke svým službám. Ve svém rozhodnutí o tom včera informovala Evropská komise (EK). Opatření má zajistit dodržování pravidel, jejichž cílem je omezit v EU tržní sílu velkých technologických firem. Google s tím nesouhlasí.

… více »

Ladislav Hagara | Komentářů: 0

Firefox od září přechází na dvoutýdenní cyklus vydávání verzí

včera 04:55 | Komunita

Nové verze webových prohlížečů Chrome a Firefox jsou vydávány každé 4 týdny. Aktuální verze Chrome je 150. Aktuální verze Firefoxu je 152. V březnu bylo oznámeno, že od září přejde Chrome na dvoutýdenní cyklus vydávání verzí. To by znamenalo, že Chrome v číslování verzí Firefox brzy přeskočí. Vývojáři Firefoxu proto také od září přecházejí na dvoutýdenní cyklus vydávání verzí. :-)

Ladislav Hagara | Komentářů: 4

Microsoft Comic Chat je dnešním dnem open source

včera 00:22 | Zajímavý software

Microsoft Comic Chat (Wikipedie), tj. grafický IRC klient z devadesátek, který převáděl konverzace na IRC do podoby komiksových panelů, a který zpopularizoval font Comic Sans, je dnešním dnem open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

Ladislav Hagara | Komentářů: 1

OPNsense 26.7 Xenial Xenops

16.7. 19:55 | Nová verze

Byla vydána (𝕏) nová verze 26.7 open source firewallové a routovací platformy OPNsense (Wikipedie). Jedná se o fork pfSense postavený na FreeBSD. Kódový název OPNsense 26.7 je Xenial Xenops. Přehled novinek v příspěvku na fóru.

Ladislav Hagara | Komentářů: 0

Česko zakázalo Polymarket

16.7. 14:44 | IT novinky

Na Seznam nepovolených internetových her (Wikipedie) se k 13. 7. 2026 dostala predikční platforma Polymarket.

Ladislav Hagara | Komentářů: 5

Raspberry Pi Official Magazine 167 a Hello World 30

16.7. 14:22 | Zajímavý článek

Nová čísla časopisů od nakladatelství Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 167 (pdf) a Hello World 30 (pdf).

Ladislav Hagara | Komentářů: 0

Gambas 3.22.0

16.7. 00:44 | Nová verze

Byla vydána nová verze 3.22.0 grafického vývojového prostředí a platformy Gambas (Wikipedie) založené na interpretru programovacího jazyka Basic s rozšířením o objektově orientované programování. Přehled novinek v poznámkách k vydání. Zdrojové kódy jsou k dispozici na GitLabu.

Ladislav Hagara | Komentářů: 0

FreeBSD odstranilo poslední GPL kód ze základního systému

15.7. 20:22 | Komunita

FreeBSD odstranilo poslední GPL kód ze základního systému. Konkrétně dpv, libdpv, libfigpar a dialog. Instalátor před čtyřmi lety přešel z dialogu na bsddialog.

Ladislav Hagara | Komentářů: 2

Centrum | Napsat | Starší

navrhněte » Anketa

Komentářů: 30, poslední 3.4. 20:20

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / Počítání českých znaků v Reg Exp

Štítky: Perl, programování, regulární výrazy, Unicode, utf8 utf-8

Dotaz: Počítání českých znaků v Reg Exp

8.9.2011 11:18 Hufy
Počítání českých znaků v Reg Exp

Přečteno: 460×

Odpovědět | Admin

Prosím o radu s regulárními výrazy v Perlu (5.10.1 pod Kubuntu 11.04) Mám text ve dvou sloupcích a rozděluji ho pomocí /^(.{66})(.*)$/ na ty dvě půlky. Jenže když tam jsou české znaky, každý se počítá za dva, vypadá to, že {66} počítá byty, ne znaky. Mám nastaveno use encoding 'utf-8'; Zkoušel jsem locale a binmode, ale bez výsledku. Strávil jsem dvě hodiny čtením dokumentace a mám z toho tak akorát zamotanou hlavu. Umíte mi někdo poradit? Díky

Řešení dotazu:

Komentář #15 (Filip Jirsák, 2 hlasů)

Nástroje: Začni sledovat (1) ?

Odpovědi

8.9.2011 13:31 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Máte ten text načtený správně v kódování UTF-8? Zkuste si třeba zjistit délku toho textu nebo vypsat některý znak s diakritikem – uvidíte, zda vstup Perl přečetl správně jako UTF-8 znaky, nebo zda to načítáte špatně a Perl to chápe jako ASCII.

8.9.2011 18:15 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Sorry, asi nerozumím... Mám vypsat délku načteného řádku?

8.9.2011 18:19 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Třeba. Prostě nějak zjistit, zda to Perl vidí jako bajty nebo jako znaky.

8.9.2011 18:53 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Mám tu

while (<>) { /^([\w\W]{70})(.*$)/; # rozdelim radek na dva sloupce print "$1 ".length($1)."\n"; # pisu levou a delku next; }

a píše to všude délku 70, jenže ne pod sebe, je vidět, že každý řádek je jinak dlouhý. Celý prográmek dám k další odpovědi.

8.9.2011 13:34 Sten
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Základní operátory regulárních výrazů, jako je ".", fungují z výkonnostních důvodů nad bajty, nikoliv znaky. Pokud chcete vybírat znaky, použijte operátor "\W".

8.9.2011 18:20 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Jenže \W nebere písmena. Zkouším [\w\W], ale dělá to totéž.

8.9.2011 15:12 ams
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Dela se to pomoci binmode, takze jak jste to zkousel?

binmode *STDIN, "utf8";  # Ted tecka = znak a ne byte
binmode *STDOUT, "utf8"; # Aby nebyly Warnings: wide character in print

while (<>) {
  print join ":", /^(.{66})(.*)$/;
}

8.9.2011 15:13 ams
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Samozrejme tam musi byt ":utf8". binmode *STDIN, ":utf8" atd.

8.9.2011 15:19 Sten
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

To sice přepne matchování z bajtů na code pointy, ale tečka potom stále není znak, protože některé znaky mohou být tvořené více code pointy, třeba u kombinované diakritiky. Na znaky je právě ten operátor "\W".

8.9.2011 18:59 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Pro jistotu dávám celý "program" a jestli přijdu na to, jak se to dělá, přidám i zdrojová data.

#!/usr/bin/perl use encoding ':utf-8'; binmode *STDIN, ":utf8"; # Ted tecka = znak a ne byte binmode *STDOUT, ":utf8"; my @radky; while (<>) { /^([\w\W]{70})(.*$)/; # rozdelim radek na dva sloupce push @radky, $2."\n"; # pravou pulku schovam print "$1 ".length($1)."\n"; # levou pisu rovnou - s udajnym poctem znaku next; } print @radky; # dotisknu pravy sloupec pod levy # jenze zacatky radku jsou rozhazene

8.9.2011 19:09 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Přílohy:

HH.txt (7575 bytů)
bbb.txt (7843 bytů)

Vkládám zdrojová data HH.txt a výsledek, který dostávám bbb.txt Pokud mi to někdo dokáže vysvětlit, budu neskonale vděčen.

Řešení 2× (Vojtěch Horký, Hufy (tazatel))

8.9.2011 20:16 Filip Jirsák | skóre: 67 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Řešení je popsané třeba zde: How do I read UTF-8 with diamond operator (<<>>)?.

Místo

binmode STDOUT, ":utf-8";

použijte

use open qw(:std :utf8);

8.9.2011 20:45 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

To je ono! A dokonce jsem asi i pochopil v čem je ten problém :-)

Díky moc všem za rady.

8.9.2011 19:24 Sten
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Pardon, Unicodový znak je \X. Bohužel, teď nemůžu vyzkoušet ty vaše soubory, mám Perl akorát přes SSH v mobilu:

$ perl -pe 'use encoding "utf8";s/^\X{4}//' <<<'Žluťoučký kůň' 
oučký kůň

8.9.2011 19:48 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Díky, ale ani \X nepomáhá. Musí být špatně něco jiného... Ten vstupní soubor přitom opravdu vypadá na utf8, aspoň pokud dokážu posoudit.

8.9.2011 19:54 jurasek
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Zdar
Kodovani souboru overis prikazem file. file HH.txt
Zdar

8.9.2011 20:42 Hufy
Rozbalit Rozbalit vše Re: Počítání českých znaků v Reg Exp

Ano, je to utf-8, dík

Založit nové vlákno • Nahoru

Tiskni Sdílej: