Inzerujte na AbcPráce.cz od 950 Kč

napište » Zprávičky

NetBSD 11.0

dnes 04:11 | Nová verze

Byla vydána nová major verze 11.0 open source unixového operačního systému NetBSD (Wikipedie). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

NÚKIB podpořil mezinárodní doporučení pro lepší přehled o složení softwaru

včera 19:55 | IT novinky

Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) se zapojil do mezinárodní iniciativy vedené americkou agenturou CISA (Cybersecurity and Infrastructure Security Agency) a dalšími partnery, jejímž cílem je stanovit minimální náležitosti pro tzv. Software Bill of Materials (SBOM). Nový dokument přináší praktická doporučení, jak by měl vypadat přehled komponent softwaru a jak s ním v praxi pracovat. SBOM lze

… více »

Ladislav Hagara | Komentářů: 1

Servo 0.4.0

včera 03:00 | Nová verze

V aktuálním přehledu vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) bylo oznámeno vydání nové verze 0.4.0. Výrazně se zlepšilo vykreslování stránek jako lichess.org, Zulip nebo Speedtest.

Ladislav Hagara | Komentářů: 0

Kritické zranitelnosti v produktech VMware: CVE-2026-59309, CVE-2026-59310 a CVE-2026-47876

31.7. 19:22 | Bezpečnostní upozornění

Vládní CERT upozorňuje (𝕏) na kritické zranitelnosti v produktech VMware: CVE-2026-59309, CVE-2026-59310 a CVE-2026-47876. Zranitelnosti v VMware vCenter umožňují vzdálenému útočníkovi se síťovým přístupem obejít autentizaci a získat neoprávněný přístup k vCenter, případně zneužít directory traversal ke spuštění libovolného kódu na vCenter.

Ladislav Hagara | Komentářů: 1

Bezpečnostní chyba hardwarových kryptopeněženek Coldcard

31.7. 18:33 | Bezpečnostní upozornění

Společnost Coinkite upozorňuje na bezpečnostní chybu svých hardwarových kryptopeněženek Coldcard. Jedná se o kritickou chybu v generování náhodných čísel (RNG). Místo hardwarového generátoru náhodných čísel (TRNG) byl omylem používán softwarový fallback (PRNG).

Ladislav Hagara | Komentářů: 3

Shadowfetch Linux, nová distribuce s důrazem na lokální umělou inteligenci

31.7. 14:11 | Zajímavý projekt

Představena byla nová linuxová distribuce Shadowfetch Linux. Na rozdíl od mnoha nováčků, které nabízejí převážně jiné téma a výběr softwaru, tato distribuce založená na Debianu Testing s desktopovým prostředím KDE Plasma 6.6, klade lokálně běžící umělou inteligenci do centra svého desktopového zážitku.

Pinhead | Komentářů: 0

Max Leiter: Wayland, X11, GNOME a KDE nativně na iPadu

30.7. 17:22 | Zajímavý projekt

Max Leiter v roce 2019 zkusil zprovoznit X server na iPadu (iOS). Nyní se k tématu vrátil a s pomocí LLM a balíčkovacích nástrojů Procursus rozběhl desktop s X11 i Waylandem. Jeho balíčky jsou dostupné v repozitáři xiOS.

|🇵🇸 | Komentářů: 20

Google Cloud získal certifikaci pro český veřejný sektor

30.7. 13:33 | IT novinky

Společnost Google Cloud dnes oznámila, že její infrastruktura a služby byly oficiálně zařazeny do Katalogu cloud computingu vedeného Digitální a informační agenturou (DIA). Tato certifikace potvrzuje, že infrastruktura a služby Google Cloud splňují přísné bezpečnostní a regulační požadavky České republiky pro provoz cloudových služeb ve veřejném sektoru.

Ladislav Hagara | Komentářů: 6

Zátěžový test eDokladů / 13. srpna ve 13:00

30.7. 13:11 | IT novinky

Vůbec poprvé v historii se stát při testování digitálních služeb obrací na širokou veřejnost. Digitální a informační agentura (DIA) a Ministerstvo vnitra zvou občany k zapojení do zátěžového testu eDokladů, které od loňského podzimu prošly optimalizací aplikace a posílením infrastruktury. Test proběhne 13. srpna ve 13:00 a pro jeho úspěch bude potřeba zapojení několika desítek tisíc občanů. Zapojení do testu je zcela dobrovolné a úkol

… více »

Ladislav Hagara | Komentářů: 41

FireDragon 13

30.7. 13:00 | Nová verze

FireDragon je webový prohlížeč, doposud založený na Floorpu, jednom z forků Firefoxu s větším důrazem na ochranu soukromí a přizpůsobení uživatelského rozhraní. Spravuje ho člen komunity distribuce Garuda Linux. Nové vydání verze 13 opouští Floorp a přechází přímo na Firefox s patchi z LibreWolfu a vlastními úpravami. Dostupný je také na Flathubu.

|🇵🇸 | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Komentářů: 30, poslední 3.4. 20:20

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / Perl: problém s češtinou v regexpu

Štítky: kódování, Perl, regulární výrazy

Dotaz: Perl: problém s češtinou v regexpu

13.4.2008 22:23 Herry
Perl: problém s češtinou v regexpu

Přečteno: 2142×

Odpovědět | Admin

Dobrý den,
mám problém s češtinou v regulárních výrazech,
/\w/ "nesežere" některé znaky s diakritikou v kódování UTF8.

Příklad:

#!/usr/bin/perl -w

use utf8;
use locale;
use encoding 'utf-8';

binmode STDOUT, ":utf8";
binmode STDERR, ":utf8";

print "ě>$1<\n" if "ě" =~ /(\w)/;
print "š>$1<\n" if "š" =~ /(\w)/;
print "č>$1<\n" if "č" =~ /(\w)/;
print "ř>$1<\n" if "ř" =~ /(\w)/;
print "ž>$1<\n" if "ž" =~ /(\w)/;
print "ý>$1<\n" if "ý" =~ /(\w)/;
print "á>$1<\n" if "á" =~ /(\w)/;
print "í>$1<\n" if "í" =~ /(\w)/;
print "é>$1<\n" if "é" =~ /(\w)/;

Výraz /(\w)/ projde jenom pro ě,š,č,ř,ž

locales mám nastaveno na:

LANG=cs_CZ.UTF-8
LC_CTYPE="cs_CZ.UTF-8"
LC_NUMERIC="cs_CZ.UTF-8"
LC_TIME="cs_CZ.UTF-8"
LC_COLLATE="cs_CZ.UTF-8"
LC_MONETARY="cs_CZ.UTF-8"
LC_MESSAGES="cs_CZ.UTF-8"
LC_PAPER="cs_CZ.UTF-8"
LC_NAME="cs_CZ.UTF-8"
LC_ADDRESS="cs_CZ.UTF-8"
LC_TELEPHONE="cs_CZ.UTF-8"
LC_MEASUREMENT="cs_CZ.UTF-8"
LC_IDENTIFICATION="cs_CZ.UTF-8"
LC_ALL=

Někde jsem našel řešení něco jako /(\p{L})/, ale nikde jsem se nedočetl co to přesně znamená a proč to původní řešení nefunguje přestože je to uvedeno v mnoha návodech.

Díky za odpovědi

Nástroje: Začni sledovat (0) ?

Odpovědi

13.4.2008 23:06 Hery
Rozbalit Rozbalit vše Dodatek

/(\p{L})/ nespolkne číslice, potřeboval bych něco na alfanumerický znaky.

14.4.2008 08:49 osladil | skóre: 12
Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu

Ahoj, v jenom skriptu pouzivam neco podobneho. Zkousel jsem to ted na tomhle:

#!/usr/bin/perl

use strict;
use warnings;
use utf8;

binmode STDIN, ":utf8";
binmode STDOUT, ":utf8";

my $string = "Čeština je ČESKÁ";
$string =~ /(\w+)/;
my ($result) = ($1);

print "Hledam v $string\n";
print "Nalezeno $result\n";

print "Čeština je cool!\n" if $result eq "Čeština";

Moje locales:

mira@batman:~$ env|grep LANG
LANG=en_US.UTF-8

14.4.2008 09:19 zoul | skóre: 43 | blog: ☂ | Boskovice
Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu

Mně to funguje:

perl -e "use locale; print 'Yep' if ('ý' =~ /\w/)"
Yep

OS X 10.5.2, Perl 5.8.8, locale en_US.UTF-8. Možná zkus nastavit ještě LC_ALL?

20.9.2008 17:22 harry
Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu

RESENI

doinstaloval jsem nejaky baliky, uz nevim ktery presne zabral:


language-pack-cs

language-gnome-cs

language-support-cs

language-translate-cs

reinstaloval jsem locale

sudo apt-get install --reinstall locales

a potom to zaclo fungovat:


LC_ALL=en_US.UTF-8 perl -C -Mutf8 -e '$_="aábcčdďeěéfghiíjklmnňoópqrřsštťuúůvwxyýzž"; s/\W/-/g; print $_, "\n"'

Založit nové vlákno • Nahoru

Tiskni Sdílej: