Přihlášení | Registrace

napište » Zprávičky

Meta Connect 2025

dnes 04:44 | IT novinky

Společnost Meta na dvoudenní konferenci Meta Connect 2025 představuje své novinky. První den byly představeny nové AI brýle: Ray-Ban Meta (Gen 2), sportovní Oakley Meta Vanguard a především Meta Ray-Ban Display s integrovaným displejem a EMG náramkem pro ovládání.

Ladislav Hagara | Komentářů: 1

GNOME 49

dnes 01:11 | Nová verze

Po půl roce vývoje od vydání verze 48 bylo vydáno GNOME 49 s kódovým názvem Brescia (Mastodon). S přehrávačem videí Showtime místo Totemu a prohlížečem dokumentů Papers místo Evince. Podrobný přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře.

Ladislav Hagara | Komentářů: 0

ROCm 7.0.0

včera 16:22 | Nová verze

Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.

Ladislav Hagara | Komentářů: 0

systemd 258

včera 15:22 | Nová verze

Byla vydána nová verze 258 správce systému a služeb systemd (GitHub).

Ladislav Hagara | Komentářů: 5

Java 25 / JDK 25

včera 15:11 | Nová verze

Byla vydána Java 25 / JDK 25. Nových vlastností (JEP - JDK Enhancement Proposal) je 18. Jedná se o LTS verzi.

Ladislav Hagara | Komentářů: 0

Věra Pohlová před 26 lety: „Já bych všechny ty internety a počítače zakázala“

včera 14:44 | Humor

Věra Pohlová před 26 lety: „Tyhle aféry každého jenom otravují. Já bych všechny ty internety a počítače zakázala“. Jde o odpověď na anketní otázku deníku Metro vydaného 17. září 1999 na téma zneužití údajů o sporožirových účtech klientů České spořitelny.

Ladislav Hagara | Komentářů: 4

Výroční zpráva Blender Foundation za rok 2024

včera 11:33 | Zajímavý článek

Byla publikována Výroční zpráva Blender Foundation za rok 2024 (pdf).

Ladislav Hagara | Komentářů: 0

Firefox 143.0

16.9. 21:44 | Nová verze

Byl vydán Mozilla Firefox 143.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově se Firefox při ukončování anonymního režimu zeptá, zda chcete smazat stažené soubory. Dialog pro povolení přístupu ke kameře zobrazuje náhled. Obzvláště užitečné při přepínání mezi více kamerami. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 143 bude brzy k dispozici také na Flathubu a Snapcraftu.

Ladislav Hagara | Komentářů: 0

Fedora Linux 43 Beta

16.9. 17:22 | Nová verze

Byla vydána betaverze Fedora Linuxu 43 (ChangeSet), tj. poslední zastávka před vydáním finální verze, která je naplánována na úterý 21. října.

Ladislav Hagara | Komentářů: 0

Ghostty 1.2

16.9. 12:22 | Nová verze

Multiplatformní emulátor terminálu Ghostty byl vydán ve verzi 1.2 (𝕏, Mastodon). Přehled novinek, vylepšení a nových efektů v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (44%)

Gitlab (56%)

Atlassian (0%)

Bitbucket (6%)

Gitea (11%)

Mercurial (6%)

jen git (17%)

jen svn (6%)

Jiné (uvedu v diskusi) (11%)

Celkem 18 hlasů

Komentářů: 1, poslední včera 13:49

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / Perl: problém s češtinou v regexpu

Štítky: kódování, Perl, regulární výrazy

Dotaz: Perl: problém s češtinou v regexpu

13.4.2008 22:23 Herry
Perl: problém s češtinou v regexpu

Přečteno: 2017×

Odpovědět | Admin

Dobrý den,
mám problém s češtinou v regulárních výrazech,
/\w/ "nesežere" některé znaky s diakritikou v kódování UTF8.

Příklad:

#!/usr/bin/perl -w

use utf8;
use locale;
use encoding 'utf-8';

binmode STDOUT, ":utf8";
binmode STDERR, ":utf8";

print "ě>$1<\n" if "ě" =~ /(\w)/;
print "š>$1<\n" if "š" =~ /(\w)/;
print "č>$1<\n" if "č" =~ /(\w)/;
print "ř>$1<\n" if "ř" =~ /(\w)/;
print "ž>$1<\n" if "ž" =~ /(\w)/;
print "ý>$1<\n" if "ý" =~ /(\w)/;
print "á>$1<\n" if "á" =~ /(\w)/;
print "í>$1<\n" if "í" =~ /(\w)/;
print "é>$1<\n" if "é" =~ /(\w)/;

Výraz /(\w)/ projde jenom pro ě,š,č,ř,ž

locales mám nastaveno na:

LANG=cs_CZ.UTF-8
LC_CTYPE="cs_CZ.UTF-8"
LC_NUMERIC="cs_CZ.UTF-8"
LC_TIME="cs_CZ.UTF-8"
LC_COLLATE="cs_CZ.UTF-8"
LC_MONETARY="cs_CZ.UTF-8"
LC_MESSAGES="cs_CZ.UTF-8"
LC_PAPER="cs_CZ.UTF-8"
LC_NAME="cs_CZ.UTF-8"
LC_ADDRESS="cs_CZ.UTF-8"
LC_TELEPHONE="cs_CZ.UTF-8"
LC_MEASUREMENT="cs_CZ.UTF-8"
LC_IDENTIFICATION="cs_CZ.UTF-8"
LC_ALL=

Někde jsem našel řešení něco jako /(\p{L})/, ale nikde jsem se nedočetl co to přesně znamená a proč to původní řešení nefunguje přestože je to uvedeno v mnoha návodech.

Díky za odpovědi

Nástroje: Začni sledovat (0) ?

Odpovědi

13.4.2008 23:06 Hery
Rozbalit Rozbalit vše Dodatek

/(\p{L})/ nespolkne číslice, potřeboval bych něco na alfanumerický znaky.

14.4.2008 08:49 osladil | skóre: 12
Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu

Ahoj, v jenom skriptu pouzivam neco podobneho. Zkousel jsem to ted na tomhle:

#!/usr/bin/perl

use strict;
use warnings;
use utf8;

binmode STDIN, ":utf8";
binmode STDOUT, ":utf8";

my $string = "Čeština je ČESKÁ";
$string =~ /(\w+)/;
my ($result) = ($1);

print "Hledam v $string\n";
print "Nalezeno $result\n";

print "Čeština je cool!\n" if $result eq "Čeština";

Moje locales:

mira@batman:~$ env|grep LANG
LANG=en_US.UTF-8

14.4.2008 09:19 zoul | skóre: 43 | blog: ☂ | Boskovice
Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu

Mně to funguje:

perl -e "use locale; print 'Yep' if ('ý' =~ /\w/)"
Yep

OS X 10.5.2, Perl 5.8.8, locale en_US.UTF-8. Možná zkus nastavit ještě LC_ALL?

20.9.2008 17:22 harry
Rozbalit Rozbalit vše Re: Perl: problém s češtinou v regexpu

RESENI

doinstaloval jsem nejaky baliky, uz nevim ktery presne zabral:


language-pack-cs

language-gnome-cs

language-support-cs

language-translate-cs

reinstaloval jsem locale

sudo apt-get install --reinstall locales

a potom to zaclo fungovat:


LC_ALL=en_US.UTF-8 perl -C -Mutf8 -e '$_="aábcčdďeěéfghiíjklmnňoópqrřsštťuúůvwxyýzž"; s/\W/-/g; print $_, "\n"'

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje