Máirín Duffy a Brian Smith v článku pro Fedora Magazine ukazují použití LLM pro diagnostiku systému (Fedora Linuxu) přes Model Context Protocol od firmy Anthropic. I ukázkové výstupy v samotném článku obsahují AI vygenerované nesmysly, např. doporučení přeinstalovat balíček pomocí správce balíčků APT z Debianu místo DNF nativního na Fedoře.
Projekt D7VK dospěl do verze 1.0. Jedná se o fork DXVK implementující překlad volání Direct3D 7 na Vulkan. DXVK zvládá Direct3D 8, 9, 10 a 11.
Byla vydána nová verze 2025.4 linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek se seznamem nových nástrojů v oficiálním oznámení na blogu.
Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) zveřejnil Národní politiku koordinovaného zveřejňování zranitelností (pdf), jejímž cílem je nejen zvyšování bezpečnosti produktů informačních a komunikačních technologií (ICT), ale také ochrana objevitelů zranitelností před negativními právními dopady. Součástí je rovněž vytvoření „koordinátora pro účely CVD“, jímž je podle nového zákona o kybernetické … více »
Vývojáři KDE oznámili vydání balíku aplikací KDE Gear 25.12. Přehled novinek i s náhledy a videi v oficiálním oznámení.
Společnost System76 vydala Pop!_OS 24.04 LTS s desktopovým prostředím COSMIC. Videoukázky na YouTube.
Byla vydána verze 1.92.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.
Free Software Foundation zveřejnila ocenění Free Software Awards za rok 2024. Oceněni byli Andy Wingo, jeden ze správců GNU Guile, Alx Sa za příspěvky do Gimpu a Govdirectory jako společensky prospěšný projekt.
Bylo vydáno Eclipse IDE 2025-12 aneb Eclipse 4.38. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.
U příležitosti oslav osmi let prací na debianím balíčku vyšlo GPXSee 15.6. Nová verze přináší především podporu pro geotagované MP4 soubory, včetně GoPro videí. Kdo nechce čekat, až nová verze dorazí do jeho distribuce, nalezne zdrojové kódy na GitHubu.
Zdravím,
řešil už někdo prapodivné chování PHP funkce mb_ereg() ?
regulární výraz
mb_ereg("^[a-zA-Z]*$","příšera")
se vyhodnotí negativně, zatímco regulární výraz
mb_ereg("^[a-zA-Z]*","příšera")
se vyhodnotí pozitivně (odstraněn znak pro konec řetězce).
Výraz:
mb_ereg("^[a-zA-Z]*$","prisera")
se vyhodnoti pozitivně.
Narazil jsem na tento problém při sestavování podstatně složitějšího výrazu, který u slov bez diakritiky fungoval naprosto bez problému. Problém je v tom, že ve výrazu nutně potřebuji omezit chování konec řetězce. Všechny patterny obsahující znak $ (pro konec řetězce) se vyhodnocují automaticky negativně.
Vstupem i výstupem je kódování UTF-8. mb_internal_encoding() hlasi UTF-8, mb_regex_encoding() taktéž. Tím, že řetězce na vstupu jsou v UTF-8, jsem si naprosto jist. Verze PHP je 5.2.6.
Má někdo nějaký nápad, či případně toto nějak řešil?
mb_ereg("^[a-zA-Z]*","příšera") se vyhodnocuje správně pozitivně, protože souhlasí "p" na začátku, pokud budeš dělat mb_ereg("^[a-zA-Z]*","činka") tak to už vyhodnotí negativně, možná bych zkusil preg_match("/^[\S]*$/u","příšera"), ale nevím co přesně máš na vstupech.
šíšera.
jj, pravda nějak jsem si spletl * a +
p
setlocale(LC_CTYPE, 'cs_CZ.utf8');
$foo = iconv('utf-8', 'ascii//TRANSLIT', "příšera");
# mb_ereg se vyhodnoti pozitivne
mb_ereg("^[a-zA-Z]*$", $foo);
# jinak lze pouzit i tento tvar
mb_ereg("^[[:alpha:]]*$", $foo);
preg_match("/^\p{L}*$/", "příšera");
Díky za reakce,
ten nápad s iconv mě taky napadl. Leč jsem si stále myslel, že mě napadne něco elegantního. V tom skriptu se jedná o ošetření vkládání klíčových slov. Pravidla jsou taková, že mohou začínat libovolným písmenem, mohou obsahovat číslici, od sebe jsou odděleny čárkou (či případně čárkou a mezerou) a musí končit slovem. Žádné jiné znaky nejsou povoleny, takže nelze použít třídu [[:alpha:]]. Vše až na to ošetření konce slova jsem už zvládl.
Správně by se měl vyhodnotit tento řetězec (i s vloženou frází "sportovní náčiní"):
činka, sportovní náčiní, číslo21, google
chybně by se měl vyhodnotit řetězec obsahující například:
činka, sportovní náčiní, 21. století, google,
(slovo nesmí začínat číslicí, tečka není přípustná a řetězec nesmí končit žádným jiným znakem, než [a-zA-Z0-9]). Něco jako
^[a-zA-Z0-9]*(,| )*[a-zA-Z0-9]*$
Moc elegantní to není, ale snad by to mohlo pomoci někomu, kdo podobný problém řeší:
$foo = iconv('utf-8', 'ASCII//IGNORE', $text);
if(ereg('^([a-zA-Z]{1,}[0-9]*(,| ){0,1})*[a-zA-Z]{1,}[0-9]*$',$foo)) {
$result=1;
} else { $result=0; }
/*
1) do proměnné $foo se překóduje text z proměnné $text, která je kódována v UTF-8, proměnná $foo je nyní reprezentována v kódování ASCII s tím, že znaky, které nemohly být zkonvertovány do ASCII "tiše" zmizí (zajišťuje příznak //IGNORE)
2) klíčová slova musí začínat písmenem a případně končit číslicí, mezi slovy je přípustná čárka (oddělovač klíčových slov) nebo mezera (oddělovač slov v slovní frázi). Celý regulární výraz musí končit slovem (případně slovem s číslicí na konci).
*/
Vypadá to, že to funguje, že jsem neudělal chybu (po 11 hodinách v práci by mě to ani nepřekvapilo).
Tiskni
Sdílej: