Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) vydal Zprávu o stavu kybernetické bezpečnosti ČR za rok 2024 (pdf). V loňském roce NÚKIB evidoval dosud nejvíce kybernetických bezpečnostních incidentů s celkovým počtem 268. Oproti roku 2023 se však jedná pouze o drobný nárůst a závažnost dopadů evidovaných incidentů klesá již třetím rokem v řadě. V minulém roce NÚKIB evidoval pouze jeden velmi významný incident a významných incidentů bylo zaznamenáno 18, což oproti roku 2023 představuje pokles o více než polovinu.
Byl publikován aktuální přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie). Servo mimo jiné nově zvládne animované obrázky APNG a WebP.
Na chytré telefony a počítačové tablety v Rusku bude od začátku příštího měsíce povinné předinstalovávat státem podporovanou komunikační aplikaci MAX, která konkuruje aplikaci WhatsApp americké společnosti Meta Platforms. Oznámila to dnes ruská vláda. Ta by podle kritiků mohla aplikaci MAX používat ke sledování uživatelů. Ruská státní média obvinění ze špehování pomocí aplikace MAX popírají. Tvrdí, že MAX má méně oprávnění k přístupu k údajům o uživatelích než konkurenční aplikace WhatsApp a Telegram.
Společnost PINE64 stojící za telefony PinePhone nebo notebooky Pinebook publikovala na svém blogu srpnový souhrn novinek. Kvůli nedostatečnému zájmu byla ukončena výroba telefonů PinePhone Pro.
Po pěti měsících vývoje byla vydána nová verze 0.15.1 programovacího jazyka Zig (GitHub, Wikipedie). Verze 0.15.0 byla přeskočena. Přispělo 162 vývojářů. Přehled novinek v poznámkách k vydání.
Před sedmi lety společnost Valve představila fork projektu Wine s názvem Proton umožňující v Linuxu přímo ze Steamu hrát počítačové hry do té doby běžící pouze ve Windows. Aktuální přehled podporovaných her na stránkách ProtonDB
Společnost DuckDuckGo rozšířila svůj AI chat Duck.ai o GPT-5 mini (𝕏). Duck.ai umožňuje anonymní přístup bez vytváření účtů k několika modelům umělé inteligence. Aktuálně k GPT-4o mini, GPT-5 mini, Llama 4 Scout, Claude Haiku 3.5 a Mistral Small 3.
Marek Tóth v příspěvku DOM-based Extension Clickjacking: Data ve správcích hesel v ohrožení na svém blogu popsal novou clickjacking techniku s několika variantami útoků a otestoval ji proti 11 správcům hesel. Výsledkem bylo nalezení několika 0-day zranitelností, které mohly ovlivnit uložená data desítek milionů uživatelů. Jedno kliknutí kdekoliv na webové stránce kontrolované útočníkem umožňovalo ukrást uživatelská data ze
… více »Na dnešní akci Made by Google 2025 (YouTube) byly představeny telefony Pixel 10 s novým čipem Google Tensor G5 a novými AI funkcemi, hodinky Pixel Watch 4 a sluchátka Pixel Buds 2a.
The Document Foundation oznámila vydání nové major verze 25.8 svobodného kancelářského balíku LibreOffice. Podrobný přehled nových vlastností i s náhledy v poznámkách k vydání (cs) a také na Youtube a PeerTube.
Pomaly sa blížim k oficiálnemu vydaniu mojho nástroju na hľadanie podobných slov. Primárne slúžiaceho na tvorbu česko-slovenského slovníku (teoreticky aj iné blízke jazyky, trochu som sa hral so slovinsko-srbským slovníkom). Z programátorského hľadiska som sa dostal do stavu, keď sa mi zdá zbytočné programovať ďalšie kusy kódu. Potrebujem však doriešiť praktické problémy.
Začnime v skratke tým ako to funguje. Na vstupe dostaneme zoznam slovenských slov v základnom tvare a zoznam českých slov, ak máme náhodou aj nejaké informácie o kontexte z veľkých korpusov tak ich možeme použiť. Projekt Trdlo (Transducing Dictionary - ako vznikajú akronymy) má sady pravidiel pre češtinu a slovenčinu, ktoré zvládajú jednoduché transformácie. Potom sa udeje pár krokov, kde získavame stále viac slov so stále menšou presnosťou :). Pri laboratórnych dátach a referenčnom slovníku sme sa dostali na pokrytie/presnosť - 68% / 97% a 82% / 92%. Bez pridania dodatočných dát sa teoreticky dá dostať niekam k 97% / 85%. Ale dosť bolo teórie, aj tak musím napísať ešte poriadny článok.
Projekt ako taký je pod BSD licencou, takže si s ním každý može robiť skoro čokoľvek. Ak však chceme kvalitnejšie dáta, tak ich potrebujeme prejsť, opraviť či pridať úplne rozdielne slová. Napadlo ma vytvoriť nejaké jednoduché rozhranie, aby si ľudia mohli prezrieť slovník a keď-tak v ňom opraviť chybu, alebo pridať nové slovo. Otázka je, či sa dá čakať nejaký efekt. Predstavoval by som to tak, že dáta ktoré by doplnili užívatelia by boli free (zrejme CC attribution) a ja by som uvolnil svoje skontrolované dáta vtedy keď by moje tvorili len 2/3. Dovtedy by som si ich ponechával pre seba, príp. pre niekoho komerčného, kto by zaplatil kontrolu časti dát.
Ďalšie využitie tohoto slovníku si viem predstaviť ako pomoc pri prekladaní GNU/FDL česko-anglického slovníku, vyhľadávanie súčasne v češtine aj slovenčine a samozrejme pre strojový preklad, kvoli ktorému som to celé robil. Ak vás napadnú akokoľvek šialené nápady na využitie, prosím prezentujte ich. Cieľom nie je zarobiť na dátach, ale mať ich čo najkvalitnejšie a v ideálnom stave aj maximálne využité.
Tiskni
Sdílej:
precetl jsem si to opravdu nekolikrat, ale jaksi jsem nepochopil, co by bylo treba delat. Nebo neni treba delat nic a je to jenom jakesi oznameni, ze uz jste s tim programem skoro u konce?
V podstate áno, ale musíš mať zoznam slov v cieľovom jazyku (stačí to, čo sa používa na kontrolu preklepov).
Po příkladech syntetické češtiny vyrobené ze slovenštiny jsem se skoro sháněl, a nic nenašel.
Slovenštinu slyším denně. Když už nevím co nějaké slovo znamená, použiju www.zoznam.sk a nechám si to přeložit do angličtiny. Toto mě zatím nikdy nezklamalo. Občas to dělám i obráceně a není problém. Sice se to stává velice málo, ale když už ano, poradím si.
Petr
Odporúčam používať tiež slovenské slovníky na http://slovnik.juls.savba.sk/ (niekedy sa hodia aj slovákom).
Cesko-slovensky tisteny slovnik mam doma uz tak dlouho, ze uz ani nevim kde jsem ho vzal :) Je to docela pekna bichle v nicem si nezada s cesko-anglickym slovnikem (ktery je ale jednosmerny).
Problém je, že rozumne kvalitný česko-slovenský slovnik (Slovensko-český a česko-slovenský slovník rozdílných výrazů (Jaroslav Nečas, Miloslav Kopecký, ISBN 8004224172) vyšiel v 1989. Jedná sa o diferenčný slovník a bol by perfektným doplnkom k tomu, čo dokážem vytvoriť, ale to by k nemu museli byť jasné práva :(
Často člověk narazí na slova, která size znějí podobně, ale význam je úplně jiný. Jako příklady mě teď napadají:
Asi bych si vzpomněl na víc příkladů, ale tohle snad stačí, jenom pro zajímavost
Máš pravdu. Tento problém dokážeš čiastočne eliminovať tým, že sa hráš len s blízkymi / veľmi blízkymi jazykmi. Pri češtine-slovenčine sa nebojuje až tak so slovami, ktoré majú úplne odlišný význam (kel ->kapusta; kapusta -> zelí) ale skor so slovami, ktoré majú podobný význam a významy sú kúsok posunuté. Ak by sme sa hrali so vzdialenejšími jazykmi, tak stále dokážeme mať slušnú úspešnosť, ale tam ide skor o odborné termíny (tj. slová z iného jazyka prisposobené na miestny zápis) - v Prahe sa kedysi robili takéto pokusy ako doplnok k existujúcemu slovníku pre neznáme slová pri preklade z češtiny do ruštiny.
Také dva klasické príklady na rovnaké slová s iným významom (okrem kapusty) sú "horký" a "chudý". Možno ich je aj viac, ale teraz si nespomeniem.
Do československého slovníka by sa viac asi hodili slová, ktoré sú úplne rozdielne (a to asi nie je ideálna úloha pre vyhľadávač podobných slov). Ja tu jeden papierový slovník rozdielných výrazov mám (z roku 1997), ale je maličký, takže raz za čas sa stane, že tam hľadané slovo nie je (nevie niekto, ako je "oliheň" v slovenčine? Je to sépia?) A keď si ho prezerám, tak sa stane aj, že nepoznám ani český ani slovenský význam niektorých slov (napr. vika (sk) = vikev (cz)), ale to je väčšinou moja neznalosť.
A čo so slovami (prípadne spôsobmi použitia slov), ktoré v jednom z jazykov neexistujú? Práve teraz ma napadne asi len málo: použitie slova "shedat" v konštrukciách ako "shledal jsem to velmi těžkým" (neviem, ako by som to bez úpravy preložil do slovenčiny) alebo české slová "křížala" alebo "povidla". Ako ich preložiť rozumne do slovenčiny? Prípadne slovenské "spevokol" jedným slovom do češtiny (aj keď to možno ide, nepoznám češtinu až tak dobre)?
Oliheň je také hlavonožec, ale ne sepie, dobře plave. Jiné slovo je kalmar, např. Architeuthis.
Podle Malá Československá encyklopedie na http://cotoje.cz: Loligo – rod desetiramenných hlavonožců. Mají protáhlé, torpédovité tělo. Dobře plavou. U pobřeží Evropy je hojná o. obecná, Loligo vulgaris, asi 50 cm dlouhá.
moje slovenská macecha říká povidlům lekvar nebo lektvar nebo nějak tak.....
Ahoj, robil som uvodnu verziu dat slovenskeho synonymickeho slovnika.
OpenThesaurus-SK - http://www.openthesaurus.tk/
Slovnik sa potom moze pouzit v OOo a inych projektoch. Projekt zastresuje Zdenko Podobny. (http://www.sk-spell.sk.cx/), ktory sa stara o dalsie projekty ktore maju nieco so Slovencinou.
snad ti tato informacia pomoze pri tvojej dalsej praci
Tibor
Vedel by si povedať, ako je užitočné dať možnosť editovať bežným používateľom?
Zdenka samozrejme poznám, do ispellu som pár (desiatok?/stoviek?) chýb reportoval :)
Ani nie, na to ti stačia omnoho jednoduchšie nástroje. Ak vezmeš vygenerovavané tvary z ispellu, tak to zvládne všetky tvary daného slova (s 'odlyšné' by si to asi už neporadilo)