Software Freedom Conservancy v novém dokumentu shrnuje doporučení, jak přistupovat ke generativní AI založené na LLM při přispívání do svobodného a open-source softwaru. Mimo jiné vyzývá k obezřetnosti, transparentnosti a revizi generovaného kódu člověkem.
Byla vydána nová verze 5.6.0 programu na úpravu digitálních fotografií darktable (Wikipedie).
Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma. V Týdnu v GNOME je zmíněn flatpak balíček pro GIMP 0.54.1 z roku 1996. Jedná se o poslední verzi GIMPu postavenou nad toolkitem Motif.
Home Assistant Operating System, tj. linuxová distribuce optimalizována pro hostování Home Assistanta a jeho aplikací, byl vydán v nové major verzi 18.0.
Po šestiletém úsilí byla z jádra Linux odstraněna funkce strncpy(). Všechna předchozí volání této funkce byla převedena na bezpečnější alternativy.
Byla vydána nová verze 261 správce systému a služeb systemd (Wikipedie, GitHub). Z novinek lze vypíchnout nový subsystém IMDS (Cloud "Instance Metadata Service"), nový příkaz storagectl nebo novou komponentu systemd-sysinstall.
Vývojové prostředí Qt Creator bylo vydáno ve verzi 20 (seznam změn). Novinky zahrnují hlavně rozšíření pro integraci LLM agentů nebo minimalistický editační režim uživatelského rozhraní („zen mode“).
Už jste se prolétli na webu Google Earth? Přibyl tam Simulátor letu (Nástroje / Simulátor letu). Funguje i bez účtu Google [𝕏].
Byla vydána nová verze 4.7 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.
Mastodon (Wikipedie) - sociální síť, která není na prodej - byl vydán ve verzi 4.6. Přehled novinek s náhledy v oznámení na blogu.
Při pročítání diskuze na abclinuxu.cz mi vždycky připadalo, že příspěvky ve slovenštině jsou daleko častěji psány bez diakritiky (Nic proti slovenštině, ale bez háčků a čárek se mi čte daleko hůř). A tak jsem se rozhodl exaktně ověřit, jestli je to tak.
A výsledek je takový:
58,2 % příspěvků je psáno s diakritikou, naopak bez diakritiky je jich 39,5 %. Zbývající 2,3 % jsou příspěvky bez textového obsahu, tj. smajlíci, čísla apod.
Česky je napsáno 80,1 % zápisů, slovensky 15,5 %, u zbývajících 4,4 % nelze rozpoznat použitý jazyk.
Jedna třetina (33,0 %) česky psaných zápisů neobsahuje háčky, u slovenštiny jsou to naopak téměř tři čtvrtiny (73,1 %) - z toho vyplývá jednoznačný závěr: Slováci (na abclinuxu.cz) kašlou na diakritiku více než Češi.
Postup:
Využil jsem toho, že diskuze je přístupná přes rozhraní news. Programem slrn-pull jsem stáhnul na disk posledních 10 000 příspěvků. Základní rozdělení na příspěvky s diakritikou a bez diakritiky jsem provedl na základě hlavičky Content-type (tj. ascii/ISO-8859-2) (tj. počítá se jen tělo příspěvku, nikoliv subject; to je logické, protože je jistě spousta případů, kdy bezháčkový člověk odpoví na příspěvek s háčkovaným subjectem). Při té příležitosti jsem z příspěvků odstranil patičky abclinuxu (linky na diskuzi):
#!/bin/bash
adresarcil="/home/hajma/tmp/recode"
adresarzdroj="/var/spool/slrnpull/news/gmane/user-groups/linux/czech"
for soubor in $(ls $adresarzdroj)
do
cat $adresarzdroj/$soubor | formail -x Content-Type | grep us-ascii
if [ $? -eq 0 ]
then
cat $adresarzdroj/$soubor | formail -I "" | sed -r /"^Zobrazit diskusi: http:\/\/www.abclinuxu.cz\/forum\/show\/"\|"^Zobrazit komentar: http:\/\
/www.abclinuxu.cz\/forum\/show\/"/d > $adresarcil/ascii/$soubor
else
cat $adresarzdroj/$soubor | formail -x Content-Type | grep ISO-8859-2
if [ $? -eq 0 ]
then
cat $adresarzdroj/$soubor | formail -I "" | sed -r /"^Zobrazit diskusi: http:\/\/www.abclinuxu.cz\/forum\/show\/"\|"^Zobrazit komentar: http:\
/\/www.abclinuxu.cz\/forum\/show\/"/d | recode l2/qp..l2 > $adresarcil/iso/$soubor
fi
fi
done
Vlastní metoda rozdělení podle jazyka byla jednoduchá: pokud příspěvek obsahuje více českých slov, je český a vice versa.
Pro svůj účel jsem využil český a slovenský slovník MySpell, které jsem ale nejprve musel zbavit pomocných znaků a převést na malá písmena:
#!/bin/bash adresarcil="/home/hajma/tmp/recode" adresarzdroj="/usr/share/dict/ooo/" cat $adresarzdroj/cs_CZ.dic | sed -e s@"\/.*$"@@g | tr '[:upper:]' '[:lower:]' | sort | uniq > $adresarcil/cz.txt cat $adresarzdroj/sk_SK.dic | sed -e s@"\/.*$"@@g | tr '[:upper:]' '[:lower:]' | sort | uniq > $adresarcil/sk.txt
Z českého slovníku jsem ještě ručně odstranil slovo "a".
Z obou souborů jsem dále odstranil slova, která se vyskytují i ve druhém jazyce:
#!/bin/bash
adresar="/home/hajma/tmp/recode"
for slovo in $(cat $adresar/cz.txt)
do
grep -wq $slovo $adresar/sk.txt
if [ $? -eq 1 ]
then
echo $slovo >> $adresar/cisteceskaslova.txt
fi
done
for slovo in $(cat $adresar/sk.txt)
do
grep -wq $slovo $adresar/cz.txt
if [ $? -eq 1 ]
then
echo $slovo >> $adresar/cisteslovenskaslova.txt
fi
done
Potom jsem bral soubor po souboru, odstranil z nich cokoliv, co nebylo písmeno (díky, Yeti) a vyhledával jednotlivá slova v českém a slovenském slovníku.
#!/bin/bash
adresar="/home/hajma/tmp/recode/iso"
for soubor in $(ls $adresar)
do
cz=0
sk=0
for slovo in $(cat $adresar/$soubor | sed 's/[^[:alpha:]]\+/\n/g' | sed 's/^[ \t]*//;s/[ \t]*$//' | sed '/^
$/d' | tr '[:upper:]' '[:lower:]')
do
#echo $slovo
grep -wq -e $slovo /home/hajma/tmp/recode/cisteceskaslova.txt
if [ $? -eq 0 ]
then
cz=$((cz+1))
fi
grep -wq -e $slovo /home/hajma/tmp/recode/cisteslovenskaslova.txt
if [ $? -eq 0 ]
then
sk=$((sk+1))
fi
done
if [ $cz -gt $sk ]
then
cp $adresar/$soubor /home/hajma/tmp/recode/diacz
elif [ $cz -lt $sk ]
then
cp $adresar/$soubor /home/hajma/tmp/recode/diask
elif [ $cz -eq 0 ]
then
cp $adresar/$soubor /home/hajma/tmp/recode/dianeznamo
else
cp $adresar/$soubor /home/hajma/tmp/recode/diaczsk
fi
done
Update: Zapomněl jsem doplnit, že podobně se to udělá i pro příspěvky bez diakritiky (převod slovníků na bezháčkové probíhá pomocí recode takto:
cat $adresarcil/cz.txt | recode -f l2..flat | sort | uniq > czbezhacku.txt
Tiskni
Sdílej:
ked sa povodna informacia z textu nestrati (myslim, ze odpovede na komentare bez diakritiky su dostatocny dokaz
Chcete mi tedy naznačit, že dokud nezačnu ignorovat dotazy bez diakritiky, neuvěříte, že se mi hůře čtou? :-(
))
Ja som naopak nedávno z počítačov na ktorých pracujem „vyhádzal“ anglické klávesnice a používam iba sk, hlavný dôvod je, že schválne bolo rozloženie opačné ako som práve potreboval a potom mi vychádzali veci ako „Ale je dnes kr8sne po4asie“
. Stačilo si len zvyknúť na ALT GR
.
Diakritiku používam všade, či už na jabbery, v mailoch, diskusiách …, v podstate môže za to aj abclinuxu.cz a hlavne osveta niektorých ľudí tu. 
Prestavate rozumiet, lebo nechcete.Nemáš dojem, že toto je mierny významový posun od toho čo tvrdíš teraz ? Základy trhovej ekonomiky ovládam, dúfam, aspoň natoľko aby som poznal a chápal vzťah medzi dopytom a ponukou. Mimochodom, je snaha dabovať české seriály na STV - myslím, že v prípade televíznych programov je je problematika trochu zložitejšia a nezužoval by som ju len na jazyk. Pokiaľ ide o knihy, tých slovenských kníh zas až tak veľa, žiaľ, nevychádza - zámerne nechávam bokom slovenské preklady z cudzích jazykov, keďže to si zrejme nemal na mysli. Späť k téme. Moja chyba, pretože som nevysvetlil, prečo to nepovažujem za argument: Autor postu pôvodne rozoberal situáciu na abclinuxu.cz, kde vôbec nemám dojem, že by nebola vôľa rozumieť. Skôr som to pochopil ako snahu o zlepšenie vzájomnej komunikácie tým, že jednoducho autor poukázal na to, že slovenčine bez diakritiky rozumie o dosť ťažšie ako slovenčine s diakritikou - čo mu ostatne viacerí, takým, či onakým spôsobom dali za pravdu. Najmä preto toto tvoje citované konštatovanie považujem za prílišné zjednodušovanie a paušalizovanie, ktoré si myslím, že pri pohľade na túto diskusiu jednoducho neplatí. Nesnažím sa analyzovať ani riešiť celospoločenskú situáciu - na to sú iní, múdrejší ako ja.
Slováci, zde píšící bez diakritiky: nedivte se, že Češi slovenštině přestávají rozumět - moc nám to neulehčujete, když píšete bez diakritiky.
Já se se slovenštinou setkala, více až v posledních 3 letech. Do té doby jem se o ni nijak moc nezajímala, proč taky - nikoho, kdo by mluvil slovensky jsem neznala, slovenskou knihu nepotkala, a když jsem později narazila na slovenskou knihu, myslela jsem si, že je to polsky.
Většinu toho, co nyní rozumím ze slovenštiny, jsem se naučila během posledních tří let, kdu jsem se naučila rozumět také polštině a ve škole jsme také začali slovenštinu probírat. Předtím jsem slovenštině nerozuměla prakticky vůbec a ani jsem neměla důvod (ani možnost) se porozumět pokusit.
S diakritikou se mi čtou veškeré texty lépe.
Srovnání textů podle "snadnosti čtení" (moje!):
)
Ať žije diakritika!
Ještě dodám. Já sama jsem "obětí" učitelů, kteří do mě hustí věci, které přeci vědět nechci
Především Latinu - šest let se nás ji učitelé snažili naučit, ale nikoho to vůbec nezajímalo. Psali jsme dokonce petice, že Latinu mít nechceme - marně. Potom jsem letos o prázdninách jela do Itálie a nejen, že jsem rozuměla latinským nápisům (přes veškerou usilovnou snahu nic se nenaučit
), ale rozuměla jsem dokonce trochu italštině. Našla bych určitě i jiné příklady.
Naučila jsem se být vděčná i za to co nechci vědět, co mě nezajímá. Když to nebudu potřebovat, zpomenu to, ale třeba se mi to někdy byde hodit, a budu vděčná až se mi to vynoří z hlubin paměti.
Zakončila buch citátem z článku v naší učebnici, který mi začíná připadat vhodný, přestože jsem si myslela, že tak to chodí zatím jen v USA.
Ignorantství je povýšeno oficiálně na ctnost a všemožně se podporuje.(Jiří Kostečka, Český jazyk pro 4. ročník gymnázií, SPN, Praha, 2003 - Jazyková kultura: Lingvistické lynčování, s 21)
Presne tak, na českých stranách si píš ako "prase", až na to, že veľa ľudí ten štýl za "prasácky" nepovažuje. Mne je úplne fuk, ako píšu Česi na svojích stránkach, tak by Vám malo byť fuk, ako píšeme my na svojich.To dúfam, nebolo myslené vážne. Je mi trochu ľúto, že sa objavila reakcia takmer v štýle "cudzie nechceme a svoje si nedáme" - dúfal som, že takýmto malichernostiam sa bude dať vyhnúť. Trochu ma zaráža tá ľahostajnosť: Ak mám úctu k svojmu jazyku a reči, tak sa ho predsa snažím prezentovať najlepšie ako viem - a tam nepochybne patrí okrem správneho pravopisu, v rámci možností "zmysluplnej" štylistiky aj správna podoba slov vrátane diakritiky.
alebo LOL, tak mu dáte facku?
Ja sa živím prekladaním, užijem si spisovného jazyka viac ako väčšina iných a z času na čas na nete prispejem do diskusie bez diakritiky. Nevidím v tom ani dehonestovanie jazyka samotného, ani nemám pocit, že môj prejav sa pomaly degeneruje.