Dnes a zítra probíhá vývojářská konference Google I/O 2025. Sledovat lze na YouTube a na síti 𝕏 (#GoogleIO).
V Bostonu probíhá konference Red Hat Summit 2025. Vybrané přednášky lze sledovat na YouTube. Dění lze sledovat na síti 𝕏 (#RHSummit).
Společnost Red Hat oficiálně oznámila vydání Red Hat Enterprise Linuxu 10. Vedle nových vlastností přináší také aktualizaci ovladačů a předběžné ukázky budoucích technologií. Podrobnosti v poznámkách k vydání.
Tuto sobotu 24. května se koná historicky první komunitní den projektu Home Assistant. Zváni jsou všichni příznivci, nadšenci a uživatelé tohoto projektu. Pro účast je potřebná registrace. Odkazy na akce v Praze a v Bratislavě.
Troy Hunt představil Have I Been Pwned 2.0, tj. nový vylepšený web služby, kde si uživatelé mohou zkontrolovat, zda se jejich hesla a osobní údaje neobjevili v únicích dat a případně se nechat na další úniky upozorňovat.
Microsoft představil open source textový editor Edit bežící v terminálu. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.
V Seattlu a také online probíhá konference Microsoft Build 2025. Microsoft představuje své novinky. Windows Subsystem for Linux je nově open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.
Z příspěvku Turris Sentinel – co přinesl rok 2024 na blogu CZ.NIC: "Za poslední rok (únor 2024 – únor 2025) jsme zachytili 8,3 miliardy incidentů a to z 232 zemí a z jejich závislých území. Tyto útoky přišly od 6,2 milionu útočníků (respektive unikátních adres). SMTP minipot je stále nejlákavější pastí, zhruba 79 % útoků bylo směřováno na tento minipot, 16 % útoků směřovalo na minipot Telnet, 3 % útoků směřovaly na minipot HTTP a 2 % na minipot FTP. Dále jsme zaznamenali 3,2 milionu unikátních hesel a 318 tisíc unikátních loginů, které útočníci zkoušeli."
Byla vydána (Mastodon, 𝕏) nová verze 3.0.4 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP je již k dispozici také na Flathubu.
Byla vydána nová stabilní verze 7.4 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 136. Přehled novinek i s náhledy v příspěvku na blogu.
Možná jste i vy někdy řešili otázku, jaký formát použít pro uložení výchozí konfigurace vašeho skriptu či aplikace. U shellových skriptů, si většinou vystačíte s jednoduchým textovým souborem, ve kterém jsou přiřazené výchozí hodnoty proměnných stejně jako ve skriptu – takový soubor si pak může skript natahovat rovnou při spuštění. Pro složitější konfiguraci je však lepší pracovat se strukturovanými formáty, jako je XML, YAML, nebo JSON.
Ovšem zpracování strukturovaného formátu přímo shellovým skriptem vyžaduje napsání parsovací funkce, která nemusí být triviální záležitostí. Proto je lepší držet se unixové filozofie a pro jejich zpracování využívat specializované procesory.
Snad nejrozšířenějším formátem pro uložení strukturovaných dat v současnosti je XML, pro jehož zpracování je k dispozici řada nástrojů počínaje těžkotonážními XSLT parsery v javě a subtilní aplikací xmlstarlet konče. Právě posledně jmenovaná aplikace se mi velice osvědčila při zpracování velkých XML souborů. Nechci vás zatěžovat zdlouhavým popisem co všechno umí, proto vás odkazuji na jeho manuálovou stránku a jeden ukázkový příklad ve zdejší poradně, který uvedl již před sedmi lety Fuky.
Dalším poměrně rozšířeným strukturovaným formátem je JSON, se kterým se můžete setkat na nejrůznějších místech. Kupříkladu u QMP konzole QEMU, nebo u souborů které používá rmlint
, o kterém jsem tu rovněž před časem psal (viz rmlint - řešení duplicit. I pro něj existuje podobná malá svižná aplikace – jq, která dovoluje výstup zpracovávat podobně, jako když aplikujeme sed
na obsah textových souborů. Viz několik ukázkových příkladů
Tiskni
Sdílej:
[WRAPPER_B] socket = /tmp/xnbd_wrapper.B.ctl port = 8250 volumes = ['/testovaci/disc.img' ,'/testovaci/cd.iso'] address = localhost [WRAPPER_A] socket = /tmp/xnbd_wrapper.A.ctl port = 777 volumes = ['/next/disc.img' ,'/next/cd.iso'] address = 10.0.0.1Podotýkám, že v tomto případě nejde o konfiguraci shellového skriptu, nýbrž pouze o ukázku toho co považuji za složitější konfiguraci.
socket_A = '/tmp/xnbd_wrapper.B.ctl' port_A = 8250 volumes_A = ('/testovaci/disc.img' ,'/testovaci/cd.iso') address_A = localhost socket_B = '/tmp/xnbd_wrapper.A.ctl' port_B = 777 volumes_B = ('/next/disc.img' ,'/next/cd.iso') address_B = '10.0.0.1', který se pak inklůdne (v shellu) a mám hned inicializované proměnné k dispozici bez jakéhokoliv potřebného parsovacího modulu.
<category> <sub page_id="74823" parent_page_id="20331"> <![CDATA[PowerBanky]]> </sub> <sub page_id="75681" parent_page_id="20338"> <![CDATA[Nabíjačky]]> </sub> <sub page_id="71290" parent_page_id="20338"> <![CDATA[Univerzálne nabíjačky]]> </sub> <sub page_id="72975" parent_page_id=""> <![CDATA[]]> </sub> <sub page_id="74824" parent_page_id=""> <![CDATA[]]> </sub> <sub page_id="75676" parent_page_id="20338"> <![CDATA[Mobilné a telefónne príslušenstvo]]> </sub> <sub page_id="76162" parent_page_id="20331"> <![CDATA[Energia na cesty]]> </sub> </category>Nechcelo sa mi hľadať tie najhošie, kde sú niektoré suby prázdne a inak posraté, nepoznám parser ktorý by to rozchodil, preto používam svoj vlastný. Tie parseri nevedia rozchodiť rovnaký tag z/bez atributov a ešte keď sa tam opakujú rovnaké hodnoty atribútov a tagov. Samozrejme je tam niekedy jeden sub a pri ďalšej položke 15 subov. Je pravda, že teoreticky by to šlo vyexportovať do XML aj cez tagy a hodnoty, ale proste také XML v reále od nikoho nedostaneš, takže môj parser tie suby čísluje 1,2,3 ... inak to proste do ničoho neskonvertuješ a ani tabuľkové procesory to nerozchodia, teda už z podstaty nemajú ako. Každé väčšie XML má proste nejaký skurwený formát, entity a ja neviem čo. Jako momentálne dokážem vyťahať údaje hádam z každého XML, ale chvíľu mi trvalo než som nad tým vyhral. Ono väčšina tých úplných parserov je ľahko hacknutelných, pretože je tam ešte podpora ťahania dát z externých súborov.
Je neco cemu bys ty osobne dal prednost?Bohužel je to bída s nouzí... Pro své projekty psané v Céčku používám konfigurační mechanismus z LibUCW, ale nikdy jsem se nedostal k napsání slušných bindingů pro jiné jazyky, mimo jiné proto, že je to celé snad až příliš ukotvené v typovém systému Céčka. Jinak používám různé omezené podmnožiny YAMLu, ale skřípu nad tím zuby od doby, kdy jsem si zkoušel napsat vlastní YAMLový parser :)
/etc/default
, přes kterou lze měnit výchozí hodnoty globálních proměnných a pak (pokud je to nutné) s dílčí konfigurací která se může spravovat přímo skriptem.
Zrovna teď si píšu tool, který umožňuje řídit virtuály v situaci, kdy potřebuji mít z nějakého důvodu odstavený pacemaker. Na jejich řízení (pokud je pacemaker aktivován a služba ve stavu managed) mám svého agenta, který pracuje přímo s QEMU. Nepotřebuji tedy žádný libvirt ani omáčku kolem. Psal jsem o tom před časem v blogpostu o parametru utilization v konfiguraci pacemakeru. Ten tool tedy pracuje se zcela identickou výchozí konfigurací, ale protože nabízí i další možnosti, které původní kvm agent nemá, uvažuji o její paralelní interpretaci v JSON formátu, která by se využívala kupř. při uspání stroje, modifikaci konfigurace VM za běhu, nebo při live migraci. Před šesti lety jsem si už jeden takový tool napsal, možná by byl i použitelný, ale byl závislý i na aplikacích které nejsou běžnou součástí standardní instalace, takže bych ho stejně musel téměř celý přepsat.
Já bych třeba v Perlu použil jednoduchý modul 'Storable', který se mi o to postará. Soubor je pak texťák, ale takový, aby byl co nejlépe a nejrychleji zpracovatelný strojově, takže je pro "čtenáře" skoro nečitelný.<rejp>Neplatí tohle náhodou i pro zdrojáky v tom perlu?</rejp>
Tak jasně, pokud dojde k tomu, že si musíme někam odkládat složitější datové struktury, pak se JSON (případně jiné vhodnější) pro to může hodit.Mimochodem, docela zajímavý je k těmto účelům CBOR. Sémantika podobná jako JSON, ale je binární a mnohem efektivnější jak časově, tak prostorově.
[ { "interfaces": [ { "device": "eth1", "ipv4": "10.0.0.12", "timestamp": 1500558336, "note": "Odstavit až vyprší čas" }, { "device": "eth2" } ] } ]
array[0]="hrušky\0"; array[1]="jablka\0" array[2]="#nějaký komentář\0"
double
(což je v Javě taky 64-bit IEEE 754), celá čísla nejprve jako long
, a pokud se to vleze do integeru, tak jako int
. Viz #stringToValue.
Úplně správně bych si to tedy představoval tak, že pokud se to ani do jednoho z těchto typů nevleze, uloží se to jako BigInteger, resp. BigDecimal. to má vyřešené dobře. Desetinná čísla to vždy ukládá jako double... což mimochodem také může vést ke ztrátě přesnosti.
Úplně správně bych si to tedy představoval tak, že pokud se to ani do jednoho z těchto typů nevleze, uloží se to jako BigInteger, resp. BigDecimal.No to já také, ale takovou implementaci jsem nejspíš ještě nepotkal. Problém tkví právě v tom, že chování čísel je specifické pro implementaci, takže se na něj prakticky nemůžete spolehnout.
Možná jste i vy někdy řešili otázku, jaký formát použít pro uložení výchozí konfigurace vašeho skriptu či aplikace.Ani ne. Vzhledem k tomu, že všechny moje bastly používají db, tak jediný konfigurák je connstring. Někdy ani to ne, pokud to běží lokálně, tak se to připojí na unix socket s auth pomocí ident. Veškeré další nastavení stejně jako data jsou potom v db. Pokud už se vyloženě něco musí nastavovat, tak je konf soubor v syntaxe daného jazyka (python, bash), který se prostě includuje.