Po roce vývoje od vydání verze 1.24.0 byla vydána nová stabilní verze 1.26.0 webového serveru a reverzní proxy nginx (Wikipedie). Nová verze přináší řadu novinek. Podrobný přehled v souboru CHANGES-1.26.
Byla vydána nová verze 6.2 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.14.
Byla vydána nová verze 30.0.0 frameworku pro vývoj multiplatformních desktopových aplikací pomocí JavaScriptu, HTML a CSS Electron (Wikipedie, GitHub). Chromium bylo aktualizováno na verzi 124.0.6367.49, V8 na verzi 12.4 a Node.js na verzi 20.11.1. Electron byl původně vyvíjen pro editor Atom pod názvem Atom Shell. Dnes je na Electronu postavena celá řada dalších aplikací.
Byla vydána nová verze 9.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 220 vývojářů. Provedeno bylo více než 2 700 commitů. Přehled úprav a nových vlastností v seznamu změn.
Evropský parlament dnes přijal směrnici týkající se tzv. práva spotřebitele na opravu. Poslanci ji podpořili 584 hlasy (3 bylo proti a 14 se zdrželo hlasování). Směrnice ujasňuje povinnosti výrobců opravovat zboží a motivovat spotřebitele k tomu, aby si výrobky nechávali opravit a prodloužili tak jejich životnost.
Bylo oznámeno (cs) vydání Fedora Linuxu 40. Přehled novinek ve Fedora Workstation 40 a Fedora KDE 40 na stránkách Fedora Magazinu. Současně byl oznámen notebook Slimbook Fedora 2.
ČTK (Česká tisková kancelář) upozorňuje (X), že na jejím zpravodajském webu České noviny byly dnes dopoledne neznámým útočníkem umístěny dva smyšlené texty, které nepocházejí z její produkce. Jde o text s titulkem „BIS zabránila pokusu o atentát na nově zvoleného slovenského prezidenta Petra Pelligriniho“ a o údajné mimořádné prohlášení ministra Lipavského k témuž. Tyto dezinformace byly útočníky zveřejněny i s příslušnými notifikacemi v mobilní aplikaci Českých novin. ČTK ve svém zpravodajském servisu žádnou informaci v tomto znění nevydala.
Byla založena nadace Open Home Foundation zastřešující více než 240 projektů, standardů, ovladačů a knihoven (Home Assistant, ESPHome, Zigpy, Piper, Improv Wi-Fi, Wyoming, …) pro otevřenou chytrou domácnost s důrazem na soukromí, možnost výběru a udržitelnost.
Společnost Meta otevírá svůj operační systém Meta Horizon OS pro headsety pro virtuální a rozšířenou realitu. Vedle Meta Quest se bude používat i v připravovaných headsetech od Asusu a Lenova.
Společnost Espressif (ESP8266, ESP32, …) získala většinový podíl ve společnosti M5Stack, čímž posiluje ekosystém AIoT.
V minulém díle jsem pověděl něco o kreslení jednoduchých grafů a počítání jednoduchých stastistických funkcí. Jak ale člověk do GNU R dostane data z reálného světa, aniž by musel tato opisovat? Dneska popíšu načítání ze souboru.
GNU R má jakési data frames, což bych vzdáleně přirovnal k tabulce v libreoffice calc. Sloupce mohou být pojmenované, mít odlišné datové typy a některé buňky můžou být nevyplněné. Dají se také vybírat různé podmnožiny sloupců, tyto mazat, duplikovat, přemisťovat, přejmenovávat, ale i sčítat, dělit, počítat součet, průměr, atd.
K tomu abych něco předvedl budu muset nějaká data napřed vyrobit.
find /usr -maxdepth 1 -mindepth 1 -type d -exec du -sk "{}" ";" 2>/dev/null | tee r.txt
Po zavaření počítače a vypití kafe se nám objeví nějaká ta kýžená statistická data popisující reálný svět našeho harddisku:
204272 /usr/include 2828 /usr/local 1448 /usr/LessTif 4516 /usr/sbin 2405148 /usr/lib 1017824 /usr/share 132480 /usr/bin 52912 /usr/libexec 4 /usr/src 24 /usr/man
Na dostání dat do programu R používám nejčastěji funkci read.table. Zkusíme tedy, co se stane, když ji pustíme jen tak s minimálním parametrem:
> df=read.table("r.txt") > dfProměnnou jsem nazval df protože se jedná právě o ten zmíněný data frame. Vida! Ono nám to načetlo a dokonce to pojmenovalo sloupečky defaultním pojmenováním V1 a V2. Vidíme také, že v data framu jsou řádky číslované:
V1 V2 1 204272 /usr/include 2 2828 /usr/local 3 1448 /usr/LessTif 4 4516 /usr/sbin 5 2405148 /usr/lib 6 1017824 /usr/share 7 132480 /usr/bin 8 52912 /usr/libexec 9 4 /usr/src 10 24 /usr/man
Ani jsme nemuseli laborovat se separátorem sloupců! R má totiž defaultně nastavený přechod z nonblank na blank nebo tak nějak. Pokud bychom ho přeci jenom potřebovali změnit (CSV soubory oddělované čárkou a pod.), dělá se to parametrem sep (viz help(read.table)).
Funkci read.table používám v drtivé většině případů. Existují i další, jako readBin použitý v minulém díle, readChar, readLines. Viz vždy help() - parametr helpu se zadává bez uvozovek.
Když už jsme u těch CSV, tyto doporučuju jako metodu dostání dat z Libreoffice Calc do R. V Save As se nastaví formát CSV a odklepne spoustu různých potvrzovacích okýnek, z kterých mi vždycky tečou nervy. Pak musíme soubor zase uložit do normálního libreoffice formátu dat, jinak se bude libreoffice pokoušet ukládat pozdější změny do CSV a přijdeme možná o nějaká metadata.
Můžeme si teď třeba spočítat velikost těch adresářů v megabajtech místo kilobajtů? Ale jistě, udělá se to takhle:
> df$mega=df$V1/1000 > df V1 V2 mega 1 204272 /usr/include 204.272 2 2828 /usr/local 2.828 3 1448 /usr/LessTif 1.448 4 4516 /usr/sbin 4.516 5 2405148 /usr/lib 2405.148 6 1017824 /usr/share 1017.824 7 132480 /usr/bin 132.480 8 52912 /usr/libexec 52.912 9 4 /usr/src 0.004 10 24 /usr/man 0.024
Jak vidíme, R se nám nežinýroval přiřadit do sloupečku s neexistujícím jménem a tak se vytvořil sloupec nový.
A co si tak spočítat procenta? Na to budeme potřebovat funkci sum, která sečte vektor. Zdalipak bude fungovat i na sloupec data frame? Funguje!:
sum(df$mega) [1] 3821.456
Tak vypočteme další sloupec s procenty. Přitom se nám projeví jeden aspekt gnu R - že když dělíme vektor jedním číslem (právě jsme viděli experimentální důkaz toho, že součet sloupce je jedno číslo ), toto se automaticky rozkopíruje na příslušný počet kopií:
> df$procenta=100*df$mega/sum(df$mega) > df V1 V2 mega procenta 1 204272 /usr/include 204.272 5.345397e+00 2 2828 /usr/local 2.828 7.400321e-02 3 1448 /usr/LessTif 1.448 3.789132e-02 4 4516 /usr/sbin 4.516 1.181749e-01 5 2405148 /usr/lib 2405.148 6.293800e+01 6 1017824 /usr/share 1017.824 2.663446e+01 7 132480 /usr/bin 132.480 3.466741e+00 8 52912 /usr/libexec 52.912 1.384603e+00 9 4 /usr/src 0.004 1.046721e-04 10 24 /usr/man 0.024 6.280329e-04
Bum! Počítače zase útočí (já bych všechny tyhle internety zakázala...!) Z vědeckého hlediska je tato odpověď jistě zcela korektní, nicméně podaří se nám ji upravit do humánně čitelné podoby? Vypadá to jakoby nás programátor R omilostnil a vybavil příkaz print parametrem digits (help(print)), který svádí k doměnce, že si s ním budeme moct nastavit zaokrouhlování:
> print(df,digits=5) V1 V2 mega procenta 1 204272 /usr/include 204.272 5.3454e+00 2 2828 /usr/local 2.828 7.4003e-02 3 1448 /usr/LessTif 1.448 3.7891e-02 4 4516 /usr/sbin 4.516 1.1817e-01 5 2405148 /usr/lib 2405.148 6.2938e+01 6 1017824 /usr/share 1017.824 2.6634e+01 7 132480 /usr/bin 132.480 3.4667e+00 8 52912 /usr/libexec 52.912 1.3846e+00 9 4 /usr/src 0.004 1.0467e-04 10 24 /usr/man 0.024 6.2803e-04
K této domněnce skutečně jen svádí. V help(print) žádný další vhodný parametr nenajdu. Podívám se tedy ještě do print.default. To je právě typické že funkce mají ještě .default v kterém se dají další věci nastavovat. Ale ani tam nic nenajdu. Jedna možnost se nabízí takto:
> df$procenta=round(df$procenta,2) > df V1 V2 mega procenta 1 204272 /usr/include 204.272 5.35 2 2828 /usr/local 2.828 0.07 3 1448 /usr/LessTif 1.448 0.04 4 4516 /usr/sbin 4.516 0.12 5 2405148 /usr/lib 2405.148 62.94 6 1017824 /usr/share 1017.824 26.63 7 132480 /usr/bin 132.480 3.47 8 52912 /usr/libexec 52.912 1.38 9 4 /usr/src 0.004 0.00 10 24 /usr/man 0.024 0.00
To má ale nevýhodu, že se nám tím zkazí ty data samotná, pokud je budeme chtít později použít, přijdeme o tisícinky. Zdá se mi že přehledný tisk čísýlek na obrazovku je téma na dizertační práci! Vytáhnu tedy řešení až úplně z paty:
> options(scipen=50) > print(df,digits=1) V1 V2 mega procenta 1 204272 /usr/include 204.272 5.3454 2 2828 /usr/local 2.828 0.0740 3 1448 /usr/LessTif 1.448 0.0379 4 4516 /usr/sbin 4.516 0.1182 5 2405148 /usr/lib 2405.148 62.9380 6 1017824 /usr/share 1017.824 26.6345 7 132480 /usr/bin 132.480 3.4667 8 52912 /usr/libexec 52.912 1.3846 9 4 /usr/src 0.004 0.0001 10 24 /usr/man 0.024 0.0006Podařilo se. Můžeme si teď v klidu zaletět do Stockholmu převzít Nobelovu cenu za tisk čísel. Mravní ponaučení co bych z toho dal je, že existuje v GNU R centrální příkaz options, který, jak píšou v jeho manuálové stránce, nastavuje "variety of global options which affect the way in which R computes and displays its results". Také je potřeba někdy kramařit v dalších manuálových stránkách odkazovaných v sekci See Also.
No a jak teď naše vydobydá data uložíme do externího souboru? Analogicky pomocí funkce write.table:
> write.table(df,file="out.txt")
Program nám texty opatřil uvozovkami, s čímž se ve světě CSV souborů často setkávám. Tyto uvozovky, separátor, popisky sloupečků a řádků a další se dají ve write.table zapínat a vypínat podle manuálové stránky.
Takto můžeme GNU R používat ve skriptech na matematiku, na kterou jsou expr a bc už těžkopádné. Musím vám jenom říct, jak se to volá v dávkovém režimu (sociálním? drogovém?). Program si napíšeme do souboru:
cat >program.R << "EOF" df=read.table("r.txt") procenta=100*df$V1/sum(df$V1) novy=data.frame(df$V2,procenta) write.table(novy,"out.txt",col.names=FALSE,quote=FALSE) EOF
A pak GNU R pustíme z příkazové řádky takto:
R --save <program.R
--save je parametr který se musí uvést a nastavuje se jím zda po skončení R prostředí uloží nebo neuloží (man R). Pokud nám program bouchne a měli jsme --save, můžeme rovnou pustit R a máme v něm pro ruční inspekci všechny proměnné ve stavu těsně před detonací. No a dnešní díl uzavřu výsledkem našeho experimentu, který je dále strojově zpracovatelný ve skriptech příkazy jako cut -d ' ':
cat out.txt 1 /usr/include 5.34539714705599 2 /usr/local 0.0740032071545505 3 /usr/LessTif 0.0378913168174643 4 /usr/sbin 0.118174852726291 5 /usr/lib 62.9380005945378 6 /usr/share 26.6344555583003 7 /usr/bin 3.46674147236027 8 /usr/libexec 1.38460314602602 9 /usr/src 0.000104672145904598 10 /usr/man 0.000628032875427586
Nástroje: Tisk bez diskuse
Tiskni Sdílej: