abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

dnes 05:55 | Zajímavý projekt

Dle příspěvku na blogu zaměstnanců CZ.NIC byl spuštěn ostrý provoz služby Honeypot as a Service (HaaS). Zapojit se může kdokoli. Stačí se zaregistrovat a nainstalovat HaaS proxy, která začne příchozí komunikaci z portu 22 (běžně používaného pro SSH) přeposílat na server HaaS, kde honeypot Cowrie (GitHub) simuluje zařízení a zaznamenává provedené příkazy. Získat lze tak zajímavé informace o provedených útocích. K dispozici jsou globální statistiky.

Ladislav Hagara | Komentářů: 0
dnes 04:44 | Komunita

Před týdnem společnost Feral Interactive zabývající se vydáváním počítačových her pro operační systémy macOS a Linux oznámila, že pro macOS a Linux vydají hru Rise of the Tomb Raider. Včera společnost oznámila (YouTube), že pro macOS a Linux vydají také hru Total War Saga: Thrones of Britannia. Verze pro Windows by měla vyjít 19. dubna. Verze pro macOS a Linux krátce na to.

Ladislav Hagara | Komentářů: 0
včera 21:33 | Nová verze

Byla vydána nová major verze 7.10 svobodného systému pro řízení vztahů se zákazníky (CRM) s názvem SuiteCRM (Wikipedie). Jedná se o fork systému SugarCRM (Wikipedie). Zdrojové kódy SuiteCRM jsou k dispozici na GitHubu pod licencí AGPL.

Ladislav Hagara | Komentářů: 0
včera 16:44 | Nová verze

Byla vydána nová verze 0.30 display serveru Mir (Wikipedie) a nová verze 2.31 nástrojů snapd pro práci s balíčky ve formátu snap (Wikipedie). Z novinek Miru vývojáři zdůrazňují vylepšenou podporu Waylandu nebo možnost sestavení a spouštění Miru ve Fedoře. Nová verze snapd umí Mir spouštět jako snap.

Ladislav Hagara | Komentářů: 0
včera 14:00 | Komunita

Na Indiegogo běží kampaň na podporu Sway Hackathonu, tj. pracovního setkání klíčových vývojářů s i3 kompatibilního dlaždicového (tiling) správce oken pro Wayland Sway. Cílová částka 1 500 dolarů byla vybrána již za 9 hodin. Nový cíl 2 000 dolarů byl dosažen záhy. Vývojáři přemýšlejí nad dalšími cíli.

Ladislav Hagara | Komentářů: 1
včera 11:11 | Nasazení Linuxu

Před dvěma týdny se skupina fail0verflow (Blog, Twitter, GitHub) pochlubila, že se jim podařilo dostat Linux na herní konzoli Nintendo Switch. O víkendu bylo Twitteru zveřejněno další video. Povedlo se jim na Nintendo Switch rozchodit KDE Plasmu [reddit].

Ladislav Hagara | Komentářů: 3
včera 05:55 | Komunita

Byla vydána vývojová verze 3.2 softwaru Wine (Wikipedie), tj. softwaru, který vytváří aplikační rozhraní umožňující chod aplikací pro Microsoft Windows také pod GNU/Linuxem. Z novinek lze zdůraznit například podporu HID gamepadů. Aktuální stabilní verze Wine je 3.0, viz verzování. Nejistá je budoucnost testovací větve Wine Staging s řadou experimentálních vlastností. Současní vývojáři na ni již nemají čas. Alexandre Julliard, vedoucí projektu Wine, otevřel v diskusním listu wine-devel diskusi o její budoucnosti.

Ladislav Hagara | Komentářů: 2
18.2. 16:55 | Komunita

Do 22. března se lze přihlásit do dalšího kola programu Outreachy (Wikipedie), jehož cílem je přitáhnout do světa svobodného a otevřeného softwaru lidi ze skupin, jež jsou ve světě svobodného a otevřeného softwaru málo zastoupeny. Za 3 měsíce práce, od 14. května do 14. srpna 2018, v participujících organizacích lze vydělat 5 500 USD.

Ladislav Hagara | Komentářů: 56
17.2. 15:44 | Komunita

Nadace The Document Foundation (TDF) zastřešující vývoj svobodného kancelářského balíku LibreOffice dnes slaví 6 let od svého oficiálního vzniku. Nadace byla představena 28. září 2010. Formálně ale byla založena až 17. února 2012. Poslední lednový den byl vydán LibreOffice 6.0. Dle zveřejněných statistik byl za dva týdny stažen již cca milionkrát.

Ladislav Hagara | Komentářů: 1
17.2. 04:44 | Bezpečnostní upozornění

CSIRT.CZ upozorňuje, že byla vydána nová verze 1.2.3 svobodného routovacího démona Quagga (Wikipedie) přinášející několik bezpečnostních záplat. Při nejhorší variantě může dojít až k ovládnutí běžícího procesu, mezi dalšími možnostmi je únik informací z běžícího procesu nebo odepření služby DoS. Konkrétní zranitelnosti mají následující ID CVE-2018-5378, CVE-2018-5379, CVE-2018-5380 a CVE-2018-5381.

Ladislav Hagara | Komentářů: 0
Který webový vyhledávač používáte nejčastěji?
 (2%)
 (28%)
 (62%)
 (2%)
 (3%)
 (1%)
 (1%)
 (1%)
Celkem 390 hlasů
 Komentářů: 34, poslední 14.2. 18:44
    Rozcestník

    GNU R prakticky - 2. díl

    10. 10. 2014 | Karel Kulhavý | Návody | 3193×

    V tomto seriálu se podíváme na schopnosti a možnosti využití GNU R.

    Načítání ze souborů a zápis do nich

    link

    V minulém díle jsem pověděl něco o kreslení jednoduchých grafů a počítání jednoduchých stastistických funkcí. Jak ale člověk do GNU R dostane data z reálného světa, aniž by musel tato opisovat? Dneska popíšu načítání ze souboru.

    GNU R má jakési data frames, což bych vzdáleně přirovnal k tabulce v libreoffice calc. Sloupce mohou být pojmenované, mít odlišné datové typy a některé buňky můžou být nevyplněné. Dají se také vybírat různé podmnožiny sloupců, tyto mazat, duplikovat, přemisťovat, přejmenovávat, ale i sčítat, dělit, počítat součet, průměr, atd.

    K tomu abych něco předvedl budu muset nějaká data napřed vyrobit.

    find /usr -maxdepth 1 -mindepth 1 -type d -exec du -sk "{}" ";" 2>/dev/null | tee r.txt

    Po zavaření počítače a vypití kafe se nám objeví nějaká ta kýžená statistická data popisující reálný svět našeho harddisku:

    204272	/usr/include
    2828	/usr/local
    1448	/usr/LessTif
    4516	/usr/sbin
    2405148	/usr/lib
    1017824	/usr/share
    132480	/usr/bin
    52912	/usr/libexec
    4	/usr/src
    24	/usr/man
    

    Na dostání dat do programu R používám nejčastěji funkci read.table. Zkusíme tedy, co se stane, když ji pustíme jen tak s minimálním parametrem:

    > df=read.table("r.txt")
    > df
    
    Proměnnou jsem nazval df protože se jedná právě o ten zmíněný data frame. Vida! Ono nám to načetlo a dokonce to pojmenovalo sloupečky defaultním pojmenováním V1 a V2. Vidíme také, že v data framu jsou řádky číslované:
            V1           V2
    1   204272 /usr/include
    2     2828   /usr/local
    3     1448 /usr/LessTif
    4     4516    /usr/sbin
    5  2405148     /usr/lib
    6  1017824   /usr/share
    7   132480     /usr/bin
    8    52912 /usr/libexec
    9        4     /usr/src
    10      24     /usr/man
    

    Ani jsme nemuseli laborovat se separátorem sloupců! R má totiž defaultně nastavený přechod z nonblank na blank nebo tak nějak. Pokud bychom ho přeci jenom potřebovali změnit (CSV soubory oddělované čárkou a pod.), dělá se to parametrem sep (viz help(read.table)).

    Funkci read.table používám v drtivé většině případů. Existují i další, jako readBin použitý v minulém díle, readChar, readLines. Viz vždy help() - parametr helpu se zadává bez uvozovek.

    Když už jsme u těch CSV, tyto doporučuju jako metodu dostání dat z Libreoffice Calc do R. V Save As se nastaví formát CSV a odklepne spoustu různých potvrzovacích okýnek, z kterých mi vždycky tečou nervy. Pak musíme soubor zase uložit do normálního libreoffice formátu dat, jinak se bude libreoffice pokoušet ukládat pozdější změny do CSV a přijdeme možná o nějaká metadata.

    Můžeme si teď třeba spočítat velikost těch adresářů v megabajtech místo kilobajtů? Ale jistě, udělá se to takhle:

    > df$mega=df$V1/1000
    > df
            V1           V2     mega
    1   204272 /usr/include  204.272
    2     2828   /usr/local    2.828
    3     1448 /usr/LessTif    1.448
    4     4516    /usr/sbin    4.516
    5  2405148     /usr/lib 2405.148
    6  1017824   /usr/share 1017.824
    7   132480     /usr/bin  132.480
    8    52912 /usr/libexec   52.912
    9        4     /usr/src    0.004
    10      24     /usr/man    0.024
    

    Jak vidíme, R se nám nežinýroval přiřadit do sloupečku s neexistujícím jménem a tak se vytvořil sloupec nový.

    A co si tak spočítat procenta? Na to budeme potřebovat funkci sum, která sečte vektor. Zdalipak bude fungovat i na sloupec data frame? Funguje!:

    sum(df$mega)
    [1] 3821.456
    

    Tak vypočteme další sloupec s procenty. Přitom se nám projeví jeden aspekt gnu R - že když dělíme vektor jedním číslem (právě jsme viděli experimentální důkaz toho, že součet sloupce je jedno číslo ;-) ), toto se automaticky rozkopíruje na příslušný počet kopií:

    > df$procenta=100*df$mega/sum(df$mega)
    > df
            V1           V2     mega     procenta
    1   204272 /usr/include  204.272 5.345397e+00
    2     2828   /usr/local    2.828 7.400321e-02
    3     1448 /usr/LessTif    1.448 3.789132e-02
    4     4516    /usr/sbin    4.516 1.181749e-01
    5  2405148     /usr/lib 2405.148 6.293800e+01
    6  1017824   /usr/share 1017.824 2.663446e+01
    7   132480     /usr/bin  132.480 3.466741e+00
    8    52912 /usr/libexec   52.912 1.384603e+00
    9        4     /usr/src    0.004 1.046721e-04
    10      24     /usr/man    0.024 6.280329e-04
    

    Bum! Počítače zase útočí (já bych všechny tyhle internety zakázala...!) Z vědeckého hlediska je tato odpověď jistě zcela korektní, nicméně podaří se nám ji upravit do humánně čitelné podoby? Vypadá to jakoby nás programátor R omilostnil a vybavil příkaz print parametrem digits (help(print)), který svádí k doměnce, že si s ním budeme moct nastavit zaokrouhlování:

    > print(df,digits=5)
            V1           V2     mega   procenta
    1   204272 /usr/include  204.272 5.3454e+00
    2     2828   /usr/local    2.828 7.4003e-02
    3     1448 /usr/LessTif    1.448 3.7891e-02
    4     4516    /usr/sbin    4.516 1.1817e-01
    5  2405148     /usr/lib 2405.148 6.2938e+01
    6  1017824   /usr/share 1017.824 2.6634e+01
    7   132480     /usr/bin  132.480 3.4667e+00
    8    52912 /usr/libexec   52.912 1.3846e+00
    9        4     /usr/src    0.004 1.0467e-04
    10      24     /usr/man    0.024 6.2803e-04
    

    K této domněnce skutečně jen svádí. V help(print) žádný další vhodný parametr nenajdu. Podívám se tedy ještě do print.default. To je právě typické že funkce mají ještě .default v kterém se dají další věci nastavovat. Ale ani tam nic nenajdu. Jedna možnost se nabízí takto:

    > df$procenta=round(df$procenta,2)
    > df
            V1           V2     mega procenta
    1   204272 /usr/include  204.272     5.35
    2     2828   /usr/local    2.828     0.07
    3     1448 /usr/LessTif    1.448     0.04
    4     4516    /usr/sbin    4.516     0.12
    5  2405148     /usr/lib 2405.148    62.94
    6  1017824   /usr/share 1017.824    26.63
    7   132480     /usr/bin  132.480     3.47
    8    52912 /usr/libexec   52.912     1.38
    9        4     /usr/src    0.004     0.00
    10      24     /usr/man    0.024     0.00
    

    To má ale nevýhodu, že se nám tím zkazí ty data samotná, pokud je budeme chtít později použít, přijdeme o tisícinky. Zdá se mi že přehledný tisk čísýlek na obrazovku je téma na dizertační práci! Vytáhnu tedy řešení až úplně z paty:

    > options(scipen=50)
    > print(df,digits=1)
            V1           V2     mega procenta
    1   204272 /usr/include  204.272   5.3454
    2     2828   /usr/local    2.828   0.0740
    3     1448 /usr/LessTif    1.448   0.0379
    4     4516    /usr/sbin    4.516   0.1182
    5  2405148     /usr/lib 2405.148  62.9380
    6  1017824   /usr/share 1017.824  26.6345
    7   132480     /usr/bin  132.480   3.4667
    8    52912 /usr/libexec   52.912   1.3846
    9        4     /usr/src    0.004   0.0001
    10      24     /usr/man    0.024   0.0006
    
    Podařilo se. Můžeme si teď v klidu zaletět do Stockholmu převzít Nobelovu cenu za tisk čísel. Mravní ponaučení co bych z toho dal je, že existuje v GNU R centrální příkaz options, který, jak píšou v jeho manuálové stránce, nastavuje "variety of global options which affect the way in which R computes and displays its results". Také je potřeba někdy kramařit v dalších manuálových stránkách odkazovaných v sekci See Also.

    No a jak teď naše vydobydá data uložíme do externího souboru? Analogicky pomocí funkce write.table:

    > write.table(df,file="out.txt")
    

    Program nám texty opatřil uvozovkami, s čímž se ve světě CSV souborů často setkávám. Tyto uvozovky, separátor, popisky sloupečků a řádků a další se dají ve write.table zapínat a vypínat podle manuálové stránky.

    Takto můžeme GNU R používat ve skriptech na matematiku, na kterou jsou expr a bc už těžkopádné. Musím vám jenom říct, jak se to volá v dávkovém režimu (sociálním? drogovém?). Program si napíšeme do souboru:

    cat >program.R << "EOF"
    df=read.table("r.txt")
    procenta=100*df$V1/sum(df$V1)
    novy=data.frame(df$V2,procenta)
    write.table(novy,"out.txt",col.names=FALSE,quote=FALSE)
    EOF
    

    A pak GNU R pustíme z příkazové řádky takto:

    R --save <program.R
    

    --save je parametr který se musí uvést a nastavuje se jím zda po skončení R prostředí uloží nebo neuloží (man R). Pokud nám program bouchne a měli jsme --save, můžeme rovnou pustit R a máme v něm pro ruční inspekci všechny proměnné ve stavu těsně před detonací. No a dnešní díl uzavřu výsledkem našeho experimentu, který je dále strojově zpracovatelný ve skriptech příkazy jako cut -d ' ':

    cat out.txt
    1 /usr/include 5.34539714705599
    2 /usr/local 0.0740032071545505
    3 /usr/LessTif 0.0378913168174643
    4 /usr/sbin 0.118174852726291
    5 /usr/lib 62.9380005945378
    6 /usr/share 26.6344555583003
    7 /usr/bin 3.46674147236027
    8 /usr/libexec 1.38460314602602
    9 /usr/src 0.000104672145904598
    10 /usr/man 0.000628032875427586
    
           

    Hodnocení: 100 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    10.10.2014 08:38 Zdenek 'Mst. Spider' Sedlak | skóre: 37 | blog: xMstSpider
    Rozbalit Rozbalit vše Re: GNU R prakticky - 2. díl
    Diky za pokracovani, momentalne si s R hraju tim zpusobem, ze to nechavam prezvykavat Apache logy. Vypadato, ze to funguje efektivneji nez awstats :-)
    10.10.2014 08:44 Tom.š Ze.le.in | skóre: 21 | blog: tz
    Rozbalit Rozbalit vše Re: GNU R prakticky - 2. díl
    Pár připomínek:
    • Pokud to má být článek pro nováčky, bylo by fajn držet se běžných konvencí. Běžná konvence je preferovat <- před = pro přiřazení (ať už to má hlubší smysl nebo ne).
    • Pro spouštění skriptů na mém počítači funguje Rscript.
    • Pokud čteme a zapisujeme CSV, možná se hodí použít read.csv(2) a write.csv(2).
    • Autor tiše spoléhá na automatickou detekci typu sloupce a konverzi při čtení tabulek, což tady funguje - ale dá se s tím snadno narazit.
    Ale ano, jinak je dobře že je tu o R článek.
    13.10.2014 23:12 mcm | skóre: 12 | blog: linca | domažlice
    Rozbalit Rozbalit vše Re: GNU R prakticky - 2. díl
    Myslím, že by taky stálo za to zkombinovat tento článek i s literaturou, která je k dispozici v tištěné podobě autorů Stanislava Pekára a Marka Brabce: Také, podobně jako tento článek velmi pěkně a názorně zpracované a když jsem se prostředí R učil (vlastně se učím pořád :D) mě hodně tyto knihy pomohly... :)

    10.10.2014 12:11 Jan33
    Rozbalit Rozbalit vše Re: GNU R prakticky - 2. díl
    s/dúkaz/důkaz/ || s/dúkaz/(d)úkaz/ díky
    KOLEGA avatar 11.10.2014 22:48 KOLEGA | skóre: 12 | blog: odpocinuti_vecne
    Rozbalit Rozbalit vše Re: GNU R prakticky - 2. díl
    && s/bysme/bychom/ ... :D Hele prohnat to něčím, co trochu kontroluje gramatiku a slova by bylo fajn :P
    Linuxový liberál ;-) ... a taky lama a BFU
    12.10.2014 02:46 dw
    Rozbalit Rozbalit vše kB na MB
    Nemá 1 megabyte tych kilobite 1024?
    12.10.2014 10:28 ebik | skóre: 2
    Rozbalit Rozbalit vše Re: kB na MB
    A neni to nahodou pro ucely clanku jedno? Chyba pod 5% je pro vetsinu statistik zanedbatelna.

    (Navic zalezi na kontextu. Informatici zneuzili predponu kilo a mega zpusobem ze predefinovali nasobek, a nasledne nepresvedcili cely svet aby to pouzival v pripade bajtu bez vyjimky (u bitu je to jeste horsi), takze ted zalezi jestli je to informaticke "kilo" nebo SI predpona. Je ale pravda, ze se hodi zachovat nasobek pouzity pro kilo pri prechodu z kilo na mega.)
    Heron avatar 12.10.2014 10:39 Heron | skóre: 51 | blog: root_at_heron | Olomouc
    Rozbalit Rozbalit vše Re: kB na MB
    Nemá.
    Petr Tomášek avatar 12.10.2014 11:36 Petr Tomášek | skóre: 37 | blog: Vejšplechty
    Rozbalit Rozbalit vše Re: kB na MB
    Záleží na tom, jakou konvenci používáš ;-)
    13.10.2014 13:59 předpona soustavy SI
    Rozbalit Rozbalit vše Re: kB na MB
    Nezalezi! Viz
    https://en.wikipedia.org/wiki/Mebibyte
    https://en.wikipedia.org/wiki/Mega-
    13.10.2014 16:45 ebik | skóre: 2
    Rozbalit Rozbalit vše Re: kB na MB
    Tak tuto konvenci v mém okolí nikdo nepoužívá.
    19.10.2014 00:40 Jan Brezina
    Rozbalit Rozbalit vše R reference card
    Pokud nedelate s R kazdodenne, tak se vam mozna bude hodit prehled nejdulezitejsich prikazu a jejich parametru na jednu oboustranou A4. Zdrojak Sestaveno kompilaci z jinych zdroju a z vlastni zkusenosti. Komentare a opravy vitany.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.