abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 13:33 | Nová verze

    Mastodon (Wikipedie) - sociální síť, která není na prodej - byl vydán ve verzi 4.6. Přehled novinek s náhledy v oznámení na blogu.

    Ladislav Hagara | Komentářů: 0
    dnes 12:44 | IT novinky

    V Edici CZ.NIC, knižní řady správce české národní domény, vychází nová kniha Martina Malého Kódy, buildy, firmwary. Autor po půl roce od vydání předchozího titulu přichází se svou již sedmou knihou, tentokrát zaměřenou na vývoj programového vybavení pro embedded zařízení. Publikace s podtitulem Základy vývojářského řemesla pro tvůrce hobby elektroniky nabízí praktického průvodce pro všechny, kdo své projekty vytvořené s Arduinem

    … více »
    Ladislav Hagara | Komentářů: 0
    dnes 11:44 | Komunita

    V Brně na FIT VUT probíhá dvoudenní open source komunitní konference DevConf.CZ 2026. Na programu je celá řada zajímavých přednášek, lightning talků, meetupů a workshopů. Přednášky lze sledovat i online na YouTube kanálu konference. Aktuální dění lze sledovat na Matrixu, 𝕏 nebo Mastodonu.

    Ladislav Hagara | Komentářů: 0
    dnes 04:22 | Nová verze

    Byla vydána nová verze 15.1 svobodného unixového operačního systému FreeBSD. Podrobný přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 19:11 | Zajímavý projekt

    Vývojáři Ubuntu představili projekt Myna, tj. iniciativu zaměřenou na přidání funkce převodu řeči na text do prostředí desktopu Ubuntu. Dle plánu již v Ubuntu 26.10.

    Ladislav Hagara | Komentářů: 1
    včera 18:33 | Zajímavý software

    Společnost Epic Games představila nový open source systém pro správu verzí Lore navržený pro "bezprecedentní škálovatelnost dat i týmů a optimalizovaný pro projekty, včetně her a zábavy, které kombinují kód s velkými binárními soubory, aby uspokojil potřeby vývojářů i umělců". Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 0
    včera 15:33 | IT novinky

    Úřad pro ochranu hospodářské soutěže (ÚOHS) provedl v říjnu 2024 místní šetření u společnosti Seznam.cz. Úřad prověřoval důvodné podezření na možné protisoutěžní jednání, konkrétně zneužití dominantního postavení. Krajský soud v Brně v květnu 2025 konstatoval, že toto šetření bylo nezákonné. Nejvyšší správní soud (NSS) včera rozhodl, že šetření bylo provedeno v souladu se zákonem. Krajský soud bude muset případ posoudit znovu.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | IT novinky

    Byl představen skládací telefon Commodore Callback 8020. Ani hloupý, ani chytrý. Pro fanoušky Commodore a digitálního minimalismu. Bez webového prohlížeče a sociálních sítí. S předinstalovaným WhatsAppem. S operačním systémem Sailfish OS.

    Ladislav Hagara | Komentářů: 3
    včera 08:22 | Bezpečnostní upozornění

    V OpenBSD byla objevena 27 let stará chyba v ppp pomocí níž lze vzdáleně obejít autentifikaci. Chyba byla nahlášena 12.6. a 14.6. byla opravena. Bližší info v článku A 27-Year-Old Authentication Bypass in OpenBSD's PPP Stack.

    Max | Komentářů: 6
    včera 05:22 | Zajímavý článek

    Odpověď Evropské komise (pdf) k evropské občanské iniciativě Stop Destroying Videogames, jež je součástí hnutí Stop Killing Games: "Komise se domnívá, že v této fázi nemůže navrhnout právní povinnost zachovat hratelnost videoher poté, co přestaly být poskytovány komerčně. Důvodem jsou i stávající práva duševního vlastnictví. Podle autorského práva EU mají nositelé práv výlučná práva ke svým výtvorům. Kromě autorských práv mohou být

    … více »
    Ladislav Hagara | Komentářů: 16
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (16%)
     (31%)
     (3%)
     (6%)
     (3%)
     (15%)
     (26%)
    Celkem 1931 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Wordcloud z dat z Facebooku

    24.11.2013 14:50 | Přečteno: 1842× | Stunome | poslední úprava: 24.11.2013 14:53

    Dneska si jako správné novomediální *** ukážeme, jak jednoduše udělat naprosto zbytečný (ale vypadá to fakt pěkně) word cloud s pomocí programu R project.

    Co k tomu potřebujeme:

    Stažení potřebných dat

    Jako první si pustíme R konzoli a nainstalujeme potřebné balíčky.

    # instalace knihoven
    install.packages("Rfacebook")
    install.packages("tm")
    install.packages("wordcloud")
    
    # nacteni knihoven
    library(Rfacebook)
    library(tm)
    library(wordcloud)
    

    Načtení dat

    Jakmile si seženeme facebook token, ze stránky https://developers.facebook.com/tools/explorer, můžeme se zvesela pustit do načítání dat z Facebooku pomocí R. Nám bude stačit načíst 300 komentářů z jakékoliv Facebook stránky. A trochu si je předpřipravíme.

    # nacteni tokenu do promenne
    token <- "token_pro_graph_api"
    
    # nacteni prispevku stranky do promenne
    page <- getPage("biooo.cz", token=token, n=300)
    
    # vytvoreni korpusu, ktery bude obsahovat pouze sloupec se zpravami
    corpus <- Corpus(VectorSource(page$message))
    
    # slova z korpusu zmenšíme, odstraníme interpunkci a čísla
    corpus <- tm_map(corpus, tolower)
    corpus <- tm_map(corpus, removePunctuation)
    corpus <- tm_map(corpus, removeNumbers)
    

    Vytvoření matice slov

    V další fázi vytvoříme z předpřipraveného korpusu matici slov a spočteme jejich frekvenci.

    ap.tdm <- TermDocumentMatrix(corpus)
    ap.m <- as.matrix(ap.tdm)
    ap.v <- sort(rowSums(ap.m), decreasing=TRUE)
    ap.d <- data.frame(word = names(ap.v), freq=ap.v)
    

    Vykreslení

    Již se zdárně blížíme k cíli, teď si načteme do proměnné předpřipravenou paletu barev:

    require(RColorBrewer)
    pal <- brewer.pal(8,"Dark2")
    

    Nyní stačí již jen nastavit soubor výstupu a spustit samotné vytvoření word cloudu!

    png("wordcloud.png",width=1024,height=1024)
    wordcloud(ap.d$word,ap.d$freq, scale=c(10,.2),min.freq=3,max.words=150, random.order=FALSE, rot.per=.15, colors=pal)
    dev.off()
    

    TADÁ! Máme náš první word cloud.

    Co by se dalo zlepšit?

    Spousta věcí! Především:

    A k čemu je to dobré?

    Přece absolutně k ničemu! ;-) P.S. Hlavně to neukazujte markeťákům, nebo vám utrhají ruce!

    Zdroj: https://gist.github.com/josefslerka/2344144

           

    Hodnocení: 92 %

            špatnédobré        

    Obrázky

    Wordcloud z dat z Facebooku, obrázek 1

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Bystroushaak avatar 24.11.2013 17:54 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
    Rozbalit Rozbalit vše Re: Wordcloud z dat z Facebooku
    R se mi začíná líbit, je to takové docela pěkné a jednoduché.
    Bedňa avatar 24.11.2013 23:01 Bedňa | skóre: 34 | blog: Žumpa | Horňany
    Rozbalit Rozbalit vše Re: Wordcloud z dat z Facebooku
    V čom je R lepšie ako Q, alebo S?
    KERNEL ULTRAS video channel >>>
    pools avatar 25.11.2013 09:12 pools | skóre: 19 | blog: Svědek Damdogův | Opava/Praha
    Rozbalit Rozbalit vše Re: Wordcloud z dat z Facebooku
    Q je sfině, to ví každý, a S je moc nacistický - ještě ti přileze jedno a jsi v prdeli...
    Vivre libre ou mourir!
    26.11.2013 17:49 frdrx | skóre: 29 | blog: frdrx
    Rozbalit Rozbalit vše Re: Wordcloud z dat z Facebooku
    R je to co se dnes skutečně používá.
    Patička mi slouží k tomu, abych si lépe poznal svoje příspěvky.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.