Služba Dropbox Sign (původně HelloSign) pro elektronické podepisování smluv byla hacknuta.
Byla vydána nová major verze 8.0 textového editoru GNU nano (Wikipedie). Podrobný přehled novinek a oprav v oznámení v diskusním listu info-nano nebo v souboru ChangeLog na Savannah. Volbou --modernbindings (-/) lze povolit "moderní" klávesové zkratky: ^C kopírování, ^V vložení, ^Z vrácení zpět, … Tato volba je aktivována také pokud binárka s nano nebo link na ni začíná písmenem "e".
Před 60 lety, 1. května 1964, byl představen programovací jazyk BASIC (Beginners' All-purpose Symbolic Instruction Code).
Byla vydána nová verze 12.0 minimalistické linuxové distribuce (JeOS, Just enough Operating System) pro Kodi (dříve XBMC) a multimediálního centra LibreELEC (Libre Embedded Linux Entertainment Center). Jedná se o fork linuxové distribuce OpenELEC (Open Embedded Linux Entertainment Center). LibreELEC 12.0 přichází s Kodi 21.0 "Omega".
Microsoft vydal novou velkou aktualizaci 2404.23 v září 2019 pod licencí SIL Open Font License (OFL) zveřejněné rodiny písma Cascadia Code pro zobrazování textu v emulátorech terminálu a vývojových prostředích.
OpenTofu, tj. svobodný a otevřený fork Terraformu vzniknuvší jako reakce na přelicencování Terraformu z MPL na BSL (Business Source License) společností HashiCorp, bylo vydáno ve verzi 1.7.0. Přehled novinek v aktualizované dokumentaci. Vypíchnout lze State encryption.
Spouštět webový prohlížeč jenom kvůli nákupu kávy? Nestačí ssh? Stačí: ssh terminal.shop (𝕏).
Yocto Project byl vydán ve verzi 5.0. Její kódové jméno je Scarthgap. Yocto Project usnadňuje vývoj vestavěných (embedded) linuxových systémů na míru konkrétním zařízením. Cílem projektu je nabídnou vývojářům vše potřebné. Jedná se o projekt Linux Foundation.
Operační systém 9front, fork operačního systému Plan 9, byl vydán v nové verzi "do not install" (pdf). Více o 9front v FQA.
Svobodná webová platforma pro sdílení a přehrávání videí PeerTube (Wikipedie) byla vydána v nové verzi 6.1. Přehled novinek i s náhledy v oficiálním oznámení a na GitHubu. Řešeny jsou také 2 bezpečnostní chyby.
V současné době jsou firmy zahlcovány obrovským množstvím dat. Jejich zdrojem bývají firemní systémy (ERP, CRM, účetní a jiné vnitrofiremní systémy), externí dodavatelé (státní instituce, banky, výzkumné agentury), logy výrobních linek nebo také logy IT systémů.
Data obsahují nezměrné množství informací, které lidé potřebují transformovat ve znalosti a ty následně použít jako podklad pro svá rozhodnutí. A právě BI poskytuje nástroje, postupy a techniky vhodné pro extrakci informací z dat a nalezení relací mezi nimi.
Abychom toho byli schopni, potřebujeme systém, který by měl umět pokrýt následující oblasti:
Schématicky to lze vyjádřit takto:
Firemní systémy mají většinou svá data uskladněna v databázích rozdílných architektur a struktur. Na obrázku jsou to vnitropodnikové systémy ERP, CRM, software na sledování docházky (HR) a jako externí systémy jsou zastoupeny výpisy z banky nebo měnové kurzy.
Naším cílem je data ze všech zdrojů centralizovat, zobecnit, ale zároveň zachovat potřebnou detailnost. Takto připravená data slouží pro analýzy, reporty nebo modelování faktů, která nám jsou známá. Ta, která zůstala doposud skryta, se snaží odhalit metody dataminingu.
Co to v praxi znamená?
Na databáze ERP, CRM a HR systémů jsou napojeny datové pumpy (ETL), které automaticky nebo na vyžádání „vytáhnou“ nová data a uloží je do datového skladu. V případě banky nelze předpokládat přímý přístup do bankovní databáze, takže jako zdroj dat budou složit offline datové soubory (XLS, TXT, …). Kurzovní lístek bude nejspíše dostupný na webu dané bankovní instituce, takže zdrojem je webová stránka. V tomto případě ETL musí zajistit převod nestrukturovaných dat do podoby vyhovující datovému skladu, takže musí provést určitou transformaci (například vyhledání hodnot kurzů v HTML).
Datový sklad musí mít takové rozhraní, aby z něj bylo možné stavět reporty nebo jej použít jako zdroj pro analýzy či modelování. Datový sklad obsahuje možné kombinace všech vstupních dat. Jelikož je rozsah informací příliš komplexní, je množina „nabízených“ dat omezena podle oborového zájmu na její podmnožiny. Těmi jsou datová tržiště, která bývají realizována datovými kostkami (ne výhradně).
Jednotlivá oddělení firmy pak přistupují pouze ke svým informacím, nad kterými si spouštějí reporty, procházejí dashboardy, analyzují data a vytvářejí si modely.
Cílem je přinést každému uživateli co možno nejkomplexnější informace, ale zároveň v co nejjednodušší formě a co nejrychleji.
Poptávka po BI v poslední době značně roste. Svoji roli hraje nejen neustále narůstající množství dat, ale také vzdělanost manažerů v oblasti využití moderních nástrojů pro řízení firmy. Podle hesla „Co nemůžete změřit, nemůžete řídit“ se ve firmách generuje množství reportů, stanovují se KPI, která by se také měla měřit a vyhodnocovat, provádějí se analýzy, sestavují modely. BI sice není všelék, ale při vhodném nasazení a zejména interpretaci dokáže nalézt a také pomoci řešit problémy firmy.
Firmy jako IBM, Microsoft, Oracle, SAP si toto uvědomují a většinou na vrchol svých databázových produktů stavějí BI řešení. Jelikož se jedná o komplikované systémy zahrnující i umělou inteligenci, jejich cena nebývá právě nejnižší. Z tohoto důvodu firmy často sahají po nestandardních řešeních, jakými je třeba nevhodné použití tabulkových procesorů. Nakonec ale s rostoucím množstvím dat a požadavků tato řešení čím dál více uživatelům ztěžují práci a více než analýzám problémů se věnují hledání chyb ve vzorcích a překopírovaných tabulkách.
Svět open source nabízí pro BI několik nástrojů (BI Jasper, Palo, Pentaho). V našem seriálu se budeme zabývat řešením od spolešnosti Pentaho – Pentaho BI. To patří mezi nejrozšířenější a nejkomplexnější open source nástroje pro BI. Zahrnuje několik samostatných aplikací (Mondrian, Kettle, Weka, jfreecharts, …), které jsou samy o sobě velmi kvalitní, a proto i často nasazované. Neodmyslitelnou součástí uceleného BI řešení je databázový systém jako zdroj dat.
Pentaho je komerční opensource nástroj, který je k dispozici v Community edition a Enterprise edition. Community edition je vydávána pod GNU GPLv2 licencí a je plně zdarma. Enterprise edition je placená a obsahuje některé komponenty, které nejsou vydávány pod GNU GPL2 nebo jinou svobodnou licencí. Srovnání obou verzí naleznete na http://www.pentaho.com/products/. Jako u většiny komerčních verzí open source je hlavní rozdíl mezi Comunity a Enterprise edition hlavně v podpoře ze strany Pentaho nebo jejich partnerů. Vedle toho Enterprice edition obsahuje i vylepšení, jako jsou Single-sing on, analyzátor výkonu systému nebo pokročilý grafický analyzátor OLAP kostek. Obě edice mají stejný základ, a to javovskou web aplikaci, běžící v aplikačním serveru (Tomcat, JBoss nebo třeba Glassfish). Některé moduly (designer kostek, reportů, ETL) jsou tvořeny samostatnými aplikacemi. Výsledek je publikován na server s Pentaho BI.
Pentaho ve spojení s dobře navrženým datovým skladem je velmi výkonný a spolehlivý nástroj na BI. S přehledem obstojí i v konkurenci proprietárních řešení. Díky možnosti integrace do jiných prostředí (intranet, vlastní aplikace) umožňuje pohodlně reportovat a analyzovat data, bez nutnosti složitých a krkolomých řešení. Pevně věřím, že vám bude tento seriál nápomocen.
První díl tohoto seriálu má úvodní, informativní charakter. Příště si rozběhneme komunitní verzi, ukážeme si její nastavení proti databázi PostgreSQL a provedeme si základní přizpůsobení.
Na shledanou s Pentaho
Nástroje: Tisk bez diskuse
Tiskni Sdílej: