;

Business intelligence a práce s daty jsou klíčem k fungujícímu byznysu (3.)

20. 9. 2012
Doba čtení: 6 minut

Sdílet

 Autor: © peshkova - Fotolia.com
Business intelligence patří v IT mezi skutečné evergreeny. Vždyť samotný termín poprvé použil v roce 1958 Hans Peter Luhn z IBM, a dějiny systémů pro podporu rozhodování se začaly psát již v šedesátých letech.

Pozor, na scénu přicházejí big data

V rámci realizace výzkumu trhu jsme se účastníků zeptali na jejich chápání pojmu velká data (big data) a jaký typ zákazníků by měla zajímat. Zajímalo nás také, jakým způsobem na nich lze případně postavit business case.

Historicky byla data ukládána v pevně daných strukturách s relativně jasným sémantickým významem, který umožňoval jejich poměrně snadné zpracování. Dnes však obrovské množství dat pevnou strukturu nemá – a teprve zde přicházíme ke skutečnému významu pojmu big data. Jde o obrovský nárůst množství nestrukturovaných informací, například ze sociálních sítí, blogů apod. Je to fenomén, který budí ve světě IT v poslední době stále větší pozdvižení, a řada společností již intenzivně zvažuje, zda a případně jakým způsobem na něj bude reagovat. Ne náhodou analytici společnosti Gartner zařadili „big data“ mezi top10 trendů letošního roku.

Samotná definice pojmu však má své mezery – stále totiž není úplně jasné, co jsou a nejsou velká data. „Pro každého mohou být velká data něco jiného. Rozdílné je to u výrobní firmy, jiné u banky. Pro nás jsou velká data tam, kde jde o miliony a více záznamů, případně ještě o složitější strukturu,“ představuje své vnímání pojmu Jan Klimeš z Ortexu.

„Podle mě jsou velká data taková, jejichž velikost, ať už měřeno na giga-, tera-, petabajty nebo z hlediska rychlosti jejich tvorby, není schopen zpracovávat běžný SW v rozumném čase,“ vyjádřila se Jana Benáková za OKsystemu.

„I nestrukturovaná data mají svou hodnotu, přesto se business case na jejich využití zatím nestaví jednoduše. Velké otázky vyvolává spolehlivost interpretace takových dat, ale také jejich využitelnost v porovnání s neužitým potenciálem existujících strukturovaných informací, kterými společnosti již disponují,“ upozorňuje Jiří Živnůstka ze společnosti Adastra.

Je pravdou, že ekonomicky zřejmě dává větší smysl se nejprve naučit využívat současná, např. klientská data pro detailní porozumění klientům a teprve potom se pustit do využívání velkých dat. Tato data pak ale budou jistě moci být využita pro přesnější identifikaci potřeb a preferencí klientů a pro podporu interaktivní komunikace s nimi.

Z výše uvedených informací je jasně patrné, že v kontextu big dat jsme teprve na začátku a na masové nasazování patřičných řešení si ještě budeme muset počkat. „Předpokládám, že potenciál velkých dat bude naplno využit až s postupem času, a to především pro sofistikované analýzy obchodních trendů a příležitostí. Velká data rozhodně mohou být jedním ze zdrojů, na jejichž základě lze business case postavit,“ shrnuje Jaroslav Poláček z Business Maps.

Na otázku, jakých společností či organizací se budou big data primárně dotýkat, odpověděli respondenti poměrně jednotně. „Oblast big dat se týká především firem, které potřebují ukládat a zpracovávat v databázích enormní množství jednoduchých záznamů, které navíc přibývají rychlým tempem. V českých podmínkách může jít například o údaje z nejrůznějších měřicích zařízení (meteostanice, měřiče spotřeby), data z oblasti telekomunikací či informace o chování zákazníků v oblasti retailu,“ uvádí Martin Korejs z J.K.R. Jeho vyjádření upřesňuje Michal Houštecký z Arbes Technologies: „Tato objemná data se netýkají pouze finančních a telekomunikačních společností, ale například také automobilek, zdravotnictví a dokonce některých internetových obchodů.“ Podle Jany Benákové z OKsystemu by tato problematika měla zajímat v první řadě velké společnosti, jako jsou například energetické, telekomunikační nebo farmaceutické. O něco střídměji vnímá rozsah nasazení řešení pro big data Robert Havránek z Microsoftu: „V našich podmínkách je jen pár firem, které skutečně potřebují pracovat s tzv. velkými daty a využívat specifické nástroje.“

Kdo je kdo v BI?

Odborné znalosti potřebné pro BI se odvíjejí od jednotlivých úrovní poskytování dané technologie. Podle Jany Benákové z OKsystemu lze vyčlenit následující kategorie:

1. Databázoví specialisté – BI je v první řadě datovým skladem. Jako takový je uložený v databázi, která potřebuje mít svého správce (DBA). Strukturu datového skladu a jednotlivých datových tržišť je třeba správně navrhnout – databázový architekt.

2. Odborníci na ETL a datoví analytici zajišťují prostřednictvím konfigurace ETL (Extract – Transform – Load) nástrojů plnění datového skladu ze zdrojových systémů (ERP, CRM…). Součástí tohoto procesu je i čištění dat – zajištění jejich kvality.

3. OLAP analytici nad daty z datového skladu a datových tržišť vytvářejí tzv. OLAP (On-line Analytical Processing) kostky. Jde o n-rozměrně uspořádaná data, často ukládaná přímo v paměti BI nástrojů pro možnost rychlého přístupu. Jsou to tedy nástroje, které uživateli umožňují provádět nejrůznější analytické úlohy, a to z mnoha pohledů.

4. BI vývojáři jsou ti, kteří nad připravenými OLAP kostkami či datovými tržišti vytvářejí reporty ve formátu tabulek, kontingenčních tabulek a grafů, které potom skládají do dashboardů a scorecardů. Cílem těchto nástrojů je sdružit na jednu obrazovku všechny nejdůležitější informace, které jsou relevantní pro rozhodování daného pracovníka.

bitcoin_skoleni

5. Byznys konzultanti a analytici jsou v celém procesu potřeba od samého počátku. Jsou to odborníci, kteří rozumějí problematice dané oblasti (bankovnictví, zdravotnictví…) a dokážou definovat požadavky na BI, tak aby výstupy dávaly smysl a měly pro koncové uživatele vypovídající hodnotu.

6. Pokročilí analytici jsou obvykle zaměstnanci uživatele BI nástrojů, kteří dolují v dostupných datech (OLAP kostkách, datových tržištích…) a vytvářejí tzv. ad hoc analýzy – reporty, které nebyly BI vývojáři vyvinuty, a nejsou tedy běžně dostupné. Primárně je jeho úlohou vyhledávání smysluplných závislostí či pravidel ve velkých objemech dat.