Předpokládejme, že podnik zatím žádnou pokročilejší analytiku nedělá. Jak by měl celý projekt systémově uchopit, aby získal maximální přínosy?
Aktiva dosahovaná využitím pokročilých analýz dat mohou být opravdu trumfem v konkurenčním boji, ale společnosti často dávají přednost jistotě přínosů dosahovaných snadno spočitatelnými úsporami nákladů (např. přechod k jinému operátorovi, změna nájmu atd.).
Odpověď na otázku, jak systémově podchytit využití pokročilých analýz dat proto vyžaduje prvotní odvahu k dotazu: „Může mi někdo ve firmě nebo i z venku kvalifikovaně odhadnout, kolik by přinesla změna x, o které přesně nevíme, jak ji udělat?“ Pokud někdo tuto odvahu, podpořenou znalostí, že úloha se týká podstatného firemního procesu, doplní i relativně malým rozpočtem na hledání odpovědi, pak je projekt nastartován. Společnost zahájila cestu ke znalostmi řízenému rozhodování.
Jaké typy podniků mohou od BI očekávat největší přínosy a kde půjde naopak spíše o plýtvání penězi?
Přínosy analytických metod jsou samozřejmě nejvyšší ve společnostech pracujících s mnoha zákazníky a produkty. Tradičními obory jsou bankovnictví či pojišťovnictví, které díky faktorům, jako jsou např. regulatorní požadavky, jejich plná elektronizace a nutnost aktivního marketingu na konkurenčním trhu, již dávno plně využívají pokročilé analýzy dat. Další obory jako telekomunikace se dnes spíše přesouvají od bouřlivě rostoucích firem ke stabilním organizacím podobným současným utilitám (energetiky, plynárny, vodárny), které nemají velký potenciál např. pro změny v tržních podílech či uvádění převratných produktů.
V souvislosti s termínem big data se často hovoří o tom, že jde pouze o nový, marketingově atraktivní název pro dávno používané technologie. Existují kromě možnosti paralelizace úloh i další vodítka, jak poznat skutečně inovativní řešení pro zpracování dat?
Zkušení odborníci rozpoznávají jisté marketingové vlny, které k počítačovým technologiím prostě patří stejně jako k automobilům. Jistě že jde o dávno používané technologie, například paralelizaci výpočtů využíval již superpočítač Cray-1 z roku 1976.
Na big data se můžeme dívat jako na analogii realizace dostupných elektromobilů ve světě, který auta na baterii zná již 100 let. Nejde jen o to, že by náhle šlo zpracovávat všechna data procházející firmou (či webem) – dnešní elektromobily jsou také náhle za rozumnou cenu schopny ujet 150 km na jedno nabití – ale že se zvolna mění celá filozofie, proč a jak se big data sbírají a zpracovávají. Analogií této změny u elektromobilů by mohlo být budování infrastruktury pro jejich dobíjení.
Velmi zajímavé výsledky přináší trend in-memory computingu. Toto řešení se však zatím zdá být finančně obtížně dostupné. Přijde někdy doba, kdy se z něj stane mainstream?
Popularita termínu in-memory zpracování je opět typickým marketingovým názvem existující technologie. Z pohledu člověka, jenž pamatuje návrh datového skladu velké banky, který obsahoval tolik GB disků, kolik máme dnes v lepším notebooku GB paměti, je in-memory řešení již realizováno. S úsměvem pak lze říkat, že na dnešním notebooku by bylo možné zpracovávat reporty o celé velké bance.
Existuje mnoho příkladů řešení reportingu pomocí OLAP technologie, které napřed několik GB základních dat během pár hodin zpracuje do podobně mnohadiskových GB, v nichž lze v průběhu milisekund vyhledávat požadované agregace. Paměť je dnes tak levná, že si toho všimli snad všichni producenti softwaru.
V souvislosti s big daty se přímo vnucuje myšlenka jejich použití na úrovni státní správy. Kde v této souvislosti vidíte příležitosti a kde naopak rizika?
Státní správa má oproti soukromým firmám v debatě o big datech nespornou výhodu – prostě jí nechybějí záznamy o zákaznících konkurence. Hodně lidí v této zemi ale při zmínce o zpracování dat ve státní správě napadne úplně jiné druhé slovo po slovu big. Vždy, když se podívám na svůj občanský průkaz, kde je adresa, ale ne PSČ, přemýšlím o údělu svých kolegů, kteří se v této zemi zabývají kvalitou dat. Problém využití big dat v České republice zcela jistě není technologický (počet lidí jako ve větším čínském městě), ale spíše politický či administrativně-organizační a možná překvapivě i legislativní a etický.