Drtivá většina velkých společností působících ve všech vertikálách investuje nemalé prostředky do sofistikovaných BI řešení. Očekávají přitom, že komplexní analýzou dat z vlastních primárních systémů odhalí skryté vztahy a skutečnosti, které jim umožní lépe cílit na zákazníky, zvyšovat tržní podíl a dosahovat stále lepších výsledků. Implementace takového BI řešení se neobejde bez důkladného propočtu a analýzy návratnosti investic (ROI) a vrcholový management investici málokdy schválí bez neprůstřelného business case.
Všechny tyto aktivity pracují s určitými předpoklady. Automaticky se očekává, že uživatelé nového řešení budou pečlivě analyzovat data v systémech a výsledky analýz pak pomohou k dalšímu růstu obratu, prodeji nových produktů a oslovení více zákazníků. Jaká je ale realita? Co když analyzovaná data nejsou správná? A co když s takto získanými informacemi uživatelé jen neumí pracovat?
Situace ze života
Pro přiblížení hloubky problému si popíšeme situaci ve třech různých fiktivních společnostech na smyšlených událostech, které však vůbec nejsou vzdáleny od reality.
Scénář č. 1.: Telefonický hovor mezi operátorkou velké banky a zákazníkem ze segmentu SMB:
Operátorka: „Dobrý den, pane Novotný, ráda bych vás seznámila s novou nabídkou naší banky, mohl byste mi věnovat asi pět minut svého času?
Zákazník: „Dobrý den, jsem zrovna na cestě, ale chvilku mám, tak povídejte.“
O.: „Máte u naší banky podnikatelský účet a tak bych vám chtěla nabídnout krátkodobou půjčku 20 tisíc korun. Neměl byste o takovou službu zájem?“
Z.: „Nezlobte se, ale 20 tisíc mě opravdu nevytrhne, takže děkuji.“
O.: „Tak vám děkuji za váš čas a přeji hezký den.“
Z.: (pro sebe) „Vždyť mám na účtu přes půl milionu, tak proč mě obtěžují s takovou prkotinou?“
Scénář č. 2.: Reklamní sdělení na výpisu z účtu kreditní karty:
Využijte akční nabídku – získejte kreditní kartu s limitem až 40 000 Kč bez úroků*
(*Platí jen v případě plné splátky dlužné částky do 30 dnů)
Scénář č. 3.:
Adresa na propagačním materiálu pojišťovny:
Vážený pan
Jana Nováková
Válavské nám. 10
110 00 Praha 1
Co mají všechny tyto scénáře společné? Každá z uvedených situací vznikla na základě informací z nějakého BI řešení, které připravuje podklady pro marketingové kampaně. V prvních dvou případech se kampaně velkých bankovních domů minou účinkem, v případě třetím je důvěryhodnost pojišťovny otřesena hned na začátku případného obchodního vztahu. BI řešení ve všech scénářích splnila svůj úkol, jejich vlastníci však mají pramalý důvod k radosti. Kde se stala chyba?
Pohled pod pokličku
Dodavatelé BI řešení při obhajobě vysokých nákladů na zavedení nového datového skladu, CRM nebo jiných systémů z této rodiny argumentují tím, že analytické zpracování dat umožňuje odhalit skryté informace a ty při správném použití vytvoří zisk. Velmi často se setkáváme s predikcí takového zisku a tím i s výpočtem návratnosti investice do BI. Této myšlence nelze upřít racionální základ. Problém ale nemusí nutně být v samotném BI nástroji, zakopaný pes je v datech.
Jak již bylo řečeno, přidaná hodnota BI řešení spočívá ve zpracování dat, ve vytěžení skrytých informací. Pracuje se však s nevysloveným předpokladem – zpracovávaná data se považují za správná. BI řešení důvěryhodnost dat nerozporuje, pouze provede celou baterii pokročilých algoritmů a dataminingových úloh a vrátí výsledek, který však může být jen tak spolehlivý, jak spolehlivá jsou vstupní data. Tento jev popsal již anglický matematik a filozof Charles Babbage (1791 – 1871), vynálezce prvního programovatelného počítacího stroje. Upozornil na fakt, že výsledkem zpracování chybných vstupů nemohou být korektní výstupy. Dnes se takové situaci slangově říká Garbage In – Garbage Out. Ani to nejkvalitnější BI řešení nezmůže nic, pokud mu nedáme správná data.
Jak by ale data mohla být špatná? Jsou přeci uložena v nejnovějším primárním systému a jeho dodavatel se dušoval, že při implementaci používá nejmodernější postupy a za kvalitu svého díla ručí. Většinou na vině opravdu není primární systém, i když chybička se vloudit může – programátor je také jen člověk. Data pořizují lidé, a protože chybovat je lidské, při pořizování dat prostě dochází k chybám. Jsou to překlepy, přeslechy, neúplné informace či zápisy nesprávných hodnot do nesprávných polí v aplikaci. Řadu takových chyb je možné odhalit pomocí kontrol a validací přímo v primárním systému, příslovečná lidová tvořivost je však vždy o krok napřed.
Dalším významným faktorem, který má na kvalitu pořizovaných dat vliv, je měnící se prostředí. Firmy stále zlepšují a zefektivňují své procesy, téměř permanentně se mění legislativa a chudák uživatel často neví, kde mu hlava stojí. V takovém prostředí se chyba udělá velmi snadno. Výsledkem pak mohou být drobné chybičky, jako je například náš fiktivní scénář č. 3, kde je chybně určeno pohlaví a překlep v adrese.
Nepříjemným důsledkem nekvalitních dat v primárních systémech je snížená použitelnost jakéhokoli BI nástroje, který s daty pracuje. Představme si situaci ve fiktivní pojišťovně Jistota, a.s., která nabízí své dva základní produkty – Životko a Kalamita. Každý z těchto produktů používá samostatný systém. Zákazník této pojišťovny, pan Opatrný, si koupí oba produkty současně. Je však evidován v každém systému zvlášť. Záznamy o panu Opatrném byly pravděpodobně pořízeny dvěma různými obchodníky v různý čas, každý navíc pracuje v úplně jiné divizi pojišťovny Jistota, a.s., a nemají příliš důvod spolu o svých klientech mluvit.
Jak asi dopadne marketingová kampaň, pokud záznamy o panu Opatrném budou v každém systému uvedeny jinak? Lišit se může adresa, chyba může nastat při zápisu rodného čísla nebo data narození. Pokud v rámci přípravy dat pro kampaň nedojde ke spolehlivému sloučení obou záznamů v jeden, pojišťovna se bude na základě chybných dat domnívat, že má dva zákazníky se jménem Opatrný. Předmětem kampaně je nabídka pojištění Kalamita zákazníkům, kteří jej ještě nemají, v daném případě tak pan Opatrný dostane nabídku na produkt, který už má, a prestiž pojišťovny Jistota v jeho očích utrží šrám. Pojišťovna navíc zbytečně zaplatí poštovné a úspěšnost její kampaně se o jednoho zákazníka sníží.
V době, kdy pojišťovna Jistota zaváděla datový sklad pro podporu marketingových kampaní, zaklínal se dodavatel tohoto řešení účinností kampaní 30 %. Skutečné výsledky, i díky uvedenému příkladu s panem Opatrným, se k této hranici ani zdaleka nepřiblížily. Pojišťovna tedy přehodnotí segmentaci, nepovedenou kampaň doplní další kampaní a nakonec dosáhne plánovaných výnosů. Očekávaná návratnost investice do datového skladu se však povážlivě prodlužuje. Uživatelé celého řešení nacházejí ve výsledných reportech další a další nesrovnalosti a pomalu ztrácejí důvěru. Ti šikovnější si začínají vytvářet své vlastní reporty v Excelu, ostatní tiše závidí a úpí. Management pojišťovny Jistota, aby neztratil tvář, pod tlakem uživatelů rozhodne o redesignu celého BI řešení a historie se opakuje.
Řešení
Ale muselo to tak dopadnout? Co když je skutečné řešení někde jinde? A nemůže být efektivita kampaně 50%? V datech je ukryto zlato a sofistikované BI nástroje jsou vlastně moderními pomůckami zlatokopů. Pokud zajistíme dostatečně kvalitní data, výrazně se zvyšuje pravděpodobnost, že najdeme zlatou hroudu. Jinak jen prosíváme kalnou vodu a místo zlata najdeme jen kamení. Jak již bylo řečeno, výstupy každého systému jsou jen tak spolehlivé, jak spolehlivé jsou jeho vstupy. Zaměřme se tedy na kvalitu vstupních dat. Jak by uvedený příklad skončil, kdyby každý z produktových systémů zaručoval, že data v něm jsou správná, úplná, aktuální a konzistentní? Následná kampaň by pracovala s kvalitními daty a její úspěšnost by možná i překonala očekávání marketingového oddělení. Znamenalo by to pochopitelně úpravy primárních systémů a doplnění potřebných kontrolních mechanizmů do uživatelského rozhranní. Pokud je každý systém od jiného dodavatele, celá akce se může poměrně prodražit. Efektivnější z pohledu investic i architektonické čistoty je centralizace celého řešení pro kontrolu kvality dat a její případné zvyšování. Pokud je v rámci architektury systémů umístěn centrální nástroj, je možné k němu napojit více systémů bez nutnosti vysokých investic, zajišťování datové kvality může rovněž fungovat jako služba v rámci SOA.
Zajištění kvality dat technickými prostředky však nestačí. Data jsou podobným vstupem do procesu výroby peněz, jakým je chmel ve výrobě piva. Odborníci na pivo (nikoli z řad konzumentů) dobře vědí, že zajišťování kvality výrobních surovin je řízený a opakovaný proces. S kvalitou dat je to stejné. Pokud chceme něco řídit, musíme zajistit i měření. Komplexní systém pro zajišťování kvality dat proto musí obsahovat opakovatelné měření kvality dat, aby bylo možné posuzovat aktuální stav, vývojový trend a účinnost přijatých nápravných opatření. Data musejí mít vlastníka, který by měl být na jejich kvalitě zainteresován a reporty datové kvality mohou sloužit i jeho nadřízeným jako objektivní podklad pro odměňování.
Pro úspěšné používání BI řešení je však nutné hodnotit i kvalitu informací, což jsou prakticky data použitá v určitém kontextu a se specifickou znalostí. Posuzování kvality informací není triviální a obsahuje vyšší míru subjektivity, není tedy možné tento proces plně automatizovat. Rozhodně je však hodnocení kvality informací důležitým nástrojem soustavného zlepšování chodu organizace, který poskytuje zpětnou vazbu dílčím procesům. Vrátíme-li se k našim fiktivním scénářům výše, hned první příklad názorně ukazuje, jak vypadá proces bez zpětné vazby. Pokud by součástí scénáře telefonického hovoru s klientem byl dotaz na důvod odmítnutí služby, firma by tak mohla velmi efektivně kampaň ladit a napříště nabízet svým klientům služby a produkty, které pro ně skutečně budou relevantní.
Bez kvalitních dat to nepůjde
Kvalita dat a informací má nesporně významný vliv na užitnou hodnotu BI řešení. Pokud tedy při kalkulaci doby návratnosti investice systému nezohledníme skutečnou kvalitu datové báze, nepodaří se nám nikdy dosáhnout plánovaných benefitů.
Naopak zavedení propracovaného konceptu pro zajišťování datové kvality, který zastřeší technickou i procesní část problému, může užitnou hodnotu BI řešení výrazně zvýšit a přitom zhodnotit vynaloženou investici nebo zkrátit ROI. Současně také získáme důvěru uživatelů, kteří využíváním spolehlivých informací tvoří firmě zisk. Změnu k lepšímu pocítí i zákazníci, které nebudou obtěžovat zbytečné hovory a zásilky, protože jim firma bude nabízet pouze skutečně vhodné služby. Pojišťovna Jistota, a.s., znovu získá důvěru svého zákazníka pana Opatrného, který na základě nové marketingové kampaně s čistými daty pojistí i svou manželku, děti a psa.
Poznámka ke kvalitě dat:
Zatímco kvalita prováděné analýzy je pečlivě sledována, kvalita samotných „surových“ dat je podceňována a data jsou často i chybná. Proto očekávaní rychlé návratnosti investic ovlivňují náklady na očištění dat a jejich opětovné zavedení do systému.