Velké organizace se již mnoho let nevyhnutelně dostávají do situace, kdy mají informace o svých klíčových entitách (zákazníci, produkty, kontrakty...) roztříštěné v mnoha různých aplikacích a systémech. Myšlenka "vyjmout" tato klíčová data z aplikací a umístit je do jedné, centrální databáze není nová. Její konkrétní implementace však doposud zůstávaly spíše na půli cesty, částečně díky (ne)zralosti technologií, částečně díky nepřipravenosti organizace udělat zásadní změny ve svých procesech. Nový přístup k této problematice – Master Data Management – kombinující zkušenosti a principy datové integrace a Data Quality, integrace aplikací a procesního reengineeringu, dává naději, že se blýská na lepší časy.
Investice do velkých IT projektů se dnes v organizacích ostře sledují, šanci na realizaci mají jen projekty s jasným dopadem na obchodní výsledky firmy, případně projekty vynucené legislativou. Vyplatí se tedy investovat prostředky a úsilí do „překopání“ celé IT infrastruktury jen proto, aby data o zákaznících a jejich produktech byla na jednom místě a centrálně spravovaná? Zdá se, že ano.
Marketing, obchod, oddělení péče o zákazníky – klíčové firemní funkce a oddělení, která dříve pracovala pouze se svojí částí dat, nyní potřebují pokud možno úplné a důvěryhodné informace i o zákazníkovi a jeho produktech, a to bez čekání. Jinak se zákazník otočí a pořídí si produkt konkurence.
Potřeba komplexního pohledu na zákazníka, ať už se zákazník dovolá na call centrum, přihlásí na zákaznický web, nebo navštíví pobočku, vede na projekty jednotných (multi-channel) front-endů pro obsluhu. Ze stejného důvodu se systémy pro marketingové kampaně těsněji integrují s datovými sklady a call centry. Telekomunikační operátoři řeší on-line propojení CRM nebo self-care systému přes billing až po infrastrukturu telekomunikační sítě, tak aby si mohl zákazník objednat například datový tarif a v příštím okamžiku mohl posílat e-maily s připojením přes svůj mobilní telefon.
Oddělení rizik – opět oddělení, která nutně potřebují integrovaná zákaznická data, navíc obohacená o komplexní ukazatele rizikovosti a hodnoty zákazníka a předschválené kreditní limity. Ne však již pouze pro analytické účely, ale v operativním režimu – při on-line schvalování úvěrů, monitoringu podezřelých transakcí či při aktivaci služeb. I zde je potřeba, aby používané informace byly spolehlivé, lidský činitel je z procesu vyloučen, a není tedy prostor pro nápravu chybných rozhodnutí z důvodů nekvalitních dat.
Legislativní požadavky typu Basel II či SOX také vyžadují integrovaná data, obvykle ne pro operativní účely, avšak s větším důrazem na důvěryhodnost a prokazatelnost poskytnutých informací.
Co je Master Data Management
Všechny zmiňované iniciativy a projekty staví na předpokladu, že potřebná data:
- jsou k dispozici bez ohledu na to, kde v organizaci vznikla
- jsou kvalitní (tj. věrně zachycují realitu)
- jsou spolehlivá a důvěryhodná
- jsou dostupná téměř neustále a s minimální prodlevou
- jsou stále aktuální
Doplňme je o pár dalších, celkem rozumných požadavků:
- odolnost poskytovaných dat vůči změnám na straně systémů
- rychlá implementace změn požadovaných konzumenty dat
Přestože z pohledu businessu jde o relativně jednoduchá a srozumitelná přání, v dnešním IT prostředí velkých organizací s mnoha systémy a složitými vazbami se jedná o komplexní problém. Koncept a principy Master Data Managementu vznikly jako odpověď právě na tyto otázky.
Různé zdroje chápou projekty a koncepty MDM různě. Na základě zkušeností z projektů, které realizujeme, pojímá společnost Adastra prostor MDM takto:
Větší obrázek.
V uvedené matici se lze rozhodnout, které entity budeme v rámci MDM projektu řešit. Zaměříme-li se na jednotlivé složky (disciplíny) MDM, pak úplně vynechat některou z nich představuje velké riziko pro konečný efekt MDM iniciativy. V případě jednodušších číselníků je však možné například významně zjednodušit unifikační pravidla či procesy data governance.
Ilustrační foto: Siemens
Existuje opravdu MDM? CDI, PIM a ti ostatní
Přestože se pojem MDM již nějakou dobu používá a ve světě je dokonce hodně „in“, skutečných projektů, které by pojímaly MDM v plné šíři, je zatím poskrovnu. Na druhou stranu, snaha o centrální management dat o zákaznících (CDI) či produktech (PIM) včetně všech souvisejících disciplín je kritickou součástí velkých projektů IT v posledních několika letech.
Informace o zákaznících jsou jedním z klíčových aktiv každé organizace, snaha o jejich integraci a co nejlepší kvalitu obvykle získá sponzora, a tím i potřebné prostředky poměrně snadno. Navíc má MDM iniciativa zaměřená na zákazníky přidanou hodnotu v tom, že pokrývá další typy dat. Zkušenosti našich konzultantů ukazují, že dobře navržené a naimplementované CDI řešení může stejně dobře posloužit jako „centrální správce dat“ pro entity typu zákazník a dodavatel či pro entity typu „provizní prodejce“, zaměstnanec apod. Obecně se dá říci, že při uvažování o CDI řešení je dobré rozšířit úvahy o další entity jako právnická či fyzická osoba.
U řešení CDI je cesta asi nejvíce prozkoumaná a lze čerpat z řady úspěšných i méně úspěšných řešení. Naprostá většina CDI řešení se zatím realizuje projektově, jako custom-build řešení s využitím best-of-breed technologických komponent a konzultačních služeb pro implementaci a metodickou podporu. Dodavatelé ERP systémů, ale i databází nebo integračních platforem, oznamují vývoj „hotových“ CDI řešení, jejich použitelnost je však zatím velmi omezená.
Master Data Management v oblasti produktů (jinak též Product Information Management) je na rozdíl od CDI otázka komplexnější, už vzhledem k velmi rozličné struktuře produktových katalogů v různých vertikálách. Produkty telekomunikační společnosti mají velmi málo společného s produkty pojišťovny či bankovní instituce, nemluvě už o produktech například v oblasti automobilového průmyslu. Vzhledem k rozdílnosti problematiky produktů je třeba zkušenosti čerpat z projektů ve stejném oboru, případně u dodavatelů, kteří se specializují na určitou vertikálu.
Opět vznikají „hotová“ PIM řešení, jejichž použitelnost může být relativně větší než u zmiňovaných CDI produktů díky tomu, že PIM řešení jsou obvykle vertikálová.
Centrální správa informací u ostatních entit a klíčových číselníků organizace se zatím ve velké míře řeší spíše „více do šířky“ tj. například master databáze pro více číselníků najednou, s jednoduššími unifikačními pravidly a bez data governance procesů. V případě, že organizace již má za sebou projekt typu CDI či PIM, je samozřejmě vhodné zajistit určitou míru kompatibility, zejména na úrovni koncepční a organizační.
Vybrané klíčové faktory úspěchu MDM
Flexibilní datový model: Datový model master databáze musí být úplný a obecný – zachycující jak všechny potřebné atributy, tak i potřebné vztahy mezi entitami bez ohledu na „původní“ datové modely z jednotlivých systémů. Zároveň by měl být navržen s co možná největší předvídavostí vzhledem k budoucím požadavkům byznysu na změny, nové typy produktů apod. V tomto směru je modelování velmi podobné modelování pro datový sklad. O podobnosti MDM a DWH hovoří text rámečku „Jak souvisí MDM a DWH/BI?“.
Požadavek na maximální flexibilitu a rozšiřitelnost datového modelu je mj. jedním z důvodů, proč se neosvědčilo použití standardních ERP/CRM systémů jako master databází a nově vznikající řešení pracují s dedikovanou master databází mimo stávající systémy.
Business pravidla pro unifikaci a kvalita dat: Problematika vyčištění a unifikace dat, tj. nalezení či vytvoření jediného „master“ záznamu, bývá obvykle podceňována, pravidla pro integraci a unfikaci nejsou v počátku projektu přesně a jednoznačně určena. Výsledkem je potom „funkční“ řešení, které ovšem neposkytuje obchodně použitelná data. Důvodem je velmi často nedostatečná komunikace mezi IT oddělením a obchodním segmentem v počátku projektu, někdy není na straně obchodního segmentu možno vůbec nalézt správného člověka s dostatečnou znalostí dané datové domény.
Abychom získali aktivní zapojení obou stran již od počátku, je vhodné před vlastní definicí zmíněných pravidel provést data profiling a jednorázovou integraci a unifikaci hlavních klíčových entit. Prvotní nastavení pravidel při čištění a unifikaci může přinést externí konzultační společnost, případně dodavatel Data Quality nástroje, pokud má zpracovánu metodiku pro příslušné lokální prostředí.
Na datech vzniklých prvotním vyčištěním a unifikací je možno:
- Zjistit skutečnou kvalitu dat a odhalit klíčové problémy při unifikaci.
- Přirozeným způsobem na jednotlivých případech získat definici pravidel pro čištění a unifikaci.
- Stanovit očekávané metriky kvality a dostupnosti dat z pohledu business uživatelů.
Vhodná integrační infrastruktura: Úspěšnost technologické části MDM iniciativy je kriticky závislá na výkonu integračního prostředí (nejen) pro výměnu dat mezi master databází a okolními systémy. Velké množství požadavků, téměř okamžité odezvy, špatně odhadnutelná charakteristika požadavků, to jsou faktory, které činí návrh integračního frameworku velmi náročným. Pro různé druhy integračních potřeb je vhodné použít různé druhy přístupů – ETL, EAI, EII, ale i point-to-point interface. Snaha použít jediný způsob integrace pro všechno, jak to navrhují někteří dodavatelé technologií či „out-of-the-box“ řešení, může podle našich zkušeností vést k závažným obtížím zejména v oblasti výkonnosti.
Data Governance program: Pokud se podaří úspěšně zvládnout všechny technické a analytické problémy v průběhu projektu, máme fungující řešení, které zpracovává a poskytuje kvalitní a jednotná data na všechna místa, kde jsou třeba, a to s dostatečnou rychlostí. Ani v tomto bodě však ještě není vyhráno – dosažený stav je třeba hned od počátku „bránit“ proti chátrání, neustále obnovovat a rozšiřovat ho na další systémy, případně další datové entity.
Tak jako bylo na počátku projektu nutné přitáhnout byznys uživatele, kteří definují pravidla pro integraci dat, je nyní třeba tuto a další role začlenit do organizační struktury, včetně silného sponzora, který bude prosazovat myšlenku MDM i přes přirozený odpor jednotlivých vlastníků systémů, vývojových projektů i obchodních oddělení, která mají své obchodní cíle.
Mezi hlavní role, které definuje Data Governance, patří:
- vlastník dat – produkuje data, zodpovídá za jejich kvalitu na vstupu.
- doménový datový steward – zodpovídá za dodržování stanovených metrik (SLA) a obecně použitelnost dat ve svěřené doméně z pohledu byznysu.
- systémový datový steward – zodpovídá za stav dat a jejich popis v rámci daného systému.
Důležitým momentem je míra pravomocí, kterou disponují datoví stewardi směrem k vlastníkům obchodních procesů, směrem k oddělení vývoje IT a projektům. V ideálním případě je datový steward oprávněn změnit jakýkoliv byznys proces či systém tak, aby dosáhl a udržel stanovené SLA, tj. kvalitu a použitelnost dat ve svěřené doméně. Datový steward tedy může navrhnout a prosadit změnu motivačního schématu na call centru tak, aby odměna operátorů byla odvozena nejen od kvantity, ale i kvality pořizovaných dat.
Lepší malá sousta: Vzhledem ke komplexitě MDM projektů je dobré postupovat step-by-step, s výjimkou úvodní mapovací a analytické fáze, která shromáždí zejména informace o výskytu a vazbách jednotlivých datových entit v celé organizaci, jejich využití v byznys procesech a obtížnost integrace jimi dotčených systémů. Potom se rozhodne, které entity zahrnout do plánované MDM iniciativy, případně s jakou prioritou.
Integrace a centrální management zákaznických dat bývá nejžhavějším požadavkem z pohledu byznysu, proto se obvykle k MDM přistupuje v oblasti zákazníků (případně dalších entit typu „osoba“) jako první. To s sebou nese i celkem poctivý přístup ve smyslu pokrytí všech disciplín MDM včetně Data Governance procesů. V případech, kdy je sousto i tak příliš velké, je vhodné pro první fázi omezit rozsah na několik systémů, případně rezignovat na některá integrační rozhraní a nahradit je organizačním procesem.
Kdy se hodí MDM ?
Vezměme si univerzální pojišťovnu, jejíž organizace i systémy odpovídají tradičnímu rozdělení na životní a neživotní pojišťovací produkty. Každá divize má svůj vlastní primární systém, vlastní informace o pojistných smlouvách, pojistných událostech a v nejhorším případě i vlastní zákaznickou databázi. Na dnešním trhu pojištění je však nutné pracovat s „celým“ zákazníkem, mít k dispozici informace o všech jeho smlouvách, pojistných událostech, placení pojistného atd. A vzhledem k rostoucí konkurenci a náročnosti zákazníka je třeba mít všechny informace v každém okamžiku k dispozici „na jedno kliknutí“.
Těmto požadavkům nevyhoví ani spojení zákaznických databází, které provádí šikovný analytik v marketingovém oddělení jednou za měsíc (příliš dlouhá perioda, neoperativní), ani tzv. Customer Identification File (žádný prostor pro kvalitní čištění a unifikaci, zákaznické atributy i nadále v mnoha různých instancích), ale dokonce už ani dobře postavený datový sklad, v němž probíhá aktualizace dat s denní či týdenní peridicitou.
Pokud se tato pojišťovna rozhodne stát skutečně zákaznicky orientovanou organizací, bude muset provést zásadní změnu své organizace a procesů, a to včetně změn v systémech IT, aby opravdu poskytovaly veškerá data o zákazníkovi „na jedno kliknutí“.
Hlavní změny v IT architektuře a procesech jsou:
- Integrace základních systémů obou divizí – sloučení/vybudování integrační nadstavby.
- Definice pravidel pro slučování zákaznických záznamů z hlavních systémů.
- Vytvoření CDI komponenty (CDI hub) a připojení na zdroje zákaznických dat.
- Přesměrování všech systémů na nově vytvořený CDI hub jako jediný zdroj .
- Ustanovení data governance programu, včetně sponzora a „správce“ nebo správců jednotlivých datových entit v CDI.
- Úpravy procesů týkajících se manipulace se zákaznickými daty.
Jak souvisí MDM a DWH/BI?
Master Data Management a data warehousing/business intelligence jsou si velmi blízké, často se i překrývající obory. Jednotný pohled na zákazníka, produkt či organizační jednotku, který poskytuje datový sklad pro analytické účely, jsou ideálně využitelné pro Master Data Management. Veškerá obchodná logika, případně nástroje pro čištění, integraci a unifikaci záznamů představují ideální základ pro MDM, pokud jsou v datovém skladu správně implementovány. Přímo použitelné budou také některé procesy a principy, jako například data stewardship či správa metadat. Na druhou stranu, datové sklady nebývají navrženy ani provozovány jako „mission critical“ systémy. To může být fatální překážka pro jejich přímé zapojení do klíčových obchodních procesů jak ve smyslu garantované dostupnosti, tak ve smyslu odezvy na požadavky uživatelů. Například operátor na call centru typicky potřebuje pro svou práci odezvy menší než jedna sekunda. Výše uvedené prvky bude tedy pravděpodobně nutné přenést do nového, technologicky pokročilejšího MDM prostředí.
Datový sklad a data marty také tvoří významný prvek v MDM architektuře, a to jako poskytovatel i jako odběratel dat. Datové entity spravované MDM prostředím by se měly stát jediným zdrojem dat pro klíčové dimenze v datovém skladu. Opačným směrem budou potom proudit agregované či odvozené informace poskytované datovým skladem, např. hodnota klienta, různá hodnocení (skóre) klinta pro marketing či Risk Management apod.
MDM není „kouzelná“ černá skříňka
Velké organizace dlouhodobě řeší potřebu centrální správy klíčových datových entit, a to nejen z pohledu technického, ale zejména z pohledu obchodního a právního. Cílem je poskytovat o vybraných entitách konzistentní, důvěryhodná a aktuální data všem odběratelům v organizaci i mimo ni, s definovaným SLA na kvalitu i dostupnost. Master Data Management není kouzelný proutek ani krabicový produkt, který vše vyřeší. MDM je kombinací metodik, technologií, procesů a organizačních opatření, které při správné aplikaci vedou ke zmíněnému cíli. MDM zároveň poskytuje návod, jak zahrnout správu dat do klíčových byznys procesů v organizaci.
Autor je ředitelem divize MDM v Adastra Corporation.