Hlavní navigace

Čistá a kvalitní data z nebe nespadnou

30. 4. 2007
Doba čtení: 11 minut

Sdílet

Se zvyšováním konkurenčního prostředí a rostoucí nasyceností trhu v jednotlivých odvětvích roste i význam čistoty a kvality dat v informačních systémech firem, které v těchto odvětvích prodávají své výrobky nebo poskytují své služby. V přístupu k zákazníkovi, dodavateli či obchodnímu partnerovi se musí v ideálním případě zohlednit veškeré dostupné informace, které o něm má firma k dispozici. Tento na první pohled rozumný požadavek však v praxi nebývá tak snadné zrealizovat právě kvůli problémům s kvalitou dat.

Se zvyšováním konkurenčního prostředí a rostoucí nasyceností trhu v jednotlivých odvětvích roste i význam čistoty a kvality dat v informačních systémech firem, které v těchto odvětvích prodávají své výrobky nebo poskytují své služby. V přístupu k zákazníkovi, dodavateli či obchodnímu partnerovi se musí v ideálním případě zohlednit veškeré dostupné informace, které o něm má firma k dispozici. Tento na první pohled rozumný požadavek však v praxi nebývá tak snadné zrealizovat právě kvůli problémům s kvalitou dat.

Zkušenosti svědčí o tom, že ten, kdo tvrdí, že nemá nekvalitní data, většinou tento problém nikdy neřešil. Pokud někdo připouští, že jeho data obsahují drobné chyby, tak často jen nedohlédl skutečný rozsah nepřesností či nečistoty, která byla do jeho dat zavlečena. Pro představu lze uvést některá čísla z reálných projektů týkajících se zákaznických dat: IČ organizace bylo správné v 97,5 % případů, rodné číslo v 95,1 % případů a 59,5 % vyplněných adres bylo zapsáno zcela korektně. Pětina vyplněných adres byla zapsána správně, pokud akceptujeme jiný způsob zápisu zkratek či chyby v diakritice, a další pětina byla zadána chybně.

Člověk nezabývající se danou problematikou by v první chvíli měl tendenci si myslet, že atributy IČ a RČ jsou přece zcela jasně definované údaje, které se uvádějí na řadě dokumentů, a tudíž by s kvalitou těchto údajů neměl být velký problém. A přesto každé padesáté IČ a každé dvacáté páté rodné číslo byly špatně vyplněny. U adresových údajů si pak asi každý dokáže představit, s jak kvalitními daty organizace pracují.

Rostoucí vliv

Na první pohled by se také mohlo zdát překvapivé, proč by například nedokonale vedená evidence zákazníků měla dnes vadit víc, než vadila před pěti či deseti lety. Zvyšující se konkurenční prostředí a nasycenost trhu však hlavní hráče na jednotlivých trzích staví do situace, že musejí co nejefektivněji využít nové příležitosti či se co nejúčinněji vypořádat s novými komplikacemi. Mezi takové trendy patří rychlý vývoj technologií, přičemž posouvá hranice toho, co je možné automatizovat a v reálném čase podporovat, přechod od funkčního k procesnímu vnímání skutečnosti. Dříve se informační technologie využívaly jako nástroje na podporu stávajících činností a úkolů. Nově firmy hledají způsoby, jak své přirozené procesy díky informačním technologiím reorganizovat a zefektivnit, přechod od produktové orientace k zákaznickému přístupu. Také nelze zapomínat na uvědomění si bohatství, které spočívá v informacích ukrytých v nashromážděných datech, a na rostoucí snahu toto bohatství vytěžit, masivní využívání internetu jako necenzurovaného prostředku pro nabízení i získávání dat, na požadavky na integraci dosud oddělených systémů/databází, které souvisejí ať už s rostoucí komplexností informačních systémů jako takových či s konsolidací jiných systémů získaných například formou fúzí či akvizicí konkurenčních společností, a konečně na různé legislativní požadavky či omezení (v českém prostředí například zákon o evidenci obyvatel a o rodných číslech, zákon o ochraně osobních údajů, antispamový zákon).

Stále častěji tak čelíme skutečnosti, že nekvalitní data znemožňují nebo v lepším případě jen komplikují efektivní fungování důležitých firemních procesů. Nejedná se přitom jen o českou záležitost, stejně tak jako se nejedná jen o otázku k akademické diskusi. Jedná se o problém s konkrétními finančními dopady. Například Datawarehouse Institute před několika lety odhadl, že nízká kvalita zákaznických dat stojí americké společnosti až 600 miliard dolarů ročně na poštovném, na nákladech na tisk a na režijních mzdových nákladech. S nárůstem množství zpracovávaných dat a se zvyšováním obratu firem mají tato čísla tendenci se ještě zvětšovat.

Zvýšení kvality dat tedy může jednak snížit vícenáklady vynucené neefektivním fungováním firemních procesů nebo naopak může zvýšit výnosy díky implementaci procesů nových.

Základ smyslupné konsolidace

Kvalitní zákaznická data umožňují správně propojit z různých informačních systémů či databází informace o různých produktech vlastněných daným zákazníkem nebo informace o jeho preferencích či historii komunikace s ním. Nekvalitní zákaznická data naopak tento komplexní pohled na zákazníka znemožňují, neboť konkrétní pan Novák může být považován za 2 či 3 různé klienty: v jednom případě byl identifikován rodným číslem, v jiném případě jen příjmením, jménem a datem narození, ve třetím případě bylo omylem jeho křestní jméno zkomoleno nebo byla zapsána špatně jeho adresa trvalého bydliště apod. V prvním případě půjde o klienta, který čerpá velmi kvalitní služby a generuje vysoký příjem pro firmu. Ve druhém případě se jedná o záznamy o problematických platbách. Ve třetím případě se jedná o žádost o zaslání detailních informací o hypotečním úvěru vyžádaných prostřednictvím webových stránek banky. Pokud by prvotní chyby v datech neznemožnily získání celkového přehledu o panu Novákovi, lze tyto údaje efektivně využít pro podporu rozhodování ve vztahu k tomuto zákazníkovi.

Komunikace se zákazníky

Kvalitní konsolidované údaje umožní obchodnímu zástupci nabídnout zákazníkovi produkty, které zatím ještě nemá, ale s největší pravděpodobností by je uvítal, nebo mu může nabídnout luxusnější variantu stávajících. Obchodní zástupce naopak také může obdržet varování o tom, že daný zákazník je identifikován jako neplatič a že mu nemá žádné další služby nabízet. Marketingové kampaně mohou být efektivněji zacíleny jen na ty, kteří s největší pravděpodobností na nabídku budou reagovat pozitivně. Konsolidovaná kvalitní zákaznická data umožní v jednotlivých tržních segmentech adekvátním způsobem kalkulovat tzv. Customer Life-time Value (CLTV), tj. hodnotu, která odráží jednak dosavadní skutečný přínos zákazníka od počátku jednání s ním, jednak potenciál budoucích přínosů, zůstane-li zákazníkem po celý svůj život. S ohledem na tuto hodnotu pak lze řídit celkovou komunikaci s tímto zákazníkem a věnovat například omezené kapacity call centra právě obsluze zákazníků s vyšší CLTV. V bankách je možné díky kvalitním datům lépe vyhodnocovat riziko zákazníka s ohledem na jeho dosavadní chování, a podporovat tím proces udělování úvěru. V pojišťovnictví lze například díky kombinaci kvalitních dat o zákaznících a vozidlech podpořit odhalování podvodného jednání v případě likvidací havárií motorových vozidel. Za pomoci kvalitních adresních údajů lze identifikovat jednotlivé domácnosti a kampaně zacílit.

Trendy v řízení kvality dat

Je zřejmé, že chyby v datech vždy byly, jsou a budou – ať už z důvodu omylu či překlepu obsluhy počítače, její přehnané iniciativy při zadávání údajů, mylné interpretace významu jednotlivých polí formuláře, při předávání údajů mezi obchodními partnery nebo v důsledku zpracovávání údajů z jiných systémů, ve kterých se používá jiný formát zápisu dat.
Snahy řešit kvalitu dat byly dříve často jakýmsi vedlejším cílem projektů na podporu konkrétních činností a procesů. Vznikaly tak ostrůvky čistších dat, které však byly čisté jen z jednoho nebo několika málo hledisek nutných pro úspěšné dokončení projektu. Přitom takto vzniklé ostrůvky kvalitnějších dat byly často nevhodné či nedostupné pro jiné účely a trpěly vinou dalších chyb nově vstupujících z primárních systémů. V horším případě musely být některé ambiciózní projekty kvůli nekvalitním datům přehodnoceny, či dokonce zastaveny. Na snahy o kompletní řešení datové kvality se postupně rezignovalo.

Data Governance

V poslední době se však setkáváme s obnoveným zájmem o komplexní uchopení této problematiky. Tento trend potvrzují například i studie Gartner Group v oblasti konsolidace zákaznických dat. Hlavním cílem nově iniciovaných projektů se stává zlepšení a zajištění kvality dat napříč celou organizací, čímž zprostředkovaně podporují ostatní firemní procesy. Takto pojatý přístup k otázkám datové kvality je plně v souladu s obecně uznávanými systémy řízení jakosti (ISO 9000, TQM) a nezahrnuje pouze technologické řešení problému, implementaci různých softwarových nástrojů, ale stejnou měrou postihuje nastavení potřebných firemních procesů a definici rolí a odpovědností osob, které se těchto procesů účastní. Aktivní uplatňování takto implementovaných procesů, pevně zakotvených do organizační struktury organizace, se označuje jako data governance.

Pro systémové řešení datové kvality lze obecně zvolit jednu ze dvou základních strategií. První, relativně méně náročná strategie je postupovat od konce – tj. postup od koncových uživatelů, jejich aplikací, respektive datového skladu, opravování dat při přípravě pro ně a následná propagace těchto oprav do primárních systémů. Druhá strategie začíná u vzniku dat a jejich kvalitu monitoruje a řídí v průběhu celého jejich životního cyklu. Z principu jde o nákladnější variantu. V praxi se zcela jistě bude možné setkávat s kombinací obou výše zmíněných strategií, neboť se bude vycházet z některých již existujících řešení (tedy od konce) a budou se budovat prvky pro řízení kvality v počátečních fázích zpracování dat při jejich vzniku.

Zvykněte si na čistotu

Projekty datové kvality lze v ideálním případě vidět právě jako projekty umožňující firmám osvojit si návyky, které povedou k trvalému dosahování a udržování kvality a čistoty dat. Uznávaný autor v oblasti leadershipu Stephen R. Covey říká, že návyk může vzniknout tam, kde dochází ke vzájemnému překrytí znalostí (co), dovedností (jak) a postoje (proč/vůle) něco dělat.

Vztáhneme-li tento předpoklad na projekty datové kvality, pak pro úspěšnou realizaci takovýchto projektů je potřeba znalostí, co je to datová kvalita a jaké procesy firma potřebuje zavést pro její zajištění, jaké nástroje k tomu lze použít, dovedností, jak po­stupovat při zavádění potřebných procesů (metodika), jak vyhodnocovat datovou kvalitu, jak používat nástroje (například specializovaný software) k měření kvality dat a v neposlední řadě je potřeba praktických zkušeností, postojů, proč projekt prosazovat (hledají se konkrétní obchodní případy dokládající jeho přínosy) a schopnost takový projekt prosadit (nutnou podmínkou pro jejich úspěšnou realizaci je získání silného byznys sponzora v organizaci, neboť změny se budou týkat většiny útvarů).
Pokud chcete problém datové kvality systémově řešit, buďte úspěšní při vytvoření dobrých a silných návyků, které pak budou pracovat za vás.

Autor působí jako Business Consultant ve společnosti Adastra Corporation.

Foto: Wikipedia, licence GFDL

Autor článku