Jak se vyhnout datové džungli

5. 11. 2010

Doba čtení: 4 minuty

Moderní informační systémy, produkující nepřeberné množství dat, vyžadují kvalitní řešení typu business intelligence. Gurmánskou metaforou lze říci, že takové řešení musí obsahovat všechny potřebné ingredience.

Business intelligence (případně datový sklad, který je zpravidla nedílnou součástí) běžně zajišťuje i kvalitu zpracovávaných a prezentovaných dat. Ale jak zajistit toto „běžné“ očekávání?

Je třeba si uvědomit, že BI sama neopravuje, ale pouze pomáhá, informuje či radí. Výjimku tvoří jednoduché opravy popisných dat (formáty, doplnění chybějících atributů podle referenčních číselníků a obdobné úpravy – ty zajišťuje např. Master Data Management a další techniky a nástroje). Nás zajímají transakční data, vznikající a uchovávaná ve zdrojových systémech a sledující průběh vyhodnocovaných procesů.

Jedná se vždy o uzavřený kruh. Zdrojový systém poskytne data, datový sklad je přijme, provede jejich kontrolu a patřičným způsobem informuje zpět zdrojový systém o nalezených chybách. Zdrojový systém si pak provede patřičnou opravu a v následující dávce už datovému skladu poskytne vše správně a čistě. Je jisté, že ne všechny kroky tohoto procesu lze plně automatizovat. Vyhodnocení chybovosti dat může být prováděno ručně, například v rámci systematického testování řešení a jeho obsahu, nebo náhodně až při běžném provozu.

S růstem složitosti datové komunikace roste i riziko případných chyb – ať už lidských či technických. Datový sklad pak může snadno přijít k neúplným či poškozeným datům. U moderních systémů je dále podporována primárně rychlost jejich nasazení a možnost uzpůsobení měnícím se uživatelským potřebám. V souvislosti s tím může být podceněna implementace kontroly správnosti pořizovaných dat (úplnost, formáty, logický obsah, návaznost na související transakce v jiné aplikaci apod.). Datový sklad pak může konstatovat pouze neúplnost či chybnost dat, ale to znamená, že supluje zanedbanou kontrolu dat při jejich vzniku. Zdrojem problémů s kvalitou dat bývají i komplikovaná datová rozhraní, pomocí kterých aplikace zpřístupňují datovému skladu svá data. Ať už jde o chyby v návrhu či implementaci (dohodnuté atributy a elementy neobsahují to, co by měly podle předpokladů obsahovat), případně je vina na straně použité komunikační platformy. Ta může být nespolehlivá, nedostatečně dohlížena či poskytuje data v časovém nesouladu s potřebami koncových uživatelů business intelligence.

A jak může business intelligence/datový sklad pomoci? Předně, součástí analýzy a návrhu řešení BI musí být podrobný rozbor dostupných primárních dat. Podle výsledku je možné definovat a vyžadovat množství úprav ve zdrojích, které data poskytují (buď v rozhraní pro přístup k datům, či v datech samotných). Tato jednorázová kontrola a náprava dat často patří ke klíčovým přínosům implementace business intelligence. Jednorázové kontroly však nestačí. Kvalitní ETL nástroje, sloužící pro načítání dat, musí umožnit implementaci pravidelných automatických kontrolních mechanismů pro všechna přicházející data. Zároveň kontroly musí být dostatečně nastavitelné – správci by měli mít možnost vypnout např. ty již nepotřebné a naopak snadno doplnit kontroly nové. Významnou roli hraje také správné nastavení následného procesu zpracování identifikovaných problémů – v případě podezřelých záznamů je systém jednoduše označí a vyřadí z finální prezentace dat. Pokud se jedná o fatální chybu, pak celá načtená dávka dat musí být vrácena zpět.

Důvody nesprávnosti dat mohou být různé, ať už na straně jednotlivých vrstev vlastního IS/ICT, tak na straně lidského faktoru (dodavatelé systémů, uživatelé a správci). Existuje množství dalších postupů, pomocí kterých lze správnost dat kontrolovat a řídit. Hlavním účelem datového skladu a řešení business intelligence ale není automaticky opravovat nalezené chyby, nýbrž pouze celý proces oprav vhodnými prostředky a postupy podporovat. Vhodným místem pro opravu chybných dat je především primární informační systém, který zodpovídá za jejich pořízení. Na základě nalezených chyb musí být v informačním systému provedeny úpravy, které opakování obdobných problémů účinně zabrání.

Autor působí jako Team Leader oddělení BI a integrace ve společnosti Aquasoft.

Vyšlo v CIO Business World 9/2010

Našli jste v článku chybu?

Petr Šprungl

Témata:

21. 11. Mews zase nakupuje

Český jednorožec Mews kupuje švédskou firmu Atomize, která se specializuje na software pro řízení výnosů (RMS). Díky pokročilým algoritmům umožňuje platforma Atomize hotelům dynamicky upravovat ceny a lépe využívat kapacity, což otevírá cestu k vyšším příjmům a efektivnějšímu řízení.
Mews zároveň nedávno posílil svou pozici na trhu akvizicí francouzské společnosti Quotelo, jejíž technologie usnadňuje hotelům organizaci eventů a automatizuje administrativní procesy spojené se skupinovými a firemními rezervacemi. Mews Ventures má na svém kontě od svého vzniku celkem jedenáct akvizic.
6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

Vítězství Donalda Trumpa vyvolalo výrazný nárůst hodnoty bitcoinu (BTC). Výzkum společnosti Finbold zjistil, že za posledních 30 dní vzniklo 11 487 nových bitcoinových adres, které drží 1 milion dolarů nebo více, a to především díky 7,5% růstu BTC od doby, kdy se náskok Donalda Trumpa ve volbách stal drtivým.
Nyní drží 132 842 adres v bitcoinech více než milion dolarů: 121 126 adres drží od 1 do 9,99 milionu dolarů, zatímco 11 697 adres drží 10 milionů dolarů a více. Analýza využila historické údaje a porovnávala předvolební údaje ze 7. října 2024, získané pomocí webového archivačního nástroje Wayback Machine, s nejnovějšími povolebními statistikami k 6. listopadu 2024.
6. 11. První akvizice EET v Česku

Strategickou akvizici divize náhradních dílů společnosti Moravia Consulting, která se specializuje především na obchod s náhradními díly k produktům Hewlett Packard a Hewlet Packard Enterprise uskutečnila distribuční společnost EET Group. Upevňuje tak svou pozici předního poskytovatele náhradních dílů pro IT po celé Evropě. Zároveň jde o první akvizici firmy z České republiky po vstupu EET Group na český trh.
30. 10. Miliony pro start-upy

Agentura CzechInvest otevírá další výzvu projektu Technologická inkubace. V pořadí již pátá výzva s alokací 104,8 milionu korun bude spuštěna v pravé poledne 30. října a potrvá do 29. listopadu 2024. Program, který podporuje startupové prostředí prostřednictvím sedmi specializovaných technologických hubů, nabízí podnikatelům pomoc s jejich inovativním produktem či službou. Nyní spolupracuje s téměř 180 firmami z plánovaných 250, projekt se tak již přehoupl přes svou symbolickou polovinu.
Více informací o programu a nové výzvě naleznete zde.
30. 10. Rozšiřující se DIA

Vzhledem ke sjednocování souvisejících agend přechází kompletní správa, rozvoj a financování registru obyvatel a registru osob od 1. listopadu 2024 z Ministerstva vnitra, resp. Českého statistického úřadu na Digitální a informační agenturu (DIA).
V době samotného převodu obou registrů od 31. října 20:00 do 1. listopadu 04:00 se může projevit snížená dostupnost jejich služeb, jinak by se podle tvrzení DIA dostupnost služeb nijak měnit neměla.

Sdílet

Autor článku

Petr Šprungl

Témata:

Mohlo by vás zajímat

Businessworld Newsletter

HP Knowledge HUB
pro moderní firemní IT

Krátce

21. 11. Mews zase nakupuje

6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

6. 11. První akvizice EET v Česku

30. 10. Miliony pro start-upy

30. 10. Rozšiřující se DIA

Anketa

Je pro váš podnik umělá inteligence vhodným řešením některých požadavků?

SPECIÁLNÍ PROJEKTY

Windows chystá offline AI vyhledávání souborů Catchy headline:

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Třetí čtvrtletí letošního roku ryze českých investic

Gmail chystá dočasné „štítové“ e-mailové adresy proti spamu

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Sledují vás přes HDMI? Revoluční útok využívá AI a elektromagnetické záření

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Jak se vyhnout datové džungli

Sdílet

Autor článku

Mohlo by vás zajímat

Kvíz týdne

21. 11. Mews zase nakupuje

6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

6. 11. První akvizice EET v Česku

30. 10. Miliony pro start-upy

30. 10. Rozšiřující se DIA

Anketa

Je pro váš podnik umělá inteligence vhodným řešením některých požadavků?

SPECIÁLNÍ PROJEKTY

Z našich webů

Windows chystá offline AI vyhledávání souborů Catchy headline:

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Třetí čtvrtletí letošního roku ryze českých investic

Gmail chystá dočasné „štítové“ e-mailové adresy proti spamu

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Sledují vás přes HDMI? Revoluční útok využívá AI a elektromagnetické záření

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Dále u nás najdete

ÚOOÚ šetří české vydavatele kvůli „pay or ok“

Lékárníci v karavanu anonymně změří cholesterol i cukr v krvi

Vánoční slevy operátorů? Daleko za očekáváním

Youtubeři a influenceři se musí registrovat

Vyznejte se v kuřatech. Takhle se liší selské od venkovského

Edge zkouší nový trik na uživatele Chromu

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

„Nemáme na tom zájem“. Opozice brzdí TV poplatky

Horké nápoje: Zkuste recepty na šest nejznámějších

Lumbální punkce sice vypadá děsivě, ale nebolí

Kdy začít péct cukroví? Vhodná doba nastává o adventu

Potíže, které dříve znamenaly neplodnost, umí lékaři vyřešit

Týmové ordinace praktiků dostanou přidáno, za to musejí nabírat pacienty

Nová centrální evidence srážek ze mzdy

O kolik vzrostou důchody? Spočítejte si, jak se zvýší váš

Ročně dostane ledvinu deset dětí, důležitá je velikost

Domácí mazlíčci jí téměř ožívají pod rukama. Figurky vyrábí z vlny

Ministr Válek má rakovinu, lékaři ji odhalili při prevenci

Prémiové AI funkce: Stojí za příplatek?

Digitální transformace znamená neustálé změny a úpravy