Michal Bezák, SAP: Mnoho firem má v datových skladech zastaralé informace

29. 1. 2013

Doba čtení: 5 minut

Vyzpovídali jsme Michala Bezáka, PreSales Associate ve společnosti SAP, na téma velkých dat a BI.

CIO Business World: Společnosti jsou dnes zatíženy záplavou nejrůznějších dat z vnitřních i vnějších zdrojů. Jak oddělit zrno od plev tak, aby se růst nákladů na datové úložiště když ne zastavil, tak alespoň zpomalil? Lze vůbec v záplavě dat efektivně selektovat ta kvalitní (nebo jakýmkoliv způsobem přínosná) ještě před tím, než jsou vůbec uložena?

Michal Bezák, SAP Michal Bezák: To je samozřejmě možné – relevantní data a zprávy můžete „zachytávat“ s použitím technologie Complex Event Processing. Následně je možné „zachycené“ zprávy analyzovat pomocí výkonného kalkulačního enginu, který zpracovává data v operační paměti. Už zanalyzované data nemusí být nutně dlouhodobě uložena – závisí to na legislativních požadavcích případně dalších požadavcích na analýzu.

Mnoho firem také drží ve svých datových skladech již zastaralé a nerelevantní informace. Z tohoto hlediska pomůže archivace případně koncept near-line storage, kdy se méně aktuální data ukládají do ekonomičtějšího near-line úložiště, zatímco vysoce aktuální data jsou k dispozici pro okamžitou analýzu.

Výhodou je možnost optimalizace řešení z hlediska dostupnosti dat a finanční náročnosti celého řešení, nevýhodou může být relativně větší odezva dotazů na data uložená v near-line storage.

Studie IDC ukazuje, že společnosti reálně potřebují pouze 15 % dat, která v reálu ukládají. Jakým způsobem je možné tuto statistiku zvrátit?

Změnit se musí celý přístup k tomu, jak ukládáme data, která analyzujeme. V případě tradiční architektury datového skladu mají dnes společnosti několik kopií těch samých dat uložených na několika místech. Příchod in-memory databázových systémů pro management dat mění celou architekturu datového skladu a výrazně ji zjednodušuje – to přináší výhody v podobě výrazného omezení potřeby agregátů a indexů a také potřebu několika databází a několikanásobného ukládání dat pro potřeby analýzy. Platformy založené na in-memory computingu jsou totiž schopné analyzovat data v původní podobě, bez předešlé agregace.

Existují kromě deduplikace i další způsoby, jak snižovat extrémní objemy ukládaných dat?

Kromě deduplikace existují i jiné způsoby komprese dat. Každý dodavatel používá jiné technologie a přístupy ke kompresi dat. Například sloupcově orientované databázové systémy přinášejí několik výhod, mezi jinými také možnost větší komprese dat a rychlost dotazování, protože ukládají data stejného typu společně.

Příkladem může být mzda zaměstnance, která bude 12 měsíců stejná, ale uloží se jenom jednou s odkazem na jednotlivé měsíce. Výsledkem je, že několikanásobně větší objem vstupních dat je možné uložit na stejnou velikost úložiště dat. To má za následek pokles paměti potřebné k exekuci jednotlivých dotazů.

V souvislosti s termínem big data se často hovoří o tom, že jde pouze o nový, marketingově atraktivní název pro dávno používané technologie. Existují kromě možnosti paralelizace úloh i další vodítka, jak poznat skutečně inovativní řešení pro zpracování dat?

Souhlasím s tím, že termín big data způsobuje mnoho nedorozumění a je při tom těžce definovatelný.

Osobně preferuji termín big value – tedy hodnotu jakou data mají a možnost jejích transformace do podoby použitelných a relevantních informací. Pravě v této oblasti se díky inovativním technologiím jako je právě in-memory computing mohou analýzy dat posunout o krok kupředu.

Co se týče inovativních řešení, tak bych odkázal na Gartner BI Hype cycle, který jmenuje jednotlivé inovace v oblasti BI. Patří mezi ně mimo jiné data mining workbench, sloupcově uspořádané databázové systémy, in-memory databázové systémy a real-time aplikace pro podporu rozhodování.

Velmi zajímavé výsledky přináší trend in-memory computingu, tedy rychlého zpracování obrovských objemů dat přímo v paměti serverů. Toto řešení se však zatím zdá být finančně obtížně dostupné. Přijde někdy doba, kdy se z něj stane mainstream?

Z mého pohledu ta doba určitě nastane a v podstatě již nastává. A nemyslím si to jenom já, ale také například analytici společnosti Gartner. Předpovídají, že in-memory technologie bude jedním z top 10 technologických trendů pro rok 2013. V dnešní době se už mnoho společností rozhodlo nasadit technologii in-memory computingu a většinou začínají s menšími projekty a selekcí jenom určité skupiny dat, která chtějí analyzovat přímo v paměti, přičemž pro analýzu ostatních dat používají klasické technologie.

Jsou ale i takové společnosti, kterým umožní in-memory computing vytvářet nové business modely a neváhají investovat do této technologie i větší finanční obnosy. Dalším příkladem jsou již celé informační systémy, které běží jenom na in-memory databázových systémech.

Našli jste v článku chybu?

redakce

Témata:

21. 11. Mews zase nakupuje

Český jednorožec Mews kupuje švédskou firmu Atomize, která se specializuje na software pro řízení výnosů (RMS). Díky pokročilým algoritmům umožňuje platforma Atomize hotelům dynamicky upravovat ceny a lépe využívat kapacity, což otevírá cestu k vyšším příjmům a efektivnějšímu řízení.
Mews zároveň nedávno posílil svou pozici na trhu akvizicí francouzské společnosti Quotelo, jejíž technologie usnadňuje hotelům organizaci eventů a automatizuje administrativní procesy spojené se skupinovými a firemními rezervacemi. Mews Ventures má na svém kontě od svého vzniku celkem jedenáct akvizic.
6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

Vítězství Donalda Trumpa vyvolalo výrazný nárůst hodnoty bitcoinu (BTC). Výzkum společnosti Finbold zjistil, že za posledních 30 dní vzniklo 11 487 nových bitcoinových adres, které drží 1 milion dolarů nebo více, a to především díky 7,5% růstu BTC od doby, kdy se náskok Donalda Trumpa ve volbách stal drtivým.
Nyní drží 132 842 adres v bitcoinech více než milion dolarů: 121 126 adres drží od 1 do 9,99 milionu dolarů, zatímco 11 697 adres drží 10 milionů dolarů a více. Analýza využila historické údaje a porovnávala předvolební údaje ze 7. října 2024, získané pomocí webového archivačního nástroje Wayback Machine, s nejnovějšími povolebními statistikami k 6. listopadu 2024.
6. 11. První akvizice EET v Česku

Strategickou akvizici divize náhradních dílů společnosti Moravia Consulting, která se specializuje především na obchod s náhradními díly k produktům Hewlett Packard a Hewlet Packard Enterprise uskutečnila distribuční společnost EET Group. Upevňuje tak svou pozici předního poskytovatele náhradních dílů pro IT po celé Evropě. Zároveň jde o první akvizici firmy z České republiky po vstupu EET Group na český trh.
30. 10. Miliony pro start-upy

Agentura CzechInvest otevírá další výzvu projektu Technologická inkubace. V pořadí již pátá výzva s alokací 104,8 milionu korun bude spuštěna v pravé poledne 30. října a potrvá do 29. listopadu 2024. Program, který podporuje startupové prostředí prostřednictvím sedmi specializovaných technologických hubů, nabízí podnikatelům pomoc s jejich inovativním produktem či službou. Nyní spolupracuje s téměř 180 firmami z plánovaných 250, projekt se tak již přehoupl přes svou symbolickou polovinu.
Více informací o programu a nové výzvě naleznete zde.
30. 10. Rozšiřující se DIA

Vzhledem ke sjednocování souvisejících agend přechází kompletní správa, rozvoj a financování registru obyvatel a registru osob od 1. listopadu 2024 z Ministerstva vnitra, resp. Českého statistického úřadu na Digitální a informační agenturu (DIA).
V době samotného převodu obou registrů od 31. října 20:00 do 1. listopadu 04:00 se může projevit snížená dostupnost jejich služeb, jinak by se podle tvrzení DIA dostupnost služeb nijak měnit neměla.

Sdílet

Autor článku

redakce

Témata:

Mohlo by vás zajímat

Businessworld Newsletter

HP Knowledge HUB
pro moderní firemní IT

Krátce

21. 11. Mews zase nakupuje

6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

6. 11. První akvizice EET v Česku

30. 10. Miliony pro start-upy

30. 10. Rozšiřující se DIA

Anketa

Je pro váš podnik umělá inteligence vhodným řešením některých požadavků?

SPECIÁLNÍ PROJEKTY

Windows chystá offline AI vyhledávání souborů Catchy headline:

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Třetí čtvrtletí letošního roku ryze českých investic

Gmail chystá dočasné „štítové“ e-mailové adresy proti spamu

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Sledují vás přes HDMI? Revoluční útok využívá AI a elektromagnetické záření

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Michal Bezák, SAP: Mnoho firem má v datových skladech zastaralé informace

Sdílet

Autor článku

Mohlo by vás zajímat

Kvíz týdne

21. 11. Mews zase nakupuje

6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

6. 11. První akvizice EET v Česku

30. 10. Miliony pro start-upy

30. 10. Rozšiřující se DIA

Anketa

Je pro váš podnik umělá inteligence vhodným řešením některých požadavků?

SPECIÁLNÍ PROJEKTY

Z našich webů

Windows chystá offline AI vyhledávání souborů Catchy headline:

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Třetí čtvrtletí letošního roku ryze českých investic

Gmail chystá dočasné „štítové“ e-mailové adresy proti spamu

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Sledují vás přes HDMI? Revoluční útok využívá AI a elektromagnetické záření

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Dále u nás najdete

Bolest prsu nemusí hned značit vážné onemocnění

Stříteský: Obchodníci mají v zahraničí vyšší sankce a omezené slevy

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Poznáte slavné značky a firmy jen podle loga?

Nejen Coca-Cola, ale i Lidl má červený vánoční kamion

Kyberbezpečnost v Česku – dokážeme čelit novým hrozbám?

Vláda chce odložit účinnost "digitální ústavy" o dva roky

Od pokeru do dílny: Vyrábí v ní nábytek z ohýbaného betonu

Svařák bez alkoholu je skvělá varianta pro těhotné či abstinenty

Chrome OS se zřejmě promění v Android

SSD už také mají obrovskou kapacitu – až 122 TB

Lékárníci v karavanu anonymně změří cholesterol i cukr v krvi

Edge zkouší nový trik na uživatele Chromu

Kdy se vyhneme platbě daně z příjmů při prodeji nemovitosti?

10 tradičních českých vánočních značek. Znáte jejich příběh?

Lékaři zdarma a bez objednání změří kapacitu plic

Na svátek 17. listopadu to s nákupy nebude moc složité

Ministr Válek má rakovinu, lékaři ji odhalili při prevenci

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

Počet OSVČ je opět rekordní. Nestojí za tím změny u dohod?