;

Odborníky na Big Data frustruje různorodost dat

25. 7. 2014
Doba čtení: 3 minuty

Sdílet

 Autor: © tashatuvango - Fotolia.com
Stále více firem zaměřuje pozornost na velká data v naději, že z rostoucího objemu údajů z různých zdrojů vytěží cenné informace, díky nimž získají konkurenční výhodu. To vytváří tlak na výsledky výzkumu z této oblasti.

Analýza tzv. velkých dat patří mezi nejsledovanější trendy v IT dnešní doby. Stále více firem na ni zaměřuje pozornost v naději, že z rostoucího objemu strukturovaných i nestrukturovaných dat z různých zdrojů vytěží cenné informace, díky nimž získají konkurenční výhodu. Vědci zabývající se touto problematikou proto pociťují rostoucí tlak na výsledky výzkumu.

Společnost Paradigm4, která poskytuje open sourcový systém pro správu databází SciDB, nedávno mezi datovými vědci provedla průzkum. Téměř tři čtvrtiny z dotázané více než stovky odborníků tvrdí, že jejich práce je čím dál složitější především kvůli stoupající různorodosti dat, nikoli kvůli jejich objemu. Zvládání prudce rostoucího objemu dat se přitom dosud uvádělo jako hlavní problém, na který je nutné se zaměřit.

Zvyšující se rozmanitost zdrojů dat nutí datové vědce ke zjednodušování, kvůli kterému nejsou data využívána maximálně efektivně, což snižuje návratnost investic. Skutečným problémem dneška je proto využití ohromného potenciálu datové analýzy u nesourodých dat.

Studie ukazuje, že 59 % firem již dnes využívá pokročilejší analýzu s funkcemi jako kovariance, shlukování, strojové učení, analýza klíčových prvků a grafické operace namísto základní analýzy jako business inteligence. Dalších 15 % plánuje začít využívat komplexní analýzu v příštím roce a 16 % v průběhu dvou let. Pouhá 4 % nic takového neplánují.

Podle studie z toho vyplývá, že „snadno dosažitelné ovoce“ analýzy velkých dat je již sklizené a odborníci na zpracování dat se budou muset snažit hledat další cesty, jak z nich vytěžit další hodnotu. Tvrdí, že pro komplexní analýzu velkých dat nebude stačit jediný server, ale budou zapotřebí distribuované systémy, které se dokáží vypořádat s řídkostí dat, chybějícími hodnotami a nejednotnými vzorkovacími frekvencemi a ve výsledku umožní, aby data hovořila sama za sebe, bez zjednodušování a lidských předpokladů.

ICTS24

Zdroj: IDG News Service

Čtěte také:
→ Jak na Business Intelligence ve světě velkých dat
Firmy si stále více začínají uvědomovat, že konkurenční výhoda je často skryta ve vlastních datech. Ta totiž říkají, co zákazníci chtěli, chtějí a co teprve budou chtít.
→ Big data budou hnacím mechanismem průmyslového internetu
Rozhovory na téma big data se často točí okolo analýzy sentimentu a zacílení na spotřebitele. Nicméně za oponou se skrývají možnosti, jež mají díky vzájemné komunikaci různých zařízení potenciál od základu změnit svět okolo nás.