Studie nese název Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East (Velká data, ještě větší stíny nad digitálním světem a největší růst na Dálném východě). Mezi její hlavní zjištění patří skutečnost, že objem dat celosvětově roste rychleji, než se očekávalo.
Digitální vesmír dosáhne do roku 2020 velikosti 40 zettabajtů (ZB) a do této doby také nově se rozvíjející trhy vytlačí z role hlavního producenta světových dat rozvinutý svět. Jen pro představu, kdyby bylo uloženo 40 ZB dat na dnešní disky Blue-ray, hmotnost těchto disků (bez jakýchkoli pouzder či obalů) by byla stejná jako hmotnost 424 letadlových lodí třídy Nimitz. Zásadním faktorem, který k rozpínání digitálního vesmíru přispívá, je růst strojově generovaných dat, jejichž podíl vzroste z 11 % v roce 2005 na více než 40 % v roce 2020.
Studie Digital Universe ale také ukazuje, že využití vytvořených dat silně pokulhává, neboť většina jich leží v neoznačených souborech nebo jiných nestrukturovaných zdrojích, takže o nich vlastníci vědí jen málo. V roce 2012 by přitom bylo možné s nástroji Big Data získat užitečné informace z 23 % (643 exabajtů) dat v digitálním vesmíru, pokud by byla označkována a podrobena analýze. Momentálně jsou však značkami opatřena jen 3 % potenciálně užitečných dat a analyzuje se jich dokonce pouze 0,5 %.
Ještě výrazněji představená studie varuje před malým zabezpečením dat. Objem těch, která vyžadují ochranu, totiž roste rychleji než samotný digitální vesmír. V letošním roce vyžadovalo nějaký typ zabezpečení zhruba 35 % informací v digitálním vesmíru, reálně se ale ochrana uplatňuje jen u 20 % informací.
Tento rozdíl mezi objemem dat se skrytou hodnotou a objemem reálně získané hodnoty, mezi požadovanou a skutečnou úrovní ochrany dat a také rozdíly v zeměpisném rozložení světových dat označuje studie, která letos vychází již pošesté, jako “velkou datovou propast“.
Další zjištění:
• Se zvyšující se důležitostí role, kterou ve správě pomocí nástrojů big data hraje cloud computing, se očekává nárůst počtu serverů po celém světě na desetinásobek a zvýšení objemu informací spravovaných přímo v podnikových datacentrech na čtrnáctinásobek.
• Také typ dat ukládaných do cloudů čeká v nejbližších letech radikální proměna. IDC předpovídá, že v roce 2020 bude 46,7 % dat uložených v cloudu souviset se zábavou – nepůjde tedy o podniková data. Zbytek budou představovat data z bezpečnostních systémů, integrovaná a zdravotní data a informace vytvářené počítači, telefony a zařízeními spotřební elektroniky.
• Objem informací, které jsou v digitálním vesmíru uloženy o jednotlivých uživatelích, převyšuje objem dat, která tito uživatelé sami vytvářejí.
• Do správy digitálního vesmíru se aktuálně nejvíce investuje v západní Evropě: 2,49 dolaru na gigabajt dat. Na druhé místo se řadí Spojené státy, jež investují 1,77 dolaru na gigabajt, následuje Čína s 1,31 dolaru na gigabajt a Indie s 0,87 dolaru na gigabajt. Studie IDC předpokládá, že celková „provozní“ investice do infrastruktury digitálního vesmíru, tj. hardware, software a služby, naroste o 40 % od roku 2012 do 2020.
• Infrastruktura digitálního vesmíru je stále propojenější. Informace tak nejsou uloženy v regionu, kde se spotřebovávají, a není to ani nutné. IDC odhaduje, že v roce 2020 bude téměř 40 % všech dat nějak dotčeno technologií cloud computingu, tedy že budou v nějakém okamžiku mezi vznikem daného bajtu a jeho spotřebováním uložena nebo zpracována v cloudu (a to jak ve veřejném, tak v privátním).