„Průměrná firma o 50 zaměstnancích ročně vyprodukuje 2 TB dat, což představuje zhruba 40 GB dat na uživatele,“ řekl Petr Diviš, technologický expert společnosti S&T CZ.
„Ročně ve firemním sektoru vzroste množství dat o 40 až 60 procent,“ potvrdil Vladimír Kyša, odborník na zálohování dat ze společnosti EMC. Nejvíce prostoru na discích zabírá obrazová dokumentace a audiovizuální data, kterých přibývá kvůli postupné digitalizaci veškerých dat – od smluv až například po nahrávky telefonních hovorů se zákazníky. Další digitalizace tempo růstu objemu dat ještě urychlí.
Klíčové informace se mohou v záplavě dat ztratit
Pokud firmy nezačnou ukládání a zálohování dat systematicky řešit, dnes uložená data nemusí být za několik let, či dokonce měsíců dostupná. Případně budou společnosti muset vynakládat více a více financí na stále nová, zejména zálohovací média. Rizika ztráty dat se přitom nezbaví, spíše naopak.
„Čím více zálohovacích médií firma spravuje, tím větší je riziko jejich selhání, poškození nebo ztráty. Během let se navíc může shromáždit tolik dokumentů, že najít ten potřebný bude v záplavě záložních disků zhola nemožné,“ varoval Diviš.
Až 90 procent záložních dat ukládají firmy zbytečně
Lékem na záplavu dat může být odstranění duplicitních, tedy nadbytečných kopií dat – provedením takzvané deduplikace dat. Běžně jde o soubory či části souborů uložené na disku vícekrát – například kvůli chaosu ve firemní síti či nevhodnému způsobu zálohování dat. „V takových firmách i při dodržování běžných pravidel je duplicita zálohovaných dat více než 90procentní,“ upozornil na značné rezervy v zálohování dat Vladimír Kyša.
Avšak ani ti, kdo zálohují data pokročilými metodami (například uchovávají jen změněné soubory), se podle Kyšy nechovají dostatečně úsporně. „Duplicita zálohovaných dat i při úsporném a pravidelném zálohování bývá více než 40procentní,“ podotkl Kyša. V deduplikaci dat je proto možné jít ještě o jednu úroveň výše a zbavit se kopií dokonce na úrovni částí jednotlivých souborů.
Data totiž zbytečně „nafukují“ nikoli nadbytečné kopie souborů, ale identické kopie jednotlivých částí souborů – číslicových bloků –, které se v souborech opakují. „Překvapivě třeba textový soubor, fotografie nebo video obsahují na základní úrovni spoustu společných datových bloků. Nové technologie umějí soubory rozkouskovat na miniaturní částečky a ty pak porovnávat mezi sebou. Pokud se některé části opakují, zbytečně je na disk neukládají,“ vysvětlil Vladimír Kyša princip fungování nejnovějších technologií společnosti EMC.
Zajímavosti ze světa jedniček a nul:
- Nároky na uložení velkého množství dat stoupají každým rokem. V roce 2006 činilo podle studie IDC množství ve světě vytvořených a replikovaných informací 161 exabytů (161 miliard gigabytů).
- To je třikrát více než všechny knihy, které byly kdy napsány. Ještě lépe si lze toto množství informací představit jako dvanáct komínků knih dosahujících ze Země na Slunce.
- Do roku 2010 bude toto množství podle IDC šestinásobné. Při použití analogie s knihami by komínek knih sahal od Slunce až na Pluto a zpět.