Firmám i domácnostem hrozí datový kolaps. Vyplývá to z interní analýzy technologických společností EMC a S&T CZ. Každý uživatel počítače v závislosti na své profesi denně vytvoří megabyty či gigabyty dat. Průměrný uživatel tak ročně vyprodukuje minimálně 40 GB dat, která zahrnují nejčastěji textové dokumenty, e-maily, fotografie a videonahrávky. „Z analýzy vyplývá, že až na výjimky z řad větších firem málokterá firma či jednotlivec řeší ukládání a archivaci dat. Je proto jen otázkou času, kdy dojde ke kolapsu,“ řekl Jan Teuschel, technologický expert společnosti EMC, která je lídrem v oblasti ukládání a archivace dat.
Firmy a zejména domácnosti si totiž do důsledku neuvědomují, že dnes uložená data musí být dostupná nejen příští rok, ale třeba i za desítky let. Experti ze společností S&T CZ a EMC se shodují, že rychlé tempo, kterým data na firemních domácích discích přibývají, znamená reálnou hrozbu. Tou je myšlena situace, kdy potřebná data – například firemní smlouvy či fotografie z dovolené – nejsou dostupná. Datový kolaps může mít řadu podob: „Selhání či poškození úložného disku, jeho zcizení, neúmyslné smazání dat či třeba poškození nebo ztráta záložního média. Během let se může navíc shromáždit tolik dokumentů, že najít ten potřebný je zhola nemožné – ať už na disku počítače nebo v množství záložních disků,“ vysvětlil Vojtěch Dvořák, manažer divize IT služeb společnosti S&T CZ, která patří mezi přední systémové integrátory.
Uchovávání dat vytvořených samotným uživatelem by se dalo ještě zvládnout. Nicméně značnou část ukládaných souborů tvoří kopie dat vytvořených jinde: „E-mail s 5megabytovým obrázkem zaslaný deseti kolegům ubere kliknutím myši na firemních discích 50 MB prostoru. Pokud jde o velkou firmu, denní akumulace dat je nepředstavitelná,“ potvrdil Vojtěch Dvořák ze společnosti S&T CZ. Větší firmy jsou proto přibývajícími daty doslova zavaleny. Šéf informačních technologií společnosti Chevron například tvrdí, že jeho firma denně akumuluje 2 terabyty dat, což je datový prostor, o kterém se ještě před několika lety tvrdilo, že by měl dvěma lidem vydržet na celý život.
Firmy mohou přijít o klíčová data a domácnosti o vzpomínky
Kolaps hrozí zejména těm firmám a jednotlivcům, kteří nemají vypracovaný systém ukládání a archivace dat. Mohou v důsledku o cenné informace navždy přijít nebo je jednoduše nenajdou. Nejde jen o pravidelné ukládání, ale i o to, kam se data ukládají a jak se archivuji. „V případě firem to může ohrozit chod společnosti, domácnosti mohou přijít o jedinečné fotografie svých ratolestí,“ dodal Jan Teuschel ze společnosti EMC. Typickým fatálním omylem je například představa, že data stačí uložit třeba na DVD disk. „Životnost takových médií je v lepších případech deset let, ale disk nemusí být čitelný již po několika letech,“ upozornil Vojtěch Dvořák ze společnosti S&T CZ.
Kam tedy data ukládat? Častou volbou je ukládání dat na pásky – levný a relativně spolehlivý způsob uložení velkého objemu dat. Bohužel může selhat při dlouhodobé archivaci dat. Navíc, pokud je třeba rychle vyhledat například deset let stará data, musí existovat systém, který k nim uživatele rychle dovede. „Pásky jsou v tomto ohledu nešikovné. Při velkých objemech dat může nalezení té správné pásky představovat úkol na několik dní, což je pro firmy neakceptovatelné,“ řekl Jan Teuschel ze společnosti EMC. Navíc i pásky mají omezenou životnost a po dvaceti letech mohou být data nenávratně ztracena.
Převládnou výkonné pevné disky
Jako nejspolehlivější metoda archivace dat se jeví pevné disky. Sice ani ty nemají neomezenou životnost, ale je možné je snadno monitorovat, a pokud se schyluje k poruše, lze data přenést na jiný disk. „Souvisejícím trendem se proto stává budování centralizovaných úložišť dat. Tam jsou systémově ukládána firemní data a s ohledem na jejich důležitost je zajištěna jejich rychlá dostupnost,“ upozornil Vojtěch Dvořák ze společnosti S&T CZ.
Centralizovaná úložiště jsou rozčleněna podle důležitosti ukládaných dat na různé typy. Cena úložného prostoru se odvíjí od typu úložiště, množství uložených dat a doprovodných služeb. „V závislosti na fázi životního cyklu dat ve firmě jsou k dispozici různé speciální funkce pro práci s daty. V případě domácností, ale i menších firem jsou stále populárnější služby pro vzdálené zálohování dat,“ řekl Jan Teuschel ze společnosti EMC. Například služby EMC Mozy za mírný poplatek umožní bezpečné uložení vybraných dat na úložiště dostupné přes internet. „Bezpečnost a dostupnost uložených dat je zajištěna přímo poskytovatelem služby, uživatel se nemusí zabývat správou dat,“ dodal Jan Teuschel.
Hledání jehly v kupce sena aneb K čemu slouží indexace dat
Dalším způsobem, jak dostat data pod kontrolu, je volba důmyslnějšího způsobu ukládání dat. Spoustu místa lze ušetřit například zálohováním odkazů na již existující soubory. „Tím se zabrání nekontrolovatelnému tvoření kopií souborů. Úspory jsou markantní například u firem s mnoha pobočkami. Centralizovaná úložiště mají datové využití kolem 90 procent, přičemž obyčejně se využitelnost pohybuje pouze kolem 40 procent,“ řekl Jan Teuschel ze společnosti EMC.
Problémový není jen objem uchovávaných dat, ale i množství ukládaných souborů. Jak najít mezi desítkami tisíc souborů klíčový dokument, nahrávku telefonu či třeba fotografii? Uživatel je musí být schopen kdykoli najít, což v takovém množství dat nemusí být vůbec jednoduché. „Podle analýzy EMC korporátní data vznikají ze 70 procent chaoticky – nejsou nijak systematicky uložena či indexována. Cílem je dostat těchto 70 procent pod kontrolu,“ řekl Jan Teuschel ze společnosti EMC.
Na trhu se proto stále více prosazují různé typy nástrojů pro indexaci obsahu takzvaných search nástrojů – například Microsoft Search či Google Search. Ty mohou pomoci při hledání v malých objemech dat, například v domácím počítači. „Při větších objemech uložených dat jsou nepoužitelné. Navíc neřeší zabezpečení přístupu. Pro větší objemy dat nastupuje technologie pro centralizovanou správu obsahu, takzvaný content management,“ řekl Jan Teuschel ze společnosti EMC. Tyto systémy zajišťují sofistikovanější správu dat, řeší řadu požadavků jako vyhledávání, zabezpečení či řízení toku dat. Takové systémy se stávají centralizovaným komunikačním kanálem pro přenos a sdílení dat ve firmě. Příkladem může být systém EMC Documentum.
Firmy a domácnosti čelí přívalu dat
Nároky na uložení velkého množství dat stoupají každým rokem. Zatímco průměrná velikost fotografie byla před několika lety okolo 2 MB, nyní díky lepším fotoaparátům a důrazu na vysoké rozlišení mají pět a více megabytů. S příchodem digitální televize a obsahu ve vysokém rozlišení hlad po úložném prostoru ještě více vzrostl. V roce 2006 činilo podle studie IDC množství vytvořených a replikovaných informací 161 exabytů (161 miliard gigabytů). To je třikrát více než všechny knihy, které byly kdy napsány. Ještě lépe si lze toto množství informací představit jako dvanáct komínků knih dosahujících ze Země na Slunce. Do roku 2010 bude toto množství šestinásobné. Při použití analogie s knihami by komínek knih sahal od Slunce až na Pluto a zpět. (zdroj: studie IDC)
E-mail zahlcuje počítače duplicitními daty
Jen kvůli e-mailové komunikaci se každoročně ve firmách i domácnostech naakumuluje obrovské množství dat. Souvisí to s rychlostí internetu, která se každoročně zvyšuje. Podle studie IDC během let 1998 až 2006 počet odeslaných e-mailů rostl šestkrát rychleji než počet uživatelů e-mailu. Zčásti kvůli spamu, ale částečně i proto, že lidé posílají více e-mailů. (zdroj: studie IDC)*
Pro tiskovou zprávu byly využity informace ze studie analytické společnosti IDC The Expanding Digital Universe, kterou sponzorovala společnost EMC.