Lekce první: Cloud nikdy neodpouští
Protože vaše data mají hodnotu, chcete, aby byla zálohována a replikována kvůli obnovení po potenciální katastrofě či selhání systému. To vám zajistí jakákoliv cloudová služba na komerční úrovni. Fajn.
Teď popřemýšlejte nad tím, jak to tyto služby dělají. Mají stovky tisíc uživatelů pohybujících se na stejných serverových clusterech. Jejich replikační služby, které zpracovávají data všech těchto uživatelů, musejí neustále streamovat aktualizace ze sestav lokálních disků na vzdálené místo (místa) obnovy po katastrofě. Protože se to děje non stop, musí být jejich replikace optimalizována pro vysoký výkon, nízkou odezvu a rychlou dobu obnovy. Je však téměř nemožné tuto službu zároveň optimalizovat pro jednoduché zbavování se souborů.
Takže ve chvíli, kdy smažete záznam, neprojeví se toto smazání v každé verzi, která kdy byla uložena v systému. Záznam nebo soubor vám zmizí z očí, ale to neznamená, že byl smazán úplně.
Proč by vás to mělo zajímat? Příště, až budete procházet právním procesem s bývalým nespokojeným zaměstnancem, s konkurencí nebo s kýmkoliv jiným, najme si chytrý žalobce jako svědka forenzního experta, aby prošel všechny soubory a záznamy, o nichž jste si mysleli, že byly smazány.
Lekce druhá: Data v cloudu potřebují obsluhu
Protože jsou vaše data vždy cennější než systém, na němž jsou uložena, potřebují data v cloudu člověka, který se o ně bude starat. Nejde o systémového administrátora, spíše o byznys analytika, který může dělat následující:
- Označovat, jaká data by měla, a – co je ještě důležitější – jaká by neměla být uložena na cloudu. To vám pomůže vyhnout se tomu, že tato data někdy někdo objeví, či že vaše firma nebude (byť nevědomky) fungovat v souladu s právními normami či jinými pravidly.
- Být správcem smyslu dat. Patří sem takové ty malé věci jako „Co je to zákazník?“ nebo „Jaké jsou dopady opožděného vyřízení případu?“
- Stanovit pravidla pro označování souborů a souborové stromy, adresáře a další hierarchické vztahy, jako je „mateřský účet“ versus „operační divize“.
- Sloužit jako hlídač importů a dat, které proudí systémem, a zajišťuje jasnou sémantiku a dále to, aby byly zdroje znečištění filtrovány a opravovány přímo u zdroje.
- Vyvíjet správné procedury pro zálohy, spojování záznamů či vytváření mateřských vztahů mezi záznamy. Nevěřili byste, kolika různými způsoby je možno pokazit tohle – a kolik týdnů zmařené práce vás čeká kvůli jedné (dobře myšlené) chybě.
- Potvrzovat výsledky reportů a zajišťovat, aby byly pro filtrování a uskupování použity správné proměnné. Příliš často různí manažeři stejných firem zakládají svá rozhodnutí na zcela jiných datech, což vede k nekonečným zmatkům.