;

EMC World 2011: Velká data, privátní cloud a ECM jako služba

17. 10. 2011
Doba čtení: 7 minut

Sdílet

Mnohem víc než konference o úložištích a virtualizaci – letošní ročník EMC Worldu se počátkem května v Las Vegas zaměřil zejména na práci s velkým objemem nestrukturovaných dat, privátní cloud a správu.

Během úvodních plenárních přednášek připomněli Jeremy Button, Joe Tucci a Pat Gelsinger z EMC řadu trendů a fenoménů, které rozhodujícím způsobem ovlivňují práci s daty a uvádění privátních a veřejných cloudů do provozu. Podle Buttona bude pro řadu zákazníků letošní rok o zrychleném tempu nástupu cloudového modelu provozování IT – zejména v oblastech, jako jsou uchovávání a analýza velkých objemů dat. EMC proto nabídne nový školicí program a certifikát „cloud architect“ (tomu se podrobněji věnujeme v krátkém rozhovoru) a v návaznosti na konferenci též uspořádalo Data Scientists Summit, setkání expertů na ukládání a analýzu informací.

Joe Tucci se mezi dalšími věcmi zaměřil na otázku bezpečnosti, s níž bojují i velcí zákazníci – 88 procent z Fortune 500 společností v minulém roce zaznamenalo aktivitu botnetů a 60 procent čelilo kompromitaci vlastních e-mailů malwarem, který byl vytvořen v minulém roce. Podle Tucciho je nejjednodušší cestou, jak bezpečnostní situaci zásadně zlepšit, přechod k modelu „IT jako služba“ ve formě hybridního cloudu. Nejúspěšnějším modelem podle Tucciho bude v první fázi migrace vlastní infrastruktury na provozní model privátního cloudu a následné vytipování veřejných poskytovatelů, k nimž bude možné postupně většinu provozu přemigrovat. Tucci také připomněl řadu akvizic, které EMC na své „cestě ke cloudu“ v posledních letech udělalo – VMware, RSA, Data Domain, Isilon a nedávno též Greenplum – právě novinka Greenplum HD patřila mezi nejvýznamnější oznámení konference.

Agresivnější slůně

Hadoop je podle zástupců EMC v současné době relevantní pro většinu podnikových uživatelů, nikoliv jen pro největší a nejrozvinutější internetové společnosti. Většina dosavadních řešení využívajících filozofie MapReduce a frameworku Hadoop byla zatím příliš „akademická“, zaměřená na hardcore softwarové inženýrství, a nikoliv pro běžné nasazení u podnikových uživatelů. EMC chce s využitím databázových technologií Greenplum (akvizice proběhla v minulém roce) vytvořit řešení, které bude kombinovat tradiční přístupy k BI s možnostmi analýzy a ukládání velkých objemů dat (řádově petabajty) pomocí Hadoop.

EMC Greenplum HD je podle výrobce „Apache Hadoop připravený pro podnikové nasazení“. EMC kolem Hadoop vytvořilo kompletní strategii zahrnující distribuci, integraci a podporu open source frameworku Apache Hadoop coby podnikového nástroje pro analýzu velkých objemů dat. Součástí strategie je uvedení specializovaných, vysoce výkonných Hadoop zařízení pro analýzu strukturovaných i nestrukturovaných dat. EMC bude na uvedení nástrojů a řešení pro práci s Hadoop pracovat s řadou partnerů. Vlastní produkty, které nabídne EMC Greenplum HD, zahrnují dvě distribuce Hadoop (plně open source) a jedno integrované řešení.

Data Computing Appliance

Úzce integrované řešení zahrnující kromě distribuce Apache Hadoop také Greenplum Database. Jako hardware budou použity běžné komoditní servery s klasickými disky SATA v konfiguracích JBOD (jednou z hlavních výhod Hadoop je právě schopnost pracovat na cenově nenáročném železe úložišť), speciální jsou ale systémová rozhraní umožňující propojení velkého množství serverů. Data jsou uložena v HDFS (Hadoop Distributed File System), přičemž je možné paralelně číst a zapisovat soubory z Greenplum databáze do HDFS pro snadné a rychlé sdílení dat. Analýza dat napříč platformami je možná díky Greenplum SQL a pokročilým analytickým funkcím HDFS. Podle výrobce se tak jedná o jedinou dostupnou kompletní platformu pro analýzu velkých objemů dat.

Enterprise Edition

Jedná se o Apache Hadoop s plnou kompatibilitou rozhraní, díky tomu jsou zachovány přenositelnost a napojitelnost aplikací, a zároveň byly doplněny pokročilé funkce požadované podnikovými uživateli:

  • funkce pro správu dat, jako jsou snímky a replikace rozsáhlých částí,
  • jednoduché nahrávání dat a přístup k nim prostřednictvím systému NFS (native network file system),
  • kompletní správa včetně tvorby jednoduchých clusterů, automatické detekce a upozornění na selhání, správy více lokalit a updatů,
  • EMC navíc slibuje dvou- až pětinásobně vyšší výkon ve srovnání se standardními balíčky/distribucemi Apache Hadoop.
  • Community Edition

Komunitní edice je plně open source certifikovaná a podporovaná verze stacku Apache Hadoop, zahrnující HDFS, MapReduce, Zookeeper, Hive a HBase. EMC Greenplum navíc nabízí odolnost proti chybám pro Name Node a Job Tracker.

EMC zároveň oznámilo vytvoření ekosystému s dvanácti partnery, kteří nabídnou business intelligence, přenos dat a další technologické doplňky, jedná se o společnosti Concurrent, CSC, Datameer, Informatica, Jaspersoft, Karmasphere, Microstrategy, Pentaho, SAS, SnapLogic, Talend a VMware. Divize EMC Global Services zároveň nabídne novou řadu služeb, školení a technické podpory pro datové sklady a podnikovou analýzu včetně Enterprise Business Analytics Assesment Service.    



EMC Cloud Architect

 

Jednou z novinek oznámených na letošním EMC Worldu je certifikát Cloud Architect. Toma Clancyho, viceprezidenta pro vzdělávací služby v EMC, jsme se právě na oblast specializací pro cloud během konference měli možnost zeptat.

CIO BusinessWorld: Jaké dovednosti a specializace budou potřebovat CIO a jejich podřízení pro nasazování různých druhů výpočetního mraku?

Tom Clancy: Jsou to především znalosti z řady technických oblastí – od síťové infrastruktury přes správu úložišť typu SAN po virtualizaci. Podniky v závislosti na velikosti potřebují architekty, správce a v některých případech i programátory s těmito odbornostmi. Zatímco některé oblasti jako třeba SAN začínají být poměrně dobře pokryté, objevují se nové – například datoví specialisté.

CIO BusinessWorld: Kde by podle vás CIO měli tyto odborníky hledat? Mají si je vychovávat sami?

Tom Clancy: V EMC se snažíme rozšiřovat spolupráci s univerzitami. Ty se v minulosti soustředily zejména na klasické vzdělávání v oblastech, jako je programování v C či Javě, a technické specializace, jako jsou datová úložiště, byly opomíjeny. Navazujeme proto spolupráci s technickými univerzitami po celém světě, jejímž zajímavým výsledkem je například kurz „architekta pro cloud“, který jsme v nedávné době připravili a jenž zahrnuje i EMC certifikát.

CIO BusinessWorld: O cloud architektech jsme už slyšeli, jaké specializace by podle vás taková odbornost měla zahrnovat?

Tom Clancy: Základy by měly být Cisco CCDA, dále VMware VCP a konečně z oblasti storage náš vlastní certifikát ISM. To jsou, společně s alespoň třemi roky praxe, základní předpoklady pro vstup do kurzu Cloud Architect – Virtual Infrastructure. Na to navazuje další kurz, IT as a Service.

ICTS24

CIO BusinessWorld: A co byznys odbornost? Předpoklady, které zmiňujete, jsou spíše technické či infrastrukturní povahy, jaké znalosti by ale architekti měli mít z oblasti byznys procesů?

Tom Clancy: Ta je důležitá zejména pro navazující kurz, který se točí především kolem katalogu služeb, procesů, metrik a souvisejících témat.