;

Co open-source Hadoop ve Windows znamená pro IT (1.)

22. 5. 2013
Doba čtení: 3 minuty

Sdílet

 Autor: © Sergey Nivens - Fotolia.com
Hadoop je téměř synonymem analýzy velkých dat. Hortonworks Data Platform pro Windows je velice významným počinem, neboť společnosti, které neoplývají odborností v Linuxu, budou moci využít platformu analýzy velkých dat, která dosud ve Windows chyběla.

Analýza velkých dat je pojem, který se na úrovni byznysu usazuje v posledním zhruba roce. Jednou z nejdůležitějších platforem takové analýzy je pak open-source projekt Apache Hadoop. Ten obecně běží na Linuxu a je využíván některými velice známými společnostmi, jako je Yahoo!, Facebook či Twitter.

Hortonworks Data Platform (HDP) pro Windows

V následujících měsících se však změní jedna zásadní věc, a sice ta, že Hadoop míří na Windows ve formě Hortonworks Data Platform (HDP) pro Windows, plně podporované open-source distribuce Hadoopu, která běží na Windows Serveru. (Hortonworks, společnost sídlící v Kalifornii, je sponzorem a přispěvatelem projektu Apache Hadoop a již nyní nabízí svou Linuxovou HDP distribuci na komerční bázi.)

To Hadoopu otevře dveře do mnoha organizací, které nemají patřičné interní schopnosti v Linuxu. Shaun Connolly, viceprezident pro korporátní strategii ve společnosti Hortonworks vysvětluje myšlenky, které vedly k přesunu HDP na Windows následujícím způsobem: „V zásadě je to rozhodnutí řízené trhem,“ říká. „Hadoop je postaven pro trh horizontálně škálovatelného komoditního hardwaru, a trh komoditního hardwaru je ze 70 procent tvořen Windows, pokud jde o instalační základnu a odbornost.“

Zaměstnanci ve společnostech používajících pouze Windows budou moci Hadoop jednoduše využít, protože jako nástroj business intelligence pro sledování výsledků Big Data analýzy (ať už Hadoop běží na Windows nebo na Linuxu) může být využit Excel. „Ideálně bychom chtěli, aby si ani nevšímali faktu, že všechno pochází od Hadoopu,“ říká Connolly. „Jestliže mohou koncoví uživatelé konzumovat data bez jakéhokoliv předchozího školení, a to díky nástrojům, jako je Excel, pak získají vyšší hodnotu.“

Z Hadoopu budou moci těžit také IT oddělení používající Windows, protože „ajťáci“ se znalostí Windows budou moci psát Hadoop aplikace s využitím Microsoft VisualStudio a .Net frameworku, a to aniž by museli znát Linux. (Malá odbočka: jak nabídky Hortonworks, tak Microsoftu – viz níže – pro Windows jsou 100% Apache Hadoop – kód nebyl nijak upravován – takže podle Connollyho může být jakákoliv Hadoop aplikace pro Linux jednoduše portována do Windows.)

Ukazuje se však, že HDP pro Windows není jedinou cestou přenosu Hadoopu do Windows. Microsoft potichu pracuje s Hortonworks od konce roku 2011, a redmondský gigant vydá svou vlastní distribuci Hadoopu, kterou nazývá HDInsight. Ta bude k dispozici jako služba běžící v cloudu společnosti Azure, nebo jako produkt, který je určen k tomu, aby byl používán jako základ on-premise privátní cloudové instalace Hadoopu.

Před zhruba deseti lety byl Microsoft striktně proti open-source softwaru, a ironicky je docela možné, že jeho podpora Hadoopu vychází z této staré nevraživosti. Tvrdí to Wes Miller, analytik Directions on Microsoft. „Myslím, že částečným důvodem, proč chce Microsoft Hadoop na Windows, je bezpochyby konkurence, kterou představuje Linux,“ říká Miller.

bitcoin_skoleni

Zároveň ale dodává, že existuje i jiný důvod. „Společnost chce také zajistit, abyste, ppokud používáte Hadoopu, mohli jako BI část používat také BI možnosti SQL.“

Pokračování