"Velká data", tedy datové sety bez jasně definované struktury, typicky generované provozem na webech, senzory a dalšími zdroji mimo tradiční podnikové aplikace, jsou feonoménem, kterému se věnuje většina dodavatelů velkých databázových systémů. Nebylo proto až tak velkým překvapením, že právě Oracle představil na letošním Open Worldu nový systém pro práci s "Velkými Daty", konkrétně s open source platformami Hadoop a R.
Nový systém Oraclu zahrnující, jak se po akvizici Sun Microsystems stalo již zvykem, jak software, tak vlastní železo, zarhnuje open source distribuci Hadoop, nástroje pro integraci a nahrávání dat, distribuci open source analytického software R a Oracle databázi "NoSQL".
NoSQL znamená přesně to, co název naznačuje, tedy rostoucí sadu databázových technologií, které lze definovat tím, co jim takříkajíc schází, tedy především SQL a obecně různé typy databázové integrity, na druhou stranu umožňují sběr a uchování obrovských objemů dat, která nemají na první pohled žádnou jasnou souvislost (tu lze případně odhalit až další analýzou).
Oracle NoSQL je tak distribuovaná, vysoce škálovatelná databáze s klíčovými hodnotami, kterou lze podle výrobce "snadno instalovat, konfigurovat a spravovat, podporuje různé druhy úloh a poskytuje vysokou spolehlivost v kombinaci se špičkovou podporou Oracle." Mimo marketingové plky je podstatné, že distribuce Oracle R je integrována s databází 11g, což umožňuje, aby si R aplikace "sahaly" pro data do systémů vyžívajících 11g. Za pozornost stojí i skutečnost, že Oracle plánuje tento software nabízet i samostatně, tedy bez "Sunovského" železa. To není až tak překvapivé - Hadoop často běží na výrazně levnějším hardwaru, než je ten od Oracle a vázat produkt z rodiny "Big data" na drahý hardware by znamenalo značný handicap.
Oracle nesdělil v době ohlášení ceny, nicméně je jasné že hlavní konkurencí budou systémy Aster Data, Netezza, Greenplum či Teradata.