Car-tech

Cloudera Preps Hadoop для предприятия

Navigator Demo

Navigator Demo
Anonim

Cloudera представила новый набор инструментов управления Hadoop под названием Cloudera Enterprise, что компания будет предлагать годовую абонентскую плату, объявила она во вторник. Он также обновил свой дистрибутивный пакет с открытым исходным кодом Hadoop.

Как новые выпуски, так и несколько новых партнерских отношений с поставщиками программного обеспечения для управления данными, показывают, что компания готовится предложить новую технологию баз данных - теперь в основном используется веб-гигантами, такими как Google и Yahoo, на рынок предприятия в качестве альтернативы реляционным базам данных.

«Наша ставка - это не только крупные веб-компании, но банки, больницы и страховые компании обнаруживают, что им необходимо проанализировать сложные и структурированные данные вместе, и Hadoop был сделан для этого », сказал генеральный директор Cloudera Майк Олсон. «Hadoop решает новую проблему по-новому».

Одно из растущего числа баз данных, отличных от SQL или NoSQL, Hadoop основано на Google MapReduce, платформе для параллельной обработки данных на большом количестве компьютеров узлы. Hadoop, который сейчас разрабатывается как проект с открытым исходным кодом Apache Software Foundation, предлагает альтернативу традиционным реляционным базам данных, по крайней мере, для тех случаев анализа больших быстро изменяющихся наборов данных.

Он может работать как с SQL, так и без него -SQL, и более устойчив к отказу сервера, чем реляционные базы данных, сказал Олсон.

Cloudera занимается упаковкой Hadoop для организаций среднего уровня, как с дистрибутивом Hadoop, так и с недавно выпущенным набором инструментов управления. По словам Олсона, оба пакета должны предоставить организациям без большого технического опыта в Hadoop для запуска программного обеспечения. «Существует этот миф о том, что Hadoop можно использовать, если у вас есть данные с масштабированием Google. Существует много пользователей, у которых всего несколько терабайт данных, которые они хотят проанализировать», - сказал Олсон.

Распределение Cloudera для Hadoop (CDH) пакет с открытым исходным кодом для предварительно интегрированных программ, построенных вокруг Hadoop Common, ранее называвшегося Hadoop Core. В пакет входят: Hive, который обеспечивает инфраструктуру хранилища данных; HBase, база данных, лежащая в основе Hadoop; Pig, компилятор для программ сокращения карты; Zookeper, планирование для запуска приложений на нескольких серверах и MapReduce.

В недавно выпущенной версии 3 пакет включает три программы, которые компания выпустила в виде проектов с открытым исходным кодом под лицензией Apache V2 с открытым исходным кодом. Одним из них является Flume, который может помочь в загрузке данных в Hadoop. Еще одно новое дополнение - Oozie, которое является программным обеспечением для управления рабочим процессом. Последним является код Hadoop User Environment (HUE), который предоставляет пользовательский интерфейс для управления Hadoop.

«HUE позволяет любому создавать приложения, ориентированные на аналитиков, и знает, как разговаривать с кластерами Hadoop», - сказал Олсон.

Пакет Cloudera Enterprise дополняет CDH версию 3 дополнительными инструментами управления. Это новое программное обеспечение, которое не является открытым исходным кодом, позволяет администраторам контролировать управление доступом с помощью протокола облегченного доступа к каталогам.

Олсон не будет обсуждать, сколько Cloudera сделала из подписных и консалтинговых сборов до сих пор, но отмечает, что в первом квартале 2010 года компания сделала столько же, сколько и что он заработал до половины 2009 года. Среди разных отраслей промышленности, финансовые услуги, телекоммуникации, розничная торговля, правительственные и веб-коммерческие компании проявили интерес к этой технологии, сказал Олсон.

«То, что компании делают с Hadoop, варьируется. в общем, эти люди ловят много данных из большого количества мест и нуждаются в том, чтобы подвергать его сложной аналитике », - сказал Олсон. «Финансовые услуги заинтересованы в использовании Hadoop для обнаружения мошенничества. В телекоммуникациях существует настоятельная необходимость в оптимизации сетей и сокращении оттока клиентов».

В дополнение к предлагаемым пакетам, Cloudera объединяет поддержку Hadoop от поставщиков бизнес-аналитики (BI) и программного обеспечения для управления данными.

Олсон планирует объявить в своем выступлении на саммите Hadoop Summit 2010 в Санта-Кларе, Калифорния, во вторник, что поставщик BI MicroStrategy будет поддерживать использование Hadoop.

Еще одним новым партнером является Talend, поставщик программного обеспечения для интеграции данных с открытым исходным кодом. Компания расширила свой пакет Talend Integration Suite для взаимодействия с базами данных Hadoop. Его набор позволяет администраторам управлять и объединять несколько источников данных с одной консоли. С помощью Hadoop программное обеспечение «может изначально вставлять или извлекать данные и обрабатывать данные в архитектуре Hadoop», сказал вице-президент Talend по маркетингу Ив де Монтчеил.

Microstrategy и Talend присоединяются к растущему числу компаний, которые готовят open source или коммерческих инструментов управления для Hadoop. На прошлой неделе Cloudera и Quest приступили к реализации проекта по созданию программного обеспечения, которое может связывать Hadoop с базами данных Oracle. В мае компания с открытым исходным кодом и бизнес-разведкой Pentaho объявила о том, что ее набор BI будет работать с базами данных Hadoop.

В отдельном интервью службе новостей IDG Yahoo CTO Raymie Stata отметил, что Hadoop может уменьшить необходимость в создании суперкомпьютеров для анализа больших наборов данных. Традиционно большие массивы данных были перенесены из хранилища в суперкомпьютер, который представляет собой объединенный набор серверов, которые необходимо проанализировать. Напротив, Hadoop переносит аналитическое вычисление туда, где находятся данные, устраняя необходимость в гигантской машине с хрустом. Yahoo была ранним ведущим спонсором Hadoop.

В дополнение к предложению Cloudera, Hadoop также коммерциализируется IBM, которая недавно начала предлагать набор аналитических услуг, которые используют эту технологию.

Joab Jackson охватывает программное обеспечение для энтерификации и общее новости технологий для Служба новостей IDG. Следуйте за Joab в Twitter на @Joab_Jackson. Адрес электронной почты Joab - [email protected]