Cloudera 5.8で分析データの最新化を図る

投稿:2016年7月29日 Alex Gutow
Categories: Product

分析ワークロードや「過去に起こったこと」を探し出す機能は、現在の企業において最も一般的なユースケースになっています。分析結果がビジネスの健全性を教えてくれるだけでなく、変化の傾向をベースに、何をどのように適用し改善すべきなのかという内容を理解することができます。しかし、ほとんどの企業はその一部を理解できているに過ぎません。分析機能は、蓄積できるデータ量、特に可能なアクセス手段により制約を受けますが、新しいデータセットを取り入れたり、柔軟性を欠くスキーマに非構造化データを取り込んだりすることは困難です。さらに分析を行おうと考えデータにアクセスしようとしても、その自由度は限定的で予め決められた方法でしか利用が許されない状況にあります。

ビッグデータがこのようなやり方を破壊していると言っても、決して過言ではありません。データは現在のビジネスを変革する可能性を秘めていますが、既に限界に達している既存のシステムでは、この可能性の具現化は望めません。ClouderaのHadoopベースのプラットフォームは、お客様がこの限界を打ち破り、セルフサービスBIや探索的分析ワークロードを実装するための支援を長年実施してきました。Cloudera 5.8のリリースと同時に、Clouderaでは、Cloudera Enterpriseをもっとも適応性の高いハイパフォーマンスなデータベースとするための機能向上の取り組みを継続しています。

Cloudera Navigator Optimizer

本リリースの大きな機能追加の1つとして、Cloudera Navigator Optimizerの一般リリース (GA) があります。Cloudera EnterpriseとHadoopは、既存のデータウェアハウスに柔軟性を与え、新しいワークロードの導入を可能にする優れたコンポーネントです。さらにインタラクティブSQLエンジンであるImpalaによって、従来の分析データベースを高いパフォーマンスと拡張性を持つClouderaのプラットフォームで置き換えることが可能になります。しかし、ワークロードがどちらのシステムにもっとも適しているかを理解できなければ、オフロードするワークロードを事前に決定し、データモデルをHadoopの特性やテクノロジーに合わせて最適化することはできません。特にレガシーなシステムの使用状況を限定的にしか把握できないデータベースアドミニストレータ (DBA) にとって、これは腰が引ける作業と言えるでしょう。Cloudera Navigator Optimizerは、このような状況を一変させます。

Navigator Optimizerは、当初からHadoopが分析データベースとして上手く機能し、またビジネスの要件に合わせ容易に変更できるようにします。本ツールによって、既存のSQLワークロードを分析し、ビジネスワークロード全般の状況把握やリスク評価を実施の上、リスクや開発コストに基づいた総合的なオフロード戦略や計画を立てられるようになります。適切なETLやBIワークロードを移行した後も、使用状況の変化に合わせてNavigator Optimizerによる分析を続けることで、DBAは、Apache HiveやApache Impala(Incubating)などのHadoopテクノロジーが、最大のパフォーマンスを発揮できるよう、データモデルを管理したり変更の提案を行うことができます。

Navigator Optimizerの詳細については、以下のデモビデオをご覧いただくか、Tech Blogをご覧ください

クラウド上でのハイパフォーマンス分析

Clouderaの多くのお客様が、パブリッククラウド・インフラストラクチャー上で分析ワークロードを稼動させています。クラウド上で大量のデータが発生してストアされるようになると、この環境に合わせて最新のデータプラットフォームを拡張できることが重要になります。Cloudera Enterpriseは、異なるクラウド環境やハイブリッドクラウド環境にHadoopを導入して管理するための最先端のエンタープライズプラットフォームです。本プラットフォームによって、Hadoopソリューションをどんな環境でも容易に管理し、包括的にセキュリティを維持できるようになります。また、その核となる分析コンポーネントがサポートするデータは、オブジェクトストアとして保存されます。

Clouderaでは、以前のリリースで、HiveとApache SparkのAmazon S3のサポートを発表し、クラウド上でのETLや、データ準備のための強力な処理機能提供の道を開きました。Cloudera 5.8では、さらにImpalaでもAmazon S3をサポートするようになりました。今やビジネスアナリストは、ハイパフォーマンスな探索的分析やBIのための最も優れた分析SQLエンジンを併用しながら、瞬時に分析結果を得ることができます。

さらに、アクセスパターンや要件変更に応じて、分析データベースに必要な処理能力を弾力的に拡大縮小できるため、運用コストの低減にもつながります。

クラウド環境における分析ワークロードの詳細については、今後もブログのポストをご注目ください。

SQL開発エクスペリエンスの向上

Hadoopでデータ分析を行うための著名なWebインタフェースであるHueもまた最新リリースに合わせアップグレードされ、SQL開発者に対するユーザーエクスペリエンスの向上が図られました。SQL開発者は、同じHueインタフェースから、quickviewsを使って使用可能なテーブルを容易に表示し検索することができるようになりました。また、自動補完型の提案機能を使って、迅速なクエリ設計が可能になったほか、クエリ実行前のデバックを即時にアシストし、効率的なトラブルシューティングが行えるようになりました。さらに、他のユーザーやグループと共にセキュリティを維持しながらクエリや実行結果を共有できるようにするための直接アクセス許可を設定できるようになりました。

詳細は次のデモビデオをご覧ください。

Cloudera Enterprise 5.8は、今すぐcloudera.com/downloadsからダウンロードすることが可能です。Cloudera Enterprise 5.8で分析データベースを強化する方法を理解したいとお考えの皆様は、ウェビナーシリーズへの登録やDeveloper Blogの参照をお願いします。

One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.