Cloudera、初の再帰的Hadoopスタックのリリースを見合わせていることを発表 #エイプリルフール

投稿日: 2015/04/01

これはエイプリルフール記事です。以下の内容についてのご質問等には一切お答えしかねますのでご了承ください。

MapReduceの使いやすさとHiveのスピードを保証します!

2015年4月1日 カリフォルニア州パロアルト:Apache Hadoop™を搭載したエンタープライズ向けデータ分析・管理システムのリーダーであるClouderaは、本日 Spark-on-Hive-on-MapReduce-on-Spark-on-Oozie-on-HBase-on-Hive-on-Spark-on-Flume-on-HDFS-on-Impala-on-Spark-on-Hive-on-MapReduce-on-Spark-on-Oozie-on-HBase-on-Hive-on-Spark-on-Flume-on-HDFS-on-Impala-on-Spark-on-Hive-on-MapReduce-on-Spark-on-Oozie-on-HBase-on-Hive-on-Spark-on-Flume-on-HDFS-on-Impala-on-…、つまり業界初の真の再帰的なデータプラットフォームのリリースを見合せていることを発表しました。

再帰的データプラットフォームは、単一でモノリシックなビッグデータ・インフラストラクチャーを構築するために、「プログラミング」と「ソフトウェア工学」の高度な概念に頼る必要があった、とCloudera が誇るコンピュータオタクの Todd Lipcon は語ります。

「Sparkが成熟し、MapReduceが使いやすく、Hiveが理論値の限界まで高速化したようなものを全部備えるシステムを開発してくれと髪のとんがったプロマネから要求されたときは最善を尽くす以外ありませんでしたが、週末も昼夜を問わず働いた結果、マジでヤバい代物を開発することができたと感じました」と、Lipconは語ります。「めちゃめちゃエキサイティングな時間でした」

Clouderaのお山の大将でバイスプレジデントのCharles Zedlewskiは次のように述べています。「ご存知のように、ビッグデータコミュニティは(我々も含まれるのですが)あまたあるテクノロジーの中から必要なものを選択するのにうんざりしているのです。全てのジョブ、タスク、そしてクエリをシステムの別個の部分で実行するよりもうまくリスクヘッジする方法には何があるのでしょうか?事実なのは、永遠に完了しないクエリの中には、技術的に難解なものと思われているか、あるいは議論の余地はあるかもしれませんが、仕様であると見なされるものもあるということです。」

「再帰的エンタープライズデータハブ(R-EDH)の潜在的に無限の数のサービスを効率的に管理できるようにするために、Cloudera ManagerはCloudera Manager自身をYARNまたはSpark、Spark-on-YARNで実行させるようになるでしょう。これらはもちろんそれ自身がCMインスタンスによって管理されます。つまり、CMを管理するCMを管理するCMを管理する(略)CMを管理するCMがCMを管理できるようになるのです」とClouderaのチーフ・タートル・オフィサーのDr. Amr Awadallahは述べています。「Oozie (HBase-on-Hive-on-Spark-on-Flume-on-YARN-on-HBase…で動作する) はひょっとすると追加のCloudera Manager インスタンスを起動するワークフローのスケジューリングに使われるかもしれません。そしてこの全く新しいR-EDHは既存のR-EDHの中に存在しています。自己複製的なR-EDHは最も効果的に、いや、唯一効果的にR-EDHの使用事例を増殖させる戦略だと信じています」とAwadallahは付け加えました。「実際、これまでも”徹頭徹尾カメのようにのろのろ”していましたが、最近は指数関数的にカメっぽくなってきています。」

Clouderaのグローバルセールスの新しいバイスプレジデント、Vishal Raoは興奮して以下のように述べています: 「まだ私には技術的な詳細は十分に明確にはなっていませんが、ライセンス収入の可能性は本当に魅力的です。本当に、本当に魅力的です」

One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.