データ解析言語 R に対応した Spark クラスタ・ベースのビッグデータ解析基盤

SQL・ストリーミング・機械学習に対応したライブラリも

 クラスキャットは、Apache Sparkクラスタ・ベースのビッグデータ解析基盤「ClassCat Analytics Stack for Spark」を、9月1日から提供することを発表した。

[公開日]

[提供元] entrepedia

  • ブックマーク
  • このエントリーをはてなブックマークに追加

 「ClassCat Analytics Stack for Spark」は、ビッグデータ解析で注目されるApache Sparkを軸にHadoopエコシステムを配備して構築されたオープンソースのソフトウェア・スタックで、IBM SoftLayerベアメタル(物理サーバ)上で提供される。

 スケーラブルな拡張にも対応しているため、ベアメタル1台から始めることも可能だという。データ解析言語Rに対応している点も特徴で、データサイエンティストの利用に最適なデータ解析基盤だとしている。

 「ClassCat Analytics Stack for Spark」は、データ解析エンジンとしてApache Sparkの最新ステーブル版(1.4.1)を使用している。Apache Sparkは、Apacheトッププロジェクトとして開発が進められているクラスタ指向の分散処理フレームワークで、次世代ビッグデータ解析プラットフォームとして注目されている。

 Apache Sparkの設計主眼は、高速性と汎用性で、Hadoop MapReduceより高速とされ、インタラクティブなシェルをはじめとする柔軟な使い方が可能だ。また、SQL・ストリーミング・機械学習に対応した有用なライブラリも豊富に提供されているという。