「ClassCat Analytics Solution Standard Model」は AWS上のマネージドサービスとして提供される。複数のSQLクエリエンジン Presto、Drill、Hive on TezおよびSpark SQLが Hadoopクラスタ上で構成され最適化されているので、手軽に利用可能だという。これらのSQLクエリエンジンは、MapReduceフレームワークには依存せず高速化が図られている。
Prestoは、Facebook社がオープンソースとして公開したSQLクエリエンジンで、PB(ペタバイト)単位のデータセットに対応可能。コーディネータと複数のワーカーから構成されるクラスタ上の分散システムとして動作し、コーディネータに投入されたSQLクエリがワーカーで分散処理される。
分散KVストアCassandraで特に高いパフォーマンスを発揮する。Cassandraは、「ClassCat Analytics Solution Standard Model」のオプションとして追加構成が可能。
Drillは、スキーマフリーなSQLエンジンとして注目され、非構造化データ・半構造化データの扱いにおいて特に優れているという。
非常に多くのNoSQLデータベースやクラウドストレージをサポートしており、MapR-FSやMapR-DBをサポートしているのも大きな特徴だという。Apacheプロジェクトにおいてメジャーリリースも完了している。
Tezは、Hadoop YARNベースのデータ処理アプリケーション用フレームワーク。MapReduceパラダイムを改良することによりHiveの利便性が高まり、パフォーマンスを向上させている。
そして、Spark SQLはSparkが提供するSQLフレームワーク。Sparkは、米University of California Berkeley(UCB)で開発された、クラスタ指向の分散処理フレームワーク。汎用性が高くHadoop MapReduceより高速とされ、インタラクティブなシェルをはじめとして柔軟な使い方が可能だという。
新ソリューション「ClassCat Analytics Solution Standard Model」は、インタラクティブなSQLクエリエンジンを中核としているので利便性が高く、スモールスタートも可能とした構成になっているため、ビッグデータ分析の入門にも最適なソリューション。AWS上のマネージドサービスとして提供されるので面倒な管理も不要だという。
クラスキャットでは、新ソリューション「ClassCat Analytics Solution Standard Model」の提供と併せて、Hadoopディストリビューション・ベンダーによる各種Hadoopソリューションを利用したSparkクラスタ構築・運用のコンサルティングサービスの提供も開始する。