日本オラクルは4月23日、非構造化データを取得、整理して「Oracle Database 11g」にロードする目的で最適化されたアプライアンス「Oracle Big Data Appliance」の日本国内での提供を開始した。最小構成税別価格は5190万1612円から。
Big Data ApplianceはSunサーバ18台のフルラックで構成、メインメモリが864Gバイト、CPUは216コア、RAWディスクストレージ容量648Tバイトとなっている。ノード間は40GbpsのInfiniBandで接続される。Linuxディストリビューション「Oracle Linux」の上で稼働する。
米Clouderaが開発する、検証済みHadoopディストリビューションの「Cloudera's Distribution Including Apache Hadoop(CDH)」とApache Hadoop用管理アプリケーションの「Cloudera Manager」も搭載されている。ビッグデータを管理するために設計された分散キーバリューストア(KVS)型データベース「Oracle NoSQL Database(DB)」(コミュニティ版)も搭載している。
NoSQL DBは、高い可用性を維持しながら数百単位でノードを拡張、必要な管理手順を最小化しながらスループットや遅延を予測できるという。NoSQL DBに保管された非構造化データは「Oracle Big Data Connectors」でOracle DB 11gに簡単にロードできるとしている。Big Data ConnectorsとNoSQL DBは、Big Data Applianceとは別に単体のソフトウェアとしても利用することができる。
Big Data Connectorsは非構造化データを取り込むための機能として「Oracle Loader for Hadoop」「Oracle Data Integration Application Adaptor for Hadoop」「Oracle Direct Connector for Hadoop Distributed File System(HDFS)」「Oracle R Connector for Hadoop」を搭載している。
Loader for HadoopはMapReduceプロセスを採用して、データを効率的にOracle DB 11gにロード、Data Integration Application Adaptor for Hadoopは使いやすいGUIを通じてデータ連携ソフト「Oracle Data Integrator」にHadoop/MapReduceプログラムを生成する。Direct Connect for HDFSはOracle DB SQLエンジンからHDFSのデータの円滑なアクセスが可能になるとしている。
R Connector for Hadoopは、オープンソースの統計解析処理の「R」言語とOracle DB 11gを統合させることができる。HadoopのファイルシステムであるHDFSとMapReduceプログラミングフレームワークにネイティブに高性能なアクセスを提供できるという。これにより、R言語のアプリケーション上でHadoop内のデータを組織化、処理、分析する基盤を形成できるとしている。
Big Data ApplianceとBig Data Connectorsは、同社のデータベース専用機「Oracle Exadata Database Machine」やアプリケーションサーバ専用機「Oracle Exalogic Elastic Cloud」、分析専用機「Oracle Exalytics In-Memory Machine」とInfiniBandで接続でき、企業が保持するデータの利活用を模索する中で、ビッグデータの取得、体系化、分析するための必要なすべての機能を提供できるという。
2011年11月に来日した、米Oracleでシステムズ事業のストラテジックエンゲージメントのシニアディレクターを務めているShane Sigler氏はZDNet Japanの取材に対して、「Big Data Applianceでデータを取り込み、Exadataに格納。そのデータをExalyticsから複雑な分析をすることもできる」といった活用方法を紹介している。
Big Data Applianceは同社の“Engineered Systems”の一環。2011年10月に米Oracleが開催するイベント「Oracle OpenWorld 2011」で発表された。