ビッグデータ、IoT、そして機械学習──。今日における企業ITのトレンドは、基本的に一つの方向へと向かっている。それは、大量データの収集・分析、あるいは機械学習・ディープラーニングによって、ビジネス上の知的な意思決定や業務プロセスを、より科学的に、ないしは自動的に行うことだ。その一方で、「サーバハードウェアのアーキテクチャはどの製品も基本的に同一」と考え、データベース基盤として何を使うかの選定よりも、ソフトウェア的なデータベースのチューニングのほうに、より多くの時間を割こうとする企業は多い。果たして、その考えは本当に正しいのだろうか。サーバのハードウェアはどれを選んでも同じで、何を選んでも、データベースの処理性能やTCOには大差がないのだろうか。このシンプルな疑問への解を、大量データの分析処理に日夜取り組む楽天技術研究所のキーパーソンと、日本を代表するシステムベンダー、富士通に求める。
ヴァイスオフィスマネージャ
宮谷 英理氏 開発のEngineerからArchitect, Senior Development manager and Marketing managerとしての17年間の経験を経て、楽天株式会社へ2006年に入社。急速に発展する開発組織を人/物/金/情報において推進と運営に従事。
現在は楽天技術研究所にて、産学連携の強化と研究支援の組織化をリードしながら、R&Dの橋渡しとなるArchitecture & Core Technology Platform Departmentの各部署を管理。
東京理科大学大学院 総合科学技術経営研究科(MOT) 技術経営修士卒業
また電気通信大学 非常勤講師、筑波大学 研究員、早稲田大学 情報生産システム研究センター 嘱託(Adjunct Researcher)、日本感性工学会 会員を努める。
プラットフォーム技術本部
プリンシパルプロダクトプランナー
志賀 真之氏 ハード開発・アプリ開発の経験を経て1991年富士通株式会社に入社。UNIXサーバにおけるハードウェア開発(ASIC開発等)、サーバアーキテクチャー設計、製品企画、テクニカルマーケティング等を担当。
サーバ製品の性能ベンチマークでは、国内外で数多くのチューニングを経験し、ハードウェア・ドライバ・ミドルウェア・アプリケーションまで動作原理から理解してチューニングするスキルを習得。
社内の様々な部門、社外のソフト・周辺機器ベンダーの技術スペシャリストと関わりを持ち、新しいソリューションを次々と開発して、お客様に適用している。
「富士通の製品と活用技術で、お客様の事業に貢献する」をテーマに製品開発、ソリューション開発、サービスまで担当分野は多岐に渡る。
大規模データ処理を巡る課題
楽天技術研究所は、先端ITによって、楽天グループの事業にイノベーションを引き起こすことをミッションとしている。楽天には、多種多様なハードウェア/ソフトウェアが導入され、あたかも先端技術の見本市のような様相を呈しており、そのため楽天技術研究所の研究分野は、クラウドコンピューティングから、ハイパフォーマンスコンピューティング、ネットワークオプティマイゼーション、データマイニング、AI(ディープラーニング)などと多岐にわたっている。
そんな楽天技術研究所にとって、大量データの分析処理の高速化は、力を注ぐ研究領域の1つだ。同研究所の設立者であり、代表を務める森正弥氏は言う。
「大量データ分析は、我々の研究のトッププライオリティに位置づけられています。楽天が分析の対象とすべきデータは極めて膨大で、多数の業務システム間でやり取りされています。そのため、データの集約・抽出・分析といった各処理をいかに高速化し、運用を効率化するかが大きな課題となっているのです」
楽天が持つデータの規模は、事業ごとに数テラ~数百テラ・バイト(TB)に及ぶ。また、研究所では、大量データを使ったディープラーニングの研究開発も進めており、「その取り組みは実際にビジネスで活用しているものも多くありますが、データの処理にとてつもなく時間がかかるものも少なくありません」(森氏)という。
さらに、データベース基盤の実運用を考えるとTCO(総所有コスト)の最適化も重要だ。
「楽天グループでは、システム運用の統合化を推進しており、サービスによってはインドのオペレーションセンターで集中管理を行ったりしています。このようなグローバルオペレーションを取り入れることで運用にかかるコストはかなり抑制をしてきていますが、ソフトウェアのライセンスコストについては、さらなる最適化を図りたいところです」と、楽天技術研究所 技術推進室 ヴァイスオフィスマネージャの宮谷英理氏は語る。
一方、データベース基盤の実運用では、データバックアップの効率性や確実性を高めることも重要だと、森氏は言う。
「データのバックアップについては、ルーチン的な作業が半自動的に行えることや、いつでも戻したいポイントに遡って、データを簡単にリストアできることが理想です。いざという時に戻せないと大きな問題になります」と、森氏は指摘する。