Dockerがビッグデータ基盤に新たな風を生む
今、Dockerの登場により、ビッグデータの世界に新たな風が生まれようとしています。技術の新潮流として、大規模インメモリ処理、大量のデータ処理を必要とするビッグデータの世界において、少しずつですが、ビッグデータ処理基盤ソフトウェアをDocker基盤で稼働させる気運が高まっています。Dockerを使うことで、ユーザーの利便性、ビッグデータ処理基盤の利用の高効率化が期待されているのです。
具体的には、ビッグデータ分析やその他の業務処理をDocker環境で相乗りさせるといった利用方法です。Docker環境ならば、例えば、1つの物理基盤上で昼夜に別々の業務アプリを切り替えて稼働させることも可能です。しかも、従来の「ハイパーバイザー型の仮想化」とは異なり、Dockerの場合は、性能劣化がほとんどないという特徴をもっていますので、性能劣化が許されないビッグデータ分析の業務をDocker環境で稼働させるというアイデアが生まれるのも当然です。つまり、Dockerによって、従来の業務用途別に用意していた別々の物理基盤の集約だけでなく、仮想化の性能劣化を排除も実現でき、さらにはOS環境やアプリの切り替え処理といった「IT資源の配備と廃棄」も比較的簡単にできるため、ビッグデータの利活用を視野に入れているIT部門から熱い視線が送られているのです。
Dockerによる革新(ビッグデータとその他の業務を同一基盤に同居)
このようにDockerによって、ビッグデータ処理基盤の在り方というものが従来とはガラリと異なる可能性を秘めています。2016年時点では、SequenceIQ社(HadoopディストリビュータのHortonworks社の傘下になりました)が、ビッグデータ処理をDocker環境で稼働させることに取り組んでいます。
SequenceIQは、Dockerイメージとよばれる「OS環境とアプリケーション」をひとまとめにしたものをコミュニティに提供しています。このDockerイメージは「Linux OS環境とビッグデータ処理基盤ソフトウェアのHadoop」で構成されており、ユーザーはそのDockerイメージをインターネット上から入手し、Docker環境上に保存することで、あまり手間をかけずにHadoopによるビッグデータ処理基盤を利用できるようになっています。Linux OSそのものやHadoopのインストールといった煩雑な準備作業を省いて、ビッグデータ基盤の配備の手間を大幅に省力化することができるのです。
Dockerによるビッグデータ基盤配備の省力化
このように、Dockerによって、ビッグデータ処理基盤の配備を大幅に省力化できることは、従来のIT基盤配備のあり方を根底から覆します。本来、ビッグデータを分析したいエンドユーザーは、本業ではない物理サーバの準備や、Linuxのインストール、Hadoopの設定といった煩雑なインフラ配備の作業を行いたくありません。従来のDockerがない環境では、そのような煩雑な作業をIT部門が固定的に用意して、分析を行うエンドユーザーに提供していました。ここでDockerが登場したことによって、サーバの準備、OSのインストール、Hadoopの設定作業は、あらかじめ用意されたDockerイメージの入手という単純作業に置き換えることができます。
また、入手したHadoop入りのOS環境のDockerイメージを使って、単一の物理基盤上に、Linux OSの種類やバージョンが異なる複数のDockerコンテナを同時に起動させることが可能です。別のバージョンのHadoopが入ったOS環境のDockerイメージを複数用意しておき、同時に稼働させることも可能ですので、エンドユーザーだけでなく、Hadoopアプリケーションの開発者にとっても非常に好都合です。
すなわち、IT部門が固定的なビッグデータ環境を整備しなくても、Docker環境があれば、ある程度、エンドユーザーやアプリケーション開発者自身で複数のビッグデータ環境を少ない手順で利用・廃棄できるようになったのです。これはまさしく、IT基盤におけるユーザーの「セルフサービス化」を意味します。セルフサービス化が進むと、IT部門の運用の負担が軽減される傾向にあり、また、ユーザーの利便性が向上すると、IT基盤自体の利用率も向上します。このように、Dockerは、IT基盤のユーザーの利用効率の改善、運用管理側の負担軽減が大いに期待できるのです。
- 古賀政純
- 日本ヒューレットパッカード オープンソース・Linuxテクノロジーエバンジェリスト
兵庫県伊丹市出身。1996年頃からオープンソースに携わる。2000年よりUNIXサーバのSE及びスーパーコンピュータの並列計算プログラミング講師、SIを経験。2006年、米国ヒューレットパッカードからLinux技術の伝道師として「OpenSource and Linux Ambassador Hall of Fame」を2年連続受賞。プリセールスMVPを4度受賞。現在は、日本ヒューレットパッカードにて、Linux、FreeBSD、Hadoop、Dockerなどのサーバ基盤のプリセールスSE、文書執筆を担当。Red Hat Certified Virtualization Administrator、Novell Certified Linux Professional、Red Hat Certified System Administrator in Red Hat OpenStack、Cloudera Certified Administrator for Apache Hadoopなどの技術者認定資格を保有。著書に「Docker実践ガイド」「CentOS 7実践ガイド」「Ubuntu Server実践入門」などがある。趣味はレーシングカートとビリヤード。