こんにちは。日本ヒューレット・パッカードのオープンソース・Linuxテクノロジーエバンジェリストの古賀政純です。前回は、デジタル変革(DX)を実践したNetflixの事例を説明しました。今回は、DXを実現する「コンポーザブルインフラストラクチャー」と「Docker」を導入した巨大研究所の事例を紹介します。
DX実現手段の一つがコンポーザブルインフラストラクチャー
コストの合理化のためのオンプレミス基盤やハイブリッドIT基盤は、大きな転換期を迎えており、そのIT基盤の一つにコンポーザブルインフラストラクチャーがあります。コンポーザブルインフラストラクチャーは、CPU、メモリー、ディスク、ネットワーク機器といったハードウェアリソースをさまざまなアプリケーションに応じて、柔軟に割り当てられる「ITインフラ」です。
具体的には、ユーザーのアプリケーションが持つAPI(Application Programming Interface:ソフトウェア同士が情報をやり取りするための仕様)を通じて、サーバーの電源オン/オフ、BIOS設定、ストレージ、ネットワーク機器のハードウェア設定、OSのインストール、ミドルウェアやアプリケーションの割り当てを自動制御します。IT部門は、エンドユーザーの業務ワークロードのニーズに基づいて、IT基盤のリソースプールからハードウェアリソースを切り出し、ハードウェア・OS導入・コンテナーで稼働するアプリケーションの大規模な変更の多くを自動化できます。事業変化に対する敏捷性の向上に大きく貢献するといった特徴があるため、DXを実現する武器の一つとして、コンポーザブルインフラストラクチャーが導入されています。
コンポーザブルインフラストラクチャーは、Dockerなどのコンテナー管理ソフトウェアや自動化ツールを組み合わせた形で納入され、欧米では多くのユーザー企業でDXに成功しています。コンポーザブルインフラストラクチャーは、IT基盤のリソースの切り出しを容易に行えるため、利用目的の柔軟性が向上します。特にタイムツーマーケットの顧客向けアプリケーションを迅速に提供しなければならない企業では、コンテナー技術とオープンソースの自動配備ツール、ハードウェアの自動設定のためのAPIを駆使できるコンポーザブルインフラストラクチャーが導入されています。

※クリックすると拡大画像が見られます
ビッグデータを活用するハドソンアルファ・バイオテクノロジー研究所
コンテナー技術、自動配備ツール、コンポーザブルインフラストラクチャーを導入したユーザーに、ハドソンアルファ・バイオテクノロジー研究所があります。同研究所は、米国を代表するゲノム研究の非営利機関の一つです。疾病の診断や治療に役立つ研究、さらには、農業に関連する研究も行っています。具体的には、小児の遺伝性疾患、がん、アルツハイマー病、神経疾患におけるゲノム研究などです。研究成果を実際に商品化する企業と研究者を集結させることに重点が置かれており、キャンパス内には、ゲノミクス研究室が16カ所、ライフサイエンス企業が34社存在し、およそ800人が勤務しています。また、教育プログラムを展開しており、年間10万人の子供たちにゲノムや遺伝子に関するナレッジ情報を提供しています。
ハドソンアルファ・バイオテクノロジー研究所は、ヒトゲノム研究と、その研究を使った希少疾患(難病)治療への応用が主な使命の一つとして挙げられます。研究室では、がん、糖尿病などの疾病治療にゲノム技術を生かすための取り組みが行われています。DNA配列やRNA配列の決定、たんぱく質の解析、メタボロミクス(細胞の活動における分子レベルの解析)などの分野の研究が行われていますが、これらの各分野に共通する課題として、研究で利用されるデータが膨大なことが挙げられます。
同研究所では、これらの提携企業に対して、ゲノミクスや遺伝学の研究のためのITリソースが提供されますが、特にゲノミクスは利用するデータが膨大であり、毎月1PB以上が生成されるため、データ自体の管理効率が大きな課題でした。大規模なデータ解析は、別途、専用の大型コンピューターが使用されますが、複数の研究部門が、CPU、メモリー、ストレージ、ネットワークなどのITリソースプールやデータを効率良く管理し、研究用のアプリケーションから簡単にクエリーできる統合環境を用意しなければなりません。単なるビッグデータの保管庫を設置しただけでは、各研究部門のニーズを満たしたことにはならないのです。
同研究所では、ゲノミクスのアルゴリズムやアプリケーションを自社で独自開発しており、それらのアルゴリズムやアプリケーションが実行できる非常に強力な高速計算基盤が必要でした。研究部門に所属する大勢のデータサイエンティストやデータエンジニアは、高速計算、ストレージ、ネットワークのリソースを同時に使用します。そのため、ユーザーの需要増加や、データの増加量を効率良く管理しなければなりません。
また、同研究所では、ハイパーバイザー型の仮想化ソフトウェアも導入していましたが、ライセンスコストの問題や仮想化基盤で稼働する仮想マシンの性能劣化の問題も抱えていました。次々と生成されるビッグデータを効率よく管理し、キャンパス内の各企業や組織への素早いデータ提供と分析のニーズを満たす必要があったのです。そこで、同研修所は、高速計算、ストレージ、高速通信用のネットワーク、そして研究用のアプリケーション環境を素早く、かつ性能劣化なく実行するコンポーザブルインフラストラクチャーを導入し、スピードと高効率化を獲得。今までとは比較にならないレベルでの高度な研究と現実の医療への貢献というDXを決意するに至ったのです。

※クリックすると拡大画像が見られます
今回は、DXを必要としているハドソンアルファ・バイオテクノロジー研究所の状況、導入を決意したコンポーザブルインフラストラクチャーについて簡単に紹介しました。次回は、より具体的な課題やコンテナの適用範囲、そしてコンテナーを利用したコンポーザブルインフラストラクチャーのシステム構成を具体的に解説します。
- 古賀政純(こが・まさずみ)
- 日本ヒューレットパッカード オープンソース・Linuxテクノロジーエバンジェリスト
- 兵庫県伊丹市出身。1996年頃からオープンソースに携わる。2000年よりUNIXサーバのSE及びスーパーコンピュータの並列計算プログラミング講師、SIを経験。2006年、米国ヒューレットパッカードからLinux技術の伝道師として「OpenSource and Linux Ambassador Hall of Fame」を2年連続受賞。プリセールスMVPを4度受賞。現在は、日本ヒューレットパッカードにて、Linux、FreeBSD、Hadoop、Dockerなどのサーバ基盤のプリセールスSE、文書執筆を担当。Red Hat Certified Virtualization Administrator、Novell Certified Linux Professional、Red Hat Certified System Administrator in Red Hat OpenStack、Cloudera Certified Administrator for Apache Hadoopなどの技術者認定資格を保有。著書に『Docker実践ガイド』『CentOS 7実践ガイド』『Ubuntu Server実践入門』などがある。趣味はレーシングカートとビリヤード。