編集部からのお知らせ
新着の記事まとめ「Emotet」動向

高速I/Oで大規模な学習データもスムーズに入出力 ─ NTTPC「Innovation LAB」のGPU基盤を支えるSeagateの先進ストレージシステム
日本最大級の“AI共創プロジェクト”が検証基盤として「Seagate Exos X 5U84」を選んだ理由

“日本最大級のAI共創プロジェクト”としてNTTPCコミュニケーションズが主催する「Innovation LAB(イノベーションラボ)」。AI活用に関して高い技術とノウハウ、意欲を持つ組織が産学官から結集した同プログラムの特徴の1つは、参画するパートナー組織に対して高性能なGPUプラットフォームを無償で提供していることだ。同社は、このプラットフォームのGPU処理性能をより高めるべく、学習用データなどを格納するストレージシステムとして日本シーゲイトの大容量「Seagate Exos X 5U84」を導入した。Exos X 5U84採用の理由は何か? プロジェクトのリーダーらに聞いた。
NTTPCコミュニケーションズ Innovation LAB
プロジェクト・リーダー
庄司洋一郎氏
NTTPCコミュニケーションズ Innovation LAB プロジェクト・リーダー 庄司洋一郎氏
NTTPCコミュニケーションズ Innovation LAB
GPUエンジニア
森重ゆう氏
NTTPCコミュニケーションズ Innovation LAB GPUエンジニア 森重ゆう氏

産官学の垣根を越えた共創で日本におけるAI活用を促進

 NTTグループにおけるICTサービスのエキスパートとして、企業向けにネットワークやデータセンター、クラウドホスティングなどのソリューションを提供してきたNTTPCコミュニケーションズ(以下、NTTPC)。近年はAI/IoTソリューションの提供にも力を注いでおり、GPU市場のグローバル・リーダーであるNVIDIA®が推進するパートナー認定制度「NVIDIA Partner Network(NPN)」ではNTTグループで唯一、AI/機械学習向けシステムの提供能力を認定する「Compute DGX」コンピテンシーで最上位の「Elite」を取得。AI/機械学習向けGPUサーバーの提供先はAI開発企業とAI導入企業を中心に120社以上、提供台数は1,600台以上に上り、GPU活用に関して国内でも有数の実績とノウハウを蓄積している。

 そんなNTTPCでAI関連の活動を牽引しているのが、2019年より開始されたAIコラボレーションプログラム「Innovation LAB」だ。同プログラムの狙いについて、プロジェクト・リーダーの庄司洋一郎氏は次のように説明する。

 「企業がデジタル変革やイノベーションにより新たな価値を生み出すうえでAIは極めて有効ですが、1社単独で取り組むのは難しいのが実情です。そこで、AIの活用にかかわるさまざまな組織がパートナーシップを結び、それぞれの強みであるヒト、モノ、コトを持ち寄って融合させ、“共創”していく場としてInnovation LABを立ち上げました」(庄司氏)

 同プログラムには現在、AIの開発や活用コンサルティングなどを行う事業者とAIを利用するユーザー企業のほか、GPUやストレージなどAI関連の先端プロダクトを提供するメーカー、学術研究機関、官庁/自治体、メディア/マーケティング会社など、さまざま分野の企業/団体がパートナーとして参画している。

研究開発やマーケティング、地方活性化など、多様な共創活動を展開

 庄司氏によれば、Innovation LABの活動には大きく2つの特徴がある。

 1つは「共創活動の多様性」だ。パートナー各社は共同で研究開発やマーケティングプロモーションを活発に行っており、例えばデータサイエンス企業のALBERTはNTTPCと共同でAI/画像認識パッケージを開発/販売している。同パッケージはNVIDIAのグラフィック向けGPUを搭載したワークステーションにALBERTの画像認識AI構築ツールなどをプリセットしたもので、画像認識AIの開発/運用を内製化したいという企業に最適だという。

 地方活性化にAIを活用するための共創も進んでいる。

 「現在、大分県およびおおいたAIテクノロジーセンター(公益財団法人 ハイパーネットワーク社会研究所内)と具体的な活動を進めています。高齢化や労働者不足と、それに伴う技術継承の問題など、地場の企業/団体が抱えるさまざまな課題にAIを活用して解決するための取り組みを進めています」(庄司氏)

 具体的な成果も上がっており、例えばブリやクロマグロの養殖/加工/販売を行う兵殖は、気温や湿度、魚の種類やサイズに合わせて冷蔵用の氷を自動計量するAIシステムを開発中。また、海藻加工食品の製造販売を行う山忠は、ひじきの製造ラインにおける異物検知にAI技術の活用を目指して開発中という。

AI開発/検証で使うGPUプラットフォームのストレージが課題に

 Innovation LABのもう1つの特徴は、パートナー企業に対して研究開発やPoC(Proof of Concept:概念実証)の基盤としてGPUプラットフォームを無償で提供していることだ。

 「パートナー様の多くは自社でもGPUインフラを保有していますが、共同で行うプロジェクトや検証、研究開発用途で手軽に使えるGPU環境が別にあると便利です。そこで、全てのパートナー様が手軽に使えるGPUプラットフォームとして、Innovation LABではNVIDIA DGX A100などの高性能なGPUサーバ、さらにはストレージやネットワークなどのインフラ一式を無償で提供しています」(庄司氏)

 Innovation LABではこのインフラについて1つの課題を感じていた。それはストレージだ。

 「AIや機械学習の開発/検証には、学習用のデータセットを格納したり、大量の推論モデルを世代別に格納・参照するためのストレージが不可欠です。しかし、GPUサーバの内蔵ディスクだけでは容量が不足するケースもあり、制約を感じていました。大容量のストレージを外付けするにしても、I/Oスループットがボトルネックとなってしまうことは避ける必要があります」(森重氏)

 また、NTTPCはパートナー各社に対してGPUサーバの販売・提供も行っているが、企業によっては複数台でクラスタを構築する場合がある。その際はGPUサーバの内蔵ストレージではなくN:1構成でのストレージ接続を検討することが望ましく、接続スループットなどをInnovation LABのGPUプラットフォームを使って事前に検証したいというニーズも寄せられていた。

 これらを背景に、NTTPCはGPUプラットフォームで使う外付けストレージを新たに導入することに決めた。

大容量ストレージを簡単かつ堅牢に運用できるEXOS X 5U84を採用

 新たに導入するストレージの選定にあたり、NTTPCではいくつかの要件を掲げた。例えば、GPUサーバにNFSでマウントする際、InfiniBandによる高速接続が行えることのほか、「複数台のストレージをヘッドサーバで管理するという構成の検証も行いたかったため、それに対応できることも必要でした」と森重氏は振り返る。

 NTTPCはこれらの要件を基に検討を進め、パートナーの1社である日本シーゲイトの「Exos X 5U84」の採用を決定。2021年2月に導入して利用を開始した。

 ストレージの選定を担当したGPUエンジニアの森重ゆう氏は、Exos X 5U84を選んだ理由を次のように説明する。

 「採用理由の1つは、Exos X 5U84は最大1.5PB のデータ(*2022年2月時点)を1つのシャーシに格納可能であり、大量のデータを高密度に集積しながらシンプルに管理できることです。容量の割り当てなど、ストレージサーバの管理が容易であることも大きな魅力でした」(森重氏)

 米国ではEXOS製品とGPUサーバとの運用実績もあり、相性の面で不安がないことも大きな選定ポイントとなった。

 また、「リセラーとして扱いやすい製品」であることも採用理由の1つだ。Exos X 5U84を接続するNVIDIA DGX A100には、GPUリソースをインスタンスごとに分割して割り当てられる「マルチインスタンスGPU機能」が備わっており、Innovation LABでは同機能を使ってインスタンス単位で分割したGPUリソースをパートナーに貸し出している。これに合わせて、ストレージ領域もインスタンス単位で分割して提供する。

 「GPUサーバを購入したお客様もオンプレミスで同様の使い方をされると思いますが、その際、Exos X 5U84ならばストレージ領域をスムーズに分割して割り当てられることをInnovation LABの環境で確認できれば、お客様にお勧めしやすくなります。Exos X 5U84は単にストレージ容量が大きいだけではなく、84本ものディスクを搭載していますので、それらを各GPUリソースに柔軟にマウントできる点は非常に便利ですし、さまざまな活用シーンが生まれると期待しています」(森重氏)

 複数のインスタンスにストレージ領域を割り当てる作業は、日本語化されたWebベースのGUIツールを使って直感的に行える。

 そのほか、Seagate独自のRAIDエンジンにより、RAID 6と同じ2パリティのデータ保護機能を持ちながら、再構築時間を大幅に短縮することが可能な「RAID ADAPT機能」を搭載するなど、RAIDシステムとして優れた機能を備えていることも選定理由となった。

外付けでも高速な性能を実現。大量データによる推論結果の世代別比較で大きな効果

 Innovation LABでは現在、DGX A100と100GBのInfiniBand EDRで接続したヘッドサーバにExos X 5U84を接続して利用している。パートナー各社は、DGX A100のマルチインスタンス機能によって割り当てられたGPUリソースとExos X 5U84のストレージ領域を使って開発/検証作業を行う。ネットワークを介して外部のエッジサイトやデバイスにコンテナベースのAIアプリケーションをデプロイし、GPUプラットフォーム上のアプリケーションと連携させながら検証を行うことも可能である。

 「GPUプラットフォームを利用するパートナー各社に伺ったところ、外付けしたExos X 5U84へのデータ入出力のパフォーマンスに関してストレスを一切感じていないとのことです。内蔵ではなく外付けのストレージでもユーザーに性能面の不満を感じさせることなく使ってもらえると確認できたことは大きな成果です」(森重氏)

 また、あるパートナー企業は、予測モデルによる推論結果を世代別に保管し、世代ごとの傾向を比較するといったことを行っているが、Exos X 5U84の導入によってこの作業が大きく効率化された。

 「データが大量にあるため、従来の低速な外付けストレージでは世代ごとの比較に多くの時間がかかり、研究スピードに大きな支障が出ていました。内蔵ストレージは高速な代わりに容量の制約が大きく、保管できる世代が大きく制限されます。Exos X 5U84ならば外付けストレージでも高速なデータ入出力が行えるため、大量の世代別比較を行いたいというケースに最適です。このお客様はExos X 5U84の導入を検討されています」(森重氏)

 なお、Innovation LABでは、Exos X 5U84のGPUDirect Storageの性能に関して独自にベンチマークテストを実施。現在、その結果を同プロジェクトのブログで公開している。

日本市場のGPUニーズに合わせた製品拡充にも期待

 このように、Exos X 5U84はInnovation LABにおける共創の加速だけでなく、NTTPCが顧客に提供するGPUソリューションの幅を広げるうえでも大きな役割を果たしている。日本企業のさらなるAI活用の促進に向けて、庄司氏はSeagateのストレージ製品の拡充に期待を寄せる。

 「日本では欧米企業のようにGPUサーバを大量に導入して大規模なクラスタを組むケースは稀であり、1、2台単位で導入するお客様が大半です。したがって、日本市場を意識した場合は1、2台規模で使う際の管理のしやすさが重要であり、ストレージについてもOSを搭載したストレージサーバ型の製品があると提案の幅が広がります。先頃リリースされた新ストレージ製品「Exos AP」は、まさにこのニーズに最適なソリューションだと期待しています」(庄司氏)

 立ち上げから3年が経過し、Innovation LABのパートナー企業数は50社を超えた。「これまで計画どおりに推移しており、次は100社を目標に取り組んでいきます。パートナーや顧客に対して、より良いGPUインフラを提供していくために、Seagateには今後も引き続きご協力いただければと思います」と話す庄司氏。NTTグループの安心感/信頼感と、AIスタートアップにも引けを取らないスピード感を両立させたAI共創プログラムのさらなる発展が続く。

提供:日本シーゲイト株式会社
[PR]企画・制作 朝日インタラクティブ株式会社 営業部  掲載内容有効期限:2022年6月30日
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]