IBM Researchは米国時間7月7日、ハイブリッドクラウド環境内のビッグデータや人工知能(AI)のワークフローの統合やスケーリングに向けたフレームワーク「CodeFlare」を発表した。このオープンソースのフレームワークは、機械学習(ML)モデルの訓練や最適化に向けたパイプラインの作成に要する時間の削減を目的としている。

提供:IBM Research
CodeFlareは、カリフォルニア大学バークレー校によるオープンソーステクノロジーである「Ray」上に構築されている。つまりCodeFlareは、ワークフローのスケーリングを容易にすることに特化した要素を追加し、Rayを拡張したものだといえる。CodeFlareはPythonをベースにしたパイプライン向けインターフェースを提供しており、データの統合や並列化、共有を容易にしている。これにより、データ科学者は新たなワークフロー記述言語を学習することなく、複数のプラットフォームでパイプラインワークフローを統合できるようになる。
IBM Researchによると、CodeFlareのパイプラインは、新たなサーバーレスプラットフォーム「IBM Cloud Code Engine」や「Red Hat OpenShift」上で容易に実行できるようになっているが、デプロイはどこにでもできる。またCodeFlareは、イベントトリガー(新たなファイルの到来など)に対するアダプターを提供することで、他のクラウドネイティブなエコシステムとのパイプラインの統合機能やブリッジ機能で開発者を支援する。さらに、クラウド上のオブジェクトストレージやデータレイク、分散ファイルシステムを含む、さまざまなソースからのデータのロードやパーティションのための機能も提供する。
CodeFlareはGitHubで提供されている。CodeFlareを利用している開発者が、開発時間を数カ月削減できている例もあるという。
ハイブリッドクラウドはIBMの成長戦略で重要な要素だ。2020会計年度には、クラウドの売上高が20%増加している。傘下のRed Hatが提供するハイブリッドクラウドプログラムが大きく寄与した。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。