Snowflakeは6月28日、米国ラスベガスで開催の年次カンファレンス「Snowflake Summit 2023」に合わせ、同社プラットフォームに対する一連の機能拡充を発表した。
プライベートプレビューで提供中の「Document AI」は、2022年9月に買収したApplicaの生成AI技術をもとに構築した新たな大規模言語モデル(LLM)になる。文書ファイルからコンテンツを容易に抽出する新しいインターフェースとして、非構造化データなどの活用を可能にする。
機械学習の専門知識を必要とせず、例えば、請求額や契約条件などについて自然言語で質問すると、自動的に回答が得られ、必要に応じて結果を微調整できる。
Snowflakeでは、Document AIをはじめとする機能を多くのタイプの非構造化データに活用できるよう計画しているという。
Document AIについて
次に、オープンテーブルフォーマットの使用を可能にする「Icebergテーブル」を近日中にプライベートプレビューで提供すると発表。「Apache Iceberg」がオープンテーブルフォーマットの業界標準となっていることを受け、同社はIcebergテーブルを活用したパフォーマンスの向上とデータガバナンスの拡張に取り組んでいる。
Icebergテーブルは、Icebergのネイティブテーブルと外部テーブルを単一のテーブルオブジェクトに統合し、Snowflakeの管理のしやすさと優れたパフォーマンスを維持しながら、相互運用性を必要とするデータアーキテクチャーをサポートするとしている。
Snowflakeは「カスタマーファースト」を最も重要な価値として掲げている。その取り組みの一環として、同社は新しい「Snowflakeパフォーマンス指標」(SPI)を導入した。これは、顧客ワークロードを分析することで一定期間における改善を定量化するもの。これにより、指標の追跡を開始してから直近の8カ月で、ワークロードのクエリー時間が15%短縮したとしている。
さらに同社は、SQLユーザー向けにプレビルドの機械学習機能(パブリックプレビュー)などの高度なアナリティクスのサポート、新たなデータ品質メトリクスや分類機能(プライベートプレビュー)による統合されたガバナンスやプライバシーの拡張を進めている。
また、Snowflakeの機能を使用してアプリケーションを構築できる開発者向けフレームワーク「Snowflakeネイティブアプリケーションフレームワーク」の提供を開始した。同社のデータクラウド内でアプリケーションの構築、配布、収益化が可能になる。
Snowflakeネイティブアプリケーションフレームワークについて
同フレームワークは、Snowflakeプラットフォームのパフォーマンス、スケール、効率性を活用して、アプリケーションの開発、デプロイ、運用に必要な機能群を提供する。企業はコストのかさむ課金システムを構築することなく、シームレスにアプリケーションを配布、収益化できる。
Snowflakeマーケットプレイスには、既に25種類以上のネイティブアプリケーションが利用可能で、100社を超えるプロバイダーが複数の業界やユースケースにまたがるアプリケーションを開発中とのこと。これらのアプリケーションは顧客のSnowflakeアカウント内で直接実行できるため、セキュリティ面やプライバシー面の問題を取り除くことができるとしている。
「Snowparkコンテナーサービス」(プライベートプレビュー)のリリースにより、開発者はNVIDIA製GPUやAIソフトウェアを用いたアクセラレーテッドコンピューティングなどのインフラストラクチャーを利用して、AIや機械学習モデル、API、内製アプリケーションなどのワークロードを実行可能になる。Snowflakeアカウント内でLLMやノートブック、MLOpsツールなどのサードパーティーソフトウェアやアプリケーションのカタログにアクセスできる。
Snowparkコンテナーサービスについて
そのほかにも、より効率的なモデル開発のための「SnowparkML API」(パブリックプレビュー)、スケーラブルなMLOpsのための「Snowparkモデルレジストリー」(プライベートプレビュー)、モデルをインタラクティブアプリに転換するための「Snowflakeへの『Streamlit』統合」(パブリックプレビューを近日開始)なども発表されている。
また、SnowflakeはNVIDIAと共同で、Snowparkコンテナーサービスのための革新的なアクセラレーテッドコンピューティングやソフトウェア統合を構築している。27日には高度な生成AI機能の企業利用を目的とした提携を発表している。