Oracleは米国時間6月26日、「HeatWave GenAI」の提供を開始すると発表した。「インデータベース大規模言語モデル(LLM)」「自動化されたインデータベースベクトルストア」「スケールアウト可能なベクトル処理」「HeatWave Chat」といった機能を備える。
「HeatWave」は、オンライントランザクション処理(OLTP)やオンライン分析処理(OLAP)、機械学習、レイクハウスなどを提供するフルマネージド型データベースサービス。HeatWaveのユーザーは、HeatWave GenAIを追加費用なしで利用できる。
インデータベースLLMは、低コストで生成AIアプリケーションの開発を簡素化する。ユーザーは、HeatWaveのベクトルストアでデータを検索し、コンテンツを生成・要約し、検索拡張生成(RAG)を実行できる。生成AIを「AutoML」などのHeatWaveの他の組み込み機能と組み合わせることで、よりリッチなアプリケーションの構築も可能という。「OCI Generative AI」サービスとも連携しており、主要なLLMプロバイダーの事前トレーニング済みの基盤モデルを利用することもできる。
インデータベースLLMの概要
HeatWave GenAIでは、ベクトルストアとベクトルの埋め込みを作成する全てのステップが自動化されている。また、オブジェクトストレージ内のドキュメントの検出、解析、埋め込み生成、ベクトルストアへの挿入などの処理がデータベース内で実行される。RAGにベクトルストアを使用することで、モデルが適切なコンテキストで独自のデータを検索し、より正確で関連性の高い回答を提供できるようになる。
インデータベースベクトルストアの概要
ベクトル処理はスケールアウトさせることで、非常に高速なセマンティック検索が可能という。さらに、HeatWaveで新しいネイティブのVECTORデータ型と最適化された距離関数の実装をサポートした。HeatWaveのインメモリーハイブリッドカラムナー表現とスケールアウトアーキテクチャーにより、ベクトル処理はメモリーに近い帯域幅で実行され、最大512のHeatWaveノード間で並列化される。セマンティック検索を他のSQL演算子と組み合わせることで、異なるドキュメントを持つ複数のテーブルを結合し、全てのドキュメントで類似検索を実行できるという。
HeatWave Chatは、「MySQL Shell」用の「Visual Code」プラグインになる。HeatWave GenAIのグラフィカルインターフェースを提供し、開発者は自然言語やSQLで質問ができる。また、「Lakehouse Navigator」を用いてデータベース全体の検索やフォルダーに限定した検索ができる。質問の履歴やソース文書の引用、LLMへのプロンプトなどのコンテキストはHeatWave内に維持され、コンテキストに基づいた会話や生成された回答の出典確認が可能である。
HeatWave GenAIのベンチマーク結果も明らかにされており、PDF、PPT、WORD、HTML形式のドキュメントのベクトルストアの作成は、「Amazon Bedrock」のKnowledge baseを使用する場合と比較して、HeatWave GenAIを使用すると最大23倍速く、コストは4分の1になるとしている。さらに、HeatWave GenAIは「Snowflake」より30倍高速でコストは25%削減され、「Databricks」より15倍高速でコストは85%削減され、「Google BigQuery」より18倍高速でコストは60%削減されるとのこと。