データ活用における生成AIとクラウド--2024年のトレンドを読む(前編)

Daniel Hand (Cloudera)

2024-02-08 07:00

 生成AIは、Gartnerが2023年に発表した先進テクノロジーのハイプサイクルにおいて、「過度な期待」のピーク期に近づいていると考えられています。

 生成AIのメリットは魅力的かつ広範囲にわたるため、アナリストらは生成AIがあらゆる主要産業や業務部門に影響を及ぼすであろうと見込んでいます。McKinsey&Companyによる2023年のレポートでは、現代における生成AIとその他のテクノロジーは、従業員の業務時間の60~70%に当たる作業を自動化する可能性があると述べられています。また、IDCの調査では、アジア太平洋地域の組織の3分の2が2023年に生成AIの検討や調査を進めていることが明らかになりました。

 2024年は、企業が生成AIの運用や改善に一層注力するとともに、クラウドをはじめとするさまざまな環境で増大するデータを管理するアプローチを見直し、さらなる柔軟性と成長を実現する取り組みを推進していくと予想されます。

 2024年に見られるであろうトレンドを6つのポイントに分けて前編・後編で紹介します。なお、後編は筆者(Daniel Hand)の予測に、Cloudera 社長執行役員の大澤毅の見解も加えています。

1.強力なMLOps とデータ連携が生成AIの運用を支える

 2022年11月に「ChatGPT」(GPT-3.5)がリリースされて以来、組織は成果を達成するため十分なコンテキストデータを安全に提供しつつ、メリットを実現するという課題に直面しています。

 ChatGPTや大規模言語モデル(LLM)を基盤とするその他のSaaSは、データプライバシーに関する重大な課題を組織にもたらします。多くの場合、質問、回答、コンテキストデータは機密性を有しています。そのため、モデルの再トレーニングのためにこうしたデータを再利用するパブリックなマルチテナント型サービスは、企業での利用に適しているとは言えません。

 Metaの「Llama 2」などのオープンソース型LLMも急速な進化を遂げ、ChatGPTに引けを取らないパフォーマンスにより代替サービスとしての可能性を示してはいますが、拡張性や信頼性を実現しつつ生成AIモデルをラボから実運用へと移行させることは困難です。また、これらのサービスは一般的に複数のアプリケーションで共有されるため、データ連携に関しては、従来の機械学習(ML)モデルと比べて大きな課題が残ります。

 2024年、組織は引き続き強力な機械学習運用(MLOps)とデータ連携機能の開発に注力することになるでしょう。

2.組織はLLM最適化のため、RAGやファインチューニングに一層注力するように

 LLMのパフォーマンスを最適化するためには、プロンプトエンジニアリングや検索拡張生成(RAG)、ファインチューニングなど幾つかのアプローチが存在します。

 RAGはナレッジベースのコンテンツを使い、プロンプトを拡充して、必要なコンテキストを提供します。RAGの主要なコンポーネントは、特別な方法でインデックスを付与したナレッジベースコンテンツのデータベースです。

 ユーザーからの質問は数学的な表現でエンコードされ、データベース内でその質問に非常に近いコンテンツを検索する際に使用できます。これらの質問はプロンプトの一部としてLLMに送信され、推論に利用されます。質問とドメインのコンテキストをいずれも提供することで、結果が大幅に改善されます。

 RAGはLLMのトレーニングやチューニングを行わずとも優れた成果を達成できるため、LLMの導入時の効果的なアプローチとして定評があります。しかし、ナレッジベースリポジトリーの維持にはデータエンジニアリングパイプラインと、インデックス化されたデータを保存する特別なベクトルデータベースが必要です。

 2024年においても、RAGは多くの組織にとって、引き続き利用しやすい生成AIアプローチであろうと思われます。

 2023年に大いに関心を集めたファインチューニングのアプローチの1つが、Performance Efficient Fine Tuning(PEFT)です。PEFTは多目的LLMと共存しつつ、ドメイン固有のデータについて小規模なニューラルネットワークをトレーニングします。これにより、コストや必要となるトレーニングデータを抑えつつ、大規模LLMの再教育によるパフォーマンスのメリットを最大限に得ることができます。LLMのファインチューニングには強力なML機能が必要となりますが、特にトレーニングデータの制約がある場合には、効率、説明可能性や結果の精度が大幅に改善される可能性があります。

 2024年にはPEFTのようなファインチューニングのアプローチが組織にますます活用されるようになるでしょう。新規のプロジェクトだけでなく、初期のRAGアーキテクチャーを利用していたプロジェクトを代替する可能性もあります。大規模かつ有能なデータサイエンスチームを擁する組織では、大いに活用されるようになるでしょう。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    マンガで解説!情シスが悩む「Microsoft 365/Copilot」の有効活用に役立つ支援策

  2. 運用管理

    データベース管理の課題を一挙に解決!効率化と柔軟性を両立する新しいアプローチとは

  3. セキュリティ

    セキュリティに対する意識や対策状況の違いが浮き彫り--日米豪における情報セキュリティの実態を調査

  4. セキュリティ

    もはや安全ではないVPN--最新動向に見る「中小企業がランサムウェア被害に遭いやすい」理由

  5. ビジネスアプリケーション

    AIエージェントの課題に対応、生成AIの活用を推進するための5つのデータガバナンス戦略

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]