野村総合研究所(NRI)とグループ企業のNRIデジタルは1月11日、2024年春以降にデータ漏えいリスクに対処する「プライベート大規模言語モデル(LLM)」を企業ごとに提供すると発表した。性能と効果はNRIの社内業務で検証済みという。
プライベートLLMは、米OpenAIの「GPT-4」など外部サービス型LLMに対して、ユーザーの機密情報や機微情報のデータを送信してしまいかねないリスクに対応するという。プライベートLLMでは、オープンソース型LLMをNRIのデータセンターのプライベートクラウドサービスや企業のオンプレミス環境で動作させる。機密性の高いデータの漏えいリスクを極少化してLLM学習に用いるとする。これにより金融機関など高次の情報セキュリティ統制が必須の企業におけるLLM利用に対応できるとしている。
外部型LLMとプライベート型LLMの特徴
プライベートLLMのサービス内容
NRIは、オープンソース型LLMをベースに企業が保有するデータを組み合わせてカスタマイズ(プリトレーニング、ファインチューニングなど)したプライベートLLMを使うことで、タスク内容により業務適用可能な水準の性能を発揮できる可能性があると解説。同社は、顧客企業ごとの業務にLLMを最適化して提供する。例えば、コンタクトセンターや対面による問い合わせ対応などでは適用可能な業務の幅を大きく広げつつ、個人特定可能な音声データの漏えいリスクを極小化する「プライベート音声認識」モジュールなどを提供していく。
同社では、社内の会計事務手続きサポート業務にプライベートLLMを適用して効果を検証したとのこと。6万件のカスタマイズ用の学習データを使い、同社データセンターのGPU上でMetaのLLM「Llama 2」をファインチューニングした結果、業務適用可能な水準にまで性能が向上した。業務の一部を代替でき、質疑応答を作成する作業時間を60%削減したとしている。
野村総研の検証結果