はじめに
前回に続いて、2024年に公開された論文「AI-assisted Assessment of Coding Practices in Industrial Code Review」に基づいて、Google社内での大規模言語モデルによるコードレビュー支援の事例を紹介します。今回は、実環境に適用する際の評価・改善のプロセス、特に、開発チーム内のテスト利用段階で実施したチューニングを紹介します。
AutoCommenterの利用環境
前回の記事では、大規模言語モデルT5Xを用いて、プログラムコードに対して、ベストプラクティスに関するレビューコメントを挿入するべき位置と該当するベストプラクティスのドキュメントへのリンクを生成するモデルを用意する所まで説明しました。開発チームでは、このモデルを「AutoCommenter」と呼んでいます。AutoCommenterを実際に使用する環境には、レビューシステムのWeb UIと開発中に使用するIDEのUIがあります。
まず、レビューシステムのWeb UIでは、レビュー対象のコードに対して、図1のようなコメントが自動的に追加されます。ここでは、適用が推奨されるベストプラクティスのドキュメント(図の例では「C++ style guide: Structs vs. Tuples」)へのリンクと、該当のベストプラクティスのサマリーがコメントとして表示されます。AutoCommenterのモデルがドキュメントへのリンクを生成した後に、別の大規模言語モデルを用いて、コメントに表示するべきサマリーを生成しています。このコメントを見た開発者やレビューアーは、Thumbs-up/downボタンによるポジティブ/ネガティブのフィードバックを返すことができます。また、このコメントの指示に従うべきだと考えたレビュアーは、「Please fix」をクリックして、開発者にコードの修正を依頼します。これもまたポジティブなフィードバックとして捉えられます。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。

