マイクロソフトとNVIDIA、5300億パラメーターの巨大言語モデルを開発

Chris Duckett （Special to ZDNET.com）翻訳校正：編集部

2021-10-12 14:28

　NVIDIAとMicrosoftは、巨大な自然言語生成モデル「Megatron-Turing Natural Language Generation（MT-NLG）」を共同で開発した。両社によれば、このモデルは「これまでにトレーニングされた中で、最も強力な単体のトランスフォーマー言語モデル」だという。

近年の自然言語モデルの規模の推移

提供：Microsoft

　この言語モデルは105層で、5300億のパラメーターを持ち、実行するにはNVIDIAの「Selene」のような、大規模なスーパーコンピューターハードウェアを必要とする。

　有名な言語モデル「GPT-3」のパラメーター数は1750億だった。

　このモデルは、3390億のトークンを含む15のデータセットでトレーニングされたもので、大規模なモデルでも少ないトレーニング量でうまく動作することを証明した。

　ただし、現実世界の言語やサンプルを使って学習する必要があるという点は変わらず、このモデルも、AIが古くから抱えている問題からは逃れられていない。それはバイアスの問題だ。

　両社は、「大規模な言語モデルは、言語生成の最新技術を進歩させ続けているが、やはりバイアスや問題のあるデータなどの問題を抱えている」と述べている。

　「MT-NLGでは、モデルがトレーニングに使用されたデータから偏見やバイアスを拾ってしまっていることが分かった。MicrosoftとNVIDIAは、この問題の解決に向けて取り組んでいる」（両社）

　Microsoftのチャットボット「Tay」が、インターネット上の対話による学習によって、ものの数時間で差別発言をするようになったという問題が起こったのは、それほど前のことではない。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

メールマガジン購読のお申し込み

関連記事

関連キーワード: 機械学習; 人工知能（AI）

関連ホワイトペーパー

人気カテゴリ: 経営; セキュリティ; クラウドコンピューティング; 仮想化; ビジネスアプリケーション; モバイル

特集

CNET Japan Top Story

ホワイトペーパー

新着

ビジネスアプリケーション

生成 AI 「Gemini」活用メリット、職種別・役職別のプロンプトも一挙に紹介
ビジネスアプリケーション

急速に進むIT運用におけるAI・生成AIの活用--実態調査から見るユーザー企業の課題と将来展望
クラウドコンピューティング

Webアプリケーションにおけるセキュリティリスクトップ10を理解し、適切に対処するための方法を知る
セキュリティ

@cosme運営のアイスタイルがAWS移行後に実施したクラウドセキュリティ対策の裏側を語る
運用管理

情報開示請求にも迅速な対応が可能に！問題が発生した機器・ユーザーを速やかに特定する方法を知る

ランキング

セキュリティ

迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは
セキュリティ

警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集
セキュリティ

まずは“交渉術”を磨くこと！情報セキュリティ担当者の使命を果たすための必須事項とは
セキュリティ

いま製造業がランサムウェアに狙われている！その被害の実態と実施すべき対策について知る
セキュリティ

VPNの欠点を理解し、ハイブリッドインフラを支えるゼロトラストの有効性を確認する

ホワイトペーパーライブラリー

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか？

カテゴリランキング

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]