AWS re:Invent

AWS、従業員に力を与える生成AIアシスタント「Amazon Q」を披露

寺島菜央 (編集部)

2023-12-01 13:08

  Amazon Web Services(AWS)は米国時間11月27日~12月1日、年次イベント「re:Invent 2023」をネバダ州ラスベガスで開催している。2日目の基調講演では、最高経営責任者(CEO)のAdam Selipsky氏が、生成AIの新たなサービスを中心に、多数の新サービス提供について説明した。

CEOのAdam Selipsky氏
CEOのAdam Selipsky氏

 12回目となる今回のre:Inventには、現地に約5万人が参加、オンラインでは30万人以上が同イベントを視聴していると明かした。連日の基調講演には会場が埋まるほどの人が参加しており、大いに盛り上がりを見せている。

2日目の基調講演会場の様子。後方まで多くの来場者が座席を埋めていた
2日目の基調講演会場の様子。後方まで多くの来場者が座席を埋めていた

 講演の冒頭、Selipsky氏はre:Inventについて「このイベントは、学習するための場として位置付けている。そのために、2万2000以上のセッションや多数の基調講演、展示場所を設けている。さまざまな業界やサイズの企業のユースケースを知る機会になるだろう」と述べる。

 AWSは、「Working Backwards」(顧客起点の考え)を重視している。同氏は「私たちは常に顧客のニーズ、課題から逆算して考えている」といい、インフラの作り直しから、セキュリティやネットワークプロトコルなど、さまざまなイノベーションに取り組んでいると述べた。

 2006年に提供を開始したストレージサービス「Amazon S3」には、コスト効果の高い「Glacier Deep Archive」「Amazon S3 Intelligent tiering」などが含まれている。ここに、高い性能と最短のレイテンシー(遅延時間)を提供するオブジェクトストレージ「Amazon S3 Express One Zone」が新たに追加された。これは1桁ミリ秒の遅延を実現し、Amazon S3と比較して10倍のアクセススピードを提供する。

Amazon S3 Express One Zoneの概要
Amazon S3 Express One Zoneの概要

 また同社は、汎用(はんよう)コンピューティングの低価格化に注力しており、このたびクラウド向けプロセッサー「AWS Graviton4」を開発。「AWS Graviton 3」と比較して、30%高い計算能力と50%多いコア数、75%高速なメモリー帯域を備えるとしている。

 常時暗号化が施された、高速な物理ハードウェアインターフェースで、セキュリティをより高い水準に引き上げた。Graviton4は、「Amazon EC2 R8gインスタンス」でプレビュー提供を開始。高性能なデータベースやインメモリキャッシュ、ビッグデータの分析に適しているという。「Amazon EC2 R8gインスタンス」に比べ、3倍のvCPUとメモリー容量を提供する。

生成AIの3つの階層に対するアプローチ

 Amazonは、AIを活用してサプライチェーンや詳細検索の機能の改善、「Amazon Alexa」などのテクノロジーを作ってきた。「私たちは、自らを革新する方法を知っているため、皆さまの革新を支援できる」(同氏)。AWSは、生成AIに対して「基盤」「基盤モデルへのアクセス」「アプリケーション」の3つの層からアプローチをする。

1.基盤

 最下層の「基盤」はインフラを指す。この基盤モデルには「学習」と「推論」のワークロードがあり、多くの学習データを用いて学ばせ、テキストや画像、動画といった推論を用いて生成する。

AWSがアプローチをする生成AIの3つの階層
AWSがアプローチをする生成AIの3つの階層

 生成AIのユースケースを本当に使えるものにするためには、コスト効果の高い機械学習(ML)とAIのために作られたインフラが必要になる。そこで同社は、基盤モデルと大規模言語モデル(LLM)の高性能なトレーニングのために開発された、ニュートラルネットワークの学習専用チップ「Trainium2」を発表。従来の「Tranium」と比較して、トレーニング処理が4倍高速になり、3倍のメモリー容量を備える一方、エネルギー消費効率は最大で2倍に向上したという。Tranium2は「Amazon EC2 Trn2インスタンス」を介して利用でき、1インスタンス当たり16器を搭載している。

2.基盤モデルへのアクセス

 次に「基盤モデルへのアクセス」において「Amazon Bedrock」の新たなサービスを発表した。AWSでは、生成AIアプリケーションを容易に構築・拡張できるAmazon Bedrockを提供している。同サービスは、画像生成や検索など、それぞれに適した幅広い基盤モデルを展開している。これに対して同氏は「1つのモデルが一番上に立つということはないし、1つのモデルだけを使うクラウドプロバイダーもいない。さまざまなモデルを使う必要がある」とし「だからいろいろな選択肢が必要だ」と言及した。

 基盤モデルの1つである「Claude 2」を提供するAnthropicのCEOであるDario Amodei氏が登壇し、先日発表した「Claude 2.1」の進化について紹介。「220万のトークンをサポートして、複数のドキュメントをサポートする。また、ハルシネーションを低減するようにしている。私たちは、責任ある生成AIを提供することを重視している」と話した。

Anthropic CEO Dario Amodei氏
Anthropic CEO Dario Amodei氏

 Amazon Bedrockは今回、3つのカスタマイズ機能を追加した。まず、「Fine Tuning」では、基盤モデル「Cohere Command Lite」「Meta Llama 2」「Amazon Titan Text Lite & Express」においてファインチューニング(微調整)が可能になる。そして、「Retrieval Augmented Generation(RAG)with Knoledge Bases」において、コンテキストや組織内の情報を利用し、基盤モデルの応答をカスタマイズできるRAG(Retrieval Augmented Generation)機能を、フルマネージドで提供する。

 「Continued Pre-training for Amazon Titan Text Lite & Express」では、業界用語への対応など、ドメイン知識に基盤モデルを対応させ、ビジネス上のテーマに対するモデルの精度を向上させる。

 Fine TuningおよびRetrieval Augmented Generation(RAG)with Knoledge Basesは一般利用を開始しており、Continued Pre-training for Amazon Titan Text Lite & Expressはプレビューを提供している。いずれもバージニア北部とオレゴンでのリージョンで利用できるという。

 以上がAmazon Bedrock内のカスタマイズ機能の追加だったが、ほかにも生成アプリケーションと企業システム、データソース全体にまたがる複数ステップのタスクをフルマネージドで実行する「Agents for Amazon Bedrock」と、基盤モデルの安全対策として「Guardrails for Amazon Bedrock」を発表した。

 Guardrails for Amazon Bedrockは、ユースケースに応じた複数のガードレールを定義し、複数の基盤モデルに適用している。多くの基盤モデルには保護機能が組み込まれているが、同ツールを活用することでユースケースに特有のフィルタリングを適用できるとしている。望ましくないトピックを定義し、有害コンテンツのカテゴリーごとにフィルタリングする値を設定。ユーザーのクエリーや基盤モデルの応答を評価し、制限に抵触するかを評価するという。

 現時点では、テキストベースのモデルに対して英語で対応しており、プレビュー版として開始している。現時点で利用可能なリージョンは、バージニア北部とオレゴンのみ。

 Selipsky氏は、「生成AIが期待できるイノベーションのツールになるということは、乱用の可能性も秘めている。AIのポテンシャルを生かしながら、リスクを削減するには、さまざまなステークホルダーの関与が必要になる。今年のはじめ、バイデン大統領と安全な、そして透明性のあるAIテクノロジーの開発をすると話した」と、AWSのAIに対する責任について述べた。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]