「Reddit」は人気の高いソーシャルネットワーキングプラットフォームで、そこでは膨大な数の人々が幅広い話題について日々議論している。つまりRedditには、開発者がさまざまな目的で利用できる貴重なデータが蓄積されている。そうした目的には人工知能(AI)モデルの訓練も含まれている。
提供:Getty Images/SOPA Images
Redditは、AIモデルの訓練に同社のデータが無償で使われているという現状を変えたいと考えているようだ。同社は米国時間4月18日、大企業による「Reddit Data API」を用いたデータへのアクセスに対して課金するという計画を発表した。
今回の発表によると、Redditのプラットフォームにおいて「追加機能や、利用制限の緩和、使用権の拡大」が必要な外部ユーザー向けに、新たな「プレミアムアクセスポイント」が追加されるという。
この新しいティアーは全ての人々に対して影響を与えるわけではない。同社のAPIを商用目的以外で使用し、Redditユーザーに役立つアプリの開発や、学術的なリサーチを実施したいという開発者や研究者は、今まで通り無償でAPIを利用できる。
新たなティアーの真のターゲットは、GoogleやOpenAIといった巨大企業だ。こうした企業は、対価を支払うことなくRedditのデータを使って生成型AIモデルを訓練している。
Redditの創業者であり、最高経営責任者(CEO)でもあるSteve Huffman氏はThe New York Timesのインタビューで、「Redditが有しているコーパスは本当に価値のあるものだ」と述べ、「しかし、そういった価値全てを世界最大級の企業に無償で提供する必要はない」と続けた。
Redditのプラットフォーム上におけるやり取りは、AIチャットボットを訓練する上で驚くほど有益なものだ。というのも、こうしたやり取りから人間同士の対話がどのようなものなのかを機械学習(ML)モデルに教えることで、AIチャットボットは自らの対話でそれを模倣できるようになるためだ。
同じような動きとして、Twitterも2月にAPIの有料化を発表している。こちらも生成型AIモデルが同社のデータを使用している状況を受けたものだとみられる。
Today we are launching our new Twitter API access tiers! We’re excited to share more details about our self-serve access.
— Twitter Dev (@TwitterDev) March 29, 2023
TwitterのCEOであるElon Musk氏は、高度な生成型AIモデルに対する懸念について公の場で語っている。しかしその一方で同氏は、自らAIチャットボットの開発に取り組んでいることも明らかにしている。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。