この記事では、「ChatGPT Plus」とOpenAIの「Code Interpreter」アドオンを使ってできる素晴らしいことを紹介する。だがまずは、まばたきをして部屋に入ろうとしている紫色の巨大な象について説明しておく必要がある。
何をするにしても、紫色の巨大な象のことを考えてはならない。
紫色の巨大な象が何かというと、データセキュリティだ。具体的には、皆さんが(ここでは筆者が)所有するデータについて説明しておく必要がある。つまりこういうことだ。ChatGPT Plusがデータをマイニングするためには、データにアクセスしなければならない。
何を言いたいか分かるだろうか。これから説明するすべてのことを実行するために、筆者は自分の会社のサーバーからエクスポートした2万2797件のデータセットをアップロードする必要があった。OpenAIとChatGPTがそのデータをどう扱うのか、見当もつかない。それは重大なリスクだ。
今回のケースでは、自分のデータを保護することより、データ分析のプロセスを紹介することに重きを置いている。しかし、これは筆者の判断であり、筆者のデータだ。このデータをChatGPTと共有しても(ひいてはこの記事を通して読者の皆さんと共有しても)、秘密保持契約の違反にはならず、自分の会社に危険が及ばないことは分かっている。
しかし、これらの手法を使用するなら(とてつもなく強力であることは間違いない)、データをAIと共有しても問題ないか、場合によってはインターネット全体と共有されても構わないかを、皆さんと勤務先の会社が判断する必要があるだろう。
何が対象か
さて、紫色の象の説明は終わったので、それについてはもう考えなくていい。話を進めよう。使用するデータセットは、ユーザーが筆者の「WordPress」プラグインをアンインストールしたときに収集されるアンインストールデータだ。これは以下の画面で収集する。
提供:David Gewirtz/ZDNET
ユーザーが「Seamless Donations」または「My Private Site」のアンインストールを選択すると、上記のダイアログが表示される。各アンインストールのデータは筆者のサーバーに送信され、そこに保存される。
これまでは、以下のような表形式でデータを確認していた。
提供:David Gewirtz/ZDNET
だが、この表からこれ以上の情報は得られない。詳細な分析を構築してグラフやピボットテーブルを作成する時間はなかった。そのため、数ページ遡って、最近のアンインストールで何が起きているかを大まかに把握することはできたが、全体を見渡して、総合的な洞察を得ることはできなかった。
だが、それは過去の話だ。