2022年の初めには、各国が入国緩和を進めるなど新型コロナウイルス感染症の世界的な流行による未曾有の事態が収束を見せ、誰もが胸をなでおろしましたが、年が明けてしばらくすると、私たちはいまだ大きな混乱の中にいることに気づきました。
景気後退が起こり、ロシアとウクライナの紛争がグローバル市場に影響を与え続け、世界中の企業が自社の収益を確保するために、何が賢明な投資なのか、何をすべきなのかを考えています。ベンチャーキャピタルの資金調達の減少、技術者の人材流出、継続的なデータスキルの欠如、より複雑な規制の導入など、あらゆる場面でテクノロジー業界への影響が現れています。
イノベーションへの期待が高まる中、何に注力すべきかを判断するのは難しいかもしれません。しかし、サイロ化したデータや分散したデータを統合してリアルタイムに全体像を把握し、意思決定の精度を高めることが、生き残りと将来の成功に不可欠であることは明らかです。こうした背景を踏まえ、2023年に全てのデータドリブン企業が取り組むべき5つの重要なトレンドを紹介します。
1.AIがデータパイプラインに深く入り込む
景気の先行きが見通せない状況が続き、多くの企業が投資や採用を控えることになるでしょう。一方、世界的なスキル不足があらゆる規模の企業に影響を与え続ける中、人工知能(AI)や機械学習(ML)などのテクノロジーによって、より煩雑なデータの準備作業を自動化できるようにすることは、非常に重要な意味を持つこととなります。アプリケーションやダッシュボードが構築される前にAIをデータパイプラインの深部に組み込むことで、データの準備と分析に費やされる時間の割合を大幅に削減できるのです。
現在、データ分析に費やされている時間は20%未満なのに対し、適切なデータの検索、準備、管理などに費やされている時間を合わせると80%強に上ります。このような状況において、データ分析ができる人材の確保は付加価値の向上につながり、これまで不可能であった新しいインサイト(洞察)を生み出せるようになります。これにより、より生産的な時間の使い方が実現します。
2.未曾有の事態に備え、派生データや合成データへの投資を拡大する
新型コロナウイルス感染症の世界的な大流行(パンデミック)を経験したことにより、リスクの予測と管理に時間とリソースを費やすことの重要性が認識されるようになりました。残念ながら、コロナ禍前はパンデミックに関する実データが十分とは言えず、企業や組織がそのような危機に備えることはできませんでした。
しかし、このギャップを合成データで埋めることが可能になります。合成データで訓練されたモデルは、他のモデルよりも正確であることが研究で示されています。もちろん、合成データはリアルデータに関連する個人情報、著作権、倫理的な問題を回避できます。また、派生データを使えばさまざまな用途にデータを再利用でき、将来の問題や危機に備えるために必要な重要なシナリオの設計が可能になります。