筆者の元にはデータ/アナリティクス業界の企業幹部や著名な人物から、年末が近付く頃に翌年の予想が数多く寄せられてくる。筆者が今回受け取った2021年の予想をまとめると、その量は49ページもの長大なものになった。
それらすべてをここで紹介するのは無理だが、30社を超える企業の幹部らによる2021年の予想について以下にまとめてみた。その中には、ClouderaやDatabricks、Micro Focus、Qlik、SAS、Snowflakeをはじめとする著名なデータ/アナリティクス企業の幹部による予想が含まれている。また、Andreessen HorowitzやDeloitte AI Institute、O'Reillyといった企業の幹部らとともに、小規模だが業界で重要な位置を占めている企業の幹部らによる見解も含まれている。
本記事ではこうした予想をグループ化し、データウェアハウス対データレイクや、人工知能(AI)の民主化、責任あるAI、AIとビジネスインテリジェンス(BI)の融合、データリテラシーの発達、データガバナンスの必要性、そしてもちろん、アナリティクスと新型コロナウイルス感染症(COVID-19)のパンデミックの間の相互作用といったテーマに分類している。前置きはこれにくらいにして、2021年の予想を紹介したい。
データウェアハウス対データレイク:共存は可能か?
2020年によく採り上げられた話題の1つは、アナリティクスに対するデータウェアハウスアプローチとデータレイクアプローチの力量の比較や、どちらが最終的に生き残るかというものだった。
Snowflakeの元最高経営責任者(CEO)であるBob Muglia氏は、画像や動画を含む、あらゆるデータソースからのデータがデータウェアハウス内で適切に処理できるようになる日が「2~3年のうちに訪れ、データレイクはとどめを刺されることになるだろう」と述べている。またMicro Focusでオープンソースリレーションズのマネージャーを務めるPaige Roberts氏は「『Vertica』のような堅牢かつ信頼できるアナリティクス向けデータベースを構築するだけで10年以上を要するため、データウェアハウスベンダーらは(データレイクベンダーらが)追いつけないほど先を走っているといえる。データレイクベンダーらは、まだ10年程度の歴史しか有しておらず、追いつくことに懸命になっている段階だ」と感じている。
FivetranのCEOであるGeorge Fraser氏は「2021年には、モダンなデータスタックにおけるデータレイクの必要性が低下している事実が明らかになると考えている」とし、この点に加えて「(中略)ストレージからコンピュートを切り離したデータウェアハウスの登場によって、データレイクを採用するという技術面からの理由はもはや存在していない」と述べている。そして、これだけでは納得できないという人のために、Fraser氏は「モダンなデータスタックの世界では、データレイクは最適なソリューションたり得ない。データレイクは既にレガシーなテクノロジーになりつつある」と総括している。