2023年も終わろうとしている今、データ管理のリーダーはこの1年を振り返り、必要に応じてデータ管理戦略を見直すことが重要です。1つ確実に言えるのは、データ中心の組織が2024年に成功を目指すのであれば、データの分散化が進む環境に備える必要があるということです。
2024年には次の5つのトレンドが出現すると思われます。
- 「データ抗重力」が主流になる。データレイク、データウェアハウスのクラウド移行が、引き続き最新のデータとアナリティクスの成功を支える大きな要因となります。しかし、いずれの組織にとっても、1つのクラウドプロバイダーやプラットフォームに依存してエンドツーエンドのデータとアナリティクスのニーズ全てを満たすことはますます困難になるでしょう。
- データ製品の重要性が高まる。データの分散化が進むにつれて、分散型のデータ管理手法であるデータメッシュがより重要な役割を果たすようになるでしょう。データメッシュのコンテキストでは、ビジネス関係者はデータ製品を定義・作成し、そのドメインのニーズに合わせてデータを管理できなくてはなりません。IT部門は、ビジネスユーザーがより自立できるように適切なインフラを配備する必要があります。
- 組織は生成AIを採用してうまく活用しようと奮闘する。生成AIもデータ管理に多大な影響を与えています。その結果、ツールやテクノロジーがビジネスにより適した使いやすいものになっていきます。ただし、分散化が進むデータ環境では、高品質で信頼できるデータへのアクセスが保証されない限り、生成AI対応のデータ管理インフラはほとんど、または全く役に立たないでしょう。
- 組織はクラウドコストの効率的な管理が必要になる。組織はインフラをクラウドに移行しつつありますが、クラウドはコストの変動が非常に大きく、予測が難しいという不都合な真実に多くの組織が直面しています。組織はクラウドコストを適切に管理する方法が必要となります。
- データのセキュリティとガバナンスの効率化が必要になる。データは常に保護され管理されている必要があります。ただし、データはオンプレミスやクラウドのシステムにわたって分散されたままであるため、データのセキュリティとガバナンスがデータアクセス、コラボレーション、イノベーションの妨げとなってはいけません。2024年には、セキュリティとガバナンスを簡素化するソリューションが増加するでしょう。
これらの各傾向を順番に詳しく見ていきましょう。
データ抗重力が主流になる
データ重力(データの複製や移動を妨げる力)の概念はもはや存在しなくなりました。最新のデータ戦略を進める全ての組織は、ビジネスニーズを満たすためにデータレイクを使用していても、それと並行してデータウェアハウスも使用する必要があります。この20年間で、データウェアハウスとデータレイクはエンタープライズデータのサイロ化問題の解決法として一般的になりましたが、これらによってむしろもっと大きな問題が生み出されています。
それは、データウェアハウスとデータレイクがオンプレミスとクラウドの両方のシステムで構成されており、多くの場合はそれらが地理的に分散しているからです。全てのクラウドサービスプロバイダーが、データとアナリティクスに関する問題の多くを自社で解決しようとしていますが、ほとんどの組織がデータとアナリティクスをマルチクラウド環境で実行しており、さまざまなクラウドサービスプロバイダーから製品やサービスを厳選して使用しています。
これが2024年以降、データ重力に抵抗する力、つまり「データ抗重力」が一般的になる理由です。他にもデータ抗重力の傾向の要因として、データ複製費用の上昇、データ主権、データガバナンスに関する地域の法律や規制、知見獲得の高速化に対する要件などがあります。データ抗重力の傾向が続く中、データ管理のリーダーは分散データ管理を前提として構築されたテクノロジーに投資する必要があります。
データ製品の重要性が高まる
2024年は、データが本質的に持つ分散的性質を受け入れるデータメッシュの地位が向上する転換点となる年になります。ビジネスユーザーにデータプロジェクトを提供するデータチームによってデータが保存・管理される従来の集中型パラダイムとは対照的に、データメッシュは複数のデータドメイン(そのデータの主なビジネス利用者によってそれぞれ管理される)を中心に編成され、各データドメインはそのデータの主要なビジネスコンシューマーによって管理されます。データメッシュでは、IT部門の役割はデータドメインの作業を行うための基盤を提供すること、つまり企業全体にデータ製品を作成して配布することに移行します。
データ製品は他の製品提供と同じ重要度で扱う必要があると認識された時が転機になるでしょう。例えば、解熱鎮痛薬「タイレノール」のカプセル剤を考えてみましょう。その価値はカプセル剤自体にあるのではなく、説明や用途から成分一覧や安全対策までさまざまな情報が記載された、消費者の信頼を得るためのパッケージ全体にあります。同様に、データカタログは生データを信頼できる利用可能な資産に変換する重要な「パッケージ」として機能します。
このデータ中心の時代に、単にデータを魅力的にパッケージングするだけでは不十分であり、組織はエンドユーザー体験全体を向上させる必要があります。EC大手のベストプラクティスで提唱されていることと同様に、現代のデータプラットフォームはパーソナライズされた推奨事項や人気製品の特徴などの機能を提供すると同時に、ユーザーによるおすすめやデータリネージの可視性を通して信頼を築く必要もあります。
さらに、これらのプラットフォームはデータカタログから直接クエリーをリアルタイムに簡単に実行できるようにし、データに関するユーザーからの問い合わせや要望、変更に対してインタラクティブなフィードバックループを維持することも必要です。ECでタイムリーな配信が不可欠であるのと同様に、データへの迅速で信頼性の高いアクセスが組織にとって極めて重要になっていきます。