ビッグデータ関連の重要用語リストを作成する際、高度な技術を持つビッグデータの専門家から、ビッグデータに関してはダッシュボードレポートにしか関心のない企業幹部まで、誰もが知っておくべき用語を洗い出すのは有意義なことだ。それに当てはまる20の用語を紹介する。
アナリティクス
ソフトウェアベースのアルゴリズムと統計を使って、データが持つ意味を解き明かす手法。
アルゴリズム
ソフトウェアプログラムに組み込まれ、データセットの分析を実行する算法。アルゴリズムは複数の計算などの手順で構成されることが多い。アルゴリズムの目的はデータを処理して特定の疑問や問題を解決することだ。
行動分析
ユーザーの行動に関して収集されたデータを使い、意図を理解したり、将来の行動を予測したりする分析手法。
ビッグデータ
System of Record(SoR)データではなく、以下の基準の1つ以上に当てはまるデータ。SoRデータセットのサイズを上回る極めて大規模なデータセットであること。多様なソースに由来するデータであること(マシン生成データ、インターネット生成データ、コンピュータログデータ、ソーシャルメディアがソースのデータ、グラフィックスや音声ベースのデータを含むがこれに限定されるものではない)。
ビジネスインテリジェンス(BI)
ビジネスに関連する情報を分析、報告、管理、配信する方法論とツール群。アナリティクスで使用されるものと同様のダッシュボードやクエリツール、レポートツールが含まれる。アナリティクスとBIの主な違いは、アナリティクスが統計および数学データ分析によって、さまざまな状況の未来の結果を予測するのに対し、BIは過去のデータを分析して本質的な情報やトレンドの情報を提示する点だ。
クリックストリーム分析
ユーザーがウェブページでクリックするアイテムに基づいて、ユーザーのオンラインでの活動を分析すること。
ダッシュボード
経営陣などがデスクトップデバイスやモバイルデバイス上で活動状況の概要を一目で把握できるグラフィックレポート。多くの場合、この高度なグラフィックレポートは、青信号(すべての業務が正常)、黄色のアラート(業務にある程度の影響がある)、赤色のアラート(業務が停止している)の機能を備えている。このようにイベントや業務が「目の届くところ」に可視化されるため、従業員は業務の状況を追跡し、必要に応じて、詳細な部分まで迅速に掘り下げて確認することができる。
データアグリゲーション
レポートや分析を目的として、多種多様なソースからデータを収集し、そのすべてを共通のデータリポジトリにまとめること。
提供:iStock/mindscanner