4月も半ばとなり、そろそろ新社会人の方々も新しい環境に慣れてきたころだろうか。
もしかすると、会社で使うことになったグループウェアの共有フォルダに保存されている「業務マニュアル」を、精読しておくよう命じられた人もいるかもしれない。その共有フォルダの中には、他にも数多くのファイルが保存されていて、ちょっと中身をのぞきたくなったかもしれない。
ビジネスの「データ」にはいろんな種類がある
当たり前のことだが、今日のビジネスは「データ」に基づいて動いている。ひと口にデータといっても、企業には実に様々なデータが存在する。ここで整理をしてみよう。
データは「定型」「非定型」で分類されることが多い。
定型データは「構造化データ」とも呼ばれ、「年月日、商品名、単価、数量」といった伝票等に記入された数値データや「社員番号、氏名、住所、生年月日」といったデータベースに登録されたレコードなどのことだ。
一方の非定型データは「非構造化データ」とも呼ばれ、ワープロソフトの「Word」などで作成した文書ファイルや電子メール、プレゼンテーション用のPowerPointファイル、PDFファイルなどで使われているデータのことを指す。画像、動画、音声などのデータもこちらに含まれる。文書ファイルの中に数値データが記入されていたとしても、中身をすべて読まなければ分からないタイプのデータとも言える。
データ活用、特に「ビジネスインテリジェンス(BI)」を用いたデータ活用においては定型データの活用が基本となる。最近のBIは非構造化データも扱えるようになったが、ここでは基礎知識を固めるために、定型データに絞って見ていくことにしよう。
企業で取り扱われる定型データは、大きく「マスタデータ」と「トランザクションデータ」に区分することができる。これ以外にも「メタデータ」や「階層データ」等もあるが、いっしょに話すと複雑になるので、今回は省略しよう。
意外に思うかもしれないが、現代の企業におけるビジネスは、ITによって大半が自動化されている。ここでいう「ビジネス」は主に「オカネの流れ」や「モノの動き」を指す。これらは、業務アプリケーションによって自動的に処理され、大幅に効率化されているのだ。
マスタデータは、そうした複数の業務アプリケーションで共通して使用されるデータ項目として定義されたデータなのである。上図のように「顧客」「商品」「社員」といったデータ項目に登録される、あまり変化しない固定的なデータ、基本的なデータがマスタに該当する。マスタデータはトランザクションの実行時にも用いられる。
一方、トランザクションデータは業務処理とともに増えていくデータだ。トランザクションデータは、マスタデータを主語にして、マスタデータが「何をどうしたのか」を示すデータだと理解してよい。たとえば、誰(顧客)が「いつ、いくらで、何個買って、合計はいくらだった」を示すのが、トランザクションデータだと考えると分かりやすいだろう。販売管理アプリケーションで、誰が何をいくら買ったというトランザクション数が絶え間なく増加している状態は、「売れ行きがたいへん好調である」ことを示している。