インメモリは「導入するかどうか」から「どう使うか」の時代へ
では、インメモリデータベースの課題とはなんだろうか。容量単価が高いことと、専用のシステムが必要になることだと生熊氏は指摘する。
「DRAMの容量は年々増加し、価格も低下しているが、ハードディスクに比べれば容量単価は非常に高く、絶対的な容量も小さい。そのため、通常は必要なところだけをインメモリデータベースに移行することになるが、結果として管理対象のシステムが増えることになる」(生熊氏)
この課題はアンケート調査の結果にも表れている。インメモリデータベースに対する懸念として、「運用管理コストの増大」「ハードウェアコストの増大」「ソフトウェアコストの増大」の3つが上位を占めているのだ。
インメモリデータベースに対する懸念点
こうした課題を抱える企業に対し、これまで生熊氏は、インメモリデータベースを導入すべきか、どの範囲を移行すべきかを、TCOだけでなくビジネス上のメリットをROIとして評価して検討し、運用コストを下げるために既存のデータベースと互換性が高い製品を選ぶこと、とアドバイスしてきたという。データベースは製品ごとにプロシージャ言語に違いがあり、データタイプも異なる。新規導入するインメモリデータベースと既存のデータベースとの違いが大きいと、開発コスト、運用コストの増大が避けられないからだ。
ただし、こうしたアドバイスは昨年までの話だという。セッションの最後でこれからのインメモリデータベース選びについて次のように語り、セッションを締めくくった。
「インメモリ機能をビルトインしたデータベース(SQL Server 2014)が登場した現在、そうした製品を選べば、インメモリデータベースとディスクベースのデータベースを同一の開発環境、運用ツールで使うことができる。既存のアプリケーションもそのまま利用することも可能だ。これまでインメモリデータベースは、ミリ秒単位のレスポンスが必要なシステムに限定してコストをかけて導入するものだったが、これからは導入するかどうかではなく、インメモリデータベースをどう使うかが重要になる」
インサイトを引き出すには、仮説ではなくオープンクエスチョンが必要
同イベントの3つ目のセッションでは、昨年35万部のベストセラー「統計学が最強の学問である」を生み出し、今年3月に「1億人のための統計解析」を発表した統計家の西内啓氏が登壇。「1億総データサイエンティスト時代に向けて」と題したセッションを行った。
「統計学が最強の学問である」の著者、
統計家 西内啓氏
西内氏によると、データ分析において「仮説を立てて検証する」という従来の方法は、すでに有効性を失っているという。
「膨大にデータが存在する現在において、仮説を立ててある1つの項目について検証するのは、データの一部しか利用していないということ。分析結果が得られたとしても他の多くの項目については説明できず、新しい発見にも出会えない」(西内氏)
仮説の代わりに立てるべきは、「オープンクエスチョン」だという。「Yes」か「No」が答えになる「クローズドクエスチョン」(仮説)に対し、さまざまな答えがありうる問いが「オープンクエスチョン」だ。例えば、「どうすればもっと儲かるのか」といった類の問いである。このオープンクエスチョンを「アウトカム」(望ましい状態の定義)、「解析単位」(アウトカムの単位)、「説明変数」(アウトカムを左右しうる特徴)の順番で分解して具体化し、データを分析することでより客観的で信頼できる分析結果が得られるという。
※クリックすると拡大画像が見られます