「ある調査では、企業においてデータベースに格納されるデータの80%〜95%は、テキスト情報の非定型データだと発表されている。ここでいう非定型データとは、たとえばExcelのピポットテーブルで集計できないデータ、つまり構造化されていないデータを指している」と神田氏。
たとえば、コールセンターに寄せられる品質リスクや日報/日誌内の最新動向、インターネットリサーチでのフリーコメント、ブログ/SNSによる風評などのテキスト情報を、企業の意思決定に役立てようとするニーズは高まりを見せている。現在、280社以上の企業でNRIのソリューションが活用されている。
神田氏は、「紙おむつとビールが一緒に売れる傾向があるというデータマイニングの事例は有名だ。紙おむつやビールといった定量的な情報の分析がデータマイニングであるのに対し、50歳以上の顧客は“○○の説明が読みにくい”といった文字情報から○○部分の定性的な非定型データを分析するのがテキストマイニングだ」と言う。
また製造業では、ブランドの失墜や製品回収コストや無償修理が業績に与えるリスクを回避するため、品質リスク管理を強化しようとする動きがある。経済産業省における消費生活用製品安全法、金融業における金融改革プログラムなどの法規制への対応は、企業でテキストマイニングの活用が進む理由のひとつだ。
さらに、顧客の意見や要望をテキストデータとして管理するだけでなく、商品開発に生かそうとする取り組みも始まっている。
2007年3月にNRIが1500社に郵送調査した結果によると、70%〜80%はコールセンターやアンケートから顧客の声を蓄積しているという。しかし、経営層に向けて顧客の声を3週間以内に伝達できている企業は5割しかない。顧客の声が有益な情報として「見える化」されていないのが実態だ。
それでは、TRUE TELLERはどのように「見える化」を実現するのか。
たとえば、文字情報を集計/分析し、経営層向けのレポートを自動作成したり、苦情の自動分類とリスクワードの高い情報をアラートメールとして配信することが可能。コールセンターやブログの文字データを一元管理し、文字検索で商品別にクロス集計を行うアドホック分析や、得られた知見をアクションボードで管理することができる。
神田氏は、「顧客の声を活用するときに、収集(Acceptance)、分析(Analysis)、共有(Acknowledge)、改善(Action)の4Aサイクルを回す仕組みを構築することは重要だ。しかし、4Aサイクルを回すために、膨大なテキスト情報の構造を把握し、グラフ化やキーワード集をリストアップする“見える化”と、必要なコンテンツだけを役職や部署に応じて配信する“見せる化”を管理する仕組みを実現することが必要になる」と話している。