ビッグデータがビジネスを制する時代といわれ、大量のデータ、顧客の声、ソーシャルメディアの書き込みを前にしながら、現場では未だ上流の『収集』『蓄積』にとどまり、最重要の『分析』にまで手が回らないようです。これではビッグデータの利活用で得られる高付加価値の知見をみすみす逃すことになってしまいます。
この「分析」をさらに難しくしているのが、数値データと不定形テキストデータの2種に分かれていることで、これらを同じツール上で分析を進めていくことは従来困難でした。
そこで、メタデータ社では、文脈を反映した高精度ネガポジAPI、感情解析APIの出力数値や、5W1H抽出API により日付時刻、場所、個人名、法人名、イベント名、製品名等を正規化し、テキストビッグデータを分析可能にする技術を磨いて提供してまいりました。
具体的には、ビッグデータの解析結果から、営業トーク原稿を改善したり(例えば、顧客アンケート結果から顧客の「心に刺さる」フレーズを発見)、次期商品の企画、キャンペーンの参考になる知見を抽出することができました。
■アンケート分析Proにより同一データベース上で自由回答を統合評価
今回、SaaSでご提供するアンケート分析Proでは、アンケート回答者の選択回答、記入数値、評価者の選択、そして自由回答を高精度ネガポジAPIで解析した「-3」から「+3」までの数値、そして自由回答本文、さらに自由回答をベクトル数値データに変換した結果を全て同一のデータベース上に保持しています。このため、これらの値に対する条件を任意に組み合わせて、回答群を絞り込むことが可能です。言葉の係り受けランキングから、多くの人が話題にしている主要テーマを発掘することもできます。
アンケート分析Proは以下の機能を備え、発想の種の宝庫である自由回答を中心に、アンケート・データベースと分析官が「対話」し、定量評価はもちろん、新たなテーマや知見、応用素材を次々と発掘できるワークベンチとなります。
■フルテキスト類似検索で素早く疑問に回答。仮説を検証。
アンケート分析Proは、ジャストシステムのConceptBase(TM)や、グーグルのGoogle Appliance(TM)などのフルテキスト類似検索と同等の機能を、データベースエンジン上に実現。自然文テキストを投入すると、自動的に単語頻度、記事頻度、特徴語の稀さなどを総合評価してランキングします(次ページ上図)。
「こんな問題について答えてる自由回答はないかね?」と組織トップに聞かれた時、また、分析官自身が、「こんな仮説思いついたけれど、関連の意見はどれくらいあるだろうか?」などと発想したとき、それらをそのまま入力すれば、関連順のランキングをすぐに確認することができます。
問への答えを含む長めの記事を探したり、それらに、ネガポジ値、回答者プロフィール(属性)、選択肢回答が付いた状態で関連度の高い自由回答をブラウズすることができます。ランキング上位に浮上した回答文いくつかからコピー&ペーストした長い文章をそのまま問い合わせテキストにして、ピンポイントで、複数のポイントを含む回答が他にないか、探すこともできます。
■ヒートマップによる数値との相関一瞥機能
選択肢やプロフィール、テキストのネガポジ評価値等の間に、特徴的な相関関係がないか、解析します。左図の例では、-3~+3の7段階のネガポジ値と、関東1都6県の回答者の居住都県との相関関係が一目でわかるようになっています。
このモードでは、赤色の濃さは該当する回答者数に比例。特異的に多いと思われた、「神奈川県の「-2」」の箱にマウスをかざすと、該当人数21が表示されます。
・ヒートマップ上の該当箇所の生データの一覧を呼び出す機能
このように気になる箇所にマウスをかざし、回答数をマウスクリックすると、該当の回答文全てを参照可能。
データを漫然と見ただけでは判らなかった相関関係をすぐに確認できるため、次々と仮説や結論を検証することが可能です。
■追加調査を手軽に行う『ツイ追(ついつい)』機能 (オプション)
上図のアンケート・サンプルは、ツイッターで、ハッシュタグ #東京五輪 を含み、東京開催決定が発表された9月8日前後1カ月間のツイート数千件を集めて自由回答としたものです。仮属性として年齢、性別、居住地を、書き込みと矛盾しない程度に付与し、さらに、2種の選択肢回答「東京五輪決定は嬉しいか」「2020年に向けて景気はよくなるか悪くなるか」を追加しました。
ツイート、特にハッシュタグ付きのツイートは、特定の話題についての意見表明を集めやすく、賛否・中立の違いなども鮮明に出る傾向があります。このため、あたかも元からアンケートで収集した自由回答のように見えるツイート群が大半を占めることも少なくありません。
一方、アンケートは、設問の不足や不備に気付いても、時間や費用などのコスト面の理由により、気軽に追加実施することはできません。そこで、役に立つのが『ツイ追(ついつい)』機能。アンケート分析Proから得られた仮説、暫定の結論を検証するために、ツイッターの「高度な検索式」を生成し、調整の上、過去長期間にもわたるツイートHTMLファイルをダウンロード。それを投入すると、アンケート追加分として、自由回答を中心に補ってデータベースを充実させ、その上で、上記の各種分析機能が使えるようになります。
このプレスリリースの付帯情報
用語解説
■用語解説
① 高精度ネガポジAPI
7段階のネガポジ属性(excellent, very good, good, neutral, no good, bad, very bad) を日本語の形容表現99%以上に付与。「物価が~高い:-2」「背が~高い:+1」のように多数のフレーズ辞書と、文脈を反映した(否定、二重否定、逆接、仮定節等に応じて適切に積算)ロジックを備え、段違いに高い精度を誇ります。
② ヒートマップ
もともとは2次元平面で温度の高低を色の違いで表現した温度分布図を意味。ネットマーケティング分野では、Webページ上での閲覧者の視線分布、または広告などのクリック率の分布をカラー表示した図に限定されていたが、アンケート分析Proでは汎用的に、2軸を選んでその間の相関関係を直感的に把握し、選んだ個所をドリルダウン表示する「見える化」ならびにドリルダウン操作のGUIとして採用しました。
メタデータ株式会社について
メタデータ株式会社は、2005年12月にメタデータ活用技術、セマンティック技術の応用ソフトウェア会社として設立。適合型自然言語解析エンジン『メタパーザ』を駆使した意味解析技術により、5W1H抽出によるコンテンツ連携や個人情報の自動匿名化や、評判分析(ネガポジ・感情解析)、風評発見・監視ソリューション、Web対話ロボットなど、SaaS、クラウド向けアプリケーションを開発してまいりました。これにより、顧客企業様のソーシャル活用推進、CRM局面での情報セーフティネットの構築を行っています。また、資料送信まで自動で行える対話ロボット"Web受付嬢"により、Webサイトを親しみやすく、ITを使いやすくすることを支援しています。
本件に関するお問い合わせ先
メタデータ株式会社
担当:野村 nomuran@metadata.co.jp
TEL:03-3813-5447
FAX:03-3813-5447 (リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。