メタデータ、内容フィルタリングソフト『個人情報99』、『有害情報99』を発売

メタデータ株式会社 2010年03月04日

 メタデータ株式会社(所在地:東京都文京区 代表取締役社長:野村直之)は3日、文章内容を解析して個人情報や有害情報を高精度に判別するフィルタリング・ソフト、『個人情報99』、『有害情報99』を提供開始いたします。  『個人情報99』は、メールや、ソーシャルメディアを介した個人情報漏洩の予防や、印刷時の個人情報の伏せ字化や出力者の追跡、開示用データの作成の効率化等に役立ちます。『有害情報99』は、青少年ネット規制法逃れで一般サイトに流入する有害投稿や、ネット上のいじめ・喧嘩、また、企業サイトの誹謗中傷対策に役立ちます。  両製品は、サーバ直販、代理店販売、メーカ・SIerへのOEM供給、SaaS提供に加え、人的サービスによるチェックやデータ加工を請け負う事業者様との共同事業によるサービス提供にも活用してまいります。  エンドユーザにとっては、例えば会社で「日付・曜日の間違いや個人情報をうっかり残したままメールの送信ボタンを押して顔面蒼白になったけれど送信保留されて助かった」、「SNSやブログに記事書いて不快なコメントをもらうことが激減」といったメリットを享受していただけるようになります。

 2005年4月に個人情報保護法が施行されて以来、個人情報保護の意識は高まっていますが、漏洩事故は一向に無くなりません。悪意の無い、うっかりミスであっても、メールや掲示板では大規模な漏洩事故につながることがあります。紙による漏洩は追跡しにくい、という問題点があります。
一方、CRM部門での顧客の声をはじめ、少しでも個人情報を含むからといって一切社内情報共有を禁止してしまえば、貴重な顧客の声が製品やサービスに反映しなくなり、競争力の低下や、甚だしくは欠陥製品の出荷につながりかねません。

『個人情報99』は、これらの問題を効率良く解決するため、次の特徴を備えました:
・個人名、法人名、住所、email、電話番号、金額、カード番号、住基IDをマスキング。
・姓・名、住所、電話番号、emailなどの一部を指定してマスキング。
・マスキング対象の通し番号を管理。マスキング前後の対応表を出力可。
・マスキングの代わりに指定文字列に置き換える仮名化が可能。
・日本人の個人名の抽出率99%(社内評価)など、文法、辞書、文脈処理により高精度。
・オプションで「日付・曜日の対応誤り」チェック&訂正等が可能。
・WebAPI経由(安全なSSL通信)で利用の他、CSV to CSV変換のコマンド呼び出しも可能
・CPUコア数に比例して処理能力が向上。標準的サーバ1台で数時間で新聞記事1年分のフィルタリングが可能。

 業務での運用形態としては、メールフィルタや、グループウェア/SNSサーバ、文書管理サーバ、議事録管理システムへの組込み、Twitter等ソーシャルメディアへの投稿管理システムからの呼び出しで、試作実績があります。「伏せ字プリンティング」ソリューションとして、印刷時の個人情報の伏せ字化や出力者の追跡の提案、また、マーケティングできめ細かいセグメント化を行う際に、顧客の住所の下位部分を適宜伏せてまとめ上げる提案が有望視されています。この他、SEさんが顧客データを匿名化・仮名化して、リアルさをある程度保ったまま自社へ持ち帰れるよう、お客保有の個人情報入り実データ(CSV)を、現場に持ち込んだノートPCで仮名化することもできます。

『有害情報99』は、青少年ネット規制法逃れで分散する有害投稿や、ネット上のいじめ・喧嘩、また、誹謗中傷を含む企業サイトの炎上対策に役立つ製品です。昨年7月、SNS運営者が「枕を高くして眠れる」よう、有害情報99のプロトタイプを搭載して安心運営できるマーケティングSNS『Mextウェル』を発売。以来、暴力/アダルト表現、誹謗中傷、個人情報暴露、行動指示などの僭越な内容、なりすましや、人名・住所を含むリアルな犯行予告(当局への届出義務あり)の各ジャンルについて、数百万記事のNG / OK振り分けで実績を積んでまいりました。
 監視基準をすり合わせ、辞書類をチューニングした結果、人手による目視チェックに比肩できる精度に肉薄。一部では人手によるチェック漏れをカバーできるようになりました。

中高生から中高年まで
 2009年4月施行の青少年ネット規制法の対象サイトはもちろん、規制から逃れた非対象のソーシャルメディア上で、中高生、小学生を守り抜く必要があります。また、意外に嫌がらせや喧嘩の多い、中高年向けSNSでも、トラブルを未然に、スムーズに解決する対応が求められています。
 『有害情報99』は、対象サイトごとに異なるフィルタリング・ポリシーや文章の特徴に応じて、半自動収集した有害表現オントロジー(= 階層分類されたシソーラス(類語辞書))を複数備えています。また、今後現れる新規サイト、新規ユーザ層に対しても、少数の正解データから、サイト特有の文体を学習して適切に対応することができます。

 こうして、正しい分かち書き(形態素解析)、正しい文節の切り出し、正しい係り受け解析(構文解析)を実行し、有害表現オントロジーと併用することで、高精度な NG / OK の切り分けができます。例えば、下記の通り:
 NG お前をいつか刺してやる。       NG 結局その日も体をしっかり重ねていた。
 OK あれだけ釘を刺されても忘れたの。 OK 苦労をいくら重ねても学べなかった。

 個々の文字列、単語だけでは、NGにしようがないものでも、離れて出現しながらフレーズとしてNGな意味を構成するもののみ、NGにしています。この他、特定の人名に対してのキツい表現のみNGとしたりすることも可能です。

リアルタイム監視も可能
 『有害情報99』のプロトタイプは、マーケティングSNS製品『Mextウェル』に組み込んで稼働させてきた以外にも監視業務に適用された実績があります。特に、365日24時間、秒単位で判定しなければならない、リアルタイム・ソーシャルメディアの自動監視試行で実績があります。多めにフィルタリングしつつ問題無く扱われるような運用上の工夫や、監視を意図的にかいくぐるための破格な書き方(例:平仮名小文字『ぁぃぅぇぉ』をランダムに混ぜるなど)も一網打尽にする新技術を投入し、実用化にこぎ着けました。

『個人情報99』『有害情報99』の両製品は、サーバ直販、代理店販売、メーカ・SIerへのOEM供給、SaaS提供に加え、人的サービスによるチェックやデータ加工を請け負う事業者様との共同事業によるサービス提供にも活用してまいります。

動作環境
サーバ要件CPU :Pentium Dual Core 2GHz相当以上
メモリー : 2GB以上  HDD: 空容量40GB以上
  OSRed Hat Enterprise Linux, CentOS, Fedora
Windows Web Server2008 (64bit版) など
初期代理店様一覧
 イーブリッドリレーションズ株式会社  (リンク »)
 株式会社ネクステージ          (リンク »)
 株式会社エスアイアソシエイツ    (リンク »)

価格・納期等
 代理店様、SIer様のサービス内容に応じ、システム買取初期費用100数10万円~。
『個人情報99』は、簡単な電話インタビューの後、推奨設定を添えて最短で翌日出荷。
『有害情報99』は、NGポリシーを伺い実例をお預かりして1週間~3週間程度チューニングの上、SaaS提供またはサーバ出荷(リモート保守の設定を推奨)。



 

このプレスリリースの付帯情報

『有害情報99』の利用イメージ

用語解説

メタデータ株式会社について
メタデータ株式会社は、2005年12月にメタデータ活用技術、セマンティック技術の応用ソフトウェア会社として設立。文書管理、情報系を中心とした企業へのWeb2.0の導入を手がけると共に、WebAPI化支援、セマンティック技術を駆使した次世代のデータ連携によりホワイトカラー業務の自動化率向上、創造性拡大の支援に努めています。


本件に関するお問い合わせ先
メタデータ株式会社
pressrel@metadata.co.jp
TEL:03-3813-5447
FAX:03-3813-5447

関連情報へのリンク »

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

メタデータ株式会社の関連情報

メタデータ株式会社

メタデータ株式会社の記事一覧へ

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。