メタデータ株式会社は、「Mextractrエンジン」の5W1Hメタデータ抽出機能を2008年6月以来、WebAPIの形式でSun x リクルートマッシュアップ・アワードや、ドリコム社のAward on Rails2008に提供してまいりました。このWebAPIのユーザ130名、そして公開7作品を含むマッシュアップ事例からフィードバックを得て、9月末に最初の応用製品「Mextractr個人情報フィルタ」を発売。メールや、SNS上の情報や、営業報告など日々企業内を流れるテキストデータから、個人名、住所などの個人情報を自動的に抽出し、その全部または一部分を伏字化し、プライバシ保護と情報共有を両立させるソリューションの提供を開始しました。
今回、「Mextractr for Mashup」の発売にあたって、一般的な5W1Hの表現から外れた任意の単語やフレーズ、あるいは本文中に存在しないフレーズを5W1H扱いできる「Mextractrエディタ」を新たに開発しました。「Mextractrエディタ」を用いることにより、従来の手作業に比して1桁少ない労力で、意図通りにマッシュアップ可能な素材としたり、チェック済みの個人情報保護を施して、社内外向けのWebサービスや、SNS/ブログのシステムに情報を掲載、配備することが可能となりました。
■ 「Mextractr for Mashup」の特徴
・数百種類の意味属性の出現パタンをチェックすることにより5W1H情報を高精度に抽出
・「Mextractrエディタ」により、執筆者や管理者、編集者、利用者が、抽出結果を任意に修正・加工可能
・サーバ・ソフトウェアのため、全社、部門で統一、一貫した5W1H抽出、ならびにカスタマイズが可能
・WebAPIをもち、フィードの形式で出力するため、マッシュアップにより、多種多様なシステム、ソフトウェアと容易に接続可能
・既存製品「Mextractr個人情報フィルタ」ライセンスと組み合わせて伏せ字化による個人情報保護が可能
■ 「Mextractr for Mashup」の価格
・最小構成(登録利用者数3名)の初期ライセンス料:35万円から
※保守契約を伴います。ボリュームライセンスは応相談です。
・「Mextractrエディタ」の価格
最小構成(登録利用者数3名)の初期ライセンス料:15万円
※保守契約を伴います。ボリュームライセンスは応相談です。
・オプション辞書(会社コード、社員コード、商品コード、関連URL等):要見積
・オプション機能(施設名や金額表現等、新種の固有表現やメタデータ、数量表現の抽出):要見積
・出力形式のカスタマイズ、クライアント・アプリケーションの制作:要見積
■ システム要件
OS:Windows XP以降,Windows 2003サーバ以降
(Linux版開発中)
CPU:Pentium4 2.8GHz相当以上必須,Pentium Dual Core 1.8GHz以上を推奨
メモリ:1GB必須,2GB以上推奨
HDD:20GB以上の空容量(システム用,データ保存用は別途)
なお、「Mextractr for Mashup」は、11月28日に開催のXMLコンソーシアム・セミナー「エンタープライズマッシュアップ、次世代クライアント製品徹底検証」:
(リンク »)
にて紹介、デモンストレーションを行います。
□ 賛同企業からのコメント
株式会社アプレッソは、「Mextractr for Mashup」の発表を歓迎します。アプレッソでは、EAI (Enterprise Application Integration)ソフトウェアDataSpiderの開発、販売を行っており、今後、顧客企業がデータ資産をWebAPI化して情報共有、機能連携をする必要性を見出しています。メタデータ社は既にDataSpider上で名寄せを行う機能や個人情報の発見、フィルタ機能のプロトタイプを試作してくれています。今回発表の「Mextractr for Mashup」により、DataSpiderが今後目指すソリューションがますます加速し、顧客のマスターデータ管理(MDM)、フロー情報の有効活用が進展することを期待しています。
株式会社アプレッソ 代表取締役副社長 小野和俊
このプレスリリースの付帯情報
用語解説
□ WebAPIについて
地図素材に代表される、Web上で常時提供されているデータや計算のサービス。マッシュアップしてアプリケーションを構築する側から極めて低いコストで短期間に組み込むことができる。
□ マッシュアップについて
Web上の様々な素材サービス(WebAPI)の集まりからシステムを構築する手法。WebAPIを1つだけ用いたものから、30数本もの様々な WebAPIを束ねたものまで、規模も特徴もバラエティに富んでいる。構築手法もエンドユーザが視覚的に素材を組み合わせるだけである程度のものができる、「使い捨て」のようなものから、サーバ側で本格的なプロミングを行う大規模システム開発まである。企業情報システムのきめ細かい機能の品揃え、カスタマイズを、低いコストで短期間に実現可能。
□ 固有表現について
様々な固有名詞に数量表現、型番、コードなどを加えたもの。Mextractrでは、300種類以上の固有表現を定義し、5W1Hに基づいて体系化、階層化した意味属性を用いて解析している。その結果は、フィードの一種AtomにGData、georss、UBL2.0、および、独自の拡張を加えた形で出力している。
■ メタデータ株式会社について
2005年12月にメタデータ活用技術、セマンティック技術の応用ソフトウェア会社として設立。文書管理、情報系を中心とした企業へのWeb2.0の導入を手がけると共に、WebAPIとマッシュアップを駆使して次世代のデータ連携によりホワイトカラー業務の自動化率向上、創造性拡大の支援に努めています。
お問い合わせにつきましては発表元企業までお願いいたします。