編集部からのお知らせ
解説集:台頭するロボット市場のいま
解説集:データ活用で考えるデータの選び方

デ変研 監査ライブラリ(個人情報検出エンジンOEM)

株式会社データ変換研究所 

2008-06-25

高速かつ高精度に個人情報を監査・検索するライブラリです。 社内のクライアントPCやサーバー内のあらゆるファイルを対象に、個人情報にあたる氏名・住所・電話番号・メールアドレス・ID情報を高速検出し、各文字パターンの存在を監査して監査結果を出力するシステムソフトウェアです。主に個人情報探索ツール等を開発・製品化していただく為の要素技術です。

製品概要

■デ変研監査ライブラリは EUC コード又は SJIS コードで作成された単語辞書を、内部的に全ての文字コード( JIS / EUC / SJIS / UTF-8 / UTF-16 / RTF/ HTML / XML/ SGML ) に自動展開して、あらゆるファイル(ファーマットに依存しない)についてこれらの辞書パターンが一致するかを高速に調べるソフトです。
■氏名
名字の人名辞書:1000語・2000語
日本人の名字の多いものより構成しておりますので全国の名字におけるこれらの辞書の網羅率は1000語辞書使用時で70%、2000語辞書使用時80%になります。
■住所
都道府県名:47・市区町村名:3791
(2005年度郵便番号表に基づき作成。)
■メールアドレス
人名辞書をローマ字変換:2100語と3600語)等を標準搭載。
"@"前にローマ字名字の付いているものをメールアドレスと判断
■電話番号
電話番号パターンを14パターンを用意。東京都内/大阪市内/市外局番3/4/5/桁市外局番のみ6桁、携帯番号、海外からの電話番号(+81など)
■ID情報
お客様が任意のコードを設定していただけます、例えばDHK####と記述すればDHKで始まる4桁の数字をID番号としてパターンマッチさせます。
※それぞれの辞書はユーザー修正、追加可能です。
<対応フォーマット例>
■圧縮したアーカイブファイル
gzip、tgz、zip(winzip/pkzip 自動解凍形式・パスワード付きは除く)、lha(自動解凍形式を含む) 、rar、bzip2.アーカイブ展開後のアーカイブファイルはさらに展開し、圧縮ファイルは1つのファイルまで展開します(展開レベル指定による制限可)。
■圧縮していないアーカイブファイル
tar / gnutar。
■メールファイル
EMLファイルとその添付ファイル。添付ファイルは更に添付展開し、圧縮ファイルは1つのファイルまで展開します(展開レベル指定による制限可)。添付ファイルのエンコードは、uuencode(MIME形式/本文埋込方式)、base64、quated-printable、binhexとします。メールはqmailでいう1つのメールファイルをいいます(UNIXのmailコマンドでいうmboxファイルのような複合メール形式ではありません)。
■Microsoft Office 
  <<Windows版>>
Word 95 / 97 / 98 / 2000 / 2002(XP) / 2003 / 2007
Excel 95 / 97 / 2000 / 2002(XP) / 2003 / 2007
PowerPoint 95 / 97 / 2000 / 2002(XP) / 2003 / 2007
<< Macintosh版 >>
Word 98 / 2001 / 2004 / 2008 for Mac
Excel 98 / 2001 / 2004 / 2008 for Mac
PowerPoint 98 / 2001 / 2004 / 2008 for Mac
Acrobat 4.0 / 5.0 / 6.0 / 7.0 / 8.0(一部未対応の場合もあります。)
PDF 1.2 / 1.3 / 1.4 / 1.5 / 1.6 / 1.7 ※PDF1.1は対象外となります
一太郎 Ver.5 〜Ver.13 / 2006 - 2008
OASYS V6 / V7 / V8 / 2002
Lotus Word PRO2001 Lotus1・2・3
テキスト文書 JIS / EUC / SJIS / UTF-8 /UTF-16 / RTF / HTML / XML / SGML

特徴

アプリケーションソフトウェア組込OEM提供となります。

製品関連情報

ホワイトペーパー

新着

ランキング

  1. クラウドコンピューティング

    AI導入に立ちはだかる「データ」「複雑さ」「コスト」「人材」の壁をどう乗り切ればいいのか?

  2. クラウドコンピューティング

    【IDC調査】2026年には75%のアプリがAIを実装!導入で遅れた企業はどう“逆転”すべきか?

  3. 運用管理

    経産省調査で明らかに:未だにレガシーシステムを抱える企業が8割!オープン化でよくある課題とは?

  4. 運用管理

    AWS東京リージョンの大規模障害に学ぶ、パブリッククラウド上のシステムの迅速な復旧方法

  5. windows-server

    【ユースケース】ソフトウェア開発にDell EMCインフラ+コンテナを使うメリット

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]