製品概要
■Mail Cyclopeは全文検索にN-gram(2gram+4gram)を採用し『日本語ABcd→日本/本語/語AB/ABcd/Bcd/cd/d』のように区切りインデックスを作成するので、ファイルサーバに貯まった大量の電子メールの内容を漏らすことなくインデックス作成します。また、作成されたインデックスを最後まで検索(mc_Search)対象とするので、最後の1通までメールを見逃すことが有りません。
■文字ゆらぎの設定
アルファベットの大小文字の同一視や全半角文字の同一視などの設定が可能です。これにより、「ABC」「abc」をふくむメールも漏らさず検索できます。
■検索条件の設定
and,or,not,( )や日付指定、件数指定、場所指定などの検索条件が設定出来、お客様のニーズに合った検索条件を設定して頂けます。
■メールをヘッダ・本文・添付ファイル(Word, Excelなど)に分割し、ヘッダ・本文はデ変研TFライブラリを使う事によりテキストに変換。添付ファイルの圧縮(ZIP/LHA)されたものにはデ変研MXライブラリで解凍後デ変研TFライブラリによりテキストに変換します。
このような処理を行い、指定したキーワードを含むメール、指定した種類のファイルが添付されているメールを監査対象と出来るようにいたします。
■インデックス生成時などに万が一、プログラムが segmentation faultやタイムアウト等により異常終了した場合でも、原因となったファイルをスキップしインデックスの再生性を自動的に行います。
また、インデックスが生成できなかったファイルの一覧も生成しますので、原因追及にも迅速に対応出来ます。
■ クラスタリング機能により、大量のメールでも、インデックスを作るサーバを分割させる事で検索しヒットするまでの時間を大幅に短縮することが可能です。
■メールのSubject / From / Toなどのヘッダーや本文からの検索はもちろん、デ変研MFXライブラリによりメールに添付されたファイルや圧縮されたファイルも解凍し解析する事が出来ます。これにより添付されたファイルも検索対象となります。
■ 添付ファイルのエンコード
uuencode(MIME形式 / 本文埋込形式)/ base64 / binhex/ 7bit binary / 8bit binary / quoted-printable
■添付ファイルの圧縮フォーマット
tar / gzip / tgz /tar.gz / zip(winzip / pkzip 自動解凍形式・パスワード付きは除く) lha( lh1 / lh5 / lh6 / lh7 / 自動解凍形式は除く) rar / bzip2 は近日対応予定
【デ変研TFライブラリ対象ファイル】
Microsoft Office
<<Windows版>>
Word 95 / 97 / 98 / 2000 / 2002(XP) / 2003 / 2007
Excel 95 / 97 / 2000 / 2002(XP) / 2003 / 2007
PowerPoint 95 / 97 / 2000 / 2002(XP) / 2003 / 2007
<< Macintosh版 >>
Word 98 / 2001 / 2004 / 2008 for Mac
Excel 98 / 2001 / 2004 / 2008 for Mac
PowerPoint 98 / 2001 / 2004 / 2008 for Mac
一太郎 Ver.5 〜Ver.13 / 2006 - 2008
富士通OASYS OASYS V6 / V7 / V8 / 2002
Lotus Word Lotus Word Pro2001
Lotus 1-2-3 Lotus 1-2-3
Acrobat 4.0 / 5.0 / 6.0 / 7.0 / 8.0 pdf 1.2 / 1.3 / 1.4 / 1.5 / 1.6 / 1.7 * PDF1.1 は変換対象外です。
XPS
リッチテキスト RTF
テキスト文書 JIS/EUC/SJIS/UCS-2/UTF-8/UTF-16
書式付きテキスト HTML / XML / SGML