概要
■ 高速性圧倒的な高速性を発揮し、全文検索におけるインデキシング生成時間の大幅な短縮化を実現します。
■ 精度/安定性
全文検索システムにとって非常に重要となる高度な検索精度を実現するには検索対象となる文書ファイルからのテキスト抽出精度が極めて重要となります。本来、ヒットすべき文書がヒットしないようでは、全文検索システム導入効果が意味のないものになってしまいます。当社「DocCat」及び「TFライブラリ」はファイルのサフィックス(.docなど)を一切参照せずファイルの中身で判定し、高精度なテキスト抽出処理をおこないます。
■ 開発生産性
ライブラリには、ファイルフォーマットの自動検出プログラムの関数も用意しておりますので、ファイルの切り分けプログラムを作成する必要はありません。
■ サポート
文書ファイル新バージョンへの対応をスピーディーに行います。また、現行サポートしていないファイル形式についてはご要望に応じて対応いたします。機能面の追加についても必要性の度合いに応じて詳細をお聞きしたうえで柔軟に対応いたします。
■ 使用方法が簡単
DocCatコマンドと似たサンプルプログラムを用意しており、プログラム経験のある方には非常に容易にご理解いただけます。
■ ユニコードを中心とした文字体系
マイクロソフトのWindowsに準拠したユニコード体系の文字コードを利用しているので、MS-Office、一太郎とのテキスト文字コードの親和性が高く他のアプリケーションで利用できます。
■ プロパティ情報も出力
MS-Office97以上のファイル、PDFファイルであれば、オプション指定によりファイルに記述されているプロパティ情報を出力することができます。
■ 半角カタカナの揺らぎを吸収
半角カタカナ文字を全角カタカナに自動的に変換し出力することができます。
■ 拡張子によらずファイルの内容を自動判別
ファイル情報の認識が困難なクライアントサーバモデルにも適しています。
■ HTML/XML形式出力
出力フォーマットをHTML、XMLにすることが出来ます。
■ マルチスレッド対応
CPU数に応じてテキスト抽出速度の情報が向上します。
■ 必要メモリ・ディスク空き容量
メモリ 256MB以上(推奨)
ディスク 1MB以上(ソフトウェアのみの場合)
■ 対応文書
Microsoft Word
Word 95 / 97 / 98 / 2000 / 2002(XP) / 2003 / 2007
Word 98/2001/2004 / 2008 for Mac
Microsoft Excel
Excel 95 / 97 / 2000 / 2002(XP) / 2003 / 2007
Excel 98/2001/2004 / 2008 for Mac
Microsoft PowerPoint
PowerPoint 95 / 97 / 2000 / 2002(XP )/ 2003 / 2007
PowerPoint 98 / 2001 / 2004 / 2008 for Mac
一太郎
Ver.5-Ver13 /2006-2008
富士通OASYS
OASYS V6/V7/V8/2002
Lotus Word Pro
Lotus Word Pro2001
Acrobat
4.0 / 5.0 / 6.0 / 7.0 / 8.0
1.2 / 1.3 / 1.4 / 1.5 / 1.6 / 1.7 (*)
* PDF1.1 は変換対象外です。
XPS
リッチテキスト
RTF
テキスト文書
JIS/EUC/SJIS/UTF-8/UTF-16
HTML
XML
SGML
■ 対応OS
Linux Red Hat 7.3 / 9 / AS3 / ES3 / WS3 /AS4 / ES4 / WS4 / EL5
Solaris 9 / 10
ほかの機種については、ご相談下さい。
特徴
アプリケーションソフトウェア組込型のOEM提供となります。
価格
-
(価格備考:-)
スペック
| クライアント側OS | その他 |
|---|---|
| クライアント側OS(備考) | - |
| クライアント側 対応プロセッサ | - |
| クライアント側 必要メモリ | - |
| クライアント側 必要ディスク容量 | - |
| クライアント側 その他動作環境 | - |
| サーバ側OS | Linux |
| サーバ側OS(備考) | ・Linux系: Red Hat 7.3 / 9 / AS3 / ES3 / WS3 /AS4 / ES4 / WS4 / EL5 ・Unix系:Solaris 9 / 10 ・Windows系 |
| サーバ側 対応プロセッサ | - |
| サーバ側 必要メモリ | - |
| サーバ側 必要ディスク容量 | - |
| サーバ側 その他動作環境 | - |
| 備考 | - |
価格
-
価格備考
-
製品関連情報
-
データ変換研究所、基礎技術を活用した企業内情報検索システムを提供開始
データ変換研究所は、同社が重点基礎技術としている「ファイル展開技術・テキスト抽出技術・全文検索技」を企業内情報検索システムとして商品化した「OfficeCyclope」の提供を、小規模企業などを対象に開始した。 - データ変換研究所
- データ変換研究所 の記事一覧へ »
IT製品を比較する
その他のシステム開発製品
- SOA対応アプリケーションフレームワーク「ProFrame」
- デ変研 MFXライブラリ(圧縮ファイル・Mailファイル展開ソフトウェアライブラリOEM)
- Dehenken WebSensor(特定Webサイトの観察・監視エンジンOEM)
- ArkSensor(リアルタイム情報漏洩検知エンジンOEM)
- デ変研 監査ライブラリ(個人情報検出エンジンOEM)
- Mail Cyclope(電子Mail高速全文検索エンジンOEM)
- DocCat(高精度・超高速テキスト抽出ソフトウェアパッケージ)
- 高機能グリッドコントロール「フリーレイアウトグリッド」
- PowerBuilder 11 Enterprise for Windows
- Visual Studio Professional Editon With MSDN Professional
- 一覧へ »
データ変換研究所の他の製品
- デ変研 MFXライブラリ(圧縮ファイル・Mailファイル展開ソフトウェアライブラリOEM)
- Dehenken WebSensor(特定Webサイトの観察・監視エンジンOEM)
- ArkSensor(リアルタイム情報漏洩検知エンジンOEM)
- デ変研 監査ライブラリ(個人情報検出エンジンOEM)
- Mail Cyclope(電子Mail高速全文検索エンジンOEM)
- 一覧へ »
製品検索
ZDNet Japan Essential Topic
-
【今注目のIT企業は何を考える…??】
オススメIT系求人情報も毎週月曜日更新! -
コラボレーション基盤特集
Notes置換とバージョンアップの情報はこちら
企画特集
[PR]
-
Webセキュリティ特集
Web2.0時代の脅威へ対抗するためのソリューションとは? -
「シンプル」&「低コスト」な運用管理
IT運用管理に関するアンケート実施中! -
ログ管理ソリューション特集
セキュリティ、コンプライアンス対策で注目度アップ! -
ZDNet Japan Green IT
サミットだけでは終わらせない!エンタープライズの取り組みはこれからだ! -
サーバ仮想化・グリーン化の利点を最大化!
そ多機能・高価値なNetAppストレージの秘密とは -
APC SOLUTIONS FORUM 2008をレポート
電源、冷却の効率化によるエネルギー削減とは? -
セキュリティ対策レベルテスト公開!
自社のセキュリティのウイークポイントはドコ? -
ZDNet Japan ホスティング特集
2008年夏のホスティングサービスのトレンドは何? -
Techno Exchange
RackableとCTCの地球にやさしい関係 -
Secure Web
Web2.0時代にプロアクティブなセキュリティを実現!! -
【ログ管理】Logstorage、SecureEagle/SIM
内部統制のためのソリューションを紹介! -
IronPort Sシリーズ
Webからの脅威に関する課題の3つの解決方法
ZDNet Japan イベント
- 開催日:2008年9月29日(月)
- イベント一覧へ»