次世代データベース?SOX法が拍車をかけるコンテンツ・マネジメント

徳田浩司(Koji Tokuda) 2006-06-16 09:00:00

Oracleの次世代コンテンツマネジメント戦略発表

6月14日、Redwood CityにあるOracle本社に、次世代のコンテンツ・マネジメント戦略についてのExecutive Briefingを聞きに行った。社長のCharles Phillips氏らがプレゼンを行い、なみなみならぬ意欲を感じた。

非構造化コンテンツの管理ソリューションへの進出

Oracleと言えばRDBが本業であるが、データベースのあり方は、新しい局面を迎えている。Charles Phillips氏によると、企業が所有する情報のうち80%ものが構造化されていないコンテンツ(非構造化コンテンツ)である。そのうち、管理できていないものは、90%にも上る。非構造化コンテンツとは、ワードやエクセル文書とか、PDFファイル、画像・動画ファイルなどで、形式が不定形であったり、メタデータ(データについての情報を記述したデータ)が不足しているものである。例えば、書類を読み込んだ画像データなどは、何についての情報なのか、ファイル名を見ただけでは判明が難しく、作成者本人ですら、中身を見ないとすぐにはわからない状態のものが少なくない。コンテンツの管理がきちんできていなければ、必要な情報がすぐに取り出せなく、業務の効率性が低下し、競争力を失わせるリスクがある。せっかく蓄積した企業情報のほとんどが有効に活用できていない状況にあるのだ。

しかも、近年、SOX法などコンプライアンス対応が急務となり、情報をきちんと保管し、必要な情報を即座に取り出せるように整備は急務となっている。企業経営者の関心が高まっており、導入意欲に拍車がかかっている。

今回発表された「Oracle Content Database」と「Oracle Records Database」は非構造化データを管理するためのソリューションで、今後、Oracle Database 10g Enterprise Editionのオプションとしてソフトウェアが提供される予定である。

効率的なコンテンツの一元管理の実現

デモでは、バージョン管理を一元的に効率的に行う方法を提案していた。従来、例えばMS Wordで作成された文書を関係者に送る際に、電子メールの添付資料として送信していた。ところが、受け取った側では、管理がきちんとされていなかったり、各人格納場所がばらばらであることなどから、混乱を招くケースが少なくなかった。どれが最終的なバージョンなのかわからなくなったり、格納しているフォルダーがどこにあるのか捜すのに手間取ったり、同じような文書が大量に、添付資料として企業内にばらばらに保存されてしまうのである。しかし、ファイルそのものを送るのではなく、Webの技術を使い、ファイルの所在地をWebのアドレスとして指定し、アドレスを送信することで、上記の問題が解決する。

SOX法に準拠した情報管理が可能

別のデモでは、財務関連のエビデンスの管理する実例が紹介された。紙ベースで受け取った請求書を、効率的に管理する方法である。企業が受け取った請求書をPDFファイルで管理し、そこから請求書番号、発注番号、金額、日付などをテキスト・数値データとして自動的に抽出する。それらをインデックス化することで、あとで検索して即座に取り出すことが可能となる。昔の話で恐縮だが、私が働いていた銀行の調査部門では、長年新聞の切抜き(いまや死語?)をやっていた。その保管と検索方法に困って、20年近く前に、イメージデータで取り込む試みがなされた。そのシステム構築に、何千万円もかけたということであった。しかし、せっかく大金を払って構築したシステムも、検索機能が貧弱なため、必要な記事がすぐに取り出せなかった。結局は、電子ゴミ箱状態になってしまっていた。キーワード検索できる機能があったが、それもいちいち考えて、入力しておかなければならず面倒だ。テキスト情報を自動的に読み出し付加されれば、ファイルにリンクしておくだけで、例えば、Google Desk Topのようなツールを使えば、ばらばらに保管されていても、すぐに取り出すことが可能となる(もっとも新聞のスクラップシステムは、新聞検索サービスが普及して、その後、全くの無用の長物になったが。)。

企業内で、財務諸表に影響を及ぼし、エビデンスとなる文書はたくさん保存されている。請求書、領収書、契約書、などなど。重要書類になればなるだけサインや印鑑が必要となるケースが少なくなく、どうしても紙ベースにならざるを得ない。構造化されていないコンテンツが大量に保存されている。SOX法対策としては、ストレージに関わる基盤システムの整備が重要となってくると思われ、もういちど、社内での情報の管理状況をレビューしてみる必要がある。

非構造化コンテンツ管理は潜在的な巨大市場

これまでにもコンテンツ・マネジメント・ソリューションは存在していたが、非常に高価で、しかも使いづらく、あまり普及していなかった。オラクルではユーザーの使い勝手をよくすることに注力したとのことで、パートナー企業もそれを活用したビジネス展開が期待できる。非構造化コンテンツ管理はほとんど手付かずの市場で、データ量を考えると、従来のRDBなど構造化データベースに比べて、はるかに巨大な市場が潜在的に存在するのである。構造化データソリューションを提供することで大きく成長してきたオラクルであるが、今後のデータベースビジネスは、非構造化データを管理する機能提供に次第に重点が移っていくことになるのであろう。この発表は日本ではあまり取り上げられていないようであるが、オラクルがこの分野に参入しようということは、非常に大きな取組みであると感じた。

Web2.0サービスのデータベース構築にも応用が可能

一方コンシューマの世界にも、応用できる。Web2.0のブームで、Flickr YouTubeなど、個人が撮った画像データや、動画データなどを公開するサービスが流行っている。現在は、種々雑多なものが、非構造化コンテンツとしてばらばらに蓄積されている状態である。適切に描写されたテキストベースのメタデータが付与されれば、検索できるようになる。それを上手く自動的に蓄積できれば、非常に強力なデータベースになる可能性がある。このあたりの技術や手法の確立が、Web2.0ビジネスの収益化にとっても、鍵となるかもしれない。

(徳田浩司 koji.tokuda at www.fusion-reactor.biz

※このエントリはZDNetブロガーにより投稿されたものです。朝日インタラクティブ および ZDNet編集部の見解・意向を示すものではありません。

SpecialPR