アライン株式会社、生成AIを利用したファイル検索サービス「デジタルライブラリ」を提供開始

アライン株式会社

From: PR TIMES

2024-07-23 10:10

キーワード一致ではなく、検索意図を理解した類似検索ができるサービス



アライン株式会社(代表取締役:清水 剛、以下「アライン」)は、2024年7月23日よりファイル検索サービス「デジタルライブラリ」をリリースしたことを発表します。

デジタルライブラリは、共有ストレージにアップロードされたあらゆる形式のファイル(テキスト、画像、PDFなど)の内容を解析し、ユーザーの検索意図を汲んだ検索を行う生成AIを利用した検索サービスです。

デジタルライブラリの検索画面イメージ
デジタルライブラリでは、例えば「デジタル化」をキーワードとして検索した場合に、「DX」などの関連キーワードも一緒に抽出して質問意図に合致する資料を表示することができます。
[画像1: (リンク ») ]


デジタルライブラリの主な特徴
- 「登録」「検索」のみのシンプルなサービス!
- ユーザーの検索意図に沿った類似検索ができる
- 数百ページに及ぶ大きなファイルでもページ単位で解析・検索できる
- OCRにより画像やPDFなどのファイルに含まれるテキストも解析・検索できる
- 英語や日本語の他、あらゆる言語に対応している


デジタルライブラリの仕組み
キーワード一致ではなく類似検索を可能にする仕組みとして、ファイルの登録時に作成するEmbeddingと呼ばれるベクトルデータベースを採用しています。ファイルに含まれるテキストデータを解析・抽出して、ページごとにEmbeddingとしてベクトル化してデータベースに保存します。
検索時には、ユーザーが入力したキーワードやセンテンスも同様にEmbeddingとしてベクトル化し、データベースの全てのベクトルと総当たりでコサイン類似度を計算します。最終的に、コサイン類似度が高い順に、ファイル名、表紙のサムネイル、該当ページ番号、該当ページに含まれるテキストの一部抜粋を表示します。

[画像2: (リンク ») ]


ファイル内のテキスト抽出にはGoogle社のCloud Vision APIによる光学式文字認識(OCR)を利用して、PDFや画像に含まれる文字もテキストとして抽出することができます。
また、ベクトル化にはVertex AIエンベディングモデルのうち、PaLM APIで利用可能な多言語テキストエンベディングモデル(textembedding-gecko-multilingual)を採用しています。
さらに、ベクトル化を行う生成AI(Gemini、ChatGPT、Claude 3など)は、ユースケースに合わせて任意に変更できます。

デジタルライブラリは、ご要望に合わせたカスタマイズも可能です。ご興味のある方は、弊社ホームページよりお問合せください。

問い合わせ先
下記URLのフォームからお問い合わせください。
(リンク »)

アライン株式会社の概要
社名:アライン株式会社(英語表記: ALIGN Inc.)
URL: (リンク »)
設立:2018年9月
事業内容:DXコンサルティング、SaaSサービス開発
代表取締役CEO:清水 剛
住所:東京都千代田区霞が関1-4-1 日土地ビル2F


【採用情報】
データエンジニア、システムエンジニアを募集中!
当社では業容拡大に伴い、データエンジニア、システムエンジニアを募集しています。
ご興味をお持ちの方は、以下のURLよりエントリーをお待ちしています。
採用ページ: (リンク »)

プレスリリース提供:PR TIMES (リンク »)
本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]