編集部からのお知らせ
新着・電子インボイスの記事まとめ
記事まとめDL:オンライン確認「eKYC」

ホワイトペーパー

日本語Wikipedia全件データの100倍?!1億文書の検索システムをつくってみた~その結果…

株式会社鉄飛テクノロジー 2018-03-15

“1億文書の全文検索システム”と聞けば、ほとんどの人が「そんなもの、うちには必要ない」と思われるだろう。しかし、何事も極端なチャレンジをしてみなければ、見えてこないこともある──。

そこで、実際にオープンソースの検索エンジンApache Solrで構築し、ファイルサーバ検索として本当に使えるのかどうか、様々な確度から検証した結果を紹介しているのが本資料である。

一口に“一億文書”と言っても、そう簡単に用意できるわけがない。そこで今回は日本語Wikipediaの全件データを100倍に増幅するという荒業を用いた。実証環境は、数年経過した普通の1Uサーバだ。Apache Solrは、鉄飛テクノロジーのファイルサーバ検索システム「Fileblog」にも組み込まれており、その活用領域の幅広さは今さら語るまでもないだろう。

1億文書のインデックス構築、全文検索は成功するのか?そして見えてきた、いくつかの運用課題や、改善ポイントとは?詳細は、ぜひ本資料から確認していただきたい。

CNET_IDでログインして資料をご覧ください

CNET_IDはCNET Japan/ZDNet Japanでご利用いただける共通IDです

パスワードをお忘れですか?

CNET_IDをお持ちでない方は
CNET_ID新規登録(無料)

ホワイトペーパー

新着

ランキング

  1. 運用管理

    マンガでわかる「ルール駆動開発」レガシーモダナイズを成功させる開発手法を基礎から理解する

  2. 経営

    5分でわかる、レポート作成の心得!成果至上主義のせっかちな上司も納得のレポートとは

  3. セキュリティ

    APIエコシステムを狙うサイバー攻撃が急増、Webアプリにおける最新のAPIセキュリティ対策とは?

  4. セキュリティ

    クラウドやコンテナ利用が増える中、世界の企業が利用するAPI経由の安全なアプリ構築手法とは?

  5. マーケティング

    ウェビナーによる営業活動が本格化、顧客接点が増加する一方で見えてきたハードルと解決策とは?

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]