Twitter、検索システムを刷新--Lucene採用で性能や拡張性を向上

CNET Japan Staff

2010-10-08 11:35

 Twitterがここ数週間かけてローンチしてきたという新しい検索システムのバックエンド技術について、米国時間10月6日のブログ投稿で明らかにした。

 Twitterのリアルタイム検索エンジンはこれまで、同社が2008年に買収で取得したSummizeの技術をベースにしていたが、古いバージョンのMySQLを利用していることから成長に合わせた拡張が難しかったという。

 そこで約半年前に、転置索引方式のアーキテクチャを基づく新システムを構築することに決定し、Javaで記述されたオープンソースの「Lucene」を採用した新システムの開発に乗り出した。リアルタイム検索に対応するため、インメモリのデータ構造など、Luceneに大きく手を加えながら新システムを開発したという。

 その結果、パフォーマンスや拡張性が向上しただけでなく、検索速度に影響することなくインデックスのサイズを拡大することができ、柔軟性も向上したという。同社の推計では新システムでは、利用可能なバックエンドリソースの5%しか利用しておらず、1秒あたりのインデックス処理も従来比50倍を達成している。

 同社はLuceneに施した変更をLuceneプロジェクトに寄贈する予定だ。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    ChatGPTに関連する詐欺が大幅に増加、パロアルトの調査結果に見るマルウェアの現状

  2. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  3. セキュリティ

    警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集

  4. セキュリティ

    いま製造業がランサムウェアに狙われている!その被害の実態と実施すべき対策について知る

  5. セキュリティ

    セキュリティリーダー向けガイド--なぜ今XDRとSIEMの違いを理解することが重要なのか

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]