マイスペース、分散処理フレームワーク「qizmt」をオープンソースに

文:Dave Rosenberg(Special to CNET News) 翻訳校正:編集部

2009-09-16 12:40

 MySpaceは米国時間9月15日、「qizmt」と呼ばれる新しいオープンソースプロジェクトを発表した。qizmtは、同社のデータマイニングチームが開発した分散型コンピュテーションフレームワークだ。

 qizmtは、Googleにおける検索インデックス作成の中核的なシステムとしてよく知られている「MapReduce」をベースにしている。しかし、qizmtは、「Microsoft Windows」サーバで構成された大規模クラスタ上で動作する。これはコモディティレベルのLinuxマシンを利用するものと思われがちなコンピューティングスタイルとしては興味深い点である。

 MapReduceは、巨大なデータセットを処理、生成するためのプログラミングモデル。キーとバリューのペアを処理して中間的なキーとバリューのペアセットを生成するmap関数や、その処理結果を集約するreduce関数を利用するのが特徴である。

 筆者は、Javaアーキテクトで分散型システムの専門家でもあるEugene Ciurana氏に話を聞いた。Ciurana氏は、「大量の非構造化データのインデックス作成は、利用する技術に関係なく、困難な作業である。MapReduceは、並列化システムにおけるデータ処理に対して、簡潔で洗練されたソリューションを提供する」と述べる。

 巨大なデータセットの管理を手がけるサイトが増えるにつれて、MapReduceのようなフレームワークや、Hadoopのようなプロジェクトは間違いなく普及していくだろう。そして、データ量の増加とともに、市場機会も増加する。ユーザーがこうした新ツールを活用する最良の方法を把握するまでの間、オープンソースというのは普及を拡大させる有効な手段である。

 qizmtは現在、「People You May Know」機能で使用されており、近いうちにユーザーのおすすめなど、ほかの機能にも拡張される予定だ。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。 原文へ

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]