編集部からのお知らせ
ダウンロード公開中「ITが取り組むべきプライバシー」
最新記事まとめ「医療IT」

Hadoopでゲノム解析データ処理環境、コスト5分の1に 日立

ZDNet Japan Staff

2011-09-27 15:22

 日立製作所は9月27日、Hadoopを採用した大量ゲノムデータ分散処理環境を試作し、従来の分散処理システムの約5分の1のコストで同水準のデータ処理能力を実現できたと発表した。

 検証は国立遺伝学研究所(遺伝研)五條堀孝教授グループの協力のもと実施した。ゲノム研究分野では次世代DNAシーケンサー分野の進展が著しく、最新の次世代DNAシーケンサーでは、断片配列データと呼ばれるDNAの配列を解析単位に断片化したデータが一回の計測で約60億個(約1.8TB)生成されるという。

 解析対象となるデータ量の増大に伴い、コスト効率に優れ、スピードも確保できる大量データ処理システムの開発が求められている。遺伝研の協力のもと、日立は現在遺伝研が使用しているゲノム解析フローを日立が構築したHadoop検証環境に移植し、さまざまな条件設定でゲノム解析を実行し、遺伝研でのゲノムデータ解析環境と処理性能を比較した。

 この結果、従来システムの約5分の1のコストで同等のデータ処理性能を実現できたという。今回の検証では、日立エントリーブレードサーバ「HA8000-bd/BD10」でHadoopの特長であるスケールアウトに適した検証環境を構築し、ゲノム解析プログラムはSanger研究所開発の「Burrows-Wheeler Aligner(BWA)」を使用した。

ゲノムデータ解析のイメージ(提供:日立製作所) ゲノムデータ解析のイメージ(提供:日立製作所)
※クリックすると拡大画像が見られます

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. クラウドコンピューティング

    AWS、Microsoft、Googleがリード!パブリッククラウドコンテナプラットフォーム市場分析

  2. ビジネスアプリケーション

    ウィズコロナ時代はあと2年は続く?!アフターデジタル時代の4つの重要ポイント

  3. セキュリティ

    2021年のサイバー脅威予測が明らかに─将来の攻撃に企業はいかに備えるべきか

  4. OS

    “テレワークだからこそ”デスクトップPCを利用すべき?!ノートPCにはない魅力の数々に迫る

  5. 運用管理

    7つの視点で解説するデータベース構築・運用ー誰でもわかるSQL Serverストレージガイド

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]