Hadoopでゲノム解析データ処理環境、コスト5分の1に 日立

ZDNET Japan Staff

2011-09-27 15:22

 日立製作所は9月27日、Hadoopを採用した大量ゲノムデータ分散処理環境を試作し、従来の分散処理システムの約5分の1のコストで同水準のデータ処理能力を実現できたと発表した。

 検証は国立遺伝学研究所(遺伝研)五條堀孝教授グループの協力のもと実施した。ゲノム研究分野では次世代DNAシーケンサー分野の進展が著しく、最新の次世代DNAシーケンサーでは、断片配列データと呼ばれるDNAの配列を解析単位に断片化したデータが一回の計測で約60億個(約1.8TB)生成されるという。

 解析対象となるデータ量の増大に伴い、コスト効率に優れ、スピードも確保できる大量データ処理システムの開発が求められている。遺伝研の協力のもと、日立は現在遺伝研が使用しているゲノム解析フローを日立が構築したHadoop検証環境に移植し、さまざまな条件設定でゲノム解析を実行し、遺伝研でのゲノムデータ解析環境と処理性能を比較した。

 この結果、従来システムの約5分の1のコストで同等のデータ処理性能を実現できたという。今回の検証では、日立エントリーブレードサーバ「HA8000-bd/BD10」でHadoopの特長であるスケールアウトに適した検証環境を構築し、ゲノム解析プログラムはSanger研究所開発の「Burrows-Wheeler Aligner(BWA)」を使用した。

ゲノムデータ解析のイメージ(提供:日立製作所) ゲノムデータ解析のイメージ(提供:日立製作所)
※クリックすると拡大画像が見られます

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    セキュリティ担当者に贈る、従業員のリテラシーが測れる「情報セキュリティ理解度チェックテスト」

  2. セキュリティ

    サイバー攻撃の“大規模感染”、調査でみえた2024年の脅威動向と課題解決策

  3. セキュリティ

    従業員のセキュリティ教育の成功に役立つ「従業員教育ToDoリスト」10ステップ

  4. セキュリティ

    IoTデバイスや重要インフラを標的としたサイバー攻撃が増加、2023年下半期グローバル脅威レポート

  5. セキュリティ

    急増する工場システムへのサイバー攻撃、現場の課題を解消し実効性あるOTセキュリティを実現するには

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]