富士通研、新DB処理エンジン--行の更新を列に即座に反映、リアルタイムに分析

NO BUDGET

2015-03-03 08:30

 富士通研究所は2月26日、データベースシステム上のタイムリーな大規模データ分析を可能にする、列形式のデータ格納と処理エンジンを開発したと発表した。オープンソースソフトウェア(OSS)のデータベース「PostgreSQL」の分析処理を50倍以上高速化し、メモリ容量が少ない中小規模のコンピュータシステムでも最新のデータが反映されたリアルタイムなデータ分析が可能になるという。

 富士通のデータベース製品「FUJITSU Software Symfoware Server」への搭載に向け、2015年度中の実用化を目指す。

 今回、PostgreSQL上で行形式データの更新を瞬時に反映でき、メモリ搭載量によらない列形式のデータ格納と、列形式データを高速に処理する実行エンジンを開発。列形式のデータの管理方法を工夫することで大容量の列形式データ格納を実現したと説明。一般のデータベースシステムが備えたインデックスの中で高速に分析でき、行形式や列形式といった格納方式の違いを意識することなく利用できるという。

 列形式データ処理に適した並列分析処理エンジンで読み出し、フィルタリング、集計を実行するベンチマークで従来と比較して1CPUコアで4倍、15CPUコア搭載のサーバ1台で50倍以上高速に分析できると説明している。

 通常、メモリに入りきらない大容量の列形式データを効率的に管理するため、“エクステント”と呼ぶ大きな単位(約26万レコード単位)で領域の確保や削除、さらに空き領域回収といったデータ領域を管理する。大きな単位で管理すると分析処理が長時間待たされるという問題が発生する。

 これを防ぐために、複数の利用者からの同時処理要求を一貫性を保って処理するための仕組みで、多くのデータベースシステムで用いられる“同時実行制御(MultiVersion Concurrency Control:MVCC)”をエクステントに導入し、分析処理とデータ領域管理が同時に進行できるようにした。

 他のインデックス同様、列形式(カラムストア)インデックスを作成することで、データベースが問い合わせする内容に応じて行形式か列形式の適切なデータ格納方式を選んで、処理するようになる。カラムストアインデックスを作成した元の行形式データの更新にも追随して、列形式データも自動的に更新されるため、利用者は格納方式の違いを全く意識することなく利用できるという。


新開発のアーキテクチャ(富士通研提供)

 列形式データの効果を十分に引き出すには、列形式データ化でデータの読み出し性能を上げるだけでは不十分とされる。そこで、複数データに対して一括して同じく処理するベクトル処理方式を分析処理エンジンに採用することで1並列時の性能を向上させたとしている。

 並列実行による分析処理の高速化の効果を高めるために、PostgreSQLで並列動作する複数のプロセス間が低遅延でデータを受け渡しできるようメモリ共有の仕組みを新たに開発した。これによりCPUが15コアのサーバ1台で、従来のPostgreSQLの50倍以上の性能を達成できると説明している。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    ChatGPTに関連する詐欺が大幅に増加、パロアルトの調査結果に見るマルウェアの現状

  2. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  3. セキュリティ

    警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集

  4. セキュリティ

    いま製造業がランサムウェアに狙われている!その被害の実態と実施すべき対策について知る

  5. セキュリティ

    ランサムウェア攻撃に狙われる医療機関、今すぐ実践すべきセキュリティ対策とは?

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]