一橋大、統計教育のデータ検索システムに自律型DBを活用

NO BUDGET

2020-08-19 15:10

 一橋大学は小・中・高での統計教育の推進に向けて同大学が開発した「基本統計量に基づいた度数別数値パターンデータベース」を自律型データベース(DB)「Oracle Autonomous Data Warehouse(ADW)」で構築した。またウェブ上でのデータ検索環境を「Oracle Application Express(APEX)」で構築した。

 環境構築には、日本オラクルのコンサルティング部門が提供する「Rapid Start Service for Autonomous Data Warehouse Cloud」を採用し、ADWへのデータロードやAPEXでのウェブアプリケーション開発などの支援により、約1.5カ月という迅速な環境構築を実現している。クラウド上にある検索システムを相互に確認し、修正を繰り返すアジャイル型の開発手法を採用することによって、短期間でのパターンデータベース開発およびデータ検索環境の構築を可能にした。

 今回の環境構築のきっかけとなったのは、同大学で行っている「基本統計量に基づいた度数別数値パターン検索」という研究だ。この研究では、1510億の基本統計量と約2億件にもおよぶ数値パターン(無限にある実数を有限化することで得られる値)を検索し回答を得るシステムを限られた人員と予算内で構築する必要があった。

 当初、高性能ワークステーションで稼働するオラクル以外のデータベース製品でデータの処理と抽出を試みたが、性能上、検索結果を得ることができないという問題に直面し、性能と運用管理、コストの要件に合ったシステムを検討していた。

 ADWで検証したところ、これまで全く抽出できなかったデータ検索が実行できる性能を得られただけでなく、アジャイル開発基盤での迅速なUI(ユーザーインターフェース)設計・開発が可能だと分かった。また自律機能による運用管理の負担軽減、暗号化によるデータセキュリティなどの今後の運用や外部公開におけるメリットがあることも分かり、同製品の導入を決定した。

 今回の導入でADWのパーティショニング機能により1510億件ある基本統計量を分散処理し、2TB以上あったデータに対して圧縮機能を活用することで、最小限のリソースでも高い性能を実現している。またADWでは、データウェアハウスを利用していないときにはコンピュートリソースをオフにできるため、仮想サーバー上にスケジューラー機能を実装・設置し、利用コストを柔軟に管理している。さらには、ウェブ上でのデータ利用を可能にする検索環境を、ローコードでのアプリケーション開発ツールであるAPEXで開発し、公開した。

 同大学では、学内にオンサイト施設を設置し、公的統計ミクロデータの利用(オンサイト利用)環境を提供している。利用者は統計調査の調査票情報を用いて、探索的な研究が行えるが、この審査については、EES Net SDCと呼ばれる文書をもとに総務省で策定されたガイドラインに基づいて行われている。

 「基本統計量に基づいた度数別数値パターン検索」の研究開発では、このガイドラインに加え、データの持ち出しが安全か否かを平均、分散、歪度、尖度などの基本統計量を用いて判定可能か検証を行った。この研究で用いた基本統計量の検索と活用の手法は、小・中・高での統計教育に興味を持つきっかけとなることから、データ検索環境を一橋大学経済研究所のウェブ上で2020年6月から公開している。

 またADWの採用を機に、同大学で手掛ける他のプロジェクトでも利用を開始している。高性能かつ運用負担を軽減できるだけでなく、ADWで利用可能な「Oracle Data Visualization」で簡単にデータの可視化を実現できることから、同大学で行っているカンボジア政府統計調査の支援活動など、さまざまな統計データの利用促進に活用している。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]