統数研、評価指標開発に「Oracle Cloud」活用--3000万本以上の論文データを解析

大場みのり (編集部)

2019-07-18 16:10

 統計数理研究所(統数研)は、新評価指標「多様性指標(REDi)」を開発・運用するためのシステム基盤にパブリッククラウド「Oracle Cloud」を導入した。日本オラクルが7月18日に発表した。

 統数研は1944年、文部省直轄の研究所として設置。2004年からは「大学共同利用機関法人情報・システム研究機構」の一員となり、他の分野の研究機関と連携して分野の枠を超えた融合研究にも取り組んでいる。

 日本オラクルによると、日本の大学や研究機関による論文数の国際的シェアは低下傾向にあり、研究体制や研究環境の見直し、研究マネジメント改革などが求められているという。その中で、研究に関するデータを収集・分析し、研究戦略立案に役立てる研究IRが注目されている。

 統数研は、研究IR活動を支援するツールの開発と活動を客観的に評価できる新たな指標の研究を通して、大学や研究機関の課題解決に取り組んでいる。2016年から開始した「異分野融合の進展や効果を公正かつ適切に評価するための新指標の研究開発」プロジェクトでは、従来の指標では捉えられない共同利用・共同研究の成果や、異分野融合の進展状況を可視化する指標の一つとして、REDiを開発している。統数研は、日本全国の大学や研究機関の研究活動の可視化とIR機能強化に貢献するため、2020年以降のREDiの公開利用を目指しており、現在システム化に取り組んでいる。

 学術研究活動のKPI(Key Performance Indicator: 主要業績評価指標)として重要視されているのは論文だと日本オラクルは説明する。統数研が手がけるREDiでは、学術論文が異分野に与えるインパクトの評価と論文間の関係性を可視化するため、「論文単位かつ書誌情報だけで算出できること」「分野間の論文数の偏りを適切に補正できること」「中長期的な影響を測定できること」の3つが要件であった。そのため論文データの分析基盤には、過去30年以上にわたる3000万本以上の論文データの解析といったアルゴリズムに必要な高速な計算資源や、論文データの関係性を分析するグラフデータベースの機能が求められていた。

 そこで統数研は、安定した計算資源に加えて拡張性に優れたインフラ環境を提供するOracle Cloud Infrastructureを選んだ。また、REDiに高度なグラフデータベース機能を提供する「Oracle Labs Parallel Graph AnalytiX機能(PGX機能)」も活用している。

 Oracle Cloudの具体的な導入理由は以下の通りだ。

  • 物理サーバーを専有するOracle Cloud Infrastructureのベアメタルマシンの採用により、システムの開発と展開のインフラ基盤としても安全性が高い
  • Oracle Cloud Infrastructureが提供する最新のGPU(Graphics Processing Unit)を時間単位で利用でき、高度なグラフ分析に必要な機能を保証しつつも運用コストを削減
  • REDiの要件の一つである分野間の論文数の偏りを補正するため、統数研では自然言語処理で使われるアルゴリズム「自己相互情報量(PMI)」を採用。PGX機能を最大限利用することで、グラフとデータを効率的に分析し、GPUの高速な計算資源により、PMIなどのREDiの計算時間を削減

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]