富士通は、化学メーカーなどが材料開発時にアイデア発掘のために行っている、人工知能(AI)で特許などの化学文書を検索する「FUJITSU Digital Laboratory Platform SCIDOCSS」(SCIDOCSS:サイドックス)の提供を開始した。2024年度末までに8.6億円の売り上げを目指す。
特許を含む化学文書は、物性値をはじめ、化合物の合成条件や手順を示す合成プロセス情報などが記載されているため、新たな材料開発のアイデアを得るためのデータリソースとして注目を集めている。
しかし、膨大な化学文書から適切な情報を抽出するには、化合物の化学構造式などの特徴や用途に基づく化合物の分類など、化学特有の知識やノウハウを基に検索し、適切な情報かどうかを一つひとつ判断する必要があるため、労力や時間を要することが課題となっていた。
SCIDOCSSは、富士通が長年にわたり研究開発を行ってきた、化学文書に特化した自然言語処理技術を搭載している。キーワードで検索する際、AIが化合物の名称や通称の違いを名寄せしつつ、関連性が高く重要度の高い情報から順に検索結果として表示できるほか、文章や化学構造式での検索も可能だという。
SCIDOCSSの検索結果画面(出典:富士通)
事前に行った実証実験の結果、従来は約5日を要していた化学文書の検索業務を1日に短縮できると確認した。キーワードによる検索に加え、化学構造式そのものによる検索にも対応したほか、数十行にわたる文章による検索にも対応している。
また検索キーワードとの関連度の判定では、自然言語処理技術を適用することで、同サービスに内包する化学文書データベース内の文書に対し、AIが検索キーワードの頻出度などから重み付けして決定する。
さらに化学構造式による検索時に、構造式の合致度が高いものを重要度が高い情報と判定するため、キーワードと化学構造式の2つを同時に検索することで、より精度高く重要度が高い順に検索結果を表示できる。
税別の販売価格は、Fujitsu Digital Laboratory Platform SCIDOCSS(SaaS版)が年額1000万円から。Fujitsu Digital Laboratory Platform SCIDOCSS(パッケージ版)は1600万円で初期費用が100万円。オプションの操作トレーニング費用が20万円。