展望2020年のIT企業

AIスタートアップELYZAが開発した日本語特化AIエンジンの意味

田中克己

2020-09-25 07:00

 AI(人工知能)の研究・開発に取り組むスタートアップが日本でも次々に生まれている。自然言語処理(NLP)技術を得意とするELYZAはその1社で、9月にディープラーニング(深層学習、DL)を使った日本語AIエンジン「ELYZA Brain」を開発した。日本語テキストの認識精度が人間を超えるという同AIエンジンの適用範囲を広げるため、業種・業務の知見や豊富なデータを持つ企業との協業に乗り出す。

 ELYZA 代表取締役CEO(最高経営責任者)の曽根岡侑也氏は、AI技術の研究開発から人材育成、社会実装までを手がける東京大学・松尾研究室に在籍した2014年にIPA未踏プロジェクトに採択されたり、スマートフォンアプリを簡単に作成できる中小企業向けプラットフォームを開発、販売するIT企業を起業したりした。

 大学院修了後に松尾研究室で共同研究プロジェクトのマネージャーやNLP講座の講師などを務める中で、2018年9月に同研究室出身らとELYZAを設立した。現在、従業員約30人のほとんどが、東京大学のほか、メルカリや三菱総合研究所、富士通などで経験を積んできたエンジニアである。

 曽根岡氏は「未踏の領域で、新しい働き方やサービスを実現すること」と、AI技術の研究開発の目的を説明する。ELYZAの主な事業は、大企業向けAI開発のコンサルティングで、例えば、DLを活用した小売業の需要予測で、メーカーや卸し、小売りのサプライチェーンの改革も支援する。

 スポーツ用品のアシックスや大手小売業などと共同研究はその一例になるという。もう1つがテキスト分析のDL活用になる。例えば、特定の契約書を大量に読み込み学習し、特定の要素を抽出したり、要約を作成したりする。2019年9月、森・濱田松本法律事務所と法務書類のリスク管理などの法務業務におけるAI活用の共同研究を開始したのが先行事例になる。法律業務のデジタル化、いわゆるリーガルテックだ。

業種・業務ノウハウを持つ企業との新サービスの共同開発

 ELYZA Brainの開発に大きな影響を与えたのは、2012年にAI研究において画像認識の精度がDLの活用で飛躍的に向上したこと。2015年には、人間を超える認識精度を実現したことで、人が行っていた作業をAIに置き換えられる。例えば、空港における出入国の本人確認や工場の生産ラインにおける不良品の検品だ。

ELYZA Brainの特徴
ELYZA Brainの特徴

 だが、「テキストの認識精度では、AIは2017年まで人に遠く及ばなかった」(曽根岡氏)。十分な教師データを準備するのが難しいからだ。特に文脈や一般常識を理解する情報量が膨大過ぎて、数千から数万のテキストを読み込んでも、認識精度のスコアは65.7と人間より20ポイント以上も低かったという。

 そういうわけで、用途はソーシャルメディアやチャットの分析など高い精度を求められないものに限定されていた。そこに、「BERT」と呼ぶDLにおける汎用的な学習モデルが登場し、認識精度が一気に向上する。東京大学工学系研究科の松尾豊教授によると、その精度は2018年9月に80.5のスコアを達成し、2019年6月には人間の精度を超える88.4を記録したという。

 曽根岡氏は、精度向上の理由は「優秀なモジュールの登場」「モデルの大規模化」「事前学習の実施」という3つの要素のかけ合わせにあるという。簡単に言えば、Wikipediaなどから一般常識に関する大量のテキストを事前学習したので、教師データは数千から数万で済むということ。「運動神経の素晴らしい選手なら数回の練習で、できるようになる」(同氏)

ELYZA Brainのできること
ELYZA Brainのできること

 そうなると、テキストを読んで判断する業務や定型的な書類の作成業務、ある程度トピックが定まった対話を行う業務といった「読む」「書く」「対話」への日本語AIエンジンの活用が可能になる。例えば、「読む」は契約書から会社名、有効期間、金額などを抜き出せる。「書く」はテキストを理解し、修正、評価した上で、より良い文書を作成できる。「対話」はコールセンターの顧客対応、外食業の注文受付に高精度なチャットポッドを構築できるということ。

 ELYZA Brainの精度は同社内の検査結果によると、人間の80を超える83のスコアだったという。「人間の精度を超えた意味は大きなこと」と、曽根岡氏は今まで不可能だったような働き方、サービスが実現可能になると期待する。例えば、医師の業務を支援する“AI医師”が考えられる。同社によれば、1日当たり約2時間費やす診察後のカルテ記入や検索、要約をAI医師に任せれば、医師は患者対応により集中できる。“AI人事”も期待される1つだ。人事採用のエントリーシートを読み、1次面接する人事担当者を支援し、従業員からの給与や労務などの問い合わせにも対応する。

ELYZA Brainを適用できるタスク
ELYZA Brainを適用できるタスク

 日本語AIエンジンを生かした業務の変革は、この他にも数多くあるだろう。同社は業界特化(医師や医療事務、弁護士、裁判官、銀行員、金融アドバイザ、ケアマネージャーなど)と、業種特化(人事や営業、法務、秘書、経営企画など)で合計30の適用領域を想定し、それぞれの業務や業界の知見やデータを持つ企業をパートナーとして募ることにした。

 先に紹介した森・濱田松本法律事務所はその1社になる。三菱総合研究所とは、調査業務へのAI活用に向けた共同研究への交流を始めたところ。こうしたパートナーには、PoC(概念実証)段階で日本語AIエンジンなど開発リソースを無償提供する。曽根岡氏は「自然言語処理の精度で、当社製品は高い」とし、パートナーの獲得で一気に日本語AIエンジンの市場開拓を推し進める考えのようだ。

田中 克己
IT産業ジャーナリスト
日経BP社で日経コンピュータ副編集長、日経ウォッチャーIBM版編集長、日経システムプロバイダ編集長などを歴任、2010年1月からフリーのITジャーナリスト。2004年度から2009年度まで専修大学兼任講師(情報産業)。12年10月からITビジネス研究会代表幹事も務める。35年にわたりIT産業の動向をウォッチし、主な著書は「IT産業崩壊の危機」「IT産業再生の針路」(日経BP社)、「ニッポンのIT企業」(ITmedia、電子書籍)、「2020年 ITがひろげる未来の可能性」(日経BPコンサルティング、監修)。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]