海外コメンタリー

IBM「Watson」関連研究チームが取り組む文書の自動要約システム--品質は人レベルにも

Nick Heath (TechRepublic) 翻訳校正: 編集部 2016年03月09日 06時30分

  • このエントリーをはてなブックマークに追加

 IBMの自然言語処理および機械学習エンジンを担当するチームが、人間に匹敵する文書要約能力を備えたディープラーニング(深層学習)ベースのシステムを開発した。

 IBMの「Watson」の質問応答能力はヘルスケアから金融まで幅広い分野で活用されている

 Watsonの自然言語処理および機械学習エンジンは、IBMが提供する言語認識やコンピュータビジョン、データアナリティクスのサービスを支えている。そして、研究チームは舞台裏でこのスマートなシステムの能力を高め続けている。

 Watsonの質問応答アルゴリズム担当チームによる最新の画期的成果は、文書の要約を自動的に作成する「最先端」システムの開発だ。

 同チームは、過去に機械翻訳や動画への自動キャプション追加に使用されたディープラーニングのアプローチを採用して、何百万もの英語ニュース記事の短い要約を作成した。

 IBM USの研究者であるRamesh Nallapati氏とBing Xiang氏、Bowen Zhou氏は論文の中で、「この研究で、われわれはテキストを要約する作業に注力している。もちろん、これはソース文書の言葉の入力シーケンスを要約という言葉のターゲットシーケンスにマッピングする作業と考えることも可能だ」と述べている。

 彼らが使用した、ディープラーニングをベースとするシーケンスツーシーケンスアプローチは、機械翻訳に使われることの方が多い。同チームによると、要約は通常、文字数が少なく、文書の長さにそれほど依存しないので、要約の作成は機械翻訳と大きく異なるという。また、機械翻訳と異なり、ソース資料の重要な概念以外のすべてを省略することも許容されるという。

 こうした違いがあるにもかかわらず、認識リカレントニューラルネットワーク(エンコーダとデコーダ)を使用してテキストの要約を作成するこのアプローチは、Facebookが要約作成に使用する新しい最先端モデルを「大幅に上回るパフォーマンス」を発揮する。

 IBMのチームは、「それらの要約は驚くほど高品質で、ほとんどの場合、人間が作成した要約として簡単に通用するだろう」と述べている。

 「われわれの研究成果は、シーケンスツーシーケンスモデルが要約に関して極めて大きな可能性を秘めていることを力強く証明するものだ」(同チーム)

 同チームが今後重点的に取り組む研究テーマは、要約の中で珍しい単語を効果的に生成する方法を調べることだ。それが「既存モデルの著しい欠点であるようだ」と同チームは述べている。

 人間のように言語を理解できる能力をコンピュータに持たせたいのなら、テキストの核心的な意味をとらえる要約を作成可能なマシンの開発が重要になる。テクノロジが高品質な文章を出力できる段階まで進歩する中で、要約作成の自動化やコンピュータによるレポート作成に対する需要も拡大している。自動レポート執筆サービス「Quill」を提供するNarrative Scienceが先頃述べたところによると、同社の売上高は毎年倍増しているという。

 IBMは従来の事業分野の低迷への対処を進める中で、Watsonサービス群を開発者に提供してサードパーティーアプリを構築してもらうだけでなく、「『Watson Health』や『Watson Internet of Things』といった新たな機会への投資も積極的に行っている」と最高経営責任者(CEO)のGinni Rometty氏は先頃述べた。

 Credit SuisseのアナリストであるKulbinder Garcha氏によると、IBMはクラウドコンピューティングへの段階的に移行し、縮小傾向にあるハードウェアやOS、従来のサービス事業による利益への依存を減らそうと努力しており、Watsonなどの新しいテクノロジへの注力は「複数年にわたる、痛みを伴う方向転換」の一環だという。

IBM「Watson」関連チームが取り組む自動要約システム
IBMのWatsonシステム 提供:IBM

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

  • このエントリーをはてなブックマークに追加

SpecialPR

連載

CIO
ハードから読み解くITトレンド放談
研究現場から見たAI
ITは「ひみつ道具」の夢を見る
内製化とユーザー体験の関係
米ZDNet編集長Larryの独り言
今週の明言
「プロジェクトマネジメント」の解き方
田中克己「2020年のIT企業」
松岡功「一言もの申す」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
三国大洋のスクラップブック
大河原克行のエンプラ徒然
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
セキュリティ
企業セキュリティの歩き方
サイバーセキュリティ未来考
セキュリティの論点
ネットワークセキュリティ
スペシャル
Gartner Symposium
企業決算
ソフトウェア開発パラダイムの進化
座談会@ZDNet
Dr.津田のクラウドトップガン対談
CSIRT座談会--バンダイナムコや大成建設、DeNAに聞く
創造的破壊を--次世代SIer座談会
「SD-WAN」の現在
展望2017
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
AWS Summit
PTC LiveWorx
古賀政純「Dockerがもたらすビジネス変革」
さとうなおきの「週刊Azureなう」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
中国ビジネス四方山話
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
Windows Server 2003サポート終了へ秒読み
米株式動向
実践ビッグデータ
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化