話者ごとの音声分析に最適な多指向性マイクロフォン用開発キットを販売開始

~世界初!12方向の発話を瞬時に分離し集音、自動追従機能も搭載~

NTTテクノクロス株式会社

2020-11-11 11:00

NTTアドバンステクノロジ株式会社(以下:NTT-AT、本社:神奈川県川崎市、代表取締役社長:木村丈治)とNTTテクノクロス株式会社(以下:NTT-TX、本社:東京都港区、代表取締役社長:串間和彦)は、NTTメディアインテリジェンス研究所の技術を活用して開発した世界初となる多指向性小型マイクロフォンモジュール(Voice Compass Direction Module)とアプリケーションの開発に必要な開発者用マニュアルをセットにした「Voice Compass Developer Kit」(以下:本製品)を、2020年12月上旬から販売します。
多指向性小型マイクロフォンモジュールは、最大12方向の音を個別に分離して集音する機能および話者の方向を自動で推定し位置変化に合わせて集音する自動追従機能を有することから、これらの機能を会議議事録システムに搭載することで、これまでは困難であった話者を分離・識別した音声認識が可能となるため、議事録作成業務の効率化が図れます。
 本製品は、11月12日(木)~13日(金)に開催される「コールセンター/CRMデモ&コンファレンス2020 in 東京」に出展予定です。

■背景
 企業やそこで働く人々にとって、日常的に行われる会議の議事録作成は、大きな負担となっています。その手助けとなる自動議事録作成ツールは、多くの企業が開発し販売しています。しかし、一般的な置き型全指向性マイクを使用し複数人の会話を収録すると、話者の識別が困難なため、音声の認識率に悪影響をおよぼします。また、一人ひとりにマイクを用意すると、装着の煩わしさやコストの増加などの問題が発生します。
 それらの問題を解決すべく生まれたのが本製品です。1台のマイクデバイスで最大12方向の高度な話者分離を実現し、正確かつ手軽な自動議事録作成に大きく貢献します。

■本製品の特長
 本製品は、NTTメディアインテリジェンス研究所で研究開発されたIM-ASTER*1技術をベースにしたマイクデバイス(NTT-ATが商品開発)とIM-ASTERライブラリ(NTT-TXが提供)、および開発者用マニュアルをセットで提供する製品です。
〔主な特長〕
●IM-ASTER技術により、最大12方向を個別に分離*2して集音を可能とする多指向性小型マイクロフォンモジュール
●話者の方向を自動で推定し、位置変化に合わせて集音する自動追従機能
●高品質な雑音抑圧機能
●8個のMEMS*3マイクとIM-ASTER技術によるソフトウェア処理で指向性をより鋭く形成
●約60gの軽量・小型のため持ち運びが簡単
●マイクデバイスはUSBバスパワー方式による給電
●12方向分離を商用化した製品は世界初*4

■提供範囲
 本製品では、マイクデバイスで集音した音声を、ソフトウェアで処理することにより音声分離を実現します。ソフトウェアはライブラリ形態での提供となります。
製品名:Voice Compass Developer Kit
提供物:Voice Compass Direction Module(マイクデバイス+IM-ASTERライブラリ)および開発者用マニュアル

■マイクデバイス
マイク素子数:8個
周波数特性:60~7,000Hz
消費電流:150mA以下
電源:USBバスパワー (DC5V)
外形寸法:H14.5×φ64.7mm
質量:約61g (コード除く)
対応OS:IM-ASTERライブラリの動作要件に準ずる
付属品:USB(A-miniB)コード(約1m)

■IM-ASTERライブラリ
提供形態:
・64bit Windows DLL形式ライブラリ(Windows)
・共有ライブラリ(*.so)形式ライブラリ(Linux)
機能:
・方向別音声分離(最大12方向、自動追従時は最大6方向、集音範囲は約60°)
・自動追従機能(最大±30°の範囲)
動作要件:
・Windows用
CPU:Intel Core i5以上のCPU
OS:Windows 10 64bit
・Ubuntu用
CPU:Quad-Core Intel Atom E3845 1.91GHz以上
OS:Ubuntu 18.04 LTS
・ARM Linux用
CPU:Cortex-Aシリーズ1.4GHz以上、NEON命令利用可
OS:Linux OS (ARM 32bit)

■開発者用マニュアル
・インターフェース仕様書
・サンプルプログラム

■販売開始時期
2020年12月上旬

■販売元
NTT-AT、NTT-TX

■価格・販売
価格や販売に関する詳細につきましてはお問い合わせ下さい。

■展示会のお知らせ
次の展示会に出展いたします。
コールセンター/CRM デモ&コンファレンス2020 in 東京
・開催期間:2020年11月12日(木)~13日(金)
・開催場所:池袋サンシャインシティ・文化会館
・出展内容: (リンク »)

このプレスリリースの付帯情報

Voice Compass Developer Kit【デバイス外観】

用語解説

ASTER:Anti-distortion Suppression of noise with mask-based TransfER function estimation
*2 12方向から集音しますが、各方向の集音範囲は概ね60°程度となります。
*3  MEMS:Micro Electro Mechanical Systems(微小電気機械システム)
*4 2020年10月現在 NTT-AT調べ

※記載された会社名及び製品名は、各社の商標または登録商標です。

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    まずは“交渉術”を磨くこと!情報セキュリティ担当者の使命を果たすための必須事項とは

  2. ビジネスアプリケーション

    改めて知っておきたい、生成AI活用が期待される業務と3つのリスク

  3. セキュリティ

    「2024年版脅威ハンティングレポート」より—アジアでサイバー攻撃の標的になりやすい業界とは?

  4. ビジネスアプリケーション

    Google が推奨する生成 AI のスタートアップガイド、 AI を活用して市場投入への時間を短縮

  5. クラウドコンピューティング

    生成 AI リスクにも対応、調査から考察する Web ブラウザを主体としたゼロトラストセキュリティ

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]