機械学習で自動分類する文書管理ソフト crossnote ML による分類例を公開

アップデイティット株式会社

From: PR TIMES

2016-10-18 13:58

果たして、明治の文豪の文章に現れる個性を機械は判別できるのか?

総合文書管理ソフト「crossnote」のオプション機能である、機械学習による文書の自動分類を誰にでも手軽に実現できるcrossnote MLを使って、実際にドキュメントを分類した例を公開しました。

ITベンチャーのアップデイティット株式会社(update it, Inc.)は次世代型統合文書管理ソフトcrossnoteの新オプション機能 crossnote MLを用いた、機械学習による文書の自動分類例を公開いたしました。crossnote MLは機械学習の仕組みを応用し、分けたい例(教師データ)をある程度与えるとその傾向を学習・分析し、crossnoteに保存されたドキュメントを自動的に分類する仕組みで、専門的な知識を必要とせず機械学習を利用することができます。

機械学習による自動分類がどの程度実用性があるのかを知って頂くための試みとして、以下の3つのテーマについて自動分類を行い、評価結果を公表いたしました。

crossnoteの機械学習で文章から作者を判別する
明治の文豪たちの作品をMLに学習させ、文体だけで作者別に分類できるか試してみました。
文章に現れる個性を機械は判別できるのでしょうか?

[slideshare1: (リンク ») ]


crossnoteの機械学習でパブリックコメントを分類する
神奈川県で募集した高校入試制度についてのパブリックコメントをMLを用いて分類してみました。
パブリックコメントは自由記載のため、同じ内容でも人によって書き方が違います。また1項目当たりのデータ数が少ないうえ、似た内容を分類するため、難易度の高い課題です。

[slideshare2: (リンク ») ]



crossnoteの機械学習でWikipediaの記事を分類する
Wikipediaにある哺乳類の項目から「分布」、「生体」、「形態」について記述されている箇所を抜き出して、正しく分類できるかを試してみました。

[slideshare3: (リンク ») ]



crossnoteは現在、製薬業界における新薬申請業務や自動車のマニュアル作成など、ドキュメンテーションが重要な業務となる分野でお使い頂いております。提供形態はオンプレミス型、クラウド型のいずれでの提供も可能で、crossnote MLはcrossnoteへのアドオン(サイトライセンス)として提供されます。

なおcrossnote MLは弊社技術顧問の、ニューヨーク大学准教授 関根聡氏との共同研究を元に開発しております。

■ crossnoteによる実際の分類例については、以下のページをご参照ください。
(リンク »)

■ crossnoteについての詳細は当社ホームページをご参照ください。
(リンク »)

プレスリリース提供:PR TIMES (リンク »)
本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]