固有表現抽出

用語の解説

固有表現抽出とは

(コユウヒョウゲンチュウシュツ,named entity extraction,named entity recognition,)
固有表現抽出とは、人名や地名などといった固有名詞や、日付、時間などに関する表現を、テキストから抜き出すこと、またはそのような手法を研究する自然言語処理における情報抽出の一分野のことである。
「固有表現」という概念や「固有表現抽出」という研究課題は、1990年頃アメリカ合衆国のDARPAが組織した評価型プロジェクト MUC (Message Understanding Conference)で初めて提唱されたと言われている。 具体的な手法としては、予め固有表現のタグが付与されたタグ付きコーパスをテストコレクションとして機械学習による統計的な手法で抽出を行う試みのや、人名や時間表現などそれぞれの固有表現に対して、それらの語の文字列のパターンを多数の正規表現などを使って抽出するヒューリスティックな手法などがある。 また、固有表現をカテゴリごとなどに細かく体系的に整理したものは、「固有表現オントロジー」などと呼ばれる。

用語解説出典   powered by. Weblio

CNET Japan

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]