コーパス

用語の解説

コーパスとは

(corpus)
コーパスとは、日本語や英語などをはじめとした自然言語の文書を大量に集めたもののことである。
コーパスは、言語学や情報処理において自然言語処理の研究や機械学習の学習データとして利用される。 単に文書を集めるだけではなく、品詞や統語構造などを付与してあるものは、特に「タグ付きコーパス」などと呼ばれる。 また、英語と日本語の文同士を、互いに対訳の形で収集したものは対訳コーパスと呼ばれる。

用語解説出典   powered by. Weblio

CNET Japan

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]