従来、自然言語処理や機械学習処理は、専門的でアカデミックなバックグラウンドを持つ人でなければ、おいそれとは手が出せない分野でした。
本書では「ビッグデータ分析」で扱うデータのうち、自然言語で表現された「非構造化データ」を扱い、普及人口が大きいプログラミング言語PHPを使って自然言語処理・機械学習処理を実現する方法を紹介しています。
自然言語処理や機械学習処理の動作試験や性能評価において、実験に使うデータは非常に重要です。
自力で実験に使うデータを揃えるとなると、膨大な時間、労力を投入しなければなりません。
そこで役に立つのが、まとまったボリュームを持ち、構造化されたテキストデータ「コーパス」(=言語資源)です。そのボリュームに加え、構造化されていること、カテゴリやタグといった分類情報がどれだけ付加されているかで、コーパスの価値が左右されます。
今回、本書向けに用意した「けんてーごっこコーパス(ライト)」が無償で使えます。
英語のコーパスには、カテゴリに分類されたコーパス「20 News Groups」のような知名度のあるものがあります。
しかし、カテゴリに分類されている日本語のコーパスで、手軽に使いやすい形態のものはあまり見当たりません。
「けんてーごっこコーパス」は、「20 News Groups」と類似した構造でカテゴリに分類されており、テキストマイニングや機械学習処理の実験に使いやすい形になっています。
「music(=音楽)」「game(=ゲーム)」「anime_manga(=アニメ・マンガ)」「idol(=アイドル・芸能)」の4つのカテゴリに分類され、約19000件のコーパスのうち約6割が訓練用コーパス、残る約4割が評価用コーパスとなっています。
【書籍概要】
「PHPによる機械学習入門」
著者:(学びing株式会社)斉藤常治/高橋佑幸
単行本(ソフトカバー):568頁
出版社:リックテレコム (2014/6/30)
予価:3,600円(税抜)
発売日:7月上旬発売
商品パッケージの寸法:23.6 × 18.2 × 2.6 cm(予定)
ISBN-13:978-4-89797-959-5
この書籍の発売を記念して、書籍執筆者の講演と事例の紹介無料セミナーを銀座で、開催します。
今回のセミナーでは、学びingがお手伝いした以下のお客様の事例を初めて、ご紹介します。
・高速バスVIPライナー(株式会社平成エンタープライズ)様の事例
・学校向け教材を提供している上場会社「株式会社文溪堂」様との実証実験
・薬業界最大の専門紙「薬事日報」様の実例
ビッグデータ分析、機械学習に興味のある経営者や、営業、マーケティング関係の方にもわかりやすい内容になっております。
【開催概要】
『PHPによる機械学習入門』の出版記念無料セミナー
日時:2014/7/9(水)14:00~16:50 (13:30 受付開始)
会場:銀座 中小企業会館 9F(講堂)
住所:〒104-0061 東京都中央区銀座2-10-18
参加費:無料 定員:80名
詳細・お申込み: (リンク »)
【学びing株式会社について】
商号:学びing株式会社 ( (リンク ») )
代表取締役社長:斉藤常治
所在地:さいたま市浦和区元町2-1-3 元町シティー2-202
事業内容:
・独自のA I(人工知能)や機械学習技術を使ったデータの分析やコンサルティング
・400万問!検定(クイズ)数日本一の「けんてーごっこ」( (リンク ») )
・エリアの宿泊施設混雑度や宿泊料金のデータを見ながら予約できる「激戦予約.com」( (リンク ») )
・書籍執筆:日本人著者初のクラウドコンピューティングの解説書「Amazon EC 2/S3クラウド入門」
「図解Q &Aクラウド事典」他
【本件に関するお問い合わせ先】
学びing株式会社
担当:斉藤/河野
電話番号:048-813-8207
E-mail:sales@manabing.jp
このプレスリリースの付帯情報
お問い合わせにつきましては発表元企業までお願いいたします。