まさかPHPで自然言語処理、機械学習処理をするとは!コーパス付568頁の画期的な本出版。

学びing株式会社

2014-06-19 00:00

学びing(株)は『PHPによる機械学習入門』を執筆し、2014年7月上旬にリックテレコムから発行します。 568頁の大ボリュームで、予価3,600円(税抜)で7月上旬発売予定です。 学習に使うデータとして、まとまったボリュームを持ち、構造化されたテキストデータ「コーパス」(=言語資源)として、約19000件(6割が訓練用、4割が評価用)の「けんてーごっこコーパス(ライト)」が無償で使えます。
学びing株式会社は、『PHPによる機械学習入門』を執筆し、2014年7月上旬に株式会社リックテレコムから発行します。

従来、自然言語処理や機械学習処理は、専門的でアカデミックなバックグラウンドを持つ人でなければ、おいそれとは手が出せない分野でした。
本書では「ビッグデータ分析」で扱うデータのうち、自然言語で表現された「非構造化データ」を扱い、普及人口が大きいプログラミング言語PHPを使って自然言語処理・機械学習処理を実現する方法を紹介しています。

自然言語処理や機械学習処理の動作試験や性能評価において、実験に使うデータは非常に重要です。
自力で実験に使うデータを揃えるとなると、膨大な時間、労力を投入しなければなりません。

そこで役に立つのが、まとまったボリュームを持ち、構造化されたテキストデータ「コーパス」(=言語資源)です。そのボリュームに加え、構造化されていること、カテゴリやタグといった分類情報がどれだけ付加されているかで、コーパスの価値が左右されます。

今回、本書向けに用意した「けんてーごっこコーパス(ライト)」が無償で使えます。

英語のコーパスには、カテゴリに分類されたコーパス「20 News Groups」のような知名度のあるものがあります。
しかし、カテゴリに分類されている日本語のコーパスで、手軽に使いやすい形態のものはあまり見当たりません。

 「けんてーごっこコーパス」は、「20 News Groups」と類似した構造でカテゴリに分類されており、テキストマイニングや機械学習処理の実験に使いやすい形になっています。
「music(=音楽)」「game(=ゲーム)」「anime_manga(=アニメ・マンガ)」「idol(=アイドル・芸能)」の4つのカテゴリに分類され、約19000件のコーパスのうち約6割が訓練用コーパス、残る約4割が評価用コーパスとなっています。
 
【書籍概要】
「PHPによる機械学習入門」
著者:(学びing株式会社)斉藤常治/高橋佑幸
単行本(ソフトカバー):568頁
出版社:リックテレコム (2014/6/30)
予価:3,600円(税抜)
発売日:7月上旬発売
商品パッケージの寸法:23.6 × 18.2 × 2.6 cm(予定)
ISBN-13:978-4-89797-959-5

この書籍の発売を記念して、書籍執筆者の講演と事例の紹介無料セミナーを銀座で、開催します。
今回のセミナーでは、学びingがお手伝いした以下のお客様の事例を初めて、ご紹介します。 

・高速バスVIPライナー(株式会社平成エンタープライズ)様の事例
・学校向け教材を提供している上場会社「株式会社文溪堂」様との実証実験
・薬業界最大の専門紙「薬事日報」様の実例

ビッグデータ分析、機械学習に興味のある経営者や、営業、マーケティング関係の方にもわかりやすい内容になっております。

【開催概要】
『PHPによる機械学習入門』の出版記念無料セミナー
日時:2014/7/9(水)14:00~16:50 (13:30 受付開始)
会場:銀座 中小企業会館 9F(講堂)
 住所:〒104-0061 東京都中央区銀座2-10-18
参加費:無料 定員:80名
詳細・お申込み: (リンク »)

【学びing株式会社について】
商号:学びing株式会社 ( (リンク ») )
代表取締役社長:斉藤常治
所在地:さいたま市浦和区元町2-1-3 元町シティー2-202
事業内容:
・独自のA I(人工知能)や機械学習技術を使ったデータの分析やコンサルティング
・400万問!検定(クイズ)数日本一の「けんてーごっこ」( (リンク ») )
・エリアの宿泊施設混雑度や宿泊料金のデータを見ながら予約できる「激戦予約.com」( (リンク ») )
・書籍執筆:日本人著者初のクラウドコンピューティングの解説書「Amazon EC 2/S3クラウド入門」
「図解Q &Aクラウド事典」他

【本件に関するお問い合わせ先】
学びing株式会社
担当:斉藤/河野
電話番号:048-813-8207
E-mail:sales@manabing.jp

このプレスリリースの付帯情報

『PHPによる機械学習入門』

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「デジタル・フォレンジック」から始まるセキュリティ災禍論--活用したいIT業界の防災マニュアル

  2. 運用管理

    「無線LANがつながらない」という問い合わせにAIで対応、トラブル解決の切り札とは

  3. 運用管理

    Oracle DatabaseのAzure移行時におけるポイント、移行前に確認しておきたい障害対策

  4. 運用管理

    Google Chrome ブラウザ がセキュリティを強化、ゼロトラスト移行で高まるブラウザの重要性

  5. ビジネスアプリケーション

    技術進化でさらに発展するデータサイエンス/アナリティクス、最新の6大トレンドを解説

ZDNET Japan クイックポール

自社にとって最大のセキュリティ脅威は何ですか

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]