こんにちは、小澤です。
前回は、HTMLの構造とBeautifulSoupの役割を整理しました。スクレイピングは「画面を読む」のではなく、HTMLという構造データを読み解く作業であることも確認しました。
今回は、その続きとして、BeautifulSoupを実際に使いこなすための基本パターンを整理しながら、実際のプログラムの書き方を紹介したいと思います。整理する点は以下です。
BeautifulSoupを使うときの基本テンプレート
find と find_all の使い分け
class や id を使った絞り込み
複数要素を扱うときの考え方
よくあるエラーと対処法
教科書『Pythonによる新しいデータ分析の教科書(第2版)』では「スクレイピング」(274ページ〜284ページ)の続きにあたる部分です。
この続きは以下をご覧ください
(リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。

