第30回「スクレイピング（2）」PythonとBeautifulSoupでHTMLを解析

一般社団法人Pythonエンジニア育成推進協会

2026-05-11 09:00

一般社団法人Pythonエンジニア育成推進協会はコラム「第30回「スクレイピング（2）」PythonとBeautifulSoupでHTMLを解析」を公開しました。

＃＃＃

こんにちは、小澤です。

前回は、スクレイピングとは何か、そしてどのような場面で役に立つのかを紹介しました。今回は実践をはじめる準備として、PythonとBeautifulSoupを使ってHTMLを解析するところまでを紹介しましょう。

スクレイピングは「画面を見て情報を抜き取る作業」ではなく、HTMLというテキスト構造を読み解き、そこから情報を抜き出す作業です。つまり、スクレイピングを行ううえでは、HTMLの構造を理解することが避けて通れません。よって、今回は、

・HTMLはどんな構造をしているのか
・PythonでWebページを取得すると何が手に入るのか
・BeautifulSoupは何をしてくれるのか
を確認しながら、スクレイピングをする感覚を実感してもらうことにします。

この続きは以下をご覧ください
(リンク »)

関連情報へのリンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

一般社団法人Pythonエンジニア育成推進協会のプレスリリース

一般社団法人Pythonエンジニア育成推進協会のプレスリリース一覧へ

【企業の皆様へ】企業情報を掲載・登録するには？

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

企業情報センターにログイン企業情報センターサービスについて

企業情報センター利用規約

CNET Japan Top Story

ホワイトペーパー

新着

ランキング

経営

8 割超の組織が“インフラの限界”に直面──エージェント型 AI 時代の新たな基準とは
経営

生成AI活用はなぜ成果につながらないのか？　P/Lヒットを生む3つのポイント
セキュリティ

AIセキュリティ確保のための実践ガイド--なぜ従来のセキュリティはAIに通用しないのか
ビジネスアプリケーション

AI、全社に広げられていますか？まずは「セキュリティ・統制の壁」の克服を
セキュリティ

ランサムウェアで止まらない基幹業務へ--クラウド選定で見るべき4つの要点

ホワイトペーパーライブラリー

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]