Python

入門:pythonでWebサイトをスクレイピング【コードサンプルあり】

スクレイピングとは何か?とイメージがつかない人に向けて書いています。

動作をみることから始めることで、イメージづくりを行います。

 

コピー&ペーストでスクレイピングの動きを確認します。

コードを貼り付けて実行して、動作を確認してみます。

スクレイピングする対象は本サイトのトップページ(https://pattern-life.com/)にします。

 

結果はこのようになっていればOKです。(記事タイトルは更新されている場合があります)

 

 

ここから解説。

サイト名はh1タグのclass名:sitenameを指定して、textを取得しています。

<コード>Web_name = soup.find('h1',class_="sitename").text

 

記事タイトルはh3タグを指定して、

<コード>Contents_title = soup.find_all('h3')

textを順番にリストに入れています。

<コード>Contents_title_child.append(count.text)

-Python
-

© 2020 Pattern Life Powered by AFFINGER5