pythonでAmazonのほしいものリストをローカル保存するスクリプト書いたら一部しか保存できぬ！

Question

pythonでAmazonのほしいものリストをローカルに保存するスクリプトを
パプレシティで作成したのですが、

スクリプトを実行すると

ほしいものリストの先頭ページしかローカル保存できません。

複数ページにまたがるほしいものリストの場合どのようにすればローカルに保存できますか？

アドバイスいただけると幸いです。よろしくおねがいします。

--------------------------------------------------------------------------

import requests
from bs4 import BeautifulSoup
import csv

def get_wishlist(wishlist_id):
    url = f"https://www.amazon.co.jp/hz/wishlist/ls/{wishlist_id}"
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
    }
    
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.content, 'html.parser')
    
    items = []
    for item in soup.find_all('li', {'data-id': True}):
        title = item.find('h2', {'class': 'a-size-base'}).text.strip()
        price = item.find('span', {'class': 'a-price'})
        price = price.text.strip() if price else 'N/A'
        link = "https://www.amazon.co.jp" + item.find('a', {'class': 'a-link-normal'})['href']
        
        items.append([title, price, link])
    
    return items

def save_wishlist_csv(items, filename):
    with open(filename, 'w', newline='', encoding='utf-8-sig') as f:
        writer = csv.writer(f)
        writer.writerow(['タイトル', '価格', 'リンク'])  # ヘッダー行
        writer.writerows(items)

# メインの実行部分
wishlist_id = input("Amazon wishlist IDを入力してください: ")
items = get_wishlist(wishlist_id)

if items:
    filename = "amazon_wishlist.csv"
    save_wishlist_csv(items, filename)
    print(f"ほしいものリストを {filename} に保存しました。")
else:
    print("ほしいものリストの取得に失敗しました。")

よっしーラボ · Accepted Answer

nextやページボタンがあれば、そこにURLが書いてあると思いますので、BeatifulSoupで対象となるタグを検索し、'url'とか、'text'で、次のページurlを取得して、BeatifulSoupで新しいページとしてロードすればいいとは思います
（クエリパラメータでpage=1とか追加されるケースがほとんどだと思いますが・・・。もしかすると、JavaScriptでリンクを生成してるかもしれません。その場合には、JavaScriptを解析してデータを持ってくるしかないです）

ただ、今のget_wishlistは、URL固定なので、whileで、loadpage(url)で戻り値をsoupにして、next pageがあれば、urlに設定して、ループ、なければ、breakして、items を戻り値にするなどの変更が必要だとは思います

多分、ページ構成は同じだと思うので、タグ検索もそのまま使えると思います。

pythonでAmazonのほしいものリストをローカル保存するスクリプト書いたら一部しか保存できぬ！

nextやページボタンがあれば、そこにURLが書いてあると思いますので、BeatifulSoupで対象となるタグを検索し、'url'とか、'text'で、次のページurlを取得して、BeatifulSoupで新しいページとしてロードすればいいとは思います

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング