Imdb排名爬蟲

要爬取IMDb的排名,你可以使用Python中的爬蟲庫,如requestsBeautifulSoup。以下是一個簡單的示例代碼,用於爬取IMDb的前50部電影排名:

import requests
from bs4 import BeautifulSoup

# 請求IMDb的前50部電影排名頁面
url = "https://www.imdb.com/search/title/?groups=top_250&sort=user_rating"
response = requests.get(url)

# 檢查請求是否成功
if response.status_code == 200:
    # 使用BeautifulSoup解析HTML內容
    soup = BeautifulSoup(response.text, "html.parser")

    # 找到排名列表
    rank_list = soup.find("ol", {"id": "title-list"})

    # 遍歷排名列表中的項目
    for rank in rank_list.find_all("li"):
        # 獲取每個項目的排名和電影名稱
        rank_number = rank.find("div", {"class": "titleColumn"}).find("span", {"class": "sortable"}).text
        movie_title = rank.find("div", {"class": "titleColumn"}).find("a").text
        print(f"{rank_number}. {movie_title}")

else:
    print("請求失敗")

請注意,這個代碼只是一個示例,實際使用時可能需要根據IMDb的最新布局和結構進行調整。此外,爬取網站時,請遵守網站的使用條款和條件,不要進行大規模或自動化的爬取,以免違反服務條款或造成伺服器負擔。