获取豆瓣电影排行榜并保存为excel
要获取豆瓣电影排行榜并保存为Excel文件,可以使用Python的requests和BeautifulSoup库来进行网页爬取和数据解析,以及pandas库来将数据保存为Excel文件。以下是一个示例代码:
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 发送请求,获取豆瓣电影排行榜页面的HTML内容
url = 'https://movie.douban.com/chart'
response = requests.get(url)
html_content = response.content
# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(html_content, 'html.parser')
# 找到电影排行榜的列表元素
movie_list = soup.find(class_='indent').find_all('tr')
# 创建一个空的DataFrame来存储电影数据
movies_data = pd.DataFrame(columns=['排名', '电影名', '评分'])
# 遍历电影列表,提取电影的排名、电影名和评分,并添加到DataFrame中
for movie in movie_list:
rank = movie.find(class_='top250-no').text.strip()
name = movie.find(class_='titleColumn').a.text.strip()
rating = movie.find(class_='rating_num').text.strip()
movies_data = movies_data.append({'排名': rank, '电影名': name, '评分': rating}, ignore_index=True)
# 将数据保存为Excel文件
movies_data.to_excel('豆瓣电影排行榜.xlsx', index=False)
执行以上代码后,将会在当前目录下生成一个名为“豆瓣电影排行榜.xlsx”的Excel文件,其中包含了豆瓣电影排行榜的排名、电影名和评分信息。

原文地址: http://www.cveoy.top/t/topic/i5He 著作权归作者所有。请勿转载和采集!