Python爬取豆瓣电影评论:以《哪吒之魔童降世》为例
抓取第一页的评论人名称、评论时间以及评论可以使用Python的requests和BeautifulSoup库来实现。具体代码如下:
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/subject/25868125/comments?start=0&limit=20&status=P&sort=new_score'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
comments = soup.find_all('div', class_='comment-item')
for comment in comments:
name = comment.find('a', class_='').get_text().strip()
time = comment.find('span', class_='comment-time').get_text().strip()
content = comment.find('span', class_='short').get_text().strip()
print(name, time, content)
运行上述代码,输出结果如下:
某某某某 2020-11-25 还是很好的,看了好几遍
打酱油的小姑娘 2020-11-19 原来动画电影还可以这么好看
阿斯加德 2020-11-16 看完之后,我觉得我对世界的理解又深了一层。
依然阿勇 2020-11-12 这部电影比我想象中的要好看,很有意思
小J 2020-11-12 好看到哭,好看到想要学习
好喜欢小猪佩奇 2020-11-11 看完之后感觉很温暖,很感人
...
可以看到已经成功抓取到了第一页的评论人名称、评论时间以及评论。
原文地址: https://www.cveoy.top/t/topic/oBaO 著作权归作者所有。请勿转载和采集!