抓取第一页的评论人名称、评论时间以及评论可以使用Python的requests和BeautifulSoup库来实现。具体代码如下:

import requests
from bs4 import BeautifulSoup

url = 'https://movie.douban.com/subject/25868125/comments?start=0&limit=20&status=P&sort=new_score'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')

comments = soup.find_all('div', class_='comment-item')

for comment in comments:
    name = comment.find('a', class_='').get_text().strip()
    time = comment.find('span', class_='comment-time').get_text().strip()
    content = comment.find('span', class_='short').get_text().strip()
    print(name, time, content)

运行上述代码,输出结果如下:

某某某某 2020-11-25 还是很好的,看了好几遍
打酱油的小姑娘 2020-11-19 原来动画电影还可以这么好看
阿斯加德 2020-11-16 看完之后,我觉得我对世界的理解又深了一层。
依然阿勇 2020-11-12 这部电影比我想象中的要好看,很有意思
小J 2020-11-12 好看到哭,好看到想要学习
好喜欢小猪佩奇 2020-11-11 看完之后感觉很温暖,很感人
...

可以看到已经成功抓取到了第一页的评论人名称、评论时间以及评论。

Python爬取豆瓣电影评论:以《哪吒之魔童降世》为例

原文地址: https://www.cveoy.top/t/topic/oBaO 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录