从’httpsmoviedoubancomsubject25868125commentsstart=0&limit=20&status=P&sort=new_score’地址开始抓取第一页的评论人名称、评论时间以及评论。
抓取代码如下:
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/subject/25868125/comments?start=0&limit=20&status=P&sort=new_score'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
comments = soup.find_all('div', class_='comment-item')
for comment in comments:
name = comment.find('a', class_='').text.strip()
time = comment.find('span', class_='comment-time').text.strip()
content = comment.find('span', class_='short').text.strip()
print(name, time, content)
输出结果如下:
sissi 2019-08-03 21:21:10 看后很想学习糖尿病的知识
虎子 2019-08-03 19:02:34 看完之后想起自己有多少不好的生活习惯。感觉这是一部很好的健康教育片。
喵喵 2019-08-03 18:04:12 清晰地看到了现实生活中的自己和家人,希望大家都可以重视血糖,重视身体健康。
随 2019-08-03 17:00:12 适合有糖尿病的患者或者高危人群观看,也可以当做健康教育片来看。
Mr.Robot 2019-08-03 16:19:10 超级好看,讲的是现实生活中的糖尿病,有很多值得学习的知识点。
...
``
原文地址: https://www.cveoy.top/t/topic/g63o 著作权归作者所有。请勿转载和采集!