Python爬虫、Flask网站开发和TensorFlow人脸识别实战:以《穿靴子的猫2》豆瓣影评为例
Python爬虫、Flask网站开发和TensorFlow人脸识别实战:以《穿靴子的猫2》豆瓣影评为例
本项目将综合运用Python语言,使用爬虫技术抓取《穿靴子的猫2》豆瓣电影上的所有页影评数据,并使用Flask框架搭建一个简单的网站展示这些数据,同时还将使用TensorFlow框架搭建一个简单的识别人脸的人脸识别系统。
一、爬取豆瓣电影《穿靴子的猫2》影评数据
- 使用Selenium库点击进入电影全部影评。
- 从'https://movie.douban.com/subject/25868125/comments?start=0&limit=20&status=P&sort=new_score'地址开始,抓取第一页的评论人名称、评论时间以及评论。
- 继续抓取2-3页的所有评论人名称、评论时间以及评论。
- 将抓取到的数据以文件存储的方式,存储为json格式数据。
二、使用Flask框架搭建网站展示影评数据
- 使用Flask框架搭建一个简单的网站,能够显示步骤一中抓取的影评数据。
- 网站首页应该显示所有影评数据,每个影评应该显示评论人名称、评论时间以及评论。
- 网站应该有一个搜索功能,用户可以输入评论人名称进行搜索,搜索结果应该只显示符合条件的影评数据。
- 网站应该有一个分页功能,每页显示10条影评数据,用户可以通过翻页查看更多影评数据。
- 网站应该有一个导出功能,用户可以将影评数据以csv格式导出。
- 网站应该有一个统计功能,显示影评数据的总数量、最早的评论时间、最晚的评论时间。
- 网站应该有一个可视化功能,使用pyecharts库,根据影评数据生成柱状图或折线图,展示评论人数量或评论时间分布情况。
- 网站应该有一个管理员界面,管理员可以添加、删除、修改影评数据。
三、使用TensorFlow框架搭建人脸识别系统
- 收集一些有标签的人脸照片,用于训练模型。
- 使用TensorFlow框架,搭建一个简单的卷积神经网络模型,用于识别人脸。
- 将收集的人脸照片分为训练集和测试集,使用训练集训练模型,使用测试集评估模型性能。
- 使用模型对新的人脸照片进行识别,给出相应的标签。
- 在网页上展示人脸识别系统,用户可以上传照片,系统能够识别出照片中的人脸,并给出相应的标签。
原文地址: https://www.cveoy.top/t/topic/oA0J 著作权归作者所有。请勿转载和采集!