CSES 问题集爬虫系统测试报告
CSES 问题集爬虫系统测试报告
1. 测试目的和范围:
本次系统测试的目的是通过对已爬取的problem_html和submission数据进行处理,爬取题目的内容,并保存到content.md中。同时,还需要获取测试用例的输入和输出,并保存到对应的文件中。本次测试的范围包括发送GET请求、解析响应、获取问题内容、保存内容到文件、获取测试用例的输入和输出等功能的测试。
2. 测试环境:
- 操作系统: Windows 10
- Python版本: 3.7.9
- 开发工具: PyCharm
3. 测试步骤:
- 设置代理配置,包括设置HTTP代理和HTTPS代理。
- 发送GET请求到问题URL,并使用代理和Cookie。
- 解析响应,并获取所有
- 元素。
- 遍历每个
- 元素,获取二级标题和
- 元素。
- 解析元素,获取问题的链接地址、标题和ID,并创建对应的目录。
- 再次发送GET请求获取问题的内容,并保存到文件中。
- 获取测试用例的输入和输出,并保存到对应的文件中。
4. 测试结果:
- 对于发送GET请求和解析响应的功能,测试通过,能够成功获取问题的URL和内容。
- 对于获取测试用例的输入和输出的功能,测试通过,能够成功获取测试用例的URL和内容,并保存到对应的文件中。
- 对于保存问题内容和测试用例内容到文件的功能,测试通过,能够成功保存内容到对应的文件中。
5. 测试总结:
本次系统测试涉及到多个功能的测试,包括发送GET请求、解析响应、保存内容到文件等。通过测试,发现程序能够正常工作,能够成功获取问题的内容,并保存到文件中。同时,还能够获取测试用例的输入和输出,并保存到对应的文件中。测试结果显示程序能够正常运行,符合预期要求。建议在后续测试中继续完善错误处理机制,提高程序的稳定性和可靠性。
原文地址: https://www.cveoy.top/t/topic/o4Tc 著作权归作者所有。请勿转载和采集!