Python爬虫实战:将数据保存到Excel表格
Python爬虫实战:将数据保存到Excel表格
本文将介绍如何使用Python爬取网页数据,并使用openpyxl库将数据保存到Excel表格中。
代码示例:
import openpyxl
from bs4 import BeautifulSoup
# 假设你已经使用BeautifulSoup获取了名为'skin_list'的网页数据
# 创建一个新的Excel工作簿
wb = openpyxl.Workbook()
ws = wb.active
# 添加表头
ws.append(['名称', '英雄', '皮肤', '图片链接'])
# 遍历数据并将每一行添加到Excel表格
for skin in skin_list:
name = skin.select_one('.pic-pf-name').text
hero = skin.select_one('.pic-pf-title').text
skin_name = skin.select_one('.pic-pf-name span').text
pic_url = skin.select_one('.pic-pf-img')['src']
ws.append([name, hero, skin_name, pic_url])
# 保存Excel文件
wb.save('skin.xlsx')
代码解析:
- 首先,我们导入了必要的库:
openpyxl用于操作Excel文件,BeautifulSoup用于解析HTML网页数据。 - 创建了一个新的Excel工作簿和一个活动工作表。
- 添加了表头,以便清楚地标识每一列的数据含义。
- 使用循环遍历
skin_list,从中提取所需的信息,并将其添加到Excel表格的每一行中。 - 最后,使用
wb.save()方法将数据保存到名为'skin.xlsx'的Excel文件中。
文件保存位置:
上述代码会将Excel文件保存在当前Python脚本运行的目录下。
总结:
通过结合使用openpyxl和BeautifulSoup库,我们可以轻松地从网页中提取数据并将其保存到Excel表格中,以便进行进一步的分析和处理。
原文地址: https://www.cveoy.top/t/topic/f1co 著作权归作者所有。请勿转载和采集!