Python爬虫实战:将数据保存到Excel表格

本文将介绍如何使用Python爬取网页数据,并使用openpyxl库将数据保存到Excel表格中。

代码示例:

import openpyxl
from bs4 import BeautifulSoup

# 假设你已经使用BeautifulSoup获取了名为'skin_list'的网页数据

# 创建一个新的Excel工作簿
wb = openpyxl.Workbook()
ws = wb.active

# 添加表头
ws.append(['名称', '英雄', '皮肤', '图片链接'])

# 遍历数据并将每一行添加到Excel表格
for skin in skin_list:
    name = skin.select_one('.pic-pf-name').text
    hero = skin.select_one('.pic-pf-title').text
    skin_name = skin.select_one('.pic-pf-name span').text
    pic_url = skin.select_one('.pic-pf-img')['src']

    ws.append([name, hero, skin_name, pic_url])

# 保存Excel文件
wb.save('skin.xlsx')

代码解析:

  1. 首先,我们导入了必要的库:openpyxl用于操作Excel文件,BeautifulSoup用于解析HTML网页数据。
  2. 创建了一个新的Excel工作簿和一个活动工作表。
  3. 添加了表头,以便清楚地标识每一列的数据含义。
  4. 使用循环遍历skin_list,从中提取所需的信息,并将其添加到Excel表格的每一行中。
  5. 最后,使用wb.save()方法将数据保存到名为'skin.xlsx'的Excel文件中。

文件保存位置:

上述代码会将Excel文件保存在当前Python脚本运行的目录下。

总结:

通过结合使用openpyxlBeautifulSoup库,我们可以轻松地从网页中提取数据并将其保存到Excel表格中,以便进行进一步的分析和处理。

Python爬虫实战:将数据保存到Excel表格

原文地址: https://www.cveoy.top/t/topic/f1co 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录