Python Pandas 处理Excel数据:提取特定内容并处理偏移
import pandas as pd
# 读取Excel文件
df = pd.read_excel('C:\Users\86186\Desktop\汽车之家_秦plus_评论.xls')
# 初始化字典列表
sentences = []
# 遍历每一行数据
for index, row in df.iterrows():
if pd.notnull(row['用户昵称']) and pd.notnull(row['最满意']):
sentence_dict = {}
sentence_dict['用户昵称'] = row['用户昵称']
# 提取最满意的内容
max_satisfaction = str(row['最满意'])
sentence_dict['最满意'] = [max_satisfaction.strip()]
# 提取最不满意的内容
if pd.notnull(row['最不满意']):
min_satisfaction = str(row['最不满意'])
sentence_dict['最不满意'] = [min_satisfaction.strip()]
else:
sentence_dict['最不满意'] = []
# 提取智能化的内容,注意偏移一行的处理
if index + 1 < len(df) and pd.notnull(df.iloc[index + 1]['智能化']):
intelligence = str(df.iloc[index + 1]['智能化'])
sentence_dict['智能化'] = [intelligence.strip()]
else:
sentence_dict['智能化'] = []
# 添加到字典列表中
sentences.append(sentence_dict)
# 打印结果
for sentence_dict in sentences:
print(sentence_dict)
这段代码展示了如何使用Python Pandas库处理Excel数据,包含以下步骤:
- 读取Excel文件: 使用
pd.read_excel()函数读取指定路径的Excel文件。 - 初始化字典列表: 创建一个空列表
sentences用于存储提取的数据。 - 遍历数据: 使用
df.iterrows()遍历DataFrame的每一行数据。 - 提取数据: 使用条件判断和字符串处理提取 '用户昵称', '最满意', '最不满意' 和 '智能化' 列的内容。
- 处理偏移: 在提取 '智能化' 列的内容时,需要注意偏移一行的处理,使用
index + 1获取下一行的内容,并进行边界检查。 - 存储数据: 将提取的内容存储到字典
sentence_dict中,并将字典添加到列表sentences中。 - 打印结果: 遍历列表
sentences打印每个字典的内容。
这段代码可以帮助你理解如何使用Python Pandas库处理Excel数据,并灵活运用偏移处理技巧解决实际问题。
原文地址: https://www.cveoy.top/t/topic/S2D 著作权归作者所有。请勿转载和采集!