Python Pandas读取Excel数据并提取句子:优化代码以将第一个最满意放在列表首位
Python Pandas读取Excel数据并提取句子:优化代码以将第一个最满意放在列表首位
本代码示例使用Python Pandas库读取Excel文件,并提取包含“最满意”等字段的句子。我们将优化代码,使得第一个最满意的句子出现在列表的首位。
原始代码:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('C:\Users\86186\Desktop\汽车之家_秦plus_评论.xls')
# 初始化字典列表
sentences = []
# 遍历每一行数据
for index, row in df.iterrows():
if pd.notnull(row['用户昵称']) and pd.notnull(row['最满意']):
sentence_dict = {}
columns = df.columns.tolist()
start_index = columns.index('最满意')
for column in columns[start_index:]:
if column == '智能化' and pd.notnull(df.iloc[index+1]['智能化']):
sentence_dict[column] = [sentence.strip() for sentence in str(df.iloc[index+1][column]).split(',')]
else:
sentence_dict[column] = [sentence.strip() for sentence in str(row[column]).split(',')]
sentences.append(sentence_dict)
# 打印结果
for sentence_dict in sentences:
print(sentence_dict)
改进后的代码:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('C:\Users\86186\Desktop\汽车之家_秦plus_评论.xls')
# 初始化字典列表
sentences = []
# 遍历每一行数据
for index, row in df.iterrows():
if pd.notnull(row['用户昵称']) and pd.notnull(row['最满意']):
sentence_dict = {}
columns = df.columns.tolist()
start_index = columns.index('最满意')
for column in columns[start_index:]:
if column == '智能化' and pd.notnull(df.iloc[index+1]['智能化']):
sentence_dict[column] = [sentence.strip() for sentence in str(df.iloc[index+1][column]).split(',')]
else:
sentence_dict[column] = [sentence.strip() for sentence in str(row[column]).split(',')]
sentences.insert(0, sentence_dict) # 将字典插入到列表开头
# 打印结果
for sentence_dict in sentences:
print(sentence_dict)
修改说明:
我们修改了 sentences.append(sentence_dict) 为 sentences.insert(0, sentence_dict),将字典插入到列表的开头,从而将第一个“最满意”放在列表的首位。
注意:
- 请确保你已经安装了
pandas库和xlrd库。 - 请将代码中的文件路径替换为你的实际路径。
总结:
本文展示了如何使用Python Pandas库读取Excel文件,并提取“最满意”等字段的句子。我们通过修改代码,将第一个“最满意”放在列表首位,方便用户查看和分析。
原文地址: https://www.cveoy.top/t/topic/So6 著作权归作者所有。请勿转载和采集!