Python Pandas读取Excel数据并提取句子：优化代码以将第一个最满意放在列表首位

本代码示例使用Python Pandas库读取Excel文件，并提取包含“最满意”等字段的句子。我们将优化代码，使得第一个最满意的句子出现在列表的首位。

原始代码：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('C:\Users\86186\Desktop\汽车之家_秦plus_评论.xls')

# 初始化字典列表
sentences = []

# 遍历每一行数据
for index, row in df.iterrows():
    if pd.notnull(row['用户昵称']) and pd.notnull(row['最满意']):
        sentence_dict = {}
        columns = df.columns.tolist()
        start_index = columns.index('最满意')
        for column in columns[start_index:]:
            if column == '智能化' and pd.notnull(df.iloc[index+1]['智能化']):
                sentence_dict[column] = [sentence.strip() for sentence in str(df.iloc[index+1][column]).split('，')]
            else:
                sentence_dict[column] = [sentence.strip() for sentence in str(row[column]).split('，')]
        sentences.append(sentence_dict)

# 打印结果
for sentence_dict in sentences:
    print(sentence_dict)

改进后的代码：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('C:\Users\86186\Desktop\汽车之家_秦plus_评论.xls')

# 初始化字典列表
sentences = []

# 遍历每一行数据
for index, row in df.iterrows():
    if pd.notnull(row['用户昵称']) and pd.notnull(row['最满意']):
        sentence_dict = {}
        columns = df.columns.tolist()
        start_index = columns.index('最满意')
        for column in columns[start_index:]:
            if column == '智能化' and pd.notnull(df.iloc[index+1]['智能化']):
                sentence_dict[column] = [sentence.strip() for sentence in str(df.iloc[index+1][column]).split('，')]
            else:
                sentence_dict[column] = [sentence.strip() for sentence in str(row[column]).split('，')]
        sentences.insert(0, sentence_dict)  # 将字典插入到列表开头

# 打印结果
for sentence_dict in sentences:
    print(sentence_dict)

修改说明：

我们修改了 sentences.append(sentence_dict) 为 sentences.insert(0, sentence_dict)，将字典插入到列表的开头，从而将第一个“最满意”放在列表的首位。

注意：

请确保你已经安装了 pandas 库和 xlrd 库。
请将代码中的文件路径替换为你的实际路径。

总结：

本文展示了如何使用Python Pandas库读取Excel文件，并提取“最满意”等字段的句子。我们通过修改代码，将第一个“最满意”放在列表首位，方便用户查看和分析。

Python Pandas读取Excel数据并提取句子：优化代码以将第一个最满意放在列表首位