import pandas as pd

# 读取Excel文件
df = pd.read_excel('C:\Users\86186\Desktop\汽车之家_秦plus_评论.xls')

# 初始化字典列表
sentences = []

# 遍历每一行数据
for index, row in df.iterrows():
    if pd.notnull(row['用户昵称']) and pd.notnull(row['最满意']):
        sentence_dict = {}
        sentence_dict['用户昵称'] = row['用户昵称']

        # 提取最满意的内容
        max_satisfaction = str(row['最满意'])
        sentence_dict['最满意'] = [max_satisfaction.strip()]

        # 提取最不满意的内容
        if pd.notnull(row['最不满意']):
            min_satisfaction = str(row['最不满意'])
            sentence_dict['最不满意'] = [min_satisfaction.strip()]
        else:
            sentence_dict['最不满意'] = []

        # 提取智能化的内容,注意偏移一行的处理
        if index + 1 < len(df) and pd.notnull(df.iloc[index + 1]['智能化']):
            intelligence = str(df.iloc[index + 1]['智能化'])
            sentence_dict['智能化'] = [intelligence.strip()]
        else:
            sentence_dict['智能化'] = []

        # 添加到字典列表中
        sentences.append(sentence_dict)

# 打印结果
for sentence_dict in sentences:
    print(sentence_dict)

这段代码展示了如何使用Python Pandas库处理Excel数据,包含以下步骤:

  1. 读取Excel文件: 使用 pd.read_excel() 函数读取指定路径的Excel文件。
  2. 初始化字典列表: 创建一个空列表 sentences 用于存储提取的数据。
  3. 遍历数据: 使用 df.iterrows() 遍历DataFrame的每一行数据。
  4. 提取数据: 使用条件判断和字符串处理提取 '用户昵称', '最满意', '最不满意' 和 '智能化' 列的内容。
  5. 处理偏移: 在提取 '智能化' 列的内容时,需要注意偏移一行的处理,使用 index + 1 获取下一行的内容,并进行边界检查。
  6. 存储数据: 将提取的内容存储到字典 sentence_dict 中,并将字典添加到列表 sentences 中。
  7. 打印结果: 遍历列表 sentences 打印每个字典的内容。

这段代码可以帮助你理解如何使用Python Pandas库处理Excel数据,并灵活运用偏移处理技巧解决实际问题。

Python Pandas 处理Excel数据:提取特定内容并处理偏移

原文地址: https://www.cveoy.top/t/topic/S2D 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录