用Python代码实现处理Excel
以下是Python代码,用于处理Excel文件:
- 安装pandas库(如果未安装的话)
pip install pandas
- 导入pandas库
import pandas as pd
- 读取Excel文件
df = pd.read_excel('filename.xlsx', sheet_name='Sheet1')
- 数据处理
可以对读取的数据进行各种处理,如数据清洗、筛选、排序、合并等等。以下是一些常见的处理方法:
- 查看数据
print(df.head()) # 查看前5行数据
print(df.tail()) # 查看后5行数据
print(df.shape) # 查看数据的行数和列数
- 数据清洗
df.dropna() # 删除有缺失值的行
df.fillna(value=0) # 将缺失值填充为0
df.drop_duplicates() # 删除重复行
- 数据筛选
df[df['column']>50] # 筛选列中大于50的行
df[(df['column1']>50) & (df['column2']<100)] # 筛选列1大于50且列2小于100的行
df[df['column'].isin(['value1', 'value2'])] # 筛选列中包含value1或value2的行
- 数据排序
df.sort_values(by='column', ascending=False) # 按列降序排列
df.sort_values(by=['column1', 'column2'], ascending=[False, True]) # 先按列1降序排列,再按列2升序排列
- 数据合并
df1 = pd.read_excel('filename1.xlsx', sheet_name='Sheet1')
df2 = pd.read_excel('filename2.xlsx', sheet_name='Sheet1')
df = pd.concat([df1, df2], axis=0) # 纵向合并两个数据框
df = pd.merge(df1, df2, on='column') # 按列合并两个数据框
- 写入Excel文件
df.to_excel('newfile.xlsx', index=False) # 将数据框写入Excel文件,不包含行索引
完整代码示例:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('filename.xlsx', sheet_name='Sheet1')
# 数据处理
df.dropna() # 删除有缺失值的行
df = df[df['column']>50] # 筛选列中大于50的行
df = df.sort_values(by='column', ascending=False) # 按列降序排列
df.to_excel('newfile.xlsx', index=False) # 将数据框写入Excel文件,不包含行索引
``
原文地址: https://www.cveoy.top/t/topic/fe9W 著作权归作者所有。请勿转载和采集!