Python Pandas数据处理:合并Excel文件并随机抽样
Python Pandas数据处理:合并Excel文件并随机抽样
以下代码展示了如何使用Python的Pandas库进行数据处理,包括从Excel文件读取数据、合并数据以及对数据进行随机抽样:
import pandas as pd
df1 = pd.read_excel('附件1.xlsx')
df2 = pd.read_excel('附件2.xlsx')
df2 = df2.sample(20000)
df2 = pd.merge(df2,df1,on='单品编码')
代码解析:
import pandas as pd: 导入Pandas库并将其简称为 'pd',方便后续使用。df1 = pd.read_excel('附件1.xlsx'): 使用read_excel函数读取名为 '附件1.xlsx' 的Excel文件,并将数据存储在名为 'df1' 的DataFrame对象中。df2 = pd.read_excel('附件2.xlsx'): 使用相同的方法读取名为 '附件2.xlsx' 的Excel文件,并将数据存储在名为 'df2' 的DataFrame对象中。df2 = df2.sample(20000): 使用sample方法从 'df2' 中随机抽取20000行数据,并将结果重新赋值给 'df2'。这可以用于减少数据集的大小,方便后续处理。df2 = pd.merge(df2,df1,on='单品编码'): 使用merge函数将 'df2' 和 'df1' 按照 '单品编码' 列进行合并。合并后的结果存储在 'df2' 中,相当于使用 'df2' 中的数据对 'df1' 进行查找和补充。
这段代码演示了如何使用Pandas进行简单的数据处理任务。Pandas提供了丰富的函数和方法,可以高效地进行数据清洗、转换、合并等操作。
原文地址: https://www.cveoy.top/t/topic/ef2x 著作权归作者所有。请勿转载和采集!