Python Pandas数据处理：合并Excel文件并随机抽样

以下代码展示了如何使用Python的Pandas库进行数据处理，包括从Excel文件读取数据、合并数据以及对数据进行随机抽样：

import pandas as pd

df1 = pd.read_excel('附件1.xlsx')
df2 = pd.read_excel('附件2.xlsx')
df2 = df2.sample(20000)
df2 = pd.merge(df2,df1,on='单品编码')

代码解析：

import pandas as pd: 导入Pandas库并将其简称为 'pd'，方便后续使用。
df1 = pd.read_excel('附件1.xlsx'): 使用 read_excel 函数读取名为 '附件1.xlsx' 的Excel文件，并将数据存储在名为 'df1' 的DataFrame对象中。
df2 = pd.read_excel('附件2.xlsx'): 使用相同的方法读取名为 '附件2.xlsx' 的Excel文件，并将数据存储在名为 'df2' 的DataFrame对象中。
df2 = df2.sample(20000): 使用 sample 方法从 'df2' 中随机抽取20000行数据，并将结果重新赋值给 'df2'。这可以用于减少数据集的大小，方便后续处理。
df2 = pd.merge(df2,df1,on='单品编码'): 使用 merge 函数将 'df2' 和 'df1' 按照 '单品编码' 列进行合并。合并后的结果存储在 'df2' 中，相当于使用 'df2' 中的数据对 'df1' 进行查找和补充。

这段代码演示了如何使用Pandas进行简单的数据处理任务。Pandas提供了丰富的函数和方法，可以高效地进行数据清洗、转换、合并等操作。