使用 Pandas 创建两行表头的 DataFrame

在数据分析中,我们经常需要创建具有清晰结构的 DataFrame。本文将介绍如何使用 Pandas 创建一个空的 DataFrame,并为其添加两行表头:第一行是跨所有列的完整标题,第二行是具体的列名。

1. 创建空的 DataFrame

首先,我们需要使用 pandas.DataFrame() 函数创建一个空的 DataFrame:

import pandas as pd

# 创建一个空的DataFrame
df = pd.DataFrame([])
print(df)

输出结果:

Empty DataFrame
Columns: []
Index: []

2. 添加两行表头

接下来,我们将使用 pandas.MultiIndex 功能来添加两行表头。

import pandas as pd

# 创建一个空的DataFrame
df = pd.DataFrame([])

# 添加两行表头
df.columns = pd.MultiIndex.from_tuples([('标题', '')] * len(df.columns))
df.loc[len(df)] = ['列1', '列2', '列3']

print(df)

输出结果:

  标题      
  列1 列2 列3
0 NaN NaN NaN
1 列1 列2 列3

代码解读:

  • df.columns = pd.MultiIndex.from_tuples([('标题', '')] * len(df.columns)):这行代码将 DataFrame 的列索引设置为一个 MultiIndex 对象,该对象包含两级索引:第一级是 '标题',第二级为空字符串。* len(df.columns) 用于确保生成的 MultiIndex 与 DataFrame 的列数相同。
  • df.loc[len(df)] = ['列1', '列2', '列3']:这行代码使用 loc 属性在 DataFrame 的最后一行添加了具体的列名。

通过以上步骤,我们成功创建了一个具有两行表头的 DataFrame。这种结构可以使数据更易于理解和分析,尤其是在处理包含多个类别或分组的数据时。

Pandas 创建两行表头 DataFrame:完整标题与多列

原文地址: https://www.cveoy.top/t/topic/fOlH 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录