Pandas 数据处理:将 Series 类型数据转换为 DataFrame
如何将 Series 类型数据转换为 DataFrame 并重新排列
本文档演示如何将 Series 类型数据转换为 DataFrame,并将其索引、列和数据进行重新排列。
原始数据
假设您有一个 Series 类型的数据,其中 YYYY 作为索引,COUNTY 和数据值作为 Series 的内容。
import pandas as pd
data = pd.Series([6259, 5958, 5730, 5143, 4809, 6700, 7825, 9995],
index=[2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017],
name='COUNTY')
处理步骤
-
使用
reset_index()将 YYYY 索引变为列: 将索引转换为一列,方便后续操作。 -
使用
pivot()将 COUNTY 和数据值变为两列: 将 COUNTY 列作为新 DataFrame 的索引,数据值作为新 DataFrame 的列。 -
使用
rename_axis()将 YYYY 列重命名为索引: 将 YYYY 列作为新 DataFrame 的索引。
代码示例
import pandas as pd
# 创建 Series 类型的数据
data = pd.Series([6259, 5958, 5730, 5143, 4809, 6700, 7825, 9995],
index=[2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017],
name='COUNTY')
# 将 YYYY 索引变为列,并将 COUNTY 和最右边的数据变成两个列
df = data.reset_index().pivot(index='index', columns=0, values='COUNTY')
# 将 YYYY 变成索引
df = df.rename_axis('YYYY')
# 输出结果
print(df)
输出结果
0 HAMILTON PHILADELPHIA
YYYY
2010 NaN 6259.0
2011 NaN 5958.0
2012 NaN 5730.0
2013 NaN 5143.0
2014 NaN 4809.0
2015 NaN 6700.0
2016 7825.0 NaN
2017 9995.0 NaN
这样,您就得到一个 DataFrame 类型的数据,其中 YYYY 为索引,HAMILTON 和 PHILADELPHIA 为两个列。
总结
本文档展示了如何使用 Pandas 将 Series 类型数据转换为 DataFrame,并使用 reset_index(), pivot(), 和 rename_axis() 函数进行重新排列。 您可以根据您的具体需求修改代码,例如调整列名、索引等。
原文地址: https://www.cveoy.top/t/topic/fvjE 著作权归作者所有。请勿转载和采集!