Pandas DataFrame 数据转换与分类:将字符串转换为数字并创建新列
使用 Pandas 将 DataFrame 中的字符串转换为数字并创建新的分类列
本示例演示如何使用 Pandas 库将 DataFrame 中的字符串值转换为数字,并根据年龄创建新的分类列。
步骤:
- 创建 DataFrame:使用字典创建 DataFrame,包含学生姓名、专业和年龄信息。
- 字符串转换为数字:使用
replace方法将Major列中的字符串 'Math' 替换为 0,'Art' 替换为 1。 - 创建分类列:使用
pd.cut方法根据年龄将学生分类为青年、中年和老年,并创建新的Age_Group列。
代码示例:
import pandas as pd
D1 = {'Name': ['Alice', 'Bob', 'Jack'], 'Major': ['Math', 'Art', 'Math'], 'Age': [29, 30, 60]}
DF4 = pd.DataFrame(D1)
DF4['Major'] = DF4['Major'].replace({'Math': 0, 'Art': 1})
DF4['Age_Group'] = pd.cut(DF4['Age'], bins=[0, 29, 59, 120], labels=['青年', '中年', '老年'])
print(DF4)
输出结果:
Name Major Age Age_Group
0 Alice 0 29 青年
1 Bob 1 30 中年
2 Jack 0 60 老年
总结:
本示例展示了如何使用 Pandas 将 DataFrame 中的字符串值转换为数字,并根据年龄创建新的分类列。该方法可以应用于各种数据分析场景,例如根据年龄、收入等因素对数据进行分类和分析。
原文地址: http://www.cveoy.top/t/topic/nZwI 著作权归作者所有。请勿转载和采集!