使用 Pandas 将 DataFrame 中的字符串转换为数字并创建新的分类列

本示例演示如何使用 Pandas 库将 DataFrame 中的字符串值转换为数字,并根据年龄创建新的分类列。

步骤:

  1. 创建 DataFrame:使用字典创建 DataFrame,包含学生姓名、专业和年龄信息。
  2. 字符串转换为数字:使用 replace 方法将 Major 列中的字符串 'Math' 替换为 0,'Art' 替换为 1。
  3. 创建分类列:使用 pd.cut 方法根据年龄将学生分类为青年、中年和老年,并创建新的 Age_Group 列。

代码示例:

import pandas as pd

D1 = {'Name': ['Alice', 'Bob', 'Jack'], 'Major': ['Math', 'Art', 'Math'], 'Age': [29, 30, 60]}
DF4 = pd.DataFrame(D1)

DF4['Major'] = DF4['Major'].replace({'Math': 0, 'Art': 1})
DF4['Age_Group'] = pd.cut(DF4['Age'], bins=[0, 29, 59, 120], labels=['青年', '中年', '老年'])

print(DF4)

输出结果:

    Name  Major  Age Age_Group
0  Alice      0   29        青年
1    Bob      1   30        中年
2   Jack      0   60        老年

总结:

本示例展示了如何使用 Pandas 将 DataFrame 中的字符串值转换为数字,并根据年龄创建新的分类列。该方法可以应用于各种数据分析场景,例如根据年龄、收入等因素对数据进行分类和分析。

Pandas DataFrame 数据转换与分类:将字符串转换为数字并创建新列

原文地址: http://www.cveoy.top/t/topic/nZwI 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录