Python Pandas数据处理:自定义DataFrame对象并进行数据查询
import pandas as pd
# 自定义成绩数据
data = {
'姓名': ['学生1', '学生2', '学生3', '学生4', '学生5', '学生6', '学生7', '学生8', '学生9', '学生10'],
'语文': [85, 90, 75, 80, 92, 88, 78, 87, 82, 91],
'数学': [92, 88, 78, 87, 82, 91, 85, 90, 75, 80],
'英语': [78, 87, 82, 91, 85, 90, 75, 80, 92, 88],
'物理': [82, 91, 85, 90, 75, 80, 92, 88, 78, 87],
'化学': [75, 80, 92, 88, 78, 87, 82, 91, 85, 90],
'生物': [90, 75, 80, 92, 88, 78, 87, 82, 91, 85]
}
# 创建 DataFrame 对象
df = pd.DataFrame(data)
# 添加新学生的成绩
df.loc[len(df)] = ['张三', 80, 85, 90, 83, 88, 77]
# 查询数学成绩
math_scores = df['数学']
print('数学成绩:')
print(math_scores)
# 查询张三的外语成绩
zhangsan_english_score = df.loc[df['姓名'] == '张三', '英语']
print('
张三的外语成绩:')
print(zhangsan_english_score)
# 用 iloc 查询索引为偶数的同学的语文、外语成绩
even_indices = df.index[df.index % 2 == 0]
selected_scores = df.loc[even_indices, ['语文', '英语']]
print('
索引为偶数的同学的语文、外语成绩:')
print(selected_scores)
这段代码演示了如何使用Python的Pandas库进行数据分析和处理。
代码解释:
- 导入Pandas库:
import pandas as pd - 创建数据: 定义了一个字典
data,包含十名学生的姓名和六科成绩。 - 创建DataFrame: 使用
pd.DataFrame(data)将字典转换为DataFrame对象。 - 添加数据: 使用
df.loc[len(df)]在DataFrame末尾添加'张三'的成绩。 - 查询数据:
- 使用
df['数学']查询所有学生的'数学'成绩。 - 使用
df.loc[df['姓名'] == '张三', '英语']查询'张三'的'英语'成绩。 - 使用
df.loc[even_indices, ['语文', '英语']]查询索引为偶数的同学的'语文'和'英语'成绩。
- 使用
这段代码清晰易懂,适合初学者学习如何使用Pandas进行数据处理和分析。
原文地址: http://www.cveoy.top/t/topic/c4dZ 著作权归作者所有。请勿转载和采集!