Python Pandas DataFrame 常用操作举例

Pandas 是 Python 中强大的数据分析库,DataFrame 是其核心数据结构,类似于 Excel 表格,可以存储和操作各种类型的数据。本教程将带您深入了解 DataFrame 的常用操作,并提供详细的代码示例,帮助您快速掌握 Pandas 数据处理技巧。

1. 创建 DataFrame

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35], 'gender': ['F', 'M', 'M']}
df = pd.DataFrame(data)

2. 查看 DataFrame

# 查看前几行
df.head()

# 查看后几行
df.tail()

# 查看列名
df.columns

# 查看索引
df.index

# 查看每列数据类型
df.dtypes

# 查看DataFrame的统计信息
df.describe()

3. 选取数据

# 选取列
df['name'] 
df[['name', 'age']]

# 选取行
df.iloc[0] # 选取第一行
df.iloc[1:3] # 选取第二行到第三行

# 选取特定条件的行
df[df['age'] > 30]
df[(df['age'] > 30) & (df['gender'] == 'M')]

4. 修改数据

# 修改列名
df.columns = ['Name', 'Age', 'Gender']

# 修改某个单元格的值
df.loc[0, 'Age'] = 26

# 新增一列
df['Country'] = ['USA', 'UK', 'Canada']

5. 排序

# 根据某列升序排列
df.sort_values('Age')

# 根据某列降序排列
df.sort_values('Age', ascending=False)

6. 分组

# 根据某列分组,并计算平均值
df.groupby('Gender')['Age'].mean()

# 根据多列分组,并计算平均值
df.groupby(['Gender', 'Country'])['Age'].mean()

7. 合并

# 横向合并
df1 = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})
df2 = pd.DataFrame({'name': ['Charlie', 'David'], 'age': [35, 40]})
pd.concat([df1, df2], axis=1)

# 纵向合并
df3 = pd.DataFrame({'gender': ['F', 'M'], 'country': ['USA', 'UK']})
pd.concat([df1, df3], axis=0)

更多示例和进阶操作请参考 Pandas 官方文档: https://pandas.pydata.org/docs/

希望本文能帮助您更好地理解和使用 Pandas DataFrame。

Python Pandas DataFrame 常用操作实例教程

原文地址: https://www.cveoy.top/t/topic/oJ6s 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录