Python Pandas DataFrame 常用操作实例教程
Python Pandas DataFrame 常用操作举例
Pandas 是 Python 中强大的数据分析库,DataFrame 是其核心数据结构,类似于 Excel 表格,可以存储和操作各种类型的数据。本教程将带您深入了解 DataFrame 的常用操作,并提供详细的代码示例,帮助您快速掌握 Pandas 数据处理技巧。
1. 创建 DataFrame
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35], 'gender': ['F', 'M', 'M']}
df = pd.DataFrame(data)
2. 查看 DataFrame
# 查看前几行
df.head()
# 查看后几行
df.tail()
# 查看列名
df.columns
# 查看索引
df.index
# 查看每列数据类型
df.dtypes
# 查看DataFrame的统计信息
df.describe()
3. 选取数据
# 选取列
df['name']
df[['name', 'age']]
# 选取行
df.iloc[0] # 选取第一行
df.iloc[1:3] # 选取第二行到第三行
# 选取特定条件的行
df[df['age'] > 30]
df[(df['age'] > 30) & (df['gender'] == 'M')]
4. 修改数据
# 修改列名
df.columns = ['Name', 'Age', 'Gender']
# 修改某个单元格的值
df.loc[0, 'Age'] = 26
# 新增一列
df['Country'] = ['USA', 'UK', 'Canada']
5. 排序
# 根据某列升序排列
df.sort_values('Age')
# 根据某列降序排列
df.sort_values('Age', ascending=False)
6. 分组
# 根据某列分组,并计算平均值
df.groupby('Gender')['Age'].mean()
# 根据多列分组,并计算平均值
df.groupby(['Gender', 'Country'])['Age'].mean()
7. 合并
# 横向合并
df1 = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})
df2 = pd.DataFrame({'name': ['Charlie', 'David'], 'age': [35, 40]})
pd.concat([df1, df2], axis=1)
# 纵向合并
df3 = pd.DataFrame({'gender': ['F', 'M'], 'country': ['USA', 'UK']})
pd.concat([df1, df3], axis=0)
更多示例和进阶操作请参考 Pandas 官方文档: https://pandas.pydata.org/docs/
希望本文能帮助您更好地理解和使用 Pandas DataFrame。
原文地址: https://www.cveoy.top/t/topic/oJ6s 著作权归作者所有。请勿转载和采集!