DataFrame的常用操作举例
- 创建DataFrame
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35], 'gender': ['F', 'M', 'M']}
df = pd.DataFrame(data)
- 查看DataFrame
# 查看前几行
df.head()
# 查看后几行
df.tail()
# 查看列名
df.columns
# 查看索引
df.index
# 查看每列数据类型
df.dtypes
# 查看DataFrame的统计信息
df.describe()
- 选取数据
# 选取列
df['name']
df[['name', 'age']]
# 选取行
df.iloc[0] # 选取第一行
df.iloc[1:3] # 选取第二行到第三行
# 选取特定条件的行
df[df['age'] > 30]
df[(df['age'] > 30) & (df['gender'] == 'M')]
- 修改数据
# 修改列名
df.columns = ['Name', 'Age', 'Gender']
# 修改某个单元格的值
df.loc[0, 'Age'] = 26
# 新增一列
df['Country'] = ['USA', 'UK', 'Canada']
- 排序
# 根据某列升序排列
df.sort_values('Age')
# 根据某列降序排列
df.sort_values('Age', ascending=False)
- 分组
# 根据某列分组,并计算平均值
df.groupby('Gender')['Age'].mean()
# 根据多列分组,并计算平均值
df.groupby(['Gender', 'Country'])['Age'].mean()
- 合并
# 横向合并
df1 = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})
df2 = pd.DataFrame({'name': ['Charlie', 'David'], 'age': [35, 40]})
pd.concat([df1, df2], axis=1)
# 纵向合并
df3 = pd.DataFrame({'gender': ['F', 'M'], 'country': ['USA', 'UK']})
pd.concat([df1, df3], axis=0)
``
原文地址: https://www.cveoy.top/t/topic/hhaz 著作权归作者所有。请勿转载和采集!