1. 读取数据:使用read_csv函数读取csv文件,使用read_excel函数读取Excel文件。

    import pandas as pd
    df = pd.read_csv('data.csv')
    df = pd.read_excel('data.xlsx')
    
  2. 查看数据:使用head函数查看前几行数据,使用tail函数查看后几行数据,使用describe函数查看数据的统计信息。

    print(df.head())
    print(df.tail())
    print(df.describe())
    
  3. 筛选数据:使用loc函数按行和列标签筛选数据,使用iloc函数按行和列位置筛选数据,使用query函数按条件筛选数据。

    # 根据标签筛选数据
    df.loc[df['age'] > 18, ['name', 'age']]
    
    # 根据位置筛选数据
    df.iloc[0:3, 0:2]
    
    # 根据条件筛选数据
    df.query('age > 18')
    
  4. 排序数据:使用sort_values函数对数据进行排序,默认升序排序,可以设置ascending参数为False进行降序排序。

    # 按年龄升序排序
    df.sort_values('age')
    
    # 按年龄降序排序
    df.sort_values('age', ascending=False)
    
  5. 分组数据:使用groupby函数对数据进行分组,然后使用聚合函数对分组后的数据进行计算。

    # 按性别分组,计算平均年龄
    df.groupby('gender')['age'].mean()
    
    # 按性别和城市分组,计算人数和平均年龄
    df.groupby(['gender', 'city']).agg({'age': 'mean', 'name': 'count'})
    
  6. 合并数据:使用merge函数将两个数据集合并为一个,使用concat函数将多个数据集合并为一个。

    # 根据id将两个数据集合并
    pd.merge(df1, df2, on='id')
    
    # 将多个数据集按行合并
    pd.concat([df1, df2])
    
  7. 缺失值处理:使用isnull函数判断数据是否缺失,使用dropna函数删除缺失值,使用fillna函数填充缺失值。

    # 判断数据是否缺失
    df.isnull()
    
    # 删除缺失值
    df.dropna()
    
    # 填充缺失值
    df.fillna(0)
    
  8. 数据转换:使用apply函数对数据进行转换,使用map函数对数据进行映射,使用replace函数对数据进行替换。

    # 对年龄进行转换
    df['age'] = df['age'].apply(lambda x: x + 1)
    
    # 对性别进行映射
    df['gender'] = df['gender'].map({'male': 1, 'female': 0})
    
    # 对城市进行替换
    df['city'] = df['city'].replace({'beijing': '北京', 'shanghai': '上海'})
    ``
    
Pandas的常用操作举例

原文地址: https://www.cveoy.top/t/topic/hha0 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录