Pandas 教程:数据处理和分析的 Python 库
Pandas 是一个 Python 库,用于数据处理和数据分析。它提供了高效的数据结构和数据分析工具,使数据处理和分析变得更加容易和快速。
以下是一些 Pandas 的常见操作和用法:
-
导入 Pandas 库:
import pandas as pd -
读取数据:
df = pd.read_csv('filename.csv')df = pd.read_excel('filename.xlsx') -
查看数据:
df.head()显示前五行数据df.tail()显示后五行数据df.info()显示数据的基本信息 -
数据清洗:
df.dropna()删除缺失值df.fillna(value)填充缺失值df.drop_duplicates()删除重复行df.rename(columns={'old_name':'new_name'})重命名列名df.astype({'column_name':'data_type'})更改列的数据类型 -
数据分析:
df.describe()显示数据的统计信息df.groupby('column_name').mean()按列名分组并计算平均值df.pivot_table(index='column_name', values='column_name', aggfunc='function')创建透视表 -
数据可视化:
df.plot()绘制线形图df.hist()绘制直方图df.boxplot()绘制箱线图
以上是 Pandas 的一些基本操作和用法,可以帮助您更好地处理和分析数据。
原文地址: https://www.cveoy.top/t/topic/lVLy 著作权归作者所有。请勿转载和采集!