数据可视化绘图数据预处理代码示例 - Python Pandas
以下是一个基本的数据预处理示例,用于清洗和转换数据,以便进行可视化绘图:
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 删除无用列
data = data.drop(['id', 'timestamp'], axis=1)
# 处理缺失值
data = data.fillna(0)
# 转换数据类型
data['price'] = data['price'].astype(int)
data['date'] = pd.to_datetime(data['date'])
# 创建新列
data['year'] = data['date'].dt.year
data['month'] = data['date'].dt.month
# 分组数据
grouped = data.groupby(['year', 'month']).agg({'price': 'mean'})
# 重置索引
grouped = grouped.reset_index()
# 导出数据
grouped.to_csv('processed_data.csv', index=False)
此示例演示了以下预处理步骤:
- 读取数据
- 删除无用列
- 处理缺失值
- 转换数据类型
- 创建新列
- 分组数据
- 重置索引
- 导出数据
这些步骤可根据数据集的需求进行调整和修改。
原文地址: http://www.cveoy.top/t/topic/oK2T 著作权归作者所有。请勿转载和采集!