Python Pandas 数据处理:读取、去重、排序、重塑和计算
- 首先需要导入 pandas 库来读取 csv 文件,并保存至变量 'iris_sepal' 中。然后使用 print 函数输出 'iris_sepal' 的数据。
import pandas as pd
iris_sepal = pd.read_csv('iris_sepal_length.csv')
print(iris_sepal)
- 使用 drop_duplicates 方法去除重复值,并重新赋值给 'iris_sepal'。然后使用 shape 属性输出 'iris_sepal' 的形状。
iris_sepal = iris_sepal.drop_duplicates()
print(iris_sepal.shape)
- 使用 sort_values 方法对 'iris_sepal' 进行排序,并输出。
iris_sepal = iris_sepal.sort_values(by='sepal_length')
print(iris_sepal)
- 使用 reshape 方法将 'iris_sepal' 转换成形状为 (5, 7) 的数组,并将其命名为 'arr'。然后使用 print 函数输出 'arr'。
arr = iris_sepal.values.reshape(5, 7)
print(arr)
- 使用 sum 和 mean 函数分别计算 'arr' 数组中每一行元素的总和和平均值,并使用 print 函数输出结果。
row_sum = arr.sum(axis=1)
row_mean = arr.mean(axis=1)
print('每一行元素的总和:', row_sum)
print('每一行元素的平均值:', row_mean)
原文地址: http://www.cveoy.top/t/topic/bmKd 著作权归作者所有。请勿转载和采集!