Python Pandas 数据处理:读取、去重、排序、重塑数组并计算统计值
import pandas as pd
1) 读取文件并输出数据
iris_sepal = pd.read_csv('iris_sepal_length.csv') print(iris_sepal)
2) 去除重复值并输出形状
iris_sepal = iris_sepal.drop_duplicates() print(iris_sepal.shape)
3) 对iris_sepal排序并输出
iris_sepal = iris_sepal.sort_values(by='sepal_length') print(iris_sepal)
4) 将iris_sepal转换成(5,7)形状的数组,并命名为arr
arr = iris_sepal.values.reshape(5, 7) print(arr)
5) 计算每行元素的总和和平均值
row_sums = arr.sum(axis=1) row_means = arr.mean(axis=1) print('每行元素的总和:', row_sums) print('每行元素的平均值:', row_means)
原文地址: https://www.cveoy.top/t/topic/bm2U 著作权归作者所有。请勿转载和采集!