Python Pandas 数据处理:筛选与计算平均值
首先,我们引入了 numpy 和 pandas 库,并读取了一个名为'2023_2_23No1_data.xlsx'的 Excel 文件,其中的数据表格被命名为'Sheet',并将第一列作为索引。
import numpy as np
import pandas as pd
df = pd.read_excel('2023_2_23No1_data.xlsx',sheet_name='Sheet', index_col=0)
接下来,我们创建了一个名为 index 的列表,其中包含了一些整数值。
index = [1,2,3,7,11,17,23,31,43,61,89,127,179,251,349]
然后,我们定义了一个名为 my_df 的变量,并将其初始化为空字符串'df'。
my_df = 'df'
我们还定义了一个名为 df_name 的变量,并将其初始化为 df(即我们在之前读取 Excel 文件时所创建的 DataFrame)。
df_name = df
接下来,我们使用 for 循环遍历 index 列表中的每一个元素。在每次循环中,我们创建了一个名为 the_df 的变量,并将其初始化为一个 DataFrame,这个 DataFrame 由以下条件筛选而来:'name' 列的值为'peritumor'、'frequency' 列的值等于 index 列表中的当前元素、'conductivity' 列的值大于 0。最后,我们使用 append() 方法将 the_df 添加到 my_df 中,以形成一个新的 DataFrame。
for i in range(len(index)):
the_df = df_name + str(index[i])
the_df = df[df['name'] == 'peritumor'] &(df['frequency'] == index) & (df['conductivity'] > 0)
my_df.append(the_df)
最后,我们使用另一个 for 循环遍历 my_df 中的每个 DataFrame,并计算每个 DataFrame 中'conductivity' 列的平均值,并输出结果。
for item in my_df:
print((sum(item['conductivity']))/(item.shape[0]))
这段代码演示了如何使用 Pandas 库进行数据筛选和计算,并展示了如何使用循环遍历数据并执行特定的操作。您可以根据自己的需求修改代码,以实现不同的数据处理功能。
原文地址: https://www.cveoy.top/t/topic/ndst 著作权归作者所有。请勿转载和采集!