对多组多维已知数据注入高斯噪声来扩充样本成更多组数据并导出为Excel表格python代码
以下是一个示例代码,可以将多组多维已知数据注入高斯噪声来扩充样本成更多组数据,并导出为Excel表格:
import numpy as np
import pandas as pd
# 原始数据
data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 注入高斯噪声的标准差
std = 0.1
# 扩充样本的数量
num_samples = 10
# 生成随机数种子
np.random.seed(0)
# 扩充数据
new_data = []
for i in range(num_samples):
new_data.append(data + np.random.normal(0, std, size=data.shape))
# 将数据转换为DataFrame,导出为Excel
df = pd.DataFrame(np.concatenate(new_data), columns=['dim1', 'dim2', 'dim3'])
df.to_excel('data.xlsx', index=False)
这个示例代码中,我们首先定义了原始数据data。然后,我们指定了注入高斯噪声的标准差std和扩充样本的数量num_samples。接下来,我们使用np.random.seed(0)生成随机数种子,以确保每次运行代码时都会得到相同的结果。
在扩充数据的循环中,我们使用np.random.normal(0, std, size=data.shape)生成高斯噪声,并将其加到原始数据中。这个步骤会重复进行num_samples次,生成多组扩充数据。
最后,我们将数据转换为DataFrame,并使用to_excel()方法将其导出为Excel文件。在这个示例中,我们将数据的列名设置为dim1、dim2和dim3,但你可以根据需要进行修改
原文地址: https://www.cveoy.top/t/topic/eB1i 著作权归作者所有。请勿转载和采集!