Python 扩充样本数据:使用高斯噪声生成更多数据
Python 扩充样本数据:使用高斯噪声生成更多数据
本文提供Python代码,用于将多组多维已知数据导入Excel表格,通过注入高斯噪声来扩充样本数据,并将结果导出为新的Excel表格。
代码示例:
import numpy as np
import pandas as pd
from openpyxl import Workbook
# 读取已知数据
data = pd.read_excel('data.xlsx')
# 生成高斯噪声
noise = np.random.normal(0, 1, size=data.shape)
# 生成新数据
new_data = data + noise
# 将新数据合并到原始数据中
all_data = pd.concat([data, pd.DataFrame(new_data)], axis=0)
# 将数据写入Excel表格中
wb = Workbook()
ws = wb.active
for r in np.array(all_data):
ws.append(r.tolist())
wb.save('all_data.xlsx')
代码说明:
- 代码中使用了
pandas库来读取Excel数据,numpy库来生成高斯噪声,并使用openpyxl库来将数据写入Excel表格中; - 代码假设已知数据保存在名为'data.xlsx'的Excel文件中,新数据保存在变量'new_data'中;
- 代码中使用了
concat方法将已知数据和新数据合并,并将结果保存在变量'all_data'中; - 最后,代码使用
openpyxl库创建了一个新的Excel表格,并将合并后的数据写入其中,保存为名为'all_data.xlsx'的Excel文件。
使用说明:
- 确保已安装
pandas、numpy和openpyxl库。 - 将代码中的'data.xlsx'替换为实际的Excel文件路径。
- 运行代码即可生成包含扩充数据的'all_data.xlsx'文件。
注意事项:
- 代码中使用的高斯噪声标准差为1,可根据实际情况调整。
- 注入高斯噪声可能会改变数据的分布,需要根据实际情况进行评估。
- 数据扩充是一种常用的方法,可以帮助提高机器学习模型的性能。
更多信息:
本代码仅供参考,请根据实际情况进行修改和调整。
原文地址: https://www.cveoy.top/t/topic/nTu0 著作权归作者所有。请勿转载和采集!