Python 扩充样本数据:使用高斯噪声生成更多数据

本文提供Python代码,用于将多组多维已知数据导入Excel表格,通过注入高斯噪声来扩充样本数据,并将结果导出为新的Excel表格。

代码示例:

import numpy as np
import pandas as pd
from openpyxl import Workbook

# 读取已知数据
data = pd.read_excel('data.xlsx')

# 生成高斯噪声
noise = np.random.normal(0, 1, size=data.shape)

# 生成新数据
new_data = data + noise

# 将新数据合并到原始数据中
all_data = pd.concat([data, pd.DataFrame(new_data)], axis=0)

# 将数据写入Excel表格中
wb = Workbook()
ws = wb.active
for r in np.array(all_data):
    ws.append(r.tolist())
wb.save('all_data.xlsx')

代码说明:

  1. 代码中使用了pandas库来读取Excel数据,numpy库来生成高斯噪声,并使用openpyxl库来将数据写入Excel表格中;
  2. 代码假设已知数据保存在名为'data.xlsx'的Excel文件中,新数据保存在变量'new_data'中;
  3. 代码中使用了concat方法将已知数据和新数据合并,并将结果保存在变量'all_data'中;
  4. 最后,代码使用openpyxl库创建了一个新的Excel表格,并将合并后的数据写入其中,保存为名为'all_data.xlsx'的Excel文件。

使用说明:

  1. 确保已安装pandasnumpyopenpyxl库。
  2. 将代码中的'data.xlsx'替换为实际的Excel文件路径。
  3. 运行代码即可生成包含扩充数据的'all_data.xlsx'文件。

注意事项:

  • 代码中使用的高斯噪声标准差为1,可根据实际情况调整。
  • 注入高斯噪声可能会改变数据的分布,需要根据实际情况进行评估。
  • 数据扩充是一种常用的方法,可以帮助提高机器学习模型的性能。

更多信息:

本代码仅供参考,请根据实际情况进行修改和调整。

Python 扩充样本数据:使用高斯噪声生成更多数据

原文地址: https://www.cveoy.top/t/topic/nTu0 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录