package org1;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

public class Data_Recovery {
    public static void main(String[] args) throws IOException {
        // 创建文件输入流
        FileInputStream inputStream = new FileInputStream('input.xlsx');

        // 创建工作簿对象
        Workbook workbook = new XSSFWorkbook(inputStream);

        // 获取第一个工作表
        Sheet sheet = workbook.getSheetAt(0);

        // 将Excel表格数据转换为二维数组
        double[][] data = new double[sheet.getLastRowNum()+1][sheet.getRow(0).getLastCellNum()];
        for (int i = 0; i <= sheet.getLastRowNum(); i++) {
            Row row = sheet.getRow(i);
            for (int j = 0; j < row.getLastCellNum(); j++) {
                Cell cell = row.getCell(j);
                if (cell.getCellType() == CellType.NUMERIC) {
                    if (DateUtil.isCellDateFormatted(cell)) {
                        data[i][j] = cell.getDateCellValue().getTime();
                    } else {
                        data[i][j] = cell.getNumericCellValue();
                    }
                } else {
                    data[i][j] = Double.NaN;
                }
            }
        }

        // 创建KNNAlgorithm对象
        KNNAlgorithm knn = new KNNAlgorithm();

        // 调用KNNAlgorithm的方法进行数据补全处理
        double[][] newData = knn.fillMissingData(data);

        // 检查是否已经存在名为Sheet2的工作表
        Sheet sheet2 = workbook.getSheet('Sheet2');

        // 如果Sheet2工作表已经存在且不为空,则新建一个名为Sheet2_new的工作表
        if (sheet2 != null && sheet2.getLastRowNum() > 0) {
            sheet2 = workbook.createSheet('Sheet2_new');
        } else {
            // 否则直接使用Sheet2工作表
            sheet2 = workbook.getSheet('Sheet2');
        }

        // 将数据写入工作表中
        for (int i = 0; i < newData.length; i++) {
            Row row = sheet2.createRow(i);
            for (int j = 0; j < newData[i].length; j++) {
                Cell cell = row.createCell(j);
                if (j == 2) { // 第3列为时间格式
                    cell.setCellValue(DateUtil.getJavaDate(newData[i][j]));
                    CellStyle cellStyle = workbook.createCellStyle();
                    CreationHelper creationHelper = workbook.getCreationHelper();
                    cellStyle.setDataFormat(creationHelper.createDataFormat().getFormat('yyyy-MM-dd HH:mm:ss'));
                    cell.setCellStyle(cellStyle);
                } else {
                    cell.setCellValue(newData[i][j]);
                }
            }
        }
        // 保存Excel文件
        FileOutputStream outputStream = new FileOutputStream('input.xlsx');
        workbook.write(outputStream);

        // 关闭工作簿和文件输入流、文件输出流
        workbook.close();
        inputStream.close();
        outputStream.close();
    }
}

这段代码实现了以下功能:

  1. 读取Excel文件并获取数据:使用Apache POI库读取指定的Excel文件,并将数据存储在二维数组中。
  2. 处理时间格式数据:将时间格式的单元格转换为数值型,以便进行KNN算法计算。
  3. 使用KNN算法填充缺失数据:调用KNNAlgorithm类的fillMissingData方法,对数据进行缺失值填充。
  4. 将处理后的数据写入新的工作表:将填充后的数据写入名为'Sheet2'或'Sheet2_new'的工作表中。
  5. 保存修改后的Excel文件:将修改后的数据保存到原始Excel文件中。

需要注意的是,这段代码依赖于KNNAlgorithm类,你需要根据实际情况自行实现该类。

基于KNN算法的Excel数据缺失值填充

原文地址: https://www.cveoy.top/t/topic/f2g8 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录